来自 娱乐资讯 2019-05-02 02:37 的文章
当前位置: 必发88官网 > 娱乐资讯 > 正文

国外运动社交平台,如何利用A

原标题:案例解析:外国运动社交平台 Strava 爆红,那是它们的布署增进实验

本文来源A/B测试 by Google(免费课程)学学计算,共计22时辰,本文仅是对学科第2节内容的学习总计,后续的科目中详细演讲了读书如何挑选和认证你的施行中所使用的目的,怎么着统一计划二个完完全全的A/B测试,怎么着准确的辨析你的实验结果,感兴趣的相恋的人能够点击连接观望并深刻学习,也愿意我们能够联手学习并浓厚交换在其实工作中的A/B测试景况。

AB测试介绍

Strava 是一款专为运动爱好者设计的测速应用程式,同时也是随即爆红的移动达人社交平台。

Strava 公司总部位于美利坚联邦合众国布宜诺斯艾利斯,由 马克 Gainey 和 迈克尔 Horvath 共同成立。截止20一柒年三秋,Strava 已累计获取七千万澳元的投资。

本文小编 Paolo Ertreo(Strava 产品设计员)将结合实际案例,跟大家享用 Strava 是哪些通过进步实验,在活动达人圈中稳步扩张影响力的。

壹、A/B 测试概述

A/B test概念:A/B测试是一种用于在线测试的例行格局,可用以测试新产品或新功效,须求安装两组用户,将里面1组织设立置为对照组,采取已有产品或效益,另壹组利用新版产品或效益,通过相比较分析上述用户做出的比不上响应数据,鲜明哪些版本更加好。

A/B test 适用场景:通过大范围的用户数据观望,如新职能界面中追加了内容,分化的外观,差异的开关配色,都足以选择A/B测试,扶助产品不断优化。案例:google曾在用户分界面中运作了4二不等紫罗兰色阴影,观看用户有何反应。amazon做过测试,每种页面增加拾0皮秒延迟,收入会稳中有降一%,google也搜查捕获类似结果。

A/B test 局限性:A/B测试不合乎做全新体验的功力评估,因为全新的体验存在四个难题,比较标准是何等?数据比较必要多久才具收看成效?(面对低频服务-如租房,很难通过A/B测试来看推荐对于人们的表现影响)。

A/B test 演习题(研究区写下您的选项,回复给您不错答案):

1、在以下哪些景况下您可以考虑A/B测试?

A:你想要知道你的电商网址是或不是完整,是或不是留存用户想要购买可是平台不大概提供的商品

B:集团曾经有了无需付费服务,但想要提供有此外功效的高端级服务,须要客户晋级或付费

C:假若三个网址提供电影推荐服务,通过新的算法对或然的提出开始展览排序

D:要是你想要改造基础架构的后台,会潜移默化到页面加载速度和用户看到的呈现结果

E:二个小车出卖网址,思量做出更换,想清楚退换是不是更恐怕再度走访网址依旧向她们的爱侣推荐

F:倘使一家商号想要更新他们的品牌形象,如主页的logo,改版后对用户作为发出什么样影响

G:假如你想改版移动应用首页,想要调节消息架构,观看对用户作为时有发生怎么着影响

当A/B测试不适用时,能够经过用户操作日志检查或考察来分析,也能够透过大四的试验,进行前瞻性分析。也得以选用难题小组,面对面联系,问卷调查,用户评价分析等格局获得定性数据,补充A/B测试的定量测试结果。

实际操作案例设计:wap首页改版,wap首页作为导流落地页,首要功用为教导用户完结登记。

什么是AB测试?

A/B Test 是2个用来在线测试的健康办法,用于测试新产品或新作用。

图片 1

二、A/B 测试度量采取

A/B测试前一定要规划合理的测试衡量目的,通过查处宗旨目的剖断区别测试版本的职能怎么着,如若急需测试首页更改对于用户注册带来的作用,能够动用独立访客点击率作为测试首页改动的衡量值。

独立访客点击率=独立访客点击注册开关数/独立访客登入首页数

实际操作案例设计:

单身访客注册按键点击率=独立来访的客人点击注册开关数/独立访客登录着六页数

单身访客注册成功率=独立访客注册成功数/独立方可登陆着陆页数

哪些操作

大家必要安装两组用户,1组织设立置为对照组,选用已部分产品或效益,另一组为实验组,选取新版产品或效益。
接下来,找到上述两组用户做出的两样响应,确认哪个版本的功效越来越好。

在Strava,增进团队的对象是扩展那几个世界上最活跃的选手社会群众体育。

叁、2项布满和置信区间

样本数差异,则结果的置信度会收下影响,第一组实验,独立访客点击注册开关数=100,独立访客登6首页数=一千,那注册改版后的独立来访的客人点击率=100/一千=百分之10,那么在做一组实验,若是单独访客点击注册按键数=150,是还是不是充裕?能够选择总结学知识张开测算测试结果是否可信。

数码中时常会有一定的有的布满,帮大家询问多少变化规律,如正态遍及,T遍及,卡方布满等。大家关于首页点击景况符合二项布满。

2项布满正是重复n次独立的伯努利试验。在每一遍考试中唯有三种恐怕的结果,而且两种结果产生与否互绝周旋,并且相互独立,与任何各次试验结果非亲非故,事件时有产生与否的票房价值在每1次独立试验中都保持不改变,则那一层层试验总称为n重伯努利实验,当考试次数为一时,2项布满遵从0-三遍及。--【源自百度百科】

二项遍布必要满足以下规则:二种结果;实验相互独立,不相互困扰;事件要依据平等种布满。

平均可能率:p=x/n

考察是或不是符合正态遍布:n*p>5,n(1-p)>5

置信区间宽:m(抽样误差幅度)=z(置信度)*SE(标准差);SE=√ ̄(p(1-p)/n)

μ±1.九陆专门的学问误之间含有全数平平均数量的玖五%,

μ±二.5八正式误之间含有全数平平均数量的9玖%

A/B Test 适用情状

留存明显的对照组和实验组,能够挑选妥当的目标评估此类改换,适合选取A/B Test。

  1. 我们能够透过A/B Test 对相当的大范围的事体进展测试,举例扩展部分新职能,或分界面中扩展的剧情,网址的不等外观等。
  2. 大家还是可以将A/B Test用于十三分复杂的更动,比如名次变动。
  3. 我们也足以针对不明显用户是不是会注意到的转移实行测试,举例页面加载时间。

A/B Test 案举例下:

  1. 亚马逊(Amazon)第一回开端做本性化推荐时,他们想看一下用户是或不是真的会选购越多商品,他们发觉,由于性子化推荐,他们的纯收入有了遐迩闻名扩大。

  2. Linkedin测试了1个改造,尝试鲜明他们是还是不是应体现新小说如故砥砺大家扩充新关系人,那就是排行变动。

  3. 拾0ms的页面加载时间不是许多,不过 谷歌 和 亚马逊(Amazon)都运转了测试。亚马逊 在200七年认证,各个页面扩充 100ms 的延时,会招致收入降低 1%。对于谷歌(Google),也获取了貌似的结果。 你可以窥见,平均来看,100ms 看起来并不多,但每扩充 100ms 的延迟,人们查询的数目实在下落了。

那正是足以从 A/B Test中学到的事物。

为了落到实处那么些目标,从新用户掌握Strava,到他俩先是次选拔那个产品,大家的集团都要为他们的经验肩负。大家的目的就是让用户相信,无论他们是何人,Strava都以帮扶他们实现活动目的的不错抉择。

4、总结显明性分析

假如核准或预计是总计学中的二个概念,以量化的点子,分明你的结果发生的可能率。

先是大家须求3个零假诺或许说基准,也正是对照组和实验组之间的票房价值未有分别,然后要思虑的是备择借使。要想确认保证结果具备总计明显性,那么须要计算结果是突发性出现的可能。要计算那么些可能率,你供给先若是,假如尝试未有效劳结果会怎么,那正是所谓的零假诺,记为Ho,大家还亟需假使假使实验有效,那结果会是如何,那叫做备择即便,记为HA。

合并标准基值误差(实验中观望差距是还是不是享有总括显明性)

Xcont,Xexp;Ncont,Nexp;

Pexp=Xcont/Ncont;Pcont=Xcont/Ncont

Ppool=(Xcont Xexp)/(Ncont Nexp)

SEpool=√ ̄(Ppool*(1-Ppool)*(1/Ncont 1/Nexp))

d=Pexp-Pcont

m=z*SEpool

H0:d=0,d~N(0,SEpool)

if d-1.96*SEpool>0 or d 1.96*SEpool<0,则足以拒绝零假诺,认为差异具备总结显然性

从事商业业角度来讲,贰%的点击概率改培养具有实际显然性。

不等的执行观测样本数量,直接影响实验的卓有成效,那么怎么着安顿科学的A/B测试呢?能够设想动用下方工具,根据输入数值,自动测算合理的实验组和对照组的观看比赛人数。

在线测算实验人数工具

工具表达

Significance level α:明显性水平是估算全体参数落在某一间隔内,大概犯错误的概率,用α表示。显然性是对出入的品位来讲的,程度不等表明引起变动的由来也有不一致:一类是标准差距,一类是轻松差别。它是在开始展览假若核实时事先鲜明五个可允许的作为剖断界限的小概率规范。

Statistical power 1−β:总括成效(statistical power )是指, 在假使核准中, 拒绝原假诺后, 接受科学的轮换假使的概率。大家精通,在若是核查中有α错误和β错误。α错误是弃真错误, β错误是取伪错误。取伪错误是指, 原即使为假,样本观测值未有落在拒绝域中,从而接受原假诺的几率,及在原借使为假的意况下收受原如若的票房价值。由此可见, 总括功用等于一-β。

第二要设计实验,鉴于能够决定对照组和实验组的网页浏览量,大家必必要规定,为博得总计显然性的结果,最能获取计算明显性的结果,这称之为总结功效。功用与范围呈负相关,你想要搜求的更动越小,或许是您想要的结果置信度越高你须求周转的实验规模就越大,那正是对照组和实验组须求越来越多的网页浏览量,我们能够尝尝在总括器中期维修改数据,观看实验样本数量,如修改最低可观望效果,修改规则转化率,修改总括成效,修改明显性水平。

A/B Test 不适用的情形

  1. A/B Test 不只怕真正的告诉您是还是不是遗漏了哪些事物。
    比方:亚马逊(Amazon)想精晓页面上是不是有用户需求,可是他们还不曾提供的货物。那种状态不能够用 A/B Test 来搜索答案。
  2. A/B Test 不适用与测试新的感受。
    举个例子说:某 SaaS 公司现已有了无需付费服务,例如有待办事项列表。他们想提供带有其余效率的高档服务,如需利用高档服务,用户要求进步,创设登入账户,并搜求新的功力。
    那种境况下,也不吻合用 A/B Test 来搜寻答案。
  3. A/B 不适用与须要相当短日子工夫印证的测试。
    譬如:某租房网站,想测试促进用户推荐页面给好友有未有效应,不过那么些职能核准供给非常长日子,或者是一周,恐怕是7个月,一年。因为租房并不是时常发生的。这种景色也不吻合。

除此以外,当您测试新的感受时,你日前已部分那多少个用户,或者会以为改动了她们的经验,那被喻为退换厌恶症;
另一种情景是,他们感觉这一个都是新的,然后尝试全部东西,那被号称新奇效应。

由此数据观望和切磋,大家将协会的对象和实际的连串联系起来,然后经超过实际验不断验证大家提议的比如是或不是适合用户的实际上选拔景况,再随处迭代优化,稳步裁减与对象的异样。

伍、案例实际操作分享

对此不适用情况,补充才能

用户在你的网址上打开操作的日记,能够经过检查或调查分析日志,得出结论,是怎么样来头导致其作为的更动。
下一场恐怕要沿着那个趋势努力,然后设计实验,落成随机化和考察,举行前瞻性分析。

能够把三种手艺整合来选择:
查看操作日志得出假使,运行A/B Test验证你的反驳是不是合理。

还有部分别的技艺:

  1. 用户体验研讨
  2. 难点小组
  3. 调查
  4. 人为评价

A/B Test 能够给大家大量广大的定量数据,而上述能力能够给我们非常中肯的意志数据作为A/B Test 的补给。

那些技能能够告知大家该爬哪座山,约等于近水楼台先得月假若。

规划拉长

伍.一 实验设计背景

案例背景概述:wap首页改版,wap首页作为导流落地页,重要功用为辅导用户落成注册。满意二项遍布

算算最小实验样本:利用上航海用体育场面工具,大家将dmin定为二%,意思是新本子用户转化增添当先二%才使得,置信区间接选举取玖五%,经过计量最小实验样本数为36二三人。

设计A/B 测试

在互联网世界中,当您做 A/B 测试时,要谨记的1件事是,显明用户是还是不是会欣赏这么些新产品或新功效;
为此在进展 A/B 测试时,你的靶子是统一希图一个客观且可以给到您可复验的结果,令你能够很好地控制是还是不是要公布1款产品或效益。

与任何产品设计员同样,增进设计员一定是好好用户体验与秋日业价值的主动促进者,并且,他会一贯力求在七个目的之间实现平衡,那样才具确定保障规划的成品既有着可用性,又具有市场。

伍.贰 实验中须求运用的公式和评估标准

须求获裁撤息:

对待组原首页一按时期内独立访问用户数:Ncont,点击注册按键的独门用户数:Xcont,最小明显性:dmin,置信度区间:95%时z=壹.6捌。

旁观组新版首页一定期间内独立访问用户数:Nexp,点击注册开关的独自用户数:Xexp。

计量合并标准相对误差:

Ppool=(Xcont Xexp)/(Ncont Nexp)

SEpool=√ ̄(Ppool*(1-Ppool)*(1/Ncont 1/Nexp))

d=Pexp-Pcont

m=z*SEpool

(d-m,d m)

通过上诉公式套用,能够计算出d和m值,那么在怎么着景况下得以肯定优化后是或不是具备实际鲜明性,全面推广改版呢?

一般来讲图所示,当d>0时,d-m>dim大家说更新具有显效

当d<0时,d m<-dim,大家得以得出结论,实验版本失利。

其他意况可能得出实验不负有总计分明性,要么供给更进一步调治优化实验。

A/B 测试的点子

貌似的话,在不利领域,假如核实是规定创新的要害措施。
在A/B测试中,大家最想见见的是对照组和实验组重临1致的响应,令你能真正地操纵试验的结构,明显实验组和对照组是或不是有很醒目标表现改换。

增进设计员必须在项目中不止试验、探寻。大家一般会从部分小的规划开始,那样工夫快速学习和稽查假若。

5.3 数值案例分析

经总结大家得出如下数据:

Xcont=97四,Ncont=10072,Xexp=124二,Nexp=9九捌陆,dmin=2%,置信区间接选举拔玖5%,则z=1.九陆

Ppool=(Xcont Xexp)/(Ncont Nexp)=(974 1242)/(10072 9986)=0.111

SEpool=√ ̄(Ppool*(1-Ppool)*(1/Ncont 1/Nexp))=√ ̄(0.111*(1-0.111)*(1/10072 1/9986))=0.00445

d=Xexp/Nexp-Xcont/Ncont=1242/9986-974/10072=0.0289

m=z*SEpool=1.96*0.00445=0.0087

最小值d-m=0.0289-0.0087=0.0202,最大值d m=0.0289 0.0087=0.0376,

因为:d>0,dmin<d-m

为此:实验结果具备总结鲜明性,同时做实超越二%,具备实际显明性,得出结论,新版首页对于注册有越来越好的转向功效,应该代表原版首页。

笔者正在深切学习A/B测试前边的教程,也期望大家能够共同学习并浓密沟通大家在其实工作中的A/B测试意况。

一张图看懂A/B测试

选料和度量目的

在小范围的测试后,若是实验败北了,那就象征那么些战败的实验无法被推广到方方面面用户群众体育中。因而在筹划时,我们会思考如何客观分配轻松的时刻和财富。我们平时问自身:在用户体验中设计有些具体环节对试验结果有正当的又可度量的熏陶呢?假诺未有,大家会把那么些环节的妄图推迟到中期,等近期的实验成功后再做。那种艺术确认保障了我们以压低资本的措施调查假如。

目的的法力

慎选2个或几个目标是因为大家须求,明显什么判断实验组比对照组的优劣。

在支配哪些定义目标在此以前,我们要思量会用这个目的来做哪些。
有三种目的:

  1. 不改变目标
  2. 评估目标

在做试验的还要,大家还交涉论数量,因为我们充足精晓设计的三6玖等必须是足以衡量的。当然,除了数量之外,大家也会通过定性反馈来证实试验的结果。在大品类中,大家会开始展览用户访谈,获取定性数据;而在小品种中,大家在一伊始就能够做可用性测试来开掘用户在使用进度中可能会遭逢的难点。这一个做法保障了大家的安排直接以数量为使得,以用户为主导。

不变目标

用来不改变量检查:那几个目的在实验组和对照组中都不会转移。

例如:

  1. 假如运营二个实验组和三个对照组,比较项目完全是还是不是壹致。比方两组中用户数量是或不是一致;布满是还是不是同样;是还是不是具有可正如的依次国家的用户数量;或相继语言的用户数量;
  2. 目的:必要开始展览那几个完整性检查,确定保证实验能够顺遂施行。
  3. 通过这个不改变目的,大家得以看出实验是不是碰到别的非供给因素的影响,是或不是会对此我们看清结果导致影响。

作者们的布置流程 一. 提议只要

评估目的

用来评估实验效果的目的。通过该目的,相比实验组和对照组是还是不是存在显著性差别,从而判断新功能是还是不是最终被接纳。

万般,我们的增长团队会以小组为单位提议想要验证的比如,以及期待经过试验升高的思想政治工作目标。

何以对目的进行定义?

  1. 要为叁个目的想出二个高档概念,也正是一句话总计,让各样人都能掌握那么些目的。举个例子“活跃用户”或“点击可能率”。
  2. 规定各种细节。举个例子你想测定活跃用户,那您哪些定义活跃?哪些事件能够算为活跃?
  3. 展开单独数据度量之后,你须要将它们计算为1个目标,有点像总结或计数,也许是二个平均值,中位数等
  4. 计算后,就获得了2个1体化的目标定义,能够展开完整性查验。
  5. 最终动用三个目的时,要求思量那个目标是不是广泛适用
  6. 对于评估目的,能够未有那么完美,可是适用于一切测试,能够用来比较;

那么些目的是依据厂家的一体化目的而定的,能够定量,也得以定性,又只怕是双方相结合。

劳累目的

  1. 不能够一向访问他们想要的多寡,不了然怎么总计;
  2. 必要太长期

急需避免。

咱俩的只要就像是教导方向的北极星,使咱们扎实专注于完毕KPI,并保管大家的安排开采专门的学业在原定范围内展开。

目标定义

概念 一(Cookie 概率):对于各类 <时间间隔>,点击的 Cookie 数量除以 Cookie 总量
概念 2(网页流量可能率):<时间间隔> 内点击的网页浏览量除以网页浏览量总的数量
概念 三(比例):点击数除以网页浏览量总的数量

至于数据搜罗和目标定义:

  1. 在进展差距性总括在此以前,大家需求先弄精晓,数据搜聚和目的定义有未有标题;
  2. 内需将定义规则
  3. 出于搜集数据的技能很多,所以要承认使用了哪些手艺

须要思虑目的的敏感性和稳健性

  1. 设计实验

过敏性和稳健性

  1. 可见捕捉到你所关怀的改变的目的,那正是稳健性的概念。当不发生任何风趣的业务时,它不会时有发生太大改观
  2. 何以度量敏感性和稳健性?
    1. 选拔实验或应用你早就局部实验;
      譬如说,在录像延迟示例中,我们可以举行部分简便的试验,我们得以巩固摄像的品质,在答辩上,大家能够扩充用户加载时间,大家得以看看您感兴趣的目的是不是对那种情形做出响应
    2. 也得以选取A/A实验,看它们是不是太敏感
      1. 在那些实验中,你不供给转移任何目标,只将能观察同样音讯的人们实行相比较,看看您的目的是不是出示两者之间的出入
      2. 经过那个首要要素,你能够保障不会将1部分实际并未有此外意义的东西感觉是关键的
    3. 对你记录的回想性分析
      1. 假设您未曾多少,或做不了新的尝试,回头看看你对您的网站做过的退换,看看您感兴趣的这么些目的是还是不是和那么些退换一齐发生了转移;
      2. 要么您能够只看目的历史,看看你是或不是能够寻觅重大更动的缘故

在Starva,各种门类都对应大家总括改进的特定目的。轻巧的目标包含下载和注册率,更盘根错节和深入的指标则囊括用户留存率或位移上传率。

哪些计算目标差距性

我们供给弄清楚,是客观因素导致目标有了变动,照旧改换之后让目的有了变通。比如,学习平台节日假期日流量会增添。

为了更加小心,我们要求为目标总括置信区间。

  1. 急需驾驭其布满情状
  2. 内需掌握目标的方差和标准不是

对此2项布满

  1. 行业内部不是SE = sqrt(β(一-β)/ N)
  2. 置信区间宽度(模型误差范围)m = z*SE
  3. N越大,越趋近李有贞态布满

咱俩把每三回设计都作为一回试验,而实验的目的正是快速学习用户作为,并确认或推翻先前的比如。

案例

对此你选取作为评估目的的种种衡量,若是有陆仟个cookie样本访问课程概述页面的情事下,分析估计一下其正式不是(保留二个人小数)
(注:请保管搞领会各类对应5000次页面浏览的胸襟须要多少分析单位。)

基准值如下:

指标 基准值
每天访问课程概述页面的独立cookie 40000
每天点击“开始试用”的独立cookie 3200
报名参加免费试用的用户数量 660
点进概率 0.08
总转化率 0.20625
留存率 0.53
净转化率 0.1093125

从地点的报表能够见见,点进概率为0.0八

故四千个样本的中,每一天点击“起初试用”的独立cookie为 $陆仟0.08 = 400.0 , 5000660/40000 = 82.5 $

则总转化率的标准不是为:
$sqrt{(0.2063*(1-0.2063)/400)} = 0.0202324189112424 $

净转化率的专门的学业不是为:
$sqrt{(0.1093*(1-0.1093)/400)} = 0.0156007620006204 $

留存率的正儿8经不是为:
$sqrt{(0.53*0.47/82.5)} = 0.0549490121785091 $

为了验证那一点,作者来举例—— Strava的位移标志功用(如下图)。

计量经验方差

解析变异性和经验变异性相配的标准是 unit of analysis = unit of diversion。(分析单元 = 转移单元)

比如说参照上述数据:

  1. 总转化率的辨析单位是cookie,转移单位也是cookie,故总转化率的剖析变异性和经历变异性相配;
  2. 净转化率的剖析单位是cookie,转移单位也是cookie,故净转化率的解析变异性和经验变异性也协作;
  3. 留存率的解析单位是user-id,转移单位是cookie,故留存率的分析变异性和经历变异性不相配,依照经验总计的变异性恐怕会远大于分析变异性。在那种气象下,应该为留存率收罗变异的经历揣摸。

借使条分缕析单元和转变单元不等于的境况下,在规则允许的景况下,我们得感到目标收罗变异的经历揣测。

经历方差的乘除方法:

  1. 使用A/A实验
    1. 二个比较组A相比别的2个相比组A,实际上用户观察的事物是从未有过什么样改观的,意味着你观看到的富有出入,都是私人住房的差距性
    2. 能够利用A/A实验实际测试目标的敏感性和创立,固然在A/A实验中,目的的差别性相当的大,大概在A/B测试时,敏感性太高
    3. 从而能够用A/A实验来测试差距性
    4. 运作更加多的A/A测试,会有深入人心的分界效益递减
    5. 三个最重要的经验法则正是:规范不是与样本量的平方根成正比
  2. 做二个规模一点都不小的A/A实验,在总括学中有种形式叫 bootstrap(自助法),你能够将洋洋的范本随机地划分为一群小样本群,然后能够对那些随机地子集实行自己检查自纠

计算经验分布的收益:

  1. 健全性检查

    1. 假设您曾经对置信区间完成的辨析盘算,你可以检查A/A测试结果是或不是符合您的预料,这是一种完整性检查效用
    2. 1经您检查出不吻合您的意料,注解你的测算出了错,也许你对数据遍及的假使是没用的
  2. 算算置信区间

    1. 假若你想要对目标布满进行借使,可是不能够分析估计方差,你能够通超过实际证估摸方差,然后用你关于遍布的借使,遵照事先的格局测算置信区间
    2. 比如您不想对数据做出任何如果,你能够间接从A/A测试的结果中估摸置信区间
    3. 假使置信区间为玖伍%,实际有40组值,那去掉最小值和最大值,所得的界定即为置信区间

未完待续,请查看下一篇。

本文由必发88官网发布于娱乐资讯,转载请注明出处:国外运动社交平台,如何利用A

关键词: 必发88官网 设计 开发 用户体验