数据分析中最常用的统计学模型 A/B test

原标题:数据分析中最常用的统计学模型 A/B test过则损,不达则无效 独立双样本检验:A\B test

A/B 测试:简单来说,就是为同一个目标制定两个方案(比如两个手机键盘界面),让一部分用户使用 A 方案,另一部分用户使用 B 方案,记录下用户的使用情况,看哪个方案更符合设计。可以看出AB测试对于产品优化有很大的帮助

案例介绍:有两款键盘布局不一样的手机(A版本,B版本),你作为公司的产品经理,想在正式发布产品之前知道,哪个键盘布局对用户体验更好呢

一、描述统计分析

1. 导入分析包和样本数据集:

二、推论统计分析

通过观察上面数据集分布图,两个样本数据集都近似正态分布,满足t分布的使用条件,所以抽样分布是t分布

检验方向

单尾检验(左尾,右尾),还是双尾检验?

因为备选假设是A版本和B版本有差别,也就是A版本平均值 不等于 B版本平均值,所以我们使用双尾检验

综合以上分析,本次假设检验是双独立样本t检验,双尾检验。

拒绝零假设,有统计显著,也就是接受备选假设

备选假设:A版本和B版本有差异

独立双样本t(45)=-4.05 , p=.00019 (α=5%),双尾检验

统计上存在显著差异,拒绝零假设,从而验证A版本和B版本存在显著差异。

置信区间

在报告告置信区间时,提供了这样几个信息: 1)开头会说是哪种类型的置信区间 例如在单样本检验中是单个平均值的置信区间,但是在我们后面要讲到的相关样本检验是两个平均值之间差异的置信区间。 在这个案例里,我们是单个平均值的置信区间 2)置信水平和区间的上下限。 置信水平(简写为CI),括号里写上下限。这里是95%的置信水平

效应量

在判断某个调查研究的结果,是否有意义或者重要时,要考虑的另一项指标是效应量。效应量太小,意味着处理即使达到了显著水平,也缺乏实用价值。

所以,在假设检验中,我们给出了是否具有统计显著性,也要给出效应量,一起来判断研究结果是否有意义。

效应量报告格式:d=x.xx ,R2=.xx

三、数据分析报告

1、描述统计分析

A版本打错字数量 平均是5.08个,标准差是2.06个

B版本打错字数量 平均是7.8个,标准差是2.65个

2、推论统计分析 1)假设检验 独立双样本t(45)=-4.05 , p=.00019 (α=5%) , 双尾检验

拒绝零假设,统计显著。

2)置信区间 两个平均值差值的置信区间, 95%置信水平 CI=[-2.76,-2.68]

3)效应量 d= - 1.32,效果显著

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();