美文网首页
A/B测试-样本比例不匹配(SRM)问题诊断方法

A/B测试-样本比例不匹配(SRM)问题诊断方法

作者: allanYan | 来源:发表于2023-06-28 13:49 被阅读0次

概论

在A/B测试运行过程中,经常会遇到对照组和实验组的进组用户比例与实验开始前配置的用户比例之间的显著差异;对这种不成比例的数据进行分析可能产生错误的结果;为了防止这种危害,每个A/B测试在分析其影响之前必须首先通过这个样本比例不匹配(Sample Ratio Mismatch,SRM)测试。

解决思路

T检验

当使用只有对照组和一个实验组时,可以认为用户要么进入对照组,要么进入实验组,服从伯努利分布(0-1分布),当用户数足够多时,可以认为服从正态分布,可以用单样本均值T检验;
单样本均值T检验主要是检验单样本的均值是否和已知总体的均值相等,假设对照组的进组人数为n_{ctr},实验组的进组人数为n_{exp}

H_0: 样本均值和已知总体的均值相等
H_1: 样本均值和已知总体的均值不等

t=(\overline X-\mu ) \over {s \over \sqrt n}

  1. \overline X=n_{ctr} \over n_{ctr} +n_{exp},为样本均值
  2. \mu为整体均值,对于50:50试验,为0.5;
  3. s=\sqrt {p(1-p)}:在大样本的情况下,二项分布的计算会很麻烦,当np和n(1-p)都大于5时可以采用正态来近似s=\sqrt {p(1-p)},;
  4. n=n_{ctr}+n_{exp}
  5. 自由度为n_{ctr} +n_{exp} -1

例子:50:50的AB试验,对照组的入组用户为2157455,实验组为2158281
\overline X-\mu=2157455/(2157455+2158281)-0.5=0.4999-0.5=0.0000957
s \over \sqrt n=0.5/2077.434=0.00024
t=0.39875
p=0.69
由于p>0.05,则不能拒绝原假设;

卡方检验

卡方拟合优度可以用于实际比例与期望比例的校验:

X^2=\sum_1^n{(O_i-E_i )^2 \over E_i}
n是表格的单元格梳理,O_iE_i分别是实际观察值到和预期值;
X^2分别的自由度为(r-1)(c-1), r和c分别是表格的行数和列数

点数 观测频次 理论频次
对照组 2157455 2157868
试验组 2158281 2157868

X^2=(2157455-2157868)^2/2157868+(2158281-2157868)^2/2157868=0.15809030024079324
自由度为1,查询卡方表得到p=0.69
由于p>0.05,则不能拒绝原假设;

相关文章

  • 描述统计学

    研究方法入门 考虑因素: 测试样本 测试方法 样本数量 样本范围 隐藏变量 总体参数(总体均值)mu是用来描述整个...

  • 通过分析鸢尾花数据学习K-近邻算法

    一、算法整体思路 按照比例切分测试集和训练集 选取特征值,对训练集建模 对于任一测试数据样本,通过计算该样本到每个...

  • 机器学习样本不均衡问题

    解决方案1:上采样或者下采样解决方案2:给样本配置比例系数,样本比例大的比例系数小,样本比例小的比例系数大。解决方...

  • CSS篇 - 样式匹配规则

    (一)问题描述 1、css规则匹配规则 2、css文件匹配顺序 3、.a, .b, .a .b, .a.b...

  • 网友的实验记录

    转载自网络 数据样本: 分为训练数据和测试数据,A表示带眼镜的样本,B表示无眼镜的样本 trainA有1185个样...

  • 体外诊断与NGS

    1 体外诊断 体外诊断(IVD)是一种在人体外检验血液、尿液等人体样本进而判断疾病或身体功能的诊断方法。目前,全球...

  • 2020版 北美精算师考试 SOA Exam IFM: Inve

    还有STAM、LTAM、SRM的ca视频,欢迎咨询。 获取方式——可以联系微信:ActuaryBook预览高清样本...

  • SOA北美精算师考试教材资料 ASM Manual 高清PDF

    获取方式——可以联系微信:ActuaryBook预览高清样本,还有IFM、STAM、LTAM、SRM等的ca视频,...

  • 构建置信区间

    总体平均数的置信区间 问题: 样本中喝咖啡的人的比例是多少?不喝咖啡的人的比例是多少? 在喝咖啡的人中,他们的平均...

  • plt和sns画图

    样本比例 概率分布

网友评论

      本文标题:A/B测试-样本比例不匹配(SRM)问题诊断方法

      本文链接:https://www.haomeiwen.com/subject/jgfnydtx.html