当前位置:网站首页>复杂AB实验
复杂AB实验
2022-08-10 06:38:00 【Coco-Lele】
1. 基本问题
检验指标分类
AB测试的检验指标可以分为两大类:绝对值指标、比例值指标。两者的方差计算方式不同。
其中比例值根据分母不同又可分为两类:分母为人次(留存率、转化率等)、分母为行为次数(曝光点击率)。
分母为人次,分流单位和分析单位相同,可以用 z z z检验;分母为行为次数,分析单位之间不独立,要用 d e l t a delta delta检验。
多天累计值
将指标在多天的表现累计合并计算。比如某行为的人均次数,则分母是实验期间该行为的总次数,分子是实验期间进组的去重人数。
优点:保证样本之间独立;增加样本量,显著性可以随着累积而增加。
留存率的多天累计:分天计算每天新进组人的留存率,再根据人数加权。
不能用AB的情况
- 不能控制干预变量时(比如看直播对用户的影响,不能强制一部分人看,一部分人不看)
- 所占用流量过多
- 策略可能损害用户体验
AB实验步骤
确定实验策略;制定实验的观察指标;计算样本量(显著性水平/统计功效/需要观察到的指标最小提升水平/指标方差);实验开发上线;数据回收。
AB不显著
- 是否达到最小样本量
- DID消除固定差异
- 检查实验链路,看是否所有人都被策略触达(渗透率低,可以PSM)
2. delta检验
见上篇,适用于分流单元和分析单元不同的情况。
3. 贝叶斯检验
优点:
- 不需要考虑样本量。
- 可以得到后验参数的分布,进而量化指标提升的概率、指标提升的大小。
贝叶斯派 VS 频率派 基本理论:
先验分布 π ( θ ) \pi(\theta) π(θ) + 样本数据 P ( X ∣ θ ) P(X|\theta) P(X∣θ) = 后验分布 π ( θ ∣ X ) \pi(\theta|X) π(θ∣X)
共轭先验分布:贝塔分布 与 二项分布
θ \theta θ~ b e t a ( α , β ) beta(\alpha, \beta) beta(α,β), X X X~ B i n o m i a l ( n , p ) Binomial(n, p) Binomial(n,p), 则 θ ∣ X \theta|X θ∣X~ b e t a ( x + α , n − x + β ) beta(x+\alpha, n-x+\beta) beta(x+α,n−x+β)
4. 不同假设检验
z z z检验:大样本数据均值检验(不区分分布,中心极限定理;不区分方差是否已知,n>30时t分布和z分布相似)
t t t检验:小样本正态数据均值检验(小于30,方差未知)
F F F检验:方差齐性检验;单因素方差分析,检验分类变量各个水平取值的影响。
卡方检验:本质是检验样本频数和期望是否一致。可用于检验两组离散变量之间的相关性(列联表);检验实际分布和期望分布之间的相似度,非参数检验多用于分类变量。
X 2 = Σ ( X − E ) 2 / E X^2=\Sigma(X-E)^2/E X2=Σ(X−E)2/E
令 E = n p E=np E=np,可得正态分布的平方。k k k- s s s检验:样本是否满足特定分布;看样本累计分布和理论累计分布的差的最大值。
DID
y = α 1 ∗ t r e a t m e n t + α 2 ∗ p o s t + α 3 ∗ t r e a t m e n t ∗ p o s t + u y=\alpha_1*treatment + \alpha2 * post + \alpha_3*treatment*post+u y=α1∗treatment+α2∗post+α3∗treatment∗post+u
α 3 \alpha_3 α3代表政策的净效应
平行趋势检验
参考文献
AB实验面试
https://www.jiqizhixin.com/articles/2020-09-18-2
https://blog.csdn.net/deephub/article/details/112167937
边栏推荐
猜你喜欢
随机推荐
May I ask why sqlserver cdc will report this error one day after the task is started, obviously cdc has been opened.
Chapter 12 Other Database Tuning Strategies [2. Index and Tuning] [MySQL Advanced]
Parallax Mapping: More Realistic Texture Detail Representation (Part 1): Why Use Parallax Mapping
2022河南萌新联赛第(五)场:信息工程大学 K - 矩阵生成
All articles summary directory
关于研究鼠标绘制平滑曲线的阶段总结
ebp/栈帧/call stack
Lunix(阿里云服务器)安装Anaconda并开启jupyter服务本地访问
Reproduce dns out-band data combined with sqlmap
直接跳转与间接跳转
mysql数据库月增长量问题
英国国家卫生服务遭受攻击,系统出现大面积故障
软件测试面试题避雷(HR面试题)最常见的面试问题和技巧性答复
MVCC详解
MySQL之InnoDB引擎(六)
基于ABP的AppUser对象扩展
椭圆曲线离散对数问题以及求解
Data types for database learning
求职
H3C文档NAT专题