当前位置:网站首页>复杂AB实验
复杂AB实验
2022-08-10 06:38:00 【Coco-Lele】
1. 基本问题
检验指标分类
AB测试的检验指标可以分为两大类:绝对值指标、比例值指标。两者的方差计算方式不同。
其中比例值根据分母不同又可分为两类:分母为人次(留存率、转化率等)、分母为行为次数(曝光点击率)。
分母为人次,分流单位和分析单位相同,可以用 z z z检验;分母为行为次数,分析单位之间不独立,要用 d e l t a delta delta检验。
多天累计值
将指标在多天的表现累计合并计算。比如某行为的人均次数,则分母是实验期间该行为的总次数,分子是实验期间进组的去重人数。
优点:保证样本之间独立;增加样本量,显著性可以随着累积而增加。
留存率的多天累计:分天计算每天新进组人的留存率,再根据人数加权。
不能用AB的情况
- 不能控制干预变量时(比如看直播对用户的影响,不能强制一部分人看,一部分人不看)
- 所占用流量过多
- 策略可能损害用户体验
AB实验步骤
确定实验策略;制定实验的观察指标;计算样本量(显著性水平/统计功效/需要观察到的指标最小提升水平/指标方差);实验开发上线;数据回收。
AB不显著
- 是否达到最小样本量
- DID消除固定差异
- 检查实验链路,看是否所有人都被策略触达(渗透率低,可以PSM)
2. delta检验
见上篇,适用于分流单元和分析单元不同的情况。
3. 贝叶斯检验
优点:
- 不需要考虑样本量。
- 可以得到后验参数的分布,进而量化指标提升的概率、指标提升的大小。
贝叶斯派 VS 频率派 基本理论:
先验分布 π ( θ ) \pi(\theta) π(θ) + 样本数据 P ( X ∣ θ ) P(X|\theta) P(X∣θ) = 后验分布 π ( θ ∣ X ) \pi(\theta|X) π(θ∣X)
共轭先验分布:贝塔分布 与 二项分布
θ \theta θ~ b e t a ( α , β ) beta(\alpha, \beta) beta(α,β), X X X~ B i n o m i a l ( n , p ) Binomial(n, p) Binomial(n,p), 则 θ ∣ X \theta|X θ∣X~ b e t a ( x + α , n − x + β ) beta(x+\alpha, n-x+\beta) beta(x+α,n−x+β)
4. 不同假设检验
z z z检验:大样本数据均值检验(不区分分布,中心极限定理;不区分方差是否已知,n>30时t分布和z分布相似)
t t t检验:小样本正态数据均值检验(小于30,方差未知)
F F F检验:方差齐性检验;单因素方差分析,检验分类变量各个水平取值的影响。
卡方检验:本质是检验样本频数和期望是否一致。可用于检验两组离散变量之间的相关性(列联表);检验实际分布和期望分布之间的相似度,非参数检验多用于分类变量。
X 2 = Σ ( X − E ) 2 / E X^2=\Sigma(X-E)^2/E X2=Σ(X−E)2/E
令 E = n p E=np E=np,可得正态分布的平方。k k k- s s s检验:样本是否满足特定分布;看样本累计分布和理论累计分布的差的最大值。
DID
y = α 1 ∗ t r e a t m e n t + α 2 ∗ p o s t + α 3 ∗ t r e a t m e n t ∗ p o s t + u y=\alpha_1*treatment + \alpha2 * post + \alpha_3*treatment*post+u y=α1∗treatment+α2∗post+α3∗treatment∗post+u
α 3 \alpha_3 α3代表政策的净效应
平行趋势检验
参考文献
AB实验面试
https://www.jiqizhixin.com/articles/2020-09-18-2
https://blog.csdn.net/deephub/article/details/112167937
边栏推荐
- 语法基础(判断语句)
- Tencent Cloud Song Xiang: Kubernetes cluster utilization improvement practice
- 2022 Henan Mengxin League Game (5): University of Information Engineering K - Matrix Generation
- 简单业务类
- 1413. Stepwise Summation to Get Minimum Positive Numbers
- 英国国家卫生服务遭受攻击,系统出现大面积故障
- 浏览器适配杂记
- SCS【2】单细胞转录组 之 cellranger
- ACPI知识(高级配置和电源接口)
- 深入理解数组
猜你喜欢

ebp/栈帧/call stack

几行代码就可以把系统高崩溃;

pytest之parametrize参数化

761. Special Binary Sequences

金融证券 初级 招股书 要求 黑话1刷数 黑话2底稿 黑话3董监高

XV6 swtch.S详解

1413. 逐步求和得到正数的最小值

Text-to-Image最新论文、代码汇总

Fiddler(八) - 抓取手机APP的流量-插件Fiddler Orchestra Beta安装&配置
![Chapter 12 Other Database Tuning Strategies [2. Index and Tuning] [MySQL Advanced]](/img/6d/f7fffb327f3191ac4c5a3dc7808c89.png)
Chapter 12 Other Database Tuning Strategies [2. Index and Tuning] [MySQL Advanced]
随机推荐
语法基础(判断语句)
Hypervisor, KVM, QEMU总结
2022 Henan Mengxin League No. 5: University of Information Engineering J-AC Automata
数据库学习之数据类型
关于MongoDb查询Decimal128转BigDecimal问题
2022河南萌新联赛第(五)场:信息工程大学 K - 矩阵生成
深入理解LTE网络的CDRX
求职
交换机的功能和ipv4
Qt使用私有接口绘制窗口阴影
ESP32 485风速
3-6月面经总结,200多页真题笔记和详解(含核心考点及6家大厂)
调试ZYNQ的u-boot 2017.3 不能正常启动,记录调试过程
CuteOneP is a PHP-based OneDrive multi-network disk mount program with member synchronization and other functions
DRM Memory Management
The constraints of the database learning table
Excuse me.Oracle CDC connector supports LogMiner and XStream API two ways to capture
[网络安全]实操AWVS靶场复现CSRF漏洞
All articles summary directory
Bigder:42/100 showCase多少bug可以打回去