ab-testing - 如果处理效果已经大于功效分析期间使用的 δ(效果大小),您是否还需要在 A/B 测试之后进行显着性测试?
问题描述
假设我们正在设计一个 A/B 测试。我们执行以下步骤:
- 使用预定义的 δ(效应大小)、α 和 β 执行功率分析以设置样本大小。
- 使用步骤 1 中确定的样本量运行 A/B 测试
- 对A/B测试结果进行显着性测试,看治疗效果是否显着。
问题是,如果从第 2 步,我们可以看到治疗效果已经 > δ,我们还需要第 3 步吗?
解决方案
你绝对仍然需要做一个重要的测试。这应该是 A/B 测试中相当微不足道但至关重要的部分。在大多数情况下,您应该能够从功率计算中借用工作,但我不会捷径并完全跳过显着性检验。我能想到几个重要的原因:
- 标准误差可能高于预期,因此即使您的治疗效果更高,结果仍可能缺乏统计学意义。
- 获得 p 值是 A/B 测试的重要结果。了解结果的重要性可能不会改变您的决定,但它有助于解释实验,尤其是当您必须将其与其他 A/B 测试进行比较时。
- 了解置信区间很重要。所有结果都是模糊的,确切地知道您的 A/B 测试结果有多模糊或准确通常有助于更多地了解您的治疗效果。
如果您已经完成了功效分析,那么运行统计测试应该相当容易。
推荐阅读
- vhdl - 带 D 触发器的 2 位向上 4 位计数器 - VHDL
- symfony - 作曲家,捆绑中的(symfony)包的哪个版本?
- java - 如何在for循环的每个循环中创建一个新数组
- vector - 使用枚举存储多种类型时,向量的内存分配如何有效?
- c# - Windows10中每个人都有相同的文件目录吗
- python - pyinstaller生成的exe不可执行
- python - Pandas - 加载数据框并显示所有列
- python - 在 Pandas 数据帧上计算时,仅对函数中的一些参数进行矢量化
- excel - VBA 代码中的多个 IF 语句可根据另一列从多列中提取不同的单元格值。
- azure-notificationhub - Azure 通知中心如何在标记表达式中使用安装 ID?