首页 > 解决方案 > R:显着性检验,两个比例,一个样本

问题描述

我试图找出来自同一样本的两个比例是否不同。

(让我们想象一下)我有一个包含 200 个答案的样本: 120 个喜欢甲方,100 个喜欢乙方 可以同时喜欢两个派对。

我想测试一下喜欢甲方或乙方的比例是否存在显着差异。

我看到了几种方法来回答这个问题,但它们似乎都没有让我真正满意:

prop.test(x = c(120, 100), n = c(200, 200))

这给出:p-value = 0.05619(甲方和乙方的喜欢比例没有差异)。然而,这并没有考虑到 120 和 100 不独立的事实。

prop.test(x = 120, n = 200)
prop.test(x = 100, n = 200)

这给出了 95% 的比例:[0.5283160, 0.6677775] 表示喜欢甲方,[0.4313609, 0.5686391] 表示喜欢乙方。这些置信区间重叠,因此甲方和乙方的喜欢比例没有差异。但是两个置信度置信度为 95% 的区间不能进行置信度为 95% 的显着性检验。

prop.test(x = 20, n = 200)

95% 置信区间为 [0.06366294 0.15229666],这不包括 0。甲方的点赞比例与乙方明显不同。这告诉我 200 人中有 20 人不是 0%,但这正是我想要的知道吗?

我不确定这三个选项实际上告诉我什么,有没有更好的方法来回答我原来的问题?

标签: rstatisticssignificancesample-data

解决方案


推荐阅读