r - 如果使用预期比例而不是 R 中的计数,则卡方结果不相等
问题描述
在不同月份测试来自同一事实的两个样本之间的拟合优度。我想知道 9 月的 4 个类别的结果是否与 10 月相似/不同。
问题是我的测试在使用列联表与将上个月作为预期比例的预期比例时给了我不同的结论。
样本数据:
data <-data.frame(september=c(10741, 1575, 174, 2),
october= c(11987, 1705, 211, 2),
row.names = c("A", "B", "C", "D"))
> data
september october
A 10741 11987
B 1575 1705
C 174 211
D 2 2
使用列联表测试通常的方法:
> chisq.test(data)
Pearson's Chi-squared test
data: data
X-squared = 1.3846, df = 3, p-value = 0.7092
从 9 月开始计算比例并将其设置为预期概率:
p <- data$september %>% prop.table()
[1] 0.8598302914 0.1260806916 0.0139289145 0.0001601025
chisq.test(x=data$october, p = p)
Chi-squared test for given probabilities
data: data$october
X-squared = 2.9748, df = 3, p-value = 0.3955
为什么在测试中有这样的差异?哪一个是错的?我认为这两种策略会导致相同的结果,但似乎是一个错误。
解决方案
推荐阅读
- php - laravel upload_max_filesize 限制为 0 KiB linux
- adsense - 使用 Adsense Management API 从特定 URL 获取总收入
- python - 通过 Python 发送邮件,自定义正文
- php - 多列对齐的 PHP 下拉菜单
- python - 如何在视图之外访问使用 Flask 应用程序对象实例化的对象?
- python - Matplotlib:subplots 函数需要很长时间才能执行
- reactjs - 如何在单击列表项上呈现组件以显示其详细信息?
- flutter - 增加 AppBar 前导属性的宽度
- python - Python3.7如何使用pydensecrf?
- python-3.x - 转换字符串列表中的变量列表