首页 > 解决方案 > 如果使用预期比例而不是 R 中的计数,则卡方结果不相等

问题描述

在不同月份测试来自同一事实的两个样本之间的拟合优度。我想知道 9 月的 4 个类别的结果是否与 10 月相似/不同。

问题是我的测试在使用列联表与将上个月作为预期比例的预期比例时给了我不同的结论。

样本数据:

data <-data.frame(september=c(10741, 1575, 174, 2),
          october= c(11987, 1705, 211, 2), 
          row.names = c("A", "B", "C", "D"))
> data
  september october
A     10741   11987
B      1575    1705
C       174     211
D         2       2

使用列联表测试通常的方法:

> chisq.test(data)

Pearson's Chi-squared test

data:  data
X-squared = 1.3846, df = 3, p-value = 0.7092

从 9 月开始计算比例并将其设置为预期概率:

    p <- data$september %>% prop.table()

    [1] 0.8598302914 0.1260806916 0.0139289145 0.0001601025

 chisq.test(x=data$october, p = p)

    Chi-squared test for given probabilities

data:  data$october
X-squared =  2.9748, df = 3, p-value = 0.3955

为什么在测试中有这样的差异?哪一个是错的?我认为这两种策略会导致相同的结果,但似乎是一个错误。

标签: rstatisticsgoodness-of-fit

解决方案


推荐阅读