首页 > 技术文章 > T检验/卡方检验/F检验/列联表/方差分析

leoyes 2021-07-21 10:16 原文

卡方检验

01) 来源定义

  Xi 取自N (0,1), 则 X1-Xn的平方和,服从卡方分布(n自由度)

02)在抽样分布中,(n-1)s2 /sigma2  服从卡方分布(n-1自由度)

  求和(X-mu)/sigma2 ,中mu未知时,改为 样本统计量 - 样本均值代替,也是正态总体,但是自由度下降了一个单位,因此是n-1。

03)单样本方差检验 ( 与已知方差比较)

   H0:  sigma02 = sigmaB2(sigma0 已知)时,  统计量 (n-1)sB2 /sigma02  服从卡方分布    

  备择假设 sigma B > sigma 0 拒绝域 为右侧, sigma B < sigma 0 拒绝域 为左侧,  sigma B <> sigma 0 拒绝域 为两侧

04)列联表卡方检验 ( Contingency table )

  H0: PA= PB = PC ,   (如列:卖场A,B,C,行:手机,I,II,III, 则假设A/B/C 3个水平的卖场中,手机I,II,III卖出去的比例一样)

  算出列表里的实际数值Q, 算出其期望E =  ( 卖场总手机数 * 机型比例 )

  则 求和(Q-E)2/E 服从 卡方分布( R-1)(C-1) 行列数-1的乘积

   note:   a.需要大样本量,每个期望>=5 )

      b. 离散变量因子独立性(相关性)检验 也是通过这个的

      c. 越大越不符合,右侧检验,拒绝域为 卡方值 >= c (临界值)

      d. 拟合优度检验是由列联表卡方检验实现的,只需要将  求和(Q-E)2/E  算出的卡方值 转化为p值,就是拟合优度值 ;  

05) 正态分布的拟合优度检验

      将分布分成几块,每一块都有期望值 与观察值,就跟04类似,算卡方分布值。

  区间设立条件: a)  区间累计概率n*p>=5   p>=5/n     b) 自由度 ,样本均值 -1,标准差 - 1    DF = K-1-1-1 >0, 所以 分成 4块以上

 

F检验

1)来源定义

  抽样 于 卡方W1(v1) , 卡方W2(v2),则 (W1/v1) /  (W2/v2) 服从F分布(F(v1,v2)),

    它跟卡方分布长得很像,有2个自由度,在自由度越来越大的情况下,趋近于正态分布

 2)  双样本方差检验

    变形:将卡方值 (n-1)s2 /sigma2  带入

      F =   ( S12/sigma12 )  /  ( S22/sigma22 )   ---------  (1)

    H0 : 两个正态分布,假设 sigma1 = sigma 2 , 则 A 总体的 样本集 m ,与 B总体的样本集n ,可以得到一个 F分布的统计量  (1) 如方差一样,则可以约掉, F = S12 / S22  符合F分布

    如果 H0成立,则F不会落在 F分布的两边。 (因为 该的统计量 在大量无数次取值以后是符合F分布的,越中间越是期望 概率发生的越大,越往2边越小)

    H1 备择假设,跟拒绝域配对 ( <> 取两边,>取右边,<取左边 )

3) 离差均方和检验 ( 方差,回归,实验设计中,起基石的作用)

 

 

需注意: 对方差特别敏感

 

推荐阅读