卡方检验
01) 来源定义
Xi 取自N (0,1), 则 X1-Xn的平方和,服从卡方分布(n自由度)
02)在抽样分布中,(n-1)s2 /sigma2 服从卡方分布(n-1自由度)
求和(X-mu)/sigma2 ,中mu未知时,改为 样本统计量 - 样本均值代替,也是正态总体,但是自由度下降了一个单位,因此是n-1。
03)单样本方差检验 ( 与已知方差比较)
H0: sigma02 = sigmaB2(sigma0 已知)时, 统计量 (n-1)sB2 /sigma02 服从卡方分布
备择假设 sigma B > sigma 0 拒绝域 为右侧, sigma B < sigma 0 拒绝域 为左侧, sigma B <> sigma 0 拒绝域 为两侧
04)列联表卡方检验 ( Contingency table )
H0: PA= PB = PC , (如列:卖场A,B,C,行:手机,I,II,III, 则假设A/B/C 3个水平的卖场中,手机I,II,III卖出去的比例一样)
算出列表里的实际数值Q, 算出其期望E = ( 卖场总手机数 * 机型比例 )
则 求和(Q-E)2/E 服从 卡方分布( R-1)(C-1) 行列数-1的乘积
note: a.需要大样本量,每个期望>=5 )
b. 离散变量因子独立性(相关性)检验 也是通过这个的
c. 越大越不符合,右侧检验,拒绝域为 卡方值 >= c (临界值)
d. 拟合优度检验是由列联表卡方检验实现的,只需要将 求和(Q-E)2/E 算出的卡方值 转化为p值,就是拟合优度值 ;
05) 正态分布的拟合优度检验
将分布分成几块,每一块都有期望值 与观察值,就跟04类似,算卡方分布值。
区间设立条件: a) 区间累计概率n*p>=5 p>=5/n b) 自由度 ,样本均值 -1,标准差 - 1 DF = K-1-1-1 >0, 所以 分成 4块以上
F检验
1)来源定义
抽样 于 卡方W1(v1) , 卡方W2(v2),则 (W1/v1) / (W2/v2) 服从F分布(F(v1,v2)),
它跟卡方分布长得很像,有2个自由度,在自由度越来越大的情况下,趋近于正态分布
2) 双样本方差检验
变形:将卡方值 (n-1)s2 /sigma2 带入
F = ( S12/sigma12 ) / ( S22/sigma22 ) --------- (1)
H0 : 两个正态分布,假设 sigma1 = sigma 2 , 则 A 总体的 样本集 m ,与 B总体的样本集n ,可以得到一个 F分布的统计量 (1) 如方差一样,则可以约掉, F = S12 / S22 符合F分布
如果 H0成立,则F不会落在 F分布的两边。 (因为 该的统计量 在大量无数次取值以后是符合F分布的,越中间越是期望 概率发生的越大,越往2边越小)
H1 备择假设,跟拒绝域配对 ( <> 取两边,>取右边,<取左边 )
3) 离差均方和检验 ( 方差,回归,实验设计中,起基石的作用)
需注意: 对方差特别敏感