首页 > 技术文章 > H-W平衡

Acceptyly 2014-08-20 19:55 原文

hardy-weinberg平衡:标准定义————
如果一个种群符合下列条件:1.种群是极大的;2.种群个体间的交配是随机的,也就是说种群中每一个个体与种群中其他个体的交配机会是相等的;3.没有突变产生;4.种群之间不存在个体的迁移或基因交流;5.没有自然选择,那么,这个种群的基因频率(包括基因型频率)就可以一代代稳定不变,保持平衡。这就是遗传平衡定律,也称哈代c温伯格平衡。
实际应用中——
做多态性等遗传分析首先要对数据结果进行hardy-weinberg平衡分析,当然——如果是病例对照研究的话,病例组由于该遗传多态可能与疾病有关联的话,很可能不符合hardy-weinberg平衡,此时也是正常现象,但是对照组无论如何都要符合这个平衡的。

 

哈代-温伯格平衡定律(Hardy-Weinberg equilibrium),即HW平衡,是指对于一个大且随机交配的种群,基因频率和基因型频率在没有迁移、突变和选择的条件下会保持不变。
它是建立在一个理想的群体模式上的,有四个假设前提:1.群体无限大;2.随机婚配;3.没有突变;4.没有大规模迁移和选择因素的影响。其结论是群体中的基因频率和基因型频率在逐代传递中保持不变。
实际上这种理想群体的条件不可能完全满足,但经过数学推导,在一个群体中,基因频率和基因型频率在每一代都是恒定的,即使未达到平衡的群体,只需繁殖一代即可重新达到平衡。
其一个重要意义在于对抽样调查的结果进行检验,评估所研究的对象群体是否符合HW平衡,从而评估群体调查资料的可靠性,特别是在遗传流行病学关联研究中。
通常采用吻合度检验运用卡方统计量衡量基因型数目的观察值与该位点上全部基因型频率分布在符合HW平衡时的期望值之间的吻合程度。一般以P=0.05作为显著性水平的界值,P>0.05说明所调查的群体达到遗传平衡,即本次群体调查的数据可信;反之,P<0.05时,需要考虑以下问题:1.被调查的群体是否处于遗传平衡状态;2.遗传标记(如SNP)分型的技术或标准是否出现误差;3.是否达到随机抽样的要求。特别是后两点需要注意!

 

举个例子,如下:

1,三个基因类型(genotype)实际数(O):
AA---AB---BB
1787 3039 1303 总数 N=6129

2,等位(allele)频率
F(A) = (1787 + 3039/2) / 6129 = 0.54 = p
F(B ) = (1303 + 3039/2) / 6129 = 0.46 = q … and S(p,q)=1

3,期待genotype频率:
期待AA 频率: p2 = (0.54)2 = 0.2916
期待AB频率: 2pq = 2x 0.54 x 0.46 = 0.4968
期待BB 频率: q2 = (0.46)2 = 0.2116

4, 期待genotype数 (Q):
期待AA : p2N = 0.2916 x 6129 = 1787.2
期待AB : 2pqN = 0.4968 x 6129 = 3044.9
期待BB : q2N = 0.2116 x 6129 = 1296.9

5, 卡方值
X2 = (OAA-QAA)2[平方]/QAA + (OAB-QAB )2[平方]/QAB + (OBB-QBB )2[平方]/QBB

再根据X2求出P值!!

 

 

文献:遗传流行病学研究中的H-W平衡检验

http://www.docin.com/p-91862556.html

 

 

在HWE检测中常用的是Pearson goodness-of-fit test,也就是我们常说的卡方检验因为近似于卡方分布。虽然这种方法容易计算,但是近似度不高特别是基因型数很低的时候,所以目前用Fisher exact test替代。

我给大家介绍一个目前公认source code! 分别用R,C/C++,Fortran写的!

若用此source code,写文章时候需引用如下:

A Note on Exact Tests of Hardy-Weinberg Equilibrium.

Wigginton JE, Cutler DJ and Abecasis GR

Am J Hum Genet (2005) 76: 887-93

 

【求助】请问HEW检验的结果是怎么看的。P要大于还是小于多少?谢谢
slisten wrote:
Sample size is one aspect, but not all. You'd better do a power analysis first, which can evaluate whether your samples are enough to reach specific statistical power.
0.05 is a common threshold for HWE p value. 0.01 is also used sometime. If you have multiple markers, remember the multiple test significance level, which is usually more tolerant than single test. For example, HWE p threshold for GWAS is usually 0.001 or 0.0001

http://www.dxy.cn/bbs/topic/16190507?ppg=2

推荐阅读