第6章 卡方检验精选文档.ppt
第6章 卡方检验本讲稿第一页,共二十一页Section 6.12 Statistic and 2 Distribution2统计量与2分布本讲稿第二页,共二十一页一个例子有一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交,其F2代如下表。试检查实际结果是否符合9:3:3:1的理论比率。表现型稃尖有色非糯稃尖有色糯稻稃尖无色非糯稃尖无色糯稻总数观察频数(O)491769086743理论频数(E)417.94139.31139.3146.44743O-E73.06-63.31-49.3139.560F2代表型的观察频数和根据9:3:3:1算出的理论频数本讲稿第三页,共二十一页 2统计量2统计量是度量实际观察频数与理论频数偏离程度的一个统计量,2越小,表明实际观察频数与理论频数越接近;2=0,表示两者完全吻合;2越大,表示两者相差越大。对于本例,可算得本讲稿第四页,共二十一页 2分布上述计算的2统计量近似地服从统计学中一种连续型随机变量的概率分布2分布本讲稿第五页,共二十一页3.847.8112.59a a0.050.05的临界值的临界值2 2分布(分布(chi-square distributionchi-square distribution)本讲稿第六页,共二十一页单侧临界值在自由度为 的 分布曲线图下,右方的面积为 a,则称 为自由度为 的 分布概率为 a 的单侧临界值。可查表。a a0 0本讲稿第七页,共二十一页 2统计量的连续性矫正上述计算的2统计量只是近似地服从连续型随机变量2分布。在对次数资料进行2检验利用连续型随机变量2分布计算概率时,常常偏低,特别是当自由度为1时偏差较大,需要作连续性矫正。Yates(1934)提出了一个矫正公式,矫正后的2值记为 :本讲稿第八页,共二十一页Section 6.2Fit Test适合性检验 本讲稿第九页,共二十一页 例例1 大豆花色一对等位基因的遗传研究,在大豆花色一对等位基因的遗传研究,在F2获得表获得表1所列分所列分离株数。问这一资料的实际观察比例是否符合于离株数。问这一资料的实际观察比例是否符合于31的理论比值。的理论比值。表表1 1 大豆花色一大豆花色一对对等位基因等位基因遗传遗传的适合性的适合性测验测验花色F2代实际株数(O)理论株数(E)OE|OE|1/2(|OE|1/2)2/E紫色208216.758.758.250.3140白色8172.258.758.250.9420总数28928901.2560本讲稿第十页,共二十一页 H0:大豆花色:大豆花色F2分离符合分离符合31比率;比率;HA:不符合:不符合31比率。显著水比率。显著水平平 =0.05。由于该资料只有。由于该资料只有k=组,故在计算,故在计算 值值时需作连续性矫正。时需作连续性矫正。由由 可得:可得:查附表,查附表,。现。现 故应接受故应接受H0,说明大,说明大豆花色这对性状是符合豆花色这对性状是符合31比率,即符合一对等位基因的表型分离比率,即符合一对等位基因的表型分离比例。比例。本讲稿第十一页,共二十一页 例例2 2 两对等位基因遗传试验,如基因为独立分配,则两对等位基因遗传试验,如基因为独立分配,则F2代的代的四种表现型在理论上应有四种表现型在理论上应有9331的比率。有一水稻遗传试验,以的比率。有一水稻遗传试验,以稃尖有色非糯品种与稃尖无色糯性品种杂交,其稃尖有色非糯品种与稃尖无色糯性品种杂交,其F2代得表代得表2 2结果。结果。试检查实际结果是否符合试检查实际结果是否符合9331的理论比率。的理论比率。表2 F2代表型的观察次数和根据9331算出的理论次数表现型稃尖有色非糯稃尖有色糯稻稃尖无色非糯稃尖无色糯稻总数观察次数(O)491769086743理论次数(E)417.94139.31139.3146.44743OE73.06-63.31-49.3139.560本讲稿第十二页,共二十一页 首先,按首先,按9331的理论比率算得各种表现型的理论次数的理论比率算得各种表现型的理论次数E,如稃尖有色非糯稻如稃尖有色非糯稻 E=743(9/16)=417.94,稃尖有色糯稻稃尖有色糯稻 E=743(3/16)=139.31,。H0:稃尖和糯性性状在:稃尖和糯性性状在F2的分离符合的分离符合9331;HA:不符合:不符合9331。显著水平:显著水平:=0.05。然后计算然后计算 值值本讲稿第十三页,共二十一页 因本例共有因本例共有k=4组,故组,故 =k-1=3。查附表,。查附表,,现实得现实得 ,所以所以否定否定H0,接受,接受HA,即该水稻稃尖和糯性性状在,即该水稻稃尖和糯性性状在F2的实际结果不符合的实际结果不符合9331的理的理论比率。论比率。这一情况表明,该两对等位基因并非独立遗传,而可能这一情况表明,该两对等位基因并非独立遗传,而可能为连锁遗传。为连锁遗传。本讲稿第十四页,共二十一页Section 6.3Independence Test独立性检验 本讲稿第十五页,共二十一页 例例3 3 调查经过种子灭菌处理与未经种子灭菌处理的小麦发生散调查经过种子灭菌处理与未经种子灭菌处理的小麦发生散黑穗病的穗数,得相依表黑穗病的穗数,得相依表3 3,试分析种子灭菌与否和散黑穗病穗多,试分析种子灭菌与否和散黑穗病穗多少是否有关。少是否有关。表3 防治小麦散黑穗病的观察结果处处 理理 项项 目目发发 病病 穗穗 数数未发病穗数未发病穗数总总 数数种子灭菌种子灭菌 26(34.7)50(41.3)76种子未灭菌种子未灭菌 184(175.3)200(208.7)384总总 数数 210 250460本讲稿第十六页,共二十一页 假设假设H0:两变数相互独立,即种子灭菌与否和散黑穗病病穗:两变数相互独立,即种子灭菌与否和散黑穗病病穗多少无关;多少无关;HA:两变数彼此相关。:两变数彼此相关。显著水平显著水平 =0.05。根据两变数相互独立的假定,算得各组格的理论次数。根据两变数相互独立的假定,算得各组格的理论次数。如种子灭菌项的发病穗数如种子灭菌项的发病穗数O1=26,其理论次数,其理论次数E1=(21076)/460=34.7,即该组格的横行总和乘以纵行总和再除,即该组格的横行总和乘以纵行总和再除以观察总次数以观察总次数(下同下同);同样可算得同样可算得 O2=50 的的 E2=(25076)/460=41.3;O3=184的的E3=(210384)/460=175.3;O4=200的的E4=(250384)/460=208.7。以上各个以上各个E值填于表值填于表3 3括号内。括号内。本讲稿第十七页,共二十一页以上各个以上各个E值代入值代入 有有 这里这里 =(21)(21)=1,查附表,查附表 ,现实得,现实得 ,故,故P0.05,故应接受,故应接受H0,即不同灌溉方式对水稻叶片的衰老情,即不同灌溉方式对水稻叶片的衰老情况没有显著影响。况没有显著影响。本讲稿第二十一页,共二十一页