生物统计学第五章卡方检验.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《生物统计学第五章卡方检验.ppt》由会员分享,可在线阅读,更多相关《生物统计学第五章卡方检验.ppt(40页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第五章第五章 卡方检验卡方检验教学目的要求教学目的要求v掌掌握握:卡卡方方检检验验的的适适用用条条件件和和计计算算公公式式;适适合合性性检检验验的的基基本本原原理理和和方方法法;独独立立性性检检验验的的原理和方法。原理和方法。v熟悉:适合性检验和独立性检验的应用。熟悉:适合性检验和独立性检验的应用。v了了解解:适适合合性性检检验验在在遗遗传传学学及及其其他他生生物物学学科科中上的应用。中上的应用。讲授内容讲授内容v一、卡方检验的原理和方法一、卡方检验的原理和方法v二、适合性检验二、适合性检验v三、独立性检验三、独立性检验一、卡方检验的原理和方法一、卡方检验的原理和方法v1、卡方检验的原理、卡方
2、检验的原理 应应用用理理论论值值(expected value,E)与与观观测测值值(observed value,O)之之间间的的偏偏离离程程度度来决定卡方值的大小。来决定卡方值的大小。2、卡方检验的程序、卡方检验的程序v将观测值分为将观测值分为k组组v计算计算n次观测值中每组的观测频数,记为次观测值中每组的观测频数,记为Oiv根根据据变变量量的的分分布布规规律律或或概概率率运运算算法法则则,计计算算每每组组的的理论频率为理论频率为Piv计算每组的理论频数计算每组的理论频数Eiv检检验验Oi与与Ei的的差差异异显显著著性性,判判断断两两者者之之间间的的不不符符合合度度va、零零假假设设:H0
3、:O-E=0;备备择择假假设设:O-E0(这这里里检检验验的的不是参数,而是判断观测数是否符合理论分布)不是参数,而是判断观测数是否符合理论分布)vb、检检验验统统计计量量:这这里里要要求求n充充分分的的大大,当当n50时时(最最好好100),所所定定义义的的检检验验统统计计量量近近似似服服从从卡卡方方分分布布,Ei=nPi不不得得小小于于5,若若小小于于5,将将尾尾区区相相邻邻的的组组合合并并,直直到到合合并并后后的组的的组的Ei5,合并后再计算卡方值。,合并后再计算卡方值。vc、建立拒绝域、建立拒绝域vd、作出统计学结论、作出统计学结论v用来检验观测数与依照某种假设或分布模型用来检验观测数
4、与依照某种假设或分布模型计算得到的理论数之间一致性的一种统计假计算得到的理论数之间一致性的一种统计假设检验,以便判断该假设或模型是否与实际设检验,以便判断该假设或模型是否与实际观测数相吻合。观测数相吻合。二、适合性检验(二、适合性检验(goodness of fit)v(一)总体参数未知的正态性检验(一)总体参数未知的正态性检验155155153153159159155155150150159159157157159159151151152152159159158158153153153153144144156156150150157157160160150150150150150150160
5、160156156160160155155160160151151157157155155159159161161156156141141156156145145156156153153158158161161157157149149153153153153155155162162154154152152162162155155161161159159161161156156162162151151152152154154157157162162158158155155153153151151157157156156153153147147158158155155148148163163156
6、156163163154154158158152152163163158158154154164164155155156156158158164164148148164164154154157157165165158158166166154154154154157157167167157157159159170170158158例例1 1 高粱高粱“三尺三三尺三”株高测定结果(株高测定结果(cmcm)题解题解组号组号组限组限/cm/cm组界组界/cm/cm中值中值频数频数频率频率1 1141141143143140.5140.5143.5143.51421421 10.010.012 2144
7、144146146143.5143.5146.5146.51451452 20.020.023 3147147149149146.5146.5149.5149.51481484 40.040.044 4150150152152149.5149.5152.5152.515115113130.130.135 5153153155155152.5152.5155.5155.515415423230.230.236 6156156158158155.5155.5158.5158.515715728280.280.287 7159159161161158.5158.5161.5161.516016015
8、150.150.158 8162162164164161.5161.5164.5164.516316310100.10 0.10 9 9165165167167164.5164.5167.5167.51661663 30.030.031010168168170170167.5167.5170.5170.51691691 10.010.01总计总计1001001 1高粱高粱“三尺三三尺三”株高频数分布表株高频数分布表(1)将将观观测测值值分分为为k组组;按按照照分分组组原原理理分分成成10组组,制制成成频频数数分布表分布表v(2)获得的)获得的n次观测值中,第次观测值中,第i组的观测频数记为组的
9、观测频数记为Oi,v(3)第)第i组的理论频率为组的理论频率为Pi,其计算方法如下:,其计算方法如下:先计算样本平均数和标准差先计算样本平均数和标准差 假假设设高高粱粱“三三尺尺三三”符符合合正正态态分分布布 。根根据据参参数数估估计计原原理理,用用 估估计计,用用s/c4=4.98/0.9975=4.99估估计计(样样本本标标准准差差分分布的矩系数布的矩系数C4、C5表表)。即假设高粱的株高)。即假设高粱的株高x服从正态分布服从正态分布 根根据据正正态态分分布布概概率率的的计计算算关关系系,查查附附表表1,计计算算各各组组组组界界的的理论频率理论频率组号组号组界组界/cm/cm观察频数观察频
10、数(OiOi)观察频率观察频率(PiPi)理论频率理论频率(P P)理论频数理论频数(EiEi)1 1140.5140.5143.5143.51 10.010.010.0050.0050.50.52 2143.5143.5146.5146.52 20.020.020.0220.0222.22.23 3146.5146.5149.5149.54 40.040.040.0660.0666.66.64 4149.5149.5152.5152.513130.130.130.1420.14214.214.25 5152.5152.5155.5155.523230.230.230.2160.21621.6
11、21.66 6155.5155.5158.5158.528280.280.280.2320.23223.223.27 7158.5158.5161.5161.515150.150.150.1760.17617.617.68 8161.5161.5164.5164.510100.10 0.10 0.0940.0949.49.49 9164.5164.5167.5167.53 30.030.030.0350.0353.53.51010167.5167.5170.5170.51 10.010.010.0090.0090.90.91001001.00 1.00 1.00 1.00 100100高粱高粱
12、“三尺三三尺三”株高观察频数和理论频数表株高观察频数和理论频数表v(4)计算各组的理论频数为)计算各组的理论频数为Ei=npi,填入下表填入下表组号组号组界组界/cm/cm观察频数观察频数(OiOi)观察频率观察频率(PiPi)理论频率理论频率(P P)理论频数理论频数(EiEi)卡方值卡方值1 13 3140.5140.5149.5149.57 70.070.070.0930.0939.30 9.30 0.5690.5694 4149.5149.5152.5152.513130.130.130.1420.14214.214.20.1010.1015 5152.5152.5155.5155.5
13、23230.230.230.2160.21621.621.60.0910.0916 6155.5155.5158.5158.528280.280.280.2320.23223.223.20.9930.9937 7158.5158.5161.5161.515150.150.150.1760.17617.617.60.3840.3848 81010161.5161.5164.5164.514140.14 0.14 0.1380.13813.813.80.0030.003总计总计1001001.00 1.00 1.00 1.00 1001002.1412.141(5 5)O Oi i与与E Ei i
14、进行比较,判断两者之间的不符合度,检验程序进行比较,判断两者之间的不符合度,检验程序如下:如下:零假设:零假设:H0:O-E=0;HA:O-E0 检验统计量:检验统计量:高粱高粱“三尺三三尺三”株高观察频数和理论频数表株高观察频数和理论频数表(合并后合并后)v卡卡方方值值的的自自由由度度df=k-1-a,其其中中k为为合合并并后后的的组组数数,a为为需需要要由由样样估估计计的的总总体体参参数数的的个个数数;合合并并后后的的组组数数k=6,由由样样本本估估计计了了总总体体的的平平均均数数和和标标准准差差,故故a=2,df=3,不用校正,计算卡方值,不用校正,计算卡方值v建立拒绝域建立拒绝域v结论
15、:高粱株高服从正态分布结论:高粱株高服从正态分布v(二)总体参数已知的正态性检验(二)总体参数已知的正态性检验例例2 自自动动包包装装的的袋袋装装食食盐盐的的重重量量是是否否服服从从正正态态分分布布?已已知知每每袋标准重量为袋标准重量为500g,调查了,调查了100袋,结果如下表所示。袋,结果如下表所示。袋装食盐重量调查表袋装食盐重量调查表500500512512515515542542522522514514488488497497475475487487497497500500518518508508530530508508500500479479506506504504493493491
16、491506506487487486486491491505505478478492492512512498498494494482482482482512512527527522522470470493493548548502502496496494494494494488488505505472472482482506506478478494494518518503503503503503503485485529529476476496496500500499499484484517517517517506506500500503503527527500500499499490490496
17、496491491491491490490520520512512482482488488509509488488518518516516516516530530508508492492486486492492536536494494500500511511511511506506493493522522524524492492478478题解题解(1)零假设:)零假设:H0:O-E=0;备择假设;备择假设HA:O-E0(2)分组:样本容量)分组:样本容量n=100,取组数,取组数m=10,组距为,组距为8g(3)计算理论频率)计算理论频率pi和理论频数和理论频数Ei(4)检验统计量的计算)检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物 统计学 第五 章卡方 检验
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内