生物统计第七章 拟合优度检验精.ppt
《生物统计第七章 拟合优度检验精.ppt》由会员分享,可在线阅读,更多相关《生物统计第七章 拟合优度检验精.ppt(81页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、生物统计第七章 拟合优度检验第1页,本讲稿共81页一、一般原理(一)什么是拟合优度检验?拟合优度检验(goodness of fit test)是用来检验实际观测数据与依照某种假设或模型计算出来的理论数之间的一致性,以便判断该假设或模型是否与观测数相配合。第2页,本讲稿共81页(二)主要内容和注意事项1.主要内容1)一致性检验根据某一假设或模型检验观测数与理论数的一致性。例如:A:判断按照回归方程的预测值与实际值之间的符合程度。B:某一组数据的正态性检验。第3页,本讲稿共81页2)独立性检验 根据检验两组数据之间的关联性或差异性来判断事件之间的独立性没有假设和理论值。如:A:遗传学中检验子二代
2、花色分离差异性检验。B:对照和处理之间的差异性检验。第4页,本讲稿共81页2.注意事项1)对上述两种类型的检验均用2检验来实现。注意与显著性检验时的2检验的区别。2)2检验主要应用于次数资料的检验。3)2检验也会出现两种类型错误。第5页,本讲稿共81页K.Pearson根据的 定义,根据属性性状资料的分布,推导出用于次数资料分析的 公式上式中O为观察次数,E为理论次数,自由度为df.(三)2统计量的计算第6页,本讲稿共81页卡方分布 图7-1 几个自由度的概率分布密度曲线第7页,本讲稿共81页 由于 分布是连续性的分布,而次数资料则是间断性的,所以用上式计得的值总是偏大,尤其当自由度df=1时
3、,这种偏差会较大,故在计算时需要用 的连续性矫正公式:第8页,本讲稿共81页当自由度大于1时,这时,可不作连续性矫正,但要求各组内的理论次数不小于5。若某组的理论次数小于5,则应把它与其相邻的一组或几组合并,直到理论次数大于5为止。第9页,本讲稿共81页(三)拟合优度检验的一般程序1.分组2.计算理论值3.估计参数4.判断理论数的数目5.计算自由度:df=k-1-6.假设7.计算统计量,作出判断第10页,本讲稿共81页四、适合性检验 检验实得次数资料的次数与假设的理论次数是否相互符合的 检验称为适合性检验。在适合性检验中,理论次数和自由度的计算:Ei=npidf=k-m第11页,本讲稿共81页
4、在适合性检验中,无效假设为H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;备择假设为HA:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。并在无效假设成立的条件下,按已知属性类别分配的理论或学说计算各属性类别的理论次数。第12页,本讲稿共81页因所计算得的各个属性类别理论次数的总和应等于各个属性类别实际观察次数的总和,即独立的理论次数的个数等于属性类别分类数减1。也就是说,适合性检验的自由度等于属性类别分类数减1。第13页,本讲稿共81页(一)适合性检验的基本步骤1、建立假设。即无效假设和备择假设:H0:符合假设的总体分布,HA:不符合假设的总体分布。2 确定显著水平3
5、 计算。在无效假设为正确的前提下,计算 值。与查表得的 值进行比较4 结论,如果 接受H0,否定HA第14页,本讲稿共81页(二)次数资料的适合性检验(二)次数资料的适合性检验1、k=2组次数资料的适合性检验组次数资料的适合性检验 这种资料仅分成2组,即k=2,其总体分布为二项总体分布。无效假设H0:符合假设的二项分布,对HA:部符合假设的二项分布。由于受到理论总次数等于实际总次数这一条件的限制,即Ei=N,因而约束条件数m=1,自由度df=2-1=1.故需用矫正公式。第15页,本讲稿共81页例8.1 海棠种子发芽试验的结果列于下表,试检验该样本所属的二项总体与假设发芽率p=0.90的二项总体
6、分布之间有无显著差异 第16页,本讲稿共81页分组分组实际次数实际次数理论概率理论概率理论次数理论次数种子发芽种子发芽种子不发芽种子不发芽352480.900.1036040合计合计4001.00400第17页,本讲稿共81页(1)直接法统统计计假假设设:H0:符合假设p=0.90的二项分布;HA:不符合假设p=0.90的二项分布显著水平显著水平:=0.05检验计算检验计算:=1.5625第18页,本讲稿共81页df=2-1=1查分布表得右尾临界值 =3.84 推断:推断:因因 =1.5625 =3.84故接受H0,否定HA,即该批海棠种子发芽试验的结果所属的二项分布与假设发芽率p=0.90的
7、二项总体之间无显著性差异。第19页,本讲稿共81页(2)简算法 对于k=2 的次数资料O1和O2,欲检验其是否属于r:s的总体二项分布时,可以省略理论次数的计算,简化公式 第20页,本讲稿共81页如本例 =1.5625 第21页,本讲稿共81页2、k3组次数资料的适合性检验组次数资料的适合性检验 这种资料分3组以上,即k3,其总体分布为多项分布。无效假设H0:符合假设的多项分布。HA:不符合假设的多项分布。这种分布亦受理论次数等于实际总次数即E=N这一条件的限制。自由度df=k-12,不用矫正公式。第22页,本讲稿共81页例8.2 用乳白色和红色金鱼草杂交F2代的实验结果列于下表。试检验该样本
8、所属的总体分布与假设理论比率为 1:2:1的多项分布之间有无显著性差异。第23页,本讲稿共81页分组分组实际次数实际次数理论概率理论概率理论次数理论次数乳白色乳白色粉红色粉红色红色红色2555200.250.500.25255025合计合计1001.00100第24页,本讲稿共81页(1)直接法统计假设:H0符合1:2:1 对HA 不符合1:2:2显著水平=0.05计算:=1.5df=k-1=2第25页,本讲稿共81页查表得右尾检验临界值 =5.99推断:因 =1.5 =5.99 故接受H0,否定HA,即金鱼草杂交F2代的试验结果所属的总体分布与假设理论比率为1:2:1的多项分布之间无显著差异
9、。第26页,本讲稿共81页2)简算法对于k3的次数资料,有下式简化计算式中oi为实际次数,n为总次数,pi为理论概率第27页,本讲稿共81页本例=1.5第28页,本讲稿共81页例:检验200头大白猪仔猪一月窝重的资料是否服从正态分布 第29页,本讲稿共81页1、先将资料(原始数据略)整理成次数分布表,组限、组中值、各组的次数列于表7-7的(1)、(2)、(3)栏,再将各组上限列于第(4)栏中。2、计算各组组上限与均数(=65.6kg)之差,列于第(5)栏。3、计算校正标准差Sc。由于由分组资料求得的标准差较不分组时所得标准差为大,故需作校正。第30页,本讲稿共81页4、依公式 求各组上限的正态
10、离差,列入第6栏。如第一组5、设该资料服从正态分布,依u值查正态分布表得各组段的累计概率(a),列入第(7)栏。如当u=-2.57时,a=0.0051,u=0.29时,a=0.6141。6、求出每一组段的概率,列入第(8)栏。由下一组段的累加概率减去本组段的累加概率而得。如8 组段的概率为0.0136-0.0051=0.0085。第31页,本讲稿共81页7、以总数n=200头乘以各组概率便得理论次数,列入第(9)栏。凡理论值小于5者应加以合并。本例前三组与后三组分别合并。合并后的实际次数与理论次数分别为10与6.44、7与8.72,见第(3)与第(9)栏。8、求各组2值,列入第(10)栏。9、
11、确定自由度。这里是因为求理论次数时用去均数,标准差与总次数三个统计量,该例经合并共12个组,故df=12-3=9。第32页,本讲稿共81页10、结论。由df=9查2表得:20.05(9)=16.919,而计算所得的2值为:2=8.7808,因为20.05,表明各组实际次数与由正态分布计算的理论次数差异不显著,可以认为大白猪仔猪一月窝重服从正态分布。第33页,本讲稿共81页例:用显微镜检查某样品内结核菌的数目,对某些视野内各小方格的结核菌数计数,然后按不同的结核菌数目把格子分类,记录每类的格子数。其结果见表79第(1)、(2)栏。试检验结核菌数是否服从波松分布。第34页,本讲稿共81页是波松分布
12、所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分布趋于对称(如图4-11所示)。当=20时分布接近于正态分布;当=50时,可以认为波松分布呈正态分布。所以在实际工作中,当20时就可以用正态分布来近似地处理波松分布的问题。第35页,本讲稿共81页1.计算理论概率 设结核菌数服从波松分布P(),其概率计算公式为:其中为平均数,且等于方差2。此时因未知,可利用样本平均数来估计。利用加权法求样本平均数为:则:各项理论概率为 计算结果列于第(3)栏 第36页,本讲稿共81页2.计算理论次数 将总次数N=118乘以各组的理论概率即得各组理论次数T。计算结果列于第(4)栏。由于表后4组的理论次数小于5,故
13、将后4组与第7组合并为一组,合并后的实际格子数为8,理论格子数为9.5818。3.计算2值 根据表79第(5)栏的数据可得2值为:第37页,本讲稿共81页 因为此例经并组后的分组数为7;计算理论次数利用了样本平均数和总次数,所以自由度为7-2=5。当df=5时,查2值表得:20.05(5)=11.07,因为20.05,表明结核菌的各实际格子数与根据波松分布计算出的理论格子数差异不显著,可以认为结核菌数服从波松分布。第38页,本讲稿共81页注意事项:计算自由度时的的数目确定!df=n-1-第39页,本讲稿共81页五、独立性检验(一)独立性检验 根据次数资料判断两类因子彼此相关或相互独立的假设检验
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 生物统计第七章 拟合优度检验精 生物 统计 第七 拟合 检验
限制150内