欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    生物统计学课件抽样分布及应用㈡.ppt

    • 资源ID:80443711       资源大小:406.51KB        全文页数:22页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    生物统计学课件抽样分布及应用㈡.ppt

    第三章第三章 抽样分布及其应用抽样分布及其应用n第一节第一节 二项总体抽样二项总体抽样n第二节第二节 检验二项资料的百分数检验二项资料的百分数n (针对单个样本百分数和两样本百分数)(针对单个样本百分数和两样本百分数)n第三节第三节 参数的区间估计参数的区间估计n第四节第四节 2的定义和分布的定义和分布n第五节第五节 次数资料的次数资料的2检验检验第三章要点提示第三章要点提示 抽样分布及其应用是上一章抽样分布及其应用的延伸,两者构抽样分布及其应用是上一章抽样分布及其应用的延伸,两者构成统计分析方法的基础部分,学习时成统计分析方法的基础部分,学习时:对于二项总体抽样,要清楚它对于二项总体抽样,要清楚它和上一章单个母总体抽样的联系和区别;和上一章单个母总体抽样的联系和区别;对于百分数的检验,要注意对于百分数的检验,要注意应用应用u-test的条件、不符合这些条件时进行连续性矫正的必要性以及标准的条件、不符合这些条件时进行连续性矫正的必要性以及标准误的计算方法衍生总体参数的异同点;误的计算方法衍生总体参数的异同点;参数的区间估计可替代显著性参数的区间估计可替代显著性检验,但它比显著性检验挖掘的信息更充分;检验,但它比显著性检验挖掘的信息更充分;掌握依据掌握依据2变量变量SS/2 服服从的理论分布进行适合性检验和独立性检验时计算从的理论分布进行适合性检验和独立性检验时计算2值的方法。值的方法。涉及教材内容:第五章第四、五节,第七章第一、二、三节。涉及教材内容:第五章第四、五节,第七章第一、二、三节。作业布置:作业布置:教材教材P77 P77 T13、T14;P154-155 P154-155 T5、T7、T8、T10。第一节第一节 二项总体抽样二项总体抽样一、二项总体参数一、二项总体参数 本节是针对一类特殊的母总体进行抽本节是针对一类特殊的母总体进行抽样研究,这类总体内的个体不管有多少个,样研究,这类总体内的个体不管有多少个,都可按某种性状出现与否分为两组,故称都可按某种性状出现与否分为两组,故称二项总体。将其中出现某种性状的个体的二项总体。将其中出现某种性状的个体的观察值定为观察值定为“1”,否则定为,否则定为“0”。若已知二项总体的个体有若已知二项总体的个体有N个,出现个,出现某种性状的概率为某种性状的概率为p,则其参数计算如下:则其参数计算如下:=fy/N=Np/N=p 2=f(y)2/N=Np(1-p)/N=pq 可见二项总体的两个参数可见二项总体的两个参数,2都由平均数都由平均数p(即个体出现某种性状的概率即个体出现某种性状的概率)唯一确定。唯一确定。二、衍生总体参数二、衍生总体参数 从二项总体中以样本容量从二项总体中以样本容量 n 进行复进行复置抽样,根据前述中心极限定理的有置抽样,根据前述中心极限定理的有关结论,同样有:关结论,同样有:或或 N(,2)且:且:=p,2=2/n=pq/n y或或 N(y ,2y )且:且:y=n=np,2y=n2=npq,于是于是:u=()/=u=(y y)/y =y f f yy-f(y)2 1 Np Np1-pNp(1-p)2 0N(1-p)0-pN(1-p)p2 N Np Np(1-p)第一节第一节 二项总体抽样二项总体抽样 例例3.1 假定调查某地全部棉株受盲椿危假定调查某地全部棉株受盲椿危害的情况,发现害的情况,发现704株受害,且株受害,且 N=2000,得得=0.352,=0.4776;现从中以现从中以n=200抽取一个样本,知受害株数抽取一个样本,知受害株数 =74,受害受害率率 =0.37,试计算获此抽样误差的概率。试计算获此抽样误差的概率。解解 依题意应求依题意应求P(|p|0.018)=0.4776200=0.034原式原式=P(|u|0.53)=2 P(u -0.53)=2(-0.53)=20.2981=0.5962 依题意也可求依题意也可求P(|np|3.6)=6.754 u=(74 70.4)/6.754=0.53 习题习题 给定一个二项总体给定一个二项总体 0,1,0,0,1,1,0,1,1,0,现从中以,现从中以 n=4进行复置抽样进行复置抽样,则分析如下则分析如下:y或或 0 1 2 3 4或或 00.25 0.50.75 1.0f(y)1/164/166/164/161/16 f ff()2 0 625 0-0.5 156.250.252500 625-0.25 156.250.537501875 0 00.7525001875 0.25 156.25 1 625 625 0.5 156.25 10 45000 0 625第二节第二节 检验二项资料的百分数检验二项资料的百分数 所谓二项资料的百分数,指数据资料所谓二项资料的百分数,指数据资料可以看成是从二项总体中抽得样本后,可以看成是从二项总体中抽得样本后,通过计数某一属性的个体数目算出来的通过计数某一属性的个体数目算出来的样本百分数,其样本百分数,其实质是样本平均数实质是样本平均数。正。正因为经计数获得,所以因为经计数获得,所以是间断性变量是间断性变量。从理论上讲,这类百分数的显著性检从理论上讲,这类百分数的显著性检验应按二项分布进行,即用验应按二项分布进行,即用(p+q)n 的的二项展开式求出某项属性的个体数达到二项展开式求出某项属性的个体数达到某个百分数某个百分数 的概率。但的概率。但 n 稍大时,直稍大时,直接用接用(p+q)n 来计算区间概率很不方便,来计算区间概率很不方便,除非制成类似专用的统计表来查。除非制成类似专用的统计表来查。而样本容量足够大而样本容量足够大(n50)时,时,若若 p、q 不过于小不过于小(np或或nq 5),则则(p+q)n 的的分布趋近于正态分布趋近于正态,可转换为可转换为 u 查算概率。查算概率。适合适合 u-test 的的 和和 值表值表 n 50 0.4 0.6 2030 80 0.3 0.7 2456 200 0.2 0.8 40160 600 0.1 0.9 605401400 0.05-0.95 70-1325第二节第二节 检验二项资料的百分数检验二项资料的百分数一、单个样本百分数一、单个样本百分数 例例3.2 根据往年调查,某地区的乳牛根据往年调查,某地区的乳牛隐性乳房炎一般为隐性乳房炎一般为30%,即即po=0.3,现对现对某牛场某牛场500头乳牛进行检测,结果有头乳牛进行检测,结果有175头头乳牛凝集反应阳性。问该牛场的隐性乳房乳牛凝集反应阳性。问该牛场的隐性乳房炎是否比往年严重?炎是否比往年严重?解解 本例本例n=500,=175/500=0.35 n200,(0.2,0.8)用用u-test H0:p p0 或或 p 0.30 =(0.30.7500)=0.0205 u=(p)/=(0.350.30)/0.0205=2.439查表知查表知单侧单侧u0.05=双侧双侧u0.10=1.64推断:推断:u u0.05 故故H0不不成立。成立。若以若以 -np=175-150=25,进行进行测验测验,=10.25,u 不变。不变。若以若以H0:p=0.7 进行检验,进行检验,或或 结果也一样,结果也一样,u=2.439。本例有一般百分数为测验依据,本例有一般百分数为测验依据,具备计算总体标准误的先决条件,所具备计算总体标准误的先决条件,所以用以用u-test。这是很少见的几种能直接这是很少见的几种能直接应用标准正态分布的场合应用标准正态分布的场合,也是应用,也是应用二项总体抽样分布进行检验的优势。二项总体抽样分布进行检验的优势。用正态分布替代二项分布做检验,用正态分布替代二项分布做检验,其其本质是将间断性变量的概率分布去本质是将间断性变量的概率分布去逼近它的极限逼近它的极限连续性变量的连续性变量的fN(y)。这种近似过程会有偏差,当数据不符这种近似过程会有偏差,当数据不符合前表所列条件时还得照下例操作。合前表所列条件时还得照下例操作。第二节第二节 检验二项资料的百分数检验二项资料的百分数 例例3.3 用基因型纯合的糯和非糯玉米用基因型纯合的糯和非糯玉米杂交,按遗传规律杂交,按遗传规律,预期预期F1植株上糯性花粉植株上糯性花粉粒的粒的P0=0.5。现于一视野中检视现于一视野中检视20粒花粉,粒花粉,发现糯性花粉发现糯性花粉8粒粒,试测验此次镜检结果是试测验此次镜检结果是否符合否符合F1代配子代配子1 1的分离规律。的分离规律。解解 本例本例n=2050,=8/20=0.4 不符合不符合u-test的条件的条件,只能用只能用t-test H0:p=p0 或或p=0.5 是是2=pq的无偏估计值的无偏估计值 =(0.40.619)=0.1124 tc=(|p|0.5/n)/=0.667 =(0.10.025)/0.1124按自由度按自由度=19 查得查得t0.05=2.093推断:推断:t t0.05 故故H0成立成立 本例若以本例若以 -np=810=-2进行进行测验测验,则同样应根据则同样应根据2=pq的无偏估的无偏估计值计值 先计算标准误先计算标准误:=(202 0.40.619)=2.25再算再算tc=(|n p|0.5)/=(20.5)/2.25=0.667 计算计算 tc 的的做法叫连续性矫正,为做法叫连续性矫正,为的是纠正用连续性变量的的是纠正用连续性变量的t 分布替代分布替代二项分布时二项分布时,因为因为 n 太小而不能忽略太小而不能忽略的偏差。即使如此,对的偏差。即使如此,对这种这种 n50的的资料进行检验只适宜于希望资料进行检验只适宜于希望 H0 被接被接受的场合;如果希望受的场合;如果希望H0被拒绝被拒绝,设计设计获得样本百分数的获得样本百分数的 n 还是越大越好,还是越大越好,达不到达不到100也不要少于也不要少于50。第二节第二节 检验二项资料的百分数检验二项资料的百分数二、两个样本百分数二、两个样本百分数 例例3.4 某养猪场第一年饲养杜长大商品某养猪场第一年饲养杜长大商品仔猪仔猪9800头,死亡头,死亡980头;第二年饲养头;第二年饲养10000头,死亡头,死亡950头,试检验第二年的死亡率与头,试检验第二年的死亡率与第一年的死亡率有无显著差异?第一年的死亡率有无显著差异?解解 =0.1,=0.095,可进行可进行u-test 不需连续性矫正,不需连续性矫正,n1 与与 n2 有有 10000之多。之多。(1)H0:p1 p2 (同时有同时有:)(2)=(n1 +n2 )/(n1+n2)=0.0975 =(980+950)/(9800+10000)=1 -=1 0.0975=0.9025 =(Se2(1/n1+1/n2)=0.00422 =(1/9800+1/10000)t=()(p1 p2)/=(0.10 0.095)/0.00422=1.185(3)查得查得双侧双侧t0.05,=u0.05=1.96(4)推断推断t t0.05 H0成立。成立。本例计算标准误的本例计算标准误的前提是可以合并前提是可以合并两个样本百分数,然后计算两个样本百分数,然后计算Se2=之所以这样作而不象前例计算之所以这样作而不象前例计算Se2=(1S12+2S22)/(1+2)前先插入前先插入F检验且知两个样本方差比无显著性,检验且知两个样本方差比无显著性,是因为该题型的是因为该题型的H0有双重作用,即作有双重作用,即作出出H0:p1 p2后,后,H0:也也同真同真,原因在于二项总体的,原因在于二项总体的2=p q=p(1-p)。至于至于n1 或或 n2 50的的两个样本百分两个样本百分数差异显著性检验问题,即使是有数差异显著性检验问题,即使是有 t-test并且可以进行连续性矫正并且可以进行连续性矫正,同样因同样因为只有利于接受为只有利于接受H0而不利于拒绝而不利于拒绝H0,实际应用中不受推崇。实际应用中不受推崇。第三节 参数的区间估计什么叫区间估计?什么叫区间估计?即使是复置抽样,由于即使是复置抽样,由于抽样误差存在的必然性,不抽样误差存在的必然性,不同的样本将有不同的同的样本将有不同的值,值,于是于是,在一定的在一定的置信度置信度(也叫也叫置信系数置信系数或可靠度,一般为或可靠度,一般为95或或99)保证之下,估)保证之下,估计出一个范围或区间以覆盖计出一个范围或区间以覆盖参数。该区间就叫置信区间参数。该区间就叫置信区间,其上下限叫置信限,分别以其上下限叫置信限,分别以L2、L1表示。表示。如例如例1.5的的n=25抽样实例:抽样实例:=44.05 g,S=4.523g,以,以1-=0.95时的时的t0.05=2.064算得:算得:L1 44.052.0644.523 42.18 gL2 44.052.0644.523 45.92 g若用若用=4.65g的已知条件,的已知条件,则:则:L1 44.051.964.65 42.23gL2 44.051.964.65 45.87 g第三节 参数的区间估计 如如例例2.3已知某品种母猪的怀孕期已知某品种母猪的怀孕期为为0 0=114d,现抽查其,现抽查其10头母猪得怀头母猪得怀孕期平均日数孕期平均日数=114.5d,S=1.581d。以以1-=0.95和和S=0.5d 以及以及t0.05=2.262 时算得:时算得:L1 114.52.2620.5113.37 gL2 114.52.2620.5115.63g 该区间估计结果也可用于显该区间估计结果也可用于显著性检验,如本例所示,著性检验,如本例所示,H0:=114d被包含在被包含在1-=0.95的置信区的置信区间:间:113.37,115.63,故故H0成立。成立。反之,则反之,则H0不能成立。不能成立。若若1-=0.99,t0.05=3.250,可算得置信区间扩大为:可算得置信区间扩大为:112.88,116.13。此时此时,H0:=114d成立与成立与否无从判断。否无从判断。再若取单侧再若取单侧 t0.05=1.833:L1 114.51.8330.5 113.58 g L2 114.51.8330.5 115.42g 此时此时,H0:114d已包已包含在含在1-=0.95的置信区间的置信区间113.58,115.42 故故H0成立。成立。第三节 参数的区间估计 又如例又如例2.6 的资料,某小麦品的资料,某小麦品种每种每m2产量的产量的2=0.4(kg2)。A法取法取12个样点,得每个样点,得每m2产量产量1=1.2kg;B法取法取8个样点个样点,得得2=1.4kg。以。以1-=0.95 和和1-2=0.28870.2887kg=kg=以及以及u0.05=1.96时算得:时算得:L1(1.2-1.4)1.960.2887 0.766 kgL2(1.2-1.4)1.960.2887 0.366 kg 该区间估计结果用于显著性检该区间估计结果用于显著性检验,如本例所示验,如本例所示,H0:1-2=0被被包含在包含在1-=0.95的置信区间:的置信区间:-0.7661-20.366,故故H0成立。成立。反之,若反之,若H0未被包含在未被包含在1-=0.95的置信区间内,则属于的置信区间内,则属于H0不能不能成立的情形。成立的情形。于是于是,就就1=2=的情形将的情形将两个样本合并按单个样本两个样本合并按单个样本进行区间进行区间估计,结果如下:估计,结果如下:1.28kg 0.1414g L1 1.281.960.1414 1.00 kgL2 1.281.960.1414 1.56kg 由此可见,用于显著性检验的由此可见,用于显著性检验的区间估计和参数的区间估计不完全区间估计和参数的区间估计不完全是一回事!是一回事!第三节 参数的区间估计 又如例又如例2.9某家禽研究所用粤黄鸡对某家禽研究所用粤黄鸡对A A、B B两种饲料的增重效果进行对比试验,时间两种饲料的增重效果进行对比试验,时间60d,60d,各获得各获得8 8只鸡的观察值只鸡的观察值,算得算得 1 1=705.625g705.625g,SSSS1 1=2022g2022g2 2;2 2=696.125g696.125g,SSSS2 2=967g 967g2 2。以以1-=0.95 和和S 1-2=7.306g 以及以及t0.05=2.145时算得:时算得:L1(705.625-696.125)2.1457.306 6.17gL2(705.625-696.125)2.1457.306 25.17g 该区间估计结果用于显著性检验该区间估计结果用于显著性检验时,由于时,由于H0:1-2=0被包含在置信被包含在置信区间:区间:6.171-2 25.17 故故H0成立。成立。于是于是,就就1=2=的情形将的情形将两个样本合并按单个样本两个样本合并按单个样本进行区间进行区间估计,结果如下:估计,结果如下:700.875gS 3.653g L1 700.8752.1313.653 693.09gL2 700.8752.1313.653 708.66g 以上两例表明当用于显著性检以上两例表明当用于显著性检验的区间估计针对验的区间估计针对1-2 而又而又接接受受H0时,有必要进一步作参数的区间时,有必要进一步作参数的区间估计以挖掘更加有用的信息!估计以挖掘更加有用的信息!第三节 参数的区间估计 再如例再如例2.8 在抽穗期间测定喷矮壮在抽穗期间测定喷矮壮素玉米素玉米8株株,得到株高得到株高1=176.3cm,SS1=3787.5cm2,对照区玉米,对照区玉米9株,得株高株,得株高2=233.3 cm,SS2=18400cm2。以以1-=0.95 和和S 1-2=18cm ,以及以及=12、一尾、一尾t0.05=1.782时算得:时算得:L1(176.3-233.3)1.78218 24.92 cmL2(176.3-233.3)1.78218 84.08cm 该区间估计结果用于显著性检该区间估计结果用于显著性检验时,由于验时,由于H0:1-2 0未包含未包含在置信区间在置信区间24.921-284.08。故故H0不不成立。成立。由本例可见,当用于显著性检由本例可见,当用于显著性检验的区间估计针对验的区间估计针对1-2 而又拒绝而又拒绝H0时,参数的区间估计信息也同时时,参数的区间估计信息也同时获得!即喷矮壮素的玉米至少比对获得!即喷矮壮素的玉米至少比对照矮照矮24.92cm以上。以上。第三节 参数的区间估计 再如再如例例2.10 研究某批注射液对家兔体研究某批注射液对家兔体温的影响,测得温的影响,测得1010只家兔注射前后的体温只家兔注射前后的体温(C C),根据所得),根据所得自身配对自身配对数据算得数据算得d=-7.3(C C),),S Sd d =0.445 0.445(C C)。)。以以1-=0.95 和和S=0.141 t0.05=2.262时算得:时算得:L1-0.732.2620.141 1.049L2-0.732.2620.141 0.411 该区间估计结果用于显著性检该区间估计结果用于显著性检验时,由于验时,由于H0:d 0未包含在置未包含在置信区间信区间1.049 d 0.411。故故H0不不成立。成立。由本例可见,当用于显著性检由本例可见,当用于显著性检验的区间估计针对验的区间估计针对而又拒绝而又拒绝H0时,时,参数的区间估计信息也同时获得!参数的区间估计信息也同时获得!即即家兔注射某批注射液后的体温家兔注射某批注射液后的体温至至少升高少升高0.411 C C。第三节 参数的区间估计 再如例再如例2.11 从从8 8窝仔猪中每窝选性别窝仔猪中每窝选性别相同、体重接近的相同、体重接近的2 2头配对,每对仔猪头配对,每对仔猪随机安排一头喂甲饲料,另一头喂乙饲随机安排一头喂甲饲料,另一头喂乙饲料,时间料,时间30d30d,根据所得,根据所得同源配对同源配对数据数据(kg)(kg)算得算得d=7.8kgd=7.8kg,SSSSd d =2.3kg=2.3kg2 2,以以1-=0.95 和和S=0.2025,双侧双侧t0.05=2.365时算得:时算得:L1 0.9752.3650.2025 0.496kgkgL2 0.9752.3650.2025 1.454kgkg 该区间估计结果用于显著性检该区间估计结果用于显著性检验时,由于验时,由于H0:d 0未包含在未包含在置信区间置信区间0.496 d 1.454。故故H0不成立。不成立。由本例可见,当用于显著性检由本例可见,当用于显著性检验的区间估计针对验的区间估计针对时,其区间估时,其区间估计信息也可达到和检验非零假设同计信息也可达到和检验非零假设同样的效果!即喂甲饲料比喂乙饲料,样的效果!即喂甲饲料比喂乙饲料,30d时间至少多时间至少多0.496kg。第三节 参数的区间估计 最后最后如例如例3.2 根据往年调查,某地区根据往年调查,某地区的乳牛隐性乳房炎一般为的乳牛隐性乳房炎一般为30%,即即po=0.3,现对某牛场,现对某牛场500头乳牛进行检测,头乳牛进行检测,结果有结果有175头乳牛凝集反应阳性。头乳牛凝集反应阳性。以以1-=0.95 和和 =0.0205,u0.05=1.96时算得:时算得:L1 0.351.960.0205 0.31L2 0.351.960.0205 0.39 该区间估计结果用于显著性检该区间估计结果用于显著性检验时,由于验时,由于H0:p=0.30未包含在未包含在置信区间置信区间0.31 p 0.39。故故H0不不成立。成立。由本例可见,当用于显著性检由本例可见,当用于显著性检验的区间估计针对验的区间估计针对H0:p=p0 时,时,对对 进行区间估计的方法和单个进行区间估计的方法和单个一样,既可以判断一样,既可以判断H0 是否成立,也是否成立,也可以估计一个范围覆盖参数!可以估计一个范围覆盖参数!第三节 参数的区间估计 再如再如例例3.4 某养猪场第一年饲养杜某养猪场第一年饲养杜长大商品仔猪长大商品仔猪9800头,死亡头,死亡980头;第头;第二年饲养二年饲养10000头,死亡头,死亡950头。头。以以1-=0.95 和和=时时,双侧双侧t0.05=u0.05=1.96,0.00422算得:算得:L1(0.1-0.095)1.960.00422 -0.00327L2(0.1-0.095)1.960.00422 0.01327 该区间估计结果用于显著性检该区间估计结果用于显著性检验时,由于验时,由于H0:p1-p2 0已包含在已包含在置信区间置信区间-0.00327 p1-p2 0.01327。故故H0成立。成立。于是于是,就就p1=p2=p的情形将两的情形将两个样本合并按单个样本个样本合并按单个样本进行区间进行区间估计,结果如下:估计,结果如下:0.0975 0.0021 L1 0.09751.960.0021 0.0934L2 0.09751.960.0021 0.1016 由此可见,当用于显著性检验由此可见,当用于显著性检验的区间估计针对的区间估计针对 而又接受而又接受H0时,参数的区间估计只对时,参数的区间估计只对p进行!进行!第四节第四节 2的定义和分布的定义和分布 假定从一个假定从一个既定的母总体中随机抽取容量既定的母总体中随机抽取容量为为 n 的样本,则定义:的样本,则定义:2=SS/2=(n 1)S 2/2=S 2/2 抽样研究的结果已证实抽样研究的结果已证实,2也是一个连续性也是一个连续性变量变量,理论上存在着抽样分布,这就是理论上存在着抽样分布,这就是2分布。分布。它的两个参数分别为:它的两个参数分别为:2=,2 2=2 2分布是由自由度分布是由自由度 n 1 决定的曲线系统,决定的曲线系统,因为受因为受2 0的限制,任一条都限于纵坐标右侧;的限制,任一条都限于纵坐标右侧;2分布曲线不对称往左偏斜,偏斜程度随分布曲线不对称往左偏斜,偏斜程度随着自由度的增加而减小着自由度的增加而减小,时,渐趋正态分布时,渐趋正态分布,实际当实际当30时时,视视(22)N(2-1),1);附表附表6(右尾右尾2值表值表)与与2分布的关系。分布的关系。第四节第四节 2的定义和分布的定义和分布f(2)2=1=3=53.84 7.81 11.07 图图中只列中只列=0.05的临界值,的临界值,=0.01尽管被称为极显著水平,尽管被称为极显著水平,但但“差异极显著差异极显著”决不意味着本质决不意味着本质差别一定比达到差别一定比达到0.05显著水平大显著水平大。第五节第五节 次数资料的次数资料的2检验检验二、适合性测验二、适合性测验 例例3.5 研究牛的毛色和角的有无两研究牛的毛色和角的有无两对相对性状的分离现象时,用黑色无角牛对相对性状的分离现象时,用黑色无角牛和红色有角牛杂交,和红色有角牛杂交,子二代四种表现型的子二代四种表现型的观察次数依次为观察次数依次为192、78、72、18。试检验试检验这两对相对性状的遗传是否符合理论比例这两对相对性状的遗传是否符合理论比例为为9 3 3 1的独立分配律。的独立分配律。H0:F2代四种表现型代四种表现型符合符合9 3 3 12 =(A T)2T)=4.711 =10.52/202.5+10.52/67.5 +4.52/67.5+4.52/22.5 按按=4-1,查得右尾查得右尾2 0.05=7.815 推断推断:2 2 0.05 H0成立成立 表现型表现型 A T AT黑色无角黑色无角192202.510.5黑色有角黑色有角7867.5+10.5红色无角红色无角7267.5 +4.5红色有角红色有角18 22.5 4.5 360 360 0 (A T)2T)2(k-1)=1时时,C C2 =(|A T|-0.5)2T)第五节第五节 次数资料的次数资料的2检验检验三、独立性测验三、独立性测验 例例3.6 分别统计了分别统计了甲甲、乙乙两个品种两个品种各各67头经产母猪的产仔情况,结果如右表头经产母猪的产仔情况,结果如右表(T Tijij内为相应的理论次数),试检验经产内为相应的理论次数),试检验经产母猪的产仔构成比是否因品种而不同。母猪的产仔构成比是否因品种而不同。H0:产仔构成比产仔构成比与与因品种因品种无关无关2 =(A T)2T)=23.23 =62/11+5.52/38.5+11.52/17.5 +62/11+5.52/38.5+11.52/17.5 按自由度按自由度=(2-1)(3-1)查得查得20.05=5.99推断:推断:2 2 0.05 H0不成立不成立(A T)2T)2(r-1)(c-1)=1时时,C C2 =(|A T|0.5)2T)品种品种9头头912头头13头头 头头甲甲 17 44667 T1j1138.517.567乙乙 5 33 2967 T2j1138.517.567 22 77 35134显著性检验(小结)显著性检验(小结)至此已讲完统计三大分布,历史上是先有至此已讲完统计三大分布,历史上是先有u 分布,后来才依次有分布,后来才依次有2分布、分布、t 分布和分布和F 分布分布 当计算当计算2的的自由度自由度=1时时,2=u u2;当计算当计算t t的自由度的自由度时时,t N(0,1);Fisher 证明证明 Gosset 定义的定义的 t 变量实际上是变量实际上是用用2变量除以变量除以后的正根值去除后的正根值去除 u 变量所得:变量所得:t=u/(2/)取取u=()/n =()/n/(S2/2)=()/n/S=()S/n F 分布与分布与u 分布、分布、2分布、分布、t 分布的联系分布的联系同样可从其定义:同样可从其定义:F=S12/S22 导出,如右图。导出,如右图。2分布与分布与F分布分布因为不对称因为不对称,其两尾检验其两尾检验不象不象u-test或或t-test那么简单那么简单,左、右尾算法不同左、右尾算法不同。四种四种抽样分布关系图抽样分布关系图

    注意事项

    本文(生物统计学课件抽样分布及应用㈡.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开