欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第四章 统计推断-.ppt

    • 资源ID:70984381       资源大小:2.52MB        全文页数:131页
    • 资源格式: PPT        下载积分:15金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要15金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第四章 统计推断-.ppt

    统计推断(statistical inference)第四章上节课内容正态分布的概率密度函数正态分布的概率密度函数标准正态分布标准正态分布正态分布的概率计算正态分布的概率计算统计推断由一个样由一个样本或一糸本或一糸列样本所列样本所得的结果得的结果来推断总来推断总体的特征体的特征假设检验假设检验参数估计参数估计第四章第四章第一节第一节第二节第二节假设检验的原理与方法假设检验的原理与方法统计数的分布与检验统计数的分布与检验第三节第三节样本频率的假设检验样本频率的假设检验第四节第四节参数的区间估计与点估计参数的区间估计与点估计中心极限定理中心极限定理(central limit theorem)如果被抽总体不是正态分布总体,但具有平均数如果被抽总体不是正态分布总体,但具有平均数和方差和方差2 2,当随样本容量,当随样本容量n的不断增大,的不断增大,样本平均数样本平均数 x 的分布也越来越接的分布也越来越接近正态分布,且具有平均数近正态分布,且具有平均数,方差方差2 2/n。不论总体为何种分布,只要是大样本,就可运用中心极限不论总体为何种分布,只要是大样本,就可运用中心极限定理,认为样本平均数的分布是正态分布,在计算样本平定理,认为样本平均数的分布是正态分布,在计算样本平均数出现的概率时,样本平均数可按下式进行标准化。均数出现的概率时,样本平均数可按下式进行标准化。一 概念:假设检验(hypothesis test)又称显著性检验(significance test),就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际原理,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。第一节 假设检验小概率原理小概率原理 概率很小的事件在一次抽样试验中实际是几乎不可能发生的。=0.05/0.01 如果假设一些条件,并在假设的条件下能够准确地算如果假设一些条件,并在假设的条件下能够准确地算出事件出现的概率出事件出现的概率 为很小,则在假设条件下的为很小,则在假设条件下的n次独次独立重复试验中,事件立重复试验中,事件A将按预定的概率发生,而在一次试将按预定的概率发生,而在一次试验中则几乎不可能发生。验中则几乎不可能发生。假假设设检检验验参数检验参数检验非参数检验非参数检验平均数的检验平均数的检验频率的检验频率的检验方差的检验方差的检验秩和检验秩和检验符号检验符号检验游程检验游程检验秩相关检验秩相关检验 治疗前治疗前 0 126 2 240 N(126,240)治疗后治疗后 n 6 x 136 未知未知 那么那么 0?即克矽平对治疗矽肺是否有效即克矽平对治疗矽肺是否有效?例例:设矽肺病患者的血红蛋白含量具平均数:设矽肺病患者的血红蛋白含量具平均数 0 0126(mg/L)126(mg/L),2 2 240240 (mg/L)(mg/L)2 2的正态分布。现用克矽平对的正态分布。现用克矽平对6 6位矽肺病患者进位矽肺病患者进行治疗,治疗后化验测得其平均血红蛋白含量行治疗,治疗后化验测得其平均血红蛋白含量x=136(mg/L)x=136(mg/L)。1 1 、提出假设、提出假设对对立立无效假设无效假设无效假设无效假设/零假设零假设零假设零假设/检验假设检验假设检验假设检验假设备择假设备择假设备择假设备择假设/对应假设对应假设对应假设对应假设 0 0 误差效应处理效应H0HA例例:克矽平治疗矽肺病是否能提高血红蛋白含量?:克矽平治疗矽肺病是否能提高血红蛋白含量?平均数的假设检验平均数的假设检验检验治疗后的总体平均数检验治疗后的总体平均数 是否还是治疗前的是否还是治疗前的126(mg/L)126(mg/L)?x-x-0 0136-126136-12610(mg/L)10(mg/L)这一差数这一差数是由于治疗造成的,还是抽样误差所致。是由于治疗造成的,还是抽样误差所致。本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样,二者来自同一总体,接受零假设则表示克矽平没有疗效。二者来自同一总体,接受零假设则表示克矽平没有疗效。而相对立的备择假设表示拒绝而相对立的备择假设表示拒绝H0,治疗后的血红蛋白平均数,治疗后的血红蛋白平均数和治疗前的平均数来自不同总体,即克矽平有疗效。和治疗前的平均数来自不同总体,即克矽平有疗效。H0:=0=126(mg/L)HA:0 0 2 2、确定显著水平确定显著水平0.05显著水平*极显著水平*能否定能否定H0的的人为人为规定的规定的概率概率标准称为显著水平,记作标准称为显著水平,记作。统计学中,一般认为概率小于统计学中,一般认为概率小于0.05或或0.01的事件为的事件为小概率事件小概率事件,所以在小概率原理基础上建立的假设检验也所以在小概率原理基础上建立的假设检验也常取常取=0.05和和=0.01两个显著水平两个显著水平。P1.581)=20.0571=0.1142 根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例:4、作出推断结论:是否接受假设PP0.05所以接受H0,从而得出结论:使用克矽平治疗前后血红蛋白含量未发现有显著差异,其差值10应归于误差所致。P(x +1.96)=0.05P(x +2.58)=0.01P(-1.96u1.96)=0.95P(x+1.96)=P(x+2.58)=P(-2.58u2.58)=0.99u2.58)=0.99P(u 1.96)=0.05P(u 2.58)=0.01已知:0.950.0250.025u 1.96u 2.58P(u )0.05P(u )0.01差异达显著水平差异达显著水平差异达极显著水平差异达极显著水平 0P(-1.96 x x +1.96 x)=0.95-1.96 x+1.96 x0.950.0250.025临界值:临界值:+u x左尾右尾否定区否定区接受区u +1.96 x三三、双尾检验与单尾检验、双尾检验与单尾检验 0P(-2.58 x x 0假设:否定区H0:0 HA:30)时,样本平均数的分布服从正态分布,标准化后服从标准正态分布,即u分布.要检验样本平均数与指定总体平均数的要检验样本平均数与指定总体平均数的差异显著时用差异显著时用u u检验法检验法进行检验进行检验一、一、u分布与分布与u检验检验1、总体方差2已知,无论n是否大于30都可采用u检验法例:例:某鱼场按常规方法所育鲢鱼一月龄的平均体长为某鱼场按常规方法所育鲢鱼一月龄的平均体长为7.25cm,标准差为标准差为1.58cm,现采用一新方法进行育苗,一月龄时随机抽,现采用一新方法进行育苗,一月龄时随机抽取取100尾进行测量,其平均体长为尾进行测量,其平均体长为7.65cm,问新育苗方法与常规方法有无显著差异?问新育苗方法与常规方法有无显著差异?分分分分析析析析()这是一个样本平均数的假设检验,因总体()这是一个样本平均数的假设检验,因总体2已知已知,采用采用u检验;检验;()新育苗方法的鱼苗体长()新育苗方法的鱼苗体长 或或常规方法鱼苗体长,常规方法鱼苗体长,应进行双尾检验。应进行双尾检验。()假设()假设(2)水平)水平(3)检验)检验(4)推断)推断H0:=0=7.25(cm),即新育苗方法与常规方法所育鱼苗一月龄体长相同;即新育苗方法与常规方法所育鱼苗一月龄体长相同;HA:0选取显著水平选取显著水平0.05 u 1.96否定否定H0,接受,接受HA;认为新育苗方法一月龄体长与常规方法有显著差异。认为新育苗方法一月龄体长与常规方法有显著差异。2、总体方差2未知,但n30时,可用样本方差s2来代替 总体方差2,仍用u检验法总体总体(0)样本样本(n30)x s22例:例:生产某种纺织品,要求棉花纤维长度平均为生产某种纺织品,要求棉花纤维长度平均为30mm以上,以上,现有一棉花品种,以现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为进行抽查,测得其纤维平均长度为30.2mm,标准差为,标准差为2.5mm,问该棉花品种的纤维长度是否符合纺织品的生产要求?问该棉花品种的纤维长度是否符合纺织品的生产要求?分分分分析析析析()这是一个样本平均数的假设检验,因总体()这是一个样本平均数的假设检验,因总体2未知未知,n=400 30,可用,可用s2代替代替2进行进行u检验;检验;()棉花纤维只有()棉花纤维只有30mm才符合纺织品的生产要求,因才符合纺织品的生产要求,因 此进行此进行单尾检验单尾检验。()假设()假设(2)水平)水平(3)检验)检验(4)推断)推断H0:0=30(cm),即该棉花品种纤维长度不能达到纺织品生产的要求。即该棉花品种纤维长度不能达到纺织品生产的要求。HA:0选取显著水平选取显著水平0.05 u 1.645接受接受H0,否定,否定HA;认为该棉花品种纤维长度不符合纺织品生产的要求。认为该棉花品种纤维长度不符合纺织品生产的要求。u 0.05=1.64样本为小样本(n30)且总体方差2 未知时,如果仍用s2来估计,这时的标准离差u 就不呈正态分布了,而是服从df=n-1的t 分布,要检验样本平均数与指定总体平均数的差异显著时,就必须用t t检验检验二、二、t分布与分布与t 检验检验t落于落于-t0.05,+t0.05 内的概率为内的概率为0.95t落于落于-t0.01,+t0.01 内的概率为内的概率为0.99置信度为和的置信度为和的t临界值。临界值。t0.05(4)2.776 t0.1(4)2.132-2.776+2.776t0.2(4)1.533在相同的自由度在相同的自由度df时,时,t值越大,概率值越大,概率P越小。越小。在相同在相同t值时,双尾概率值时,双尾概率P为单尾概率为单尾概率P的两倍。的两倍。12df增大,增大,t分布接近正态分布,即分布接近正态分布,即t值接近值接近u值。值。3t分布特性分布特性 例:总体方差2未知,且n30时,可用样本方差s2来代替总体方差2,采用df=n-1的t检验法总体总体(0)样本样本(n30)x s22例:例:某鱼塘水中的含氧量,多年平均为某鱼塘水中的含氧量,多年平均为4.5(mg/L),该鱼塘设,该鱼塘设10个点采集水样,测定含氧量为:个点采集水样,测定含氧量为:4.33,4.62,3.89,4.14,4.78,4.64,4.52,4.55,4.48,4.26(mg/L)试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。分分分分析析析析()这是一个样本平均数的假设检验,因总体()这是一个样本平均数的假设检验,因总体2未知未知,n=10 或或0.05从方差为从方差为2 2的的正态总体中,随机抽取正态总体中,随机抽取k个独立样本,计算个独立样本,计算出样本方差出样本方差S2 2,研究其样本方差的分布。,研究其样本方差的分布。df=k-1在研究样本方差的分布时,通常将其标准化,得到在研究样本方差的分布时,通常将其标准化,得到k个正个正态离差态离差u,则,则三、三、x 分布与分布与x 检验检验22表中表头的概率表中表头的概率是是2 2大于表内所列大于表内所列2 2值的概率。值的概率。df=2P P(2 2 5.995.99)0.050.05P P(2 2 9.219.21)0.010.01P P(2 2 0.100.10)0.950.95例1 一个样本方差的同质性检验所谓方差的同质性,就是指各个总体的所谓方差的同质性,就是指各个总体的方差是相同的。方差是相同的。方差的同质性检验就是要从各样本的方方差的同质性检验就是要从各样本的方差来推断其总体方差是否相同差来推断其总体方差是否相同我们知道从标准正态总体中抽我们知道从标准正态总体中抽取取k个独立个独立u2之和为之和为2,即,即当用样本平均数当用样本平均数 估计估计时,则有:时,则有:由样本方差由样本方差 上式中上式中,分子表示样本的离散程度分子表示样本的离散程度,分母表示总分母表示总体方差体方差,其其 服从自由度为服从自由度为n-1的的 分布分布.得得例题例题 已知某农田受到重金属的污染,经抽样测定其铅浓度为已知某农田受到重金属的污染,经抽样测定其铅浓度为4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2gg-1,样本方差为,样本方差为0.150(gg-1)2,试检验受到污染的农田铅浓度的方差是否与正,试检验受到污染的农田铅浓度的方差是否与正常农田铅浓度的方差常农田铅浓度的方差0.065(gg-1)2相同。相同。此题为一个样本方差与总体方差的同质性检验此题为一个样本方差与总体方差的同质性检验()假设()假设(2)水平)水平选取显著水平选取显著水平0.05 H0:20.065,即受到污染的农田,即受到污染的农田铅浓度的方差与正常农田铅浓度的铅浓度的方差与正常农田铅浓度的方差相同。方差相同。HA:20.065(3)检验)检验查附表,当查附表,当df8-17时,附表是单尾检验,此题为双尾时,附表是单尾检验,此题为双尾(4)推断)推断否定否定H0,接受接受A,即样本方差与总体方差是,即样本方差与总体方差是不同质的,认为受到污染的农田铅浓度的方差不同质的,认为受到污染的农田铅浓度的方差与正常农田铅浓度的方差与正常农田铅浓度的方差0.065(gg-1)2有有显著差异显著差异0.02516.010.9751.690.025例2独立性检验独立性检验又叫列联表(又叫列联表(contigency tablecontigency table)2 2检验,检验,它是研究两个或两个以上因子彼此之间是独立还它是研究两个或两个以上因子彼此之间是独立还是相互影响的一类统计方法。是相互影响的一类统计方法。例例2某医院用碘治疗地方性甲状腺肿,不同某医院用碘治疗地方性甲状腺肿,不同年龄的治疗效果列于下表,试检验不同年龄年龄的治疗效果列于下表,试检验不同年龄的治疗效果有无差异?的治疗效果有无差异?年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效合计合计11113030313150505050以上以上6767323210109 9232311111010202023235 54 45 5919179794949合计合计109109434353531414219219不同年龄用碘剂治疗甲状腺肿效果比较不同年龄用碘剂治疗甲状腺肿效果比较1.H0:治疗效果与年龄无关;:治疗效果与年龄无关;HA:治疗效果与:治疗效果与年龄有关,即不同年龄治疗效果不同;年龄有关,即不同年龄治疗效果不同;2.给出显著水平给出显著水平0.010.013.3.计算统计数计算统计数2:年龄(岁)年龄(岁)治愈治愈显效显效好转好转无效无效 合计合计11113030313150505050以上以上6767323210109 9232311111010202023235 54 45 5919179794949合计合计109109434353531414219219查查2表,当表,当df=(3-1)(4-1)6时,时,20.0116.81,所以,所以246.98820.01,P0.01,应拒绝,应拒绝H0,接受,接受HA,说明治疗效果与年龄有关。,说明治疗效果与年龄有关。在治疗效果与年龄有关的基础上,可以将下面的在治疗效果与年龄有关的基础上,可以将下面的34列联表做成列联表做成3个24列联表,测验列联表,测验2个年龄段疗效个年龄段疗效的差异:的差异:11113030岁岁与与31315050岁岁两个年龄段疗效的比较两个年龄段疗效的比较11113030岁岁与与5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗效的比较31315050岁岁与与5050岁以上岁以上两个年龄段疗效的比较两个年龄段疗效的比较(1)(1)11113030岁与岁与31315050岁两个年龄段疗效的比较岁两个年龄段疗效的比较年龄(岁)年龄(岁)治愈治愈显效显效 好转好转 无效无效 合计合计1111303031315050676732329 92323101020205 54 491917979合计合计9999323230309 9170170(2)(2)11113030岁与岁与5050岁以上两个年龄段疗效的比较岁以上两个年龄段疗效的比较年龄(岁)年龄(岁)治愈治愈显效显效 好转好转 无效无效 合计合计111130305050以上以上676710109 91111101023235 55 591914949合计合计7777202033331010140140(3)31(3)315050岁与岁与5050岁以上两个年龄段疗效的比较岁以上两个年龄段疗效的比较年龄(岁)年龄(岁)治愈治愈显效显效 好转好转 无效无效 合计合计313150505050以上以上3232101023231111202023234 45 579794949合计合计4242343443439 912812811113030岁与岁与31315050岁两个年龄段疗效的比较岁两个年龄段疗效的比较 2 2 21.202(21.202(极显著极显著)11113030岁与岁与5050岁以上两个年龄段疗效的比较岁以上两个年龄段疗效的比较2 2 38.37(38.37(极显著极显著)31315050岁与岁与5050岁以上两个年龄段疗效的比较岁以上两个年龄段疗效的比较2 2 9.574(9.574(显著显著)df=(2-1)df=(2-1)(4-1)=3 (4-1)=3 2 20.050.05=7.81 =7.81 2 20.010.01=11.34=11.34 比较观测数与理论数是否符合的假设检验。比较观测数与理论数是否符合的假设检验。例例3 适合性检验适合性检验定义定义用用 途途遗传学中用以检验实际结果是否符合遗传规律遗传学中用以检验实际结果是否符合遗传规律样本的分布与理论分布是否相等样本的分布与理论分布是否相等自由组合定律自由组合定律适合性检验的适合性检验的dfdf由于受理论值的总和等于由于受理论值的总和等于观测值总和这一条件的约束,故观测值总和这一条件的约束,故dfdf=n-1=n-1孟德尔分离规律孟德尔分离规律体色体色青灰色青灰色红色红色总数总数F F2 2观测尾数观测尾数15031503999916021602鲤鱼遗传试验鲤鱼遗传试验F F2 2观测结果观测结果问问:鲤鱼体色鲤鱼体色F2F2分离符合否符合遗传规律分离符合否符合遗传规律3 3:1 1比率比率?(1)H0:鲤鱼体色:鲤鱼体色F F2 2分离符合分离符合3:1比率比率;HA:鲤鱼体色:鲤鱼体色F F2 2分离不符合分离不符合3 3:1 1比率比率;(2)取显著水平)取显著水平0.050.05(3)计算统计数)计算统计数2 2 :df=k-1=2-1=1df=k-1=2-1=1在无效假设在无效假设H0正确的前提下,青灰色的理论数为:正确的前提下,青灰色的理论数为:Ei 16023/4=1201.5红色理论数为:红色理论数为:Ei 16021/4=400.5需要连续性校正需要连续性校正2(OiEi 0.50.5)2 Eii=12=+(15031201.5 0.50.5)2 1201.5(99400.5 0.50.5)2 400.5=75.41+226.22301.63(4 4)查)查2 2值表,当值表,当df=1df=1时,时,2 20.050.05 3.843.84。现实。现实得得2 2c c 301.63301.632 20.050.05 ,故应否定,故应否定H H0 0 ,接受,接受H HA A ,即认为鲤鱼体色,即认为鲤鱼体色F2F2分离不符合分离不符合3 3:1 1比率。比率。设从一正态总体设从一正态总体N(,N(,2 2)中随机抽取样本容量为中随机抽取样本容量为n1、n2的两个独立样本,其样本方差为的两个独立样本,其样本方差为s12、s22,则定义其,则定义其比值:比值:F=此值具有此值具有s12的自由度的自由度df1=n1-1和和s22的自由度的自由度df2=n2-1。S12/s22四、四、F分布与分布与F 检验检验其其F 分布曲线随着分布曲线随着df1 和和df2 的变化而的变化而变化。由于变化。由于F 值表是一尾的(值表是一尾的(F值的区间值的区间0,+)),一般将大方差作分子,小),一般将大方差作分子,小方差作分母,使方差作分母,使F 值大于值大于1,因此,表上,因此,表上df1 的代表大方差自由度,的代表大方差自由度,df2 代表小方代表小方差自由度。差自由度。P P(3.483.48)0.050.05P P(5.995.99)0.010.01F0.05(4,10)=3.48F0.01(4,10)=5.99检验两品种小麦蛋白质样本方差是否有显著差异?检验两品种小麦蛋白质样本方差是否有显著差异?分分析析测定农大测定农大193的蛋白质含量()的蛋白质含量()5次,次,s22=0.135测定东方红测定东方红3号的蛋白质含量()号的蛋白质含量()10次,次,s12=1.621()假设()假设(2)水平)水平(3)检验)检验H0:12=22=2 HA:12 22(4)推断)推断P0.05,否定否定H0,接受接受HA,两样本方两样本方差有显著不同。差有显著不同。选取显著水平选取显著水平0.05 例例1:例例2、两个样本方差的同质性检验、两个样本方差的同质性检验假设两个样本容量分别为假设两个样本容量分别为n1和和n2,方差分别,方差分别为为s12和和s22,总体方差分别为,总体方差分别为12和和22,当检验,当检验12和和22是否同质时,可用检验法。是否同质时,可用检验法。当两样本总体均服从正态分布,且两样本当两样本总体均服从正态分布,且两样本的抽样是随机的和独立的,其值等于两的抽样是随机的和独立的,其值等于两样本方差样本方差s12和和s22之比。之比。且服从且服从df1n1-1,df2n2-1的的F分布。当分布。当FF时,否定时,否定0:1222,即认为两样,即认为两样本的方差是不同质的。本的方差是不同质的。F=S12/s22检验例中两个小麦品种千粒重的方差是否同质。检验例中两个小麦品种千粒重的方差是否同质。该题中,该题中,s1222.933,s222.933,n1=n2=10()假设()假设H0:12 22,HA:12 22(2)水平)水平选取显著水平选取显著水平0.05 ,F0.05(9,9)=3.18例例:两个小麦品种千粒重:两个小麦品种千粒重(g)调查结果调查结果品种甲:品种甲:50,47,42,43,39,51,43,38,44,37品种乙:品种乙:36,38,37,38,36,39,37,35,33,37(3)检验(4)推断否定否定H0,接受,接受HA,即认为两小麦,即认为两小麦品种千粒重的方差不是同质的品种千粒重的方差不是同质的F=S12/s22=2.933/22.933=7.8193.18四、综合四、综合F 检验与检验与t检验检验前提条件:要检验两个样本(成组数据)平均数的差异显著时前提条件:要检验两个样本(成组数据)平均数的差异显著时两个总体方差12 和22未知,且两个样本都是小样本,即n130,n230,Se22 df=n-1df=n-1平均数差数的标准误平均数差数的标准误当当n1=n2=n时时如果如果1 12 22 22 2,n n1 1=n=n2 2=n=n 平均数差数的方差平均数差数的方差或或1 12 2=2 22 2df=(n1-1)+(n2-1)df=(n1-1)+(n2-1)Se22 df=df=(n n1 1-1)+(n-1)+(n2 2-1)-1)平均数差数的标准误平均数差数的标准误如果如果1 12 2=2 22 2平均数差数的方差平均数差数的方差Se22 df=n-1df=n-1平均数差数的标准误平均数差数的标准误当当n1=n2=n时时如果如果1 12 22 22 2(由由F F检验得知检验得知),n n1 1=n=n2 2=n=n 平均数差数的方差平均数差数的方差例例:两个小麦品种千粒重:两个小麦品种千粒重(g)调查结果调查结果品种甲:品种甲:50,47,42,43,39,51,43,38,44,37品种乙:品种乙:36,38,37,38,36,39,37,35,33,37检验两品种的千粒重有无差异。检验两品种的千粒重有无差异。两样本方差不相等。两样本方差不相等。分分析析()()1 12 2和和2 22 2未知,且不相等,都小样本,未知,且不相等,都小样本,且且n n1 1=n=n2 2,用用df=n-1df=n-1的的t t检验。检验。()事先不知道两个品种千粒重孰高孰低,()事先不知道两个品种千粒重孰高孰低,故而用双尾检验。故而用双尾检验。()假设()假设(2)水平)水平(3)检验)检验H0:1 2,即认为两品种千粒重无显著差异。,即认为两品种千粒重无显著差异。HA:1 2选取显著水平选取显著水平0.05(4)推断)推断在在0.05显著水平上,否定显著水平上,否定H0,接受,接受HA;认为两品种千粒重存在明显差异。认为两品种千粒重存在明显差异。t 0.05(9)=2.262P0.05df=n-1df=n-19 9采用近似地采用近似地t t检验,即检验,即Aspin-WelchAspin-Welch检验法。检验法。如果如果1 12 22 22 2,n n1 1 n n2 2检验两品种小麦蛋白质含量是否有显著差异?检验两品种小麦蛋白质含量是否有显著差异?分分析析n n1 1 n n2 2,用近似的,用近似的t分布,使用双尾检验。分布,使用双尾检验。测定农大测定农大193的蛋白质含量()的蛋白质含量()5次,次,x2=11.7,s22=0.135测定东方红测定东方红3号的蛋白质含量()号的蛋白质含量()10次,次,x1=14.3,s12=1.621()假设()假设(2)水平)水平(3)检验)检验H0:12=22=2 HA:12 22(4)推断)推断两样本方差有显著不同。两样本方差有显著不同。选取显著水平选取显著水平0.05 例:例:()假设()假设(2)水平)水平(3)检验)检验H0:12,即两品种蛋白质含量没有显著差别。,即两品种蛋白质含量没有显著差别。HA:1 2选取显著水平选取显著水平0.01(4)推断)推断在在0.01显著水平上,否定显著水平上,否定H0,接受,接受HA;认为两品种蛋白质含量有极显著差异,东方红认为两品种蛋白质含量有极显著差异,东方红3号小麦蛋白质含量极显著的高于农大号小麦蛋白质含量极显著的高于农大193。t 0.01(12)=3.056P0.01频率的假设检验频率的假设检验当当 np 或或 nq5由二项式由二项式 (p+q)n 展开式直接检验展开式直接检验概率函数概率函数 Cnxpxqn-x P(x)P(0)C50p0q5 0.00001 P(1)C51p1q4 0.00045 P(2)C52p2q3 0.0081 P(3)C53p3q2 0.0729 P(4)C54p4q1 0.32805 P(5)C55p5q0 0.59049孵化小鸡的概率表孵化小鸡的概率表(p=0.90 q=0.10)P(0)或或P(1)或或P(2)0.05,差异不显著。,差异不显著。频率的假设检验频率的假设检验当当 np 和和 nq 30中心极限定中心极限定中心极限定中心极限定理理理理正态分布正态分布正态分布正态分布(u u u u 检检检检 验验验验 )近似近似近似近似发芽率发芽率发芽率发芽率死亡率死亡率死亡率死亡率结实率结实率结实率结实率相状比相状比相状比相状比一、一个样本频率一、一个样本频率一、一个样本频率一、一个样本频率的假设检验的假设检验的假设检验的假设检验适用范围适用范围:检验一个样本频率(记为检验一个样本频率(记为 )和某一理论值或期望值和某一理论值或期望值p的差异显著性。的差异显著性。样本频率的标准误样本频率的标准误其中其中 q=1-p1、当、当 np 和和 nq 30,不需连续性矫正,则,不需连续性矫正,则u值为:值为:2、当、当 5np 或或 nq30时,需要进行连续性矫正,时,需要进行连续性矫正,uc值为:值为:如果如果np30,因,因0p1,所以,所以np时取时取“”;30,无需连续矫正,用,无需连续矫正,用u检验;检验;()假设()假设(2)水平)水平(3)检验)检验(4)推断)推断H0:p=0.85即用种衣剂浸种后的发芽率仍为即用种衣剂浸种后的发芽率仍为0.85;HA:p0.85选取显著水平选取显著水平0.05 u 1.96,P0.800.80为合格,现对一批种蛋随为合格,现对一批种蛋随为合格,现对一批种蛋随为合格,现对一批种蛋随机抽取机抽取机抽取机抽取100100枚进行孵化,结果有枚进行孵化,结果有枚进行孵化,结果有枚进行孵化,结果有7878枚孵出,枚孵出,枚孵出,枚孵出,问这批种蛋是否合格?问这批种蛋是否合格?问这批种蛋是否合格?问这批种蛋是否合格?(3)只有孵化率只有孵化率只有孵化率只有孵化率 0.800.80,才认为是不合格,故采用,才认为是不合格,故采用,才认为是不合格,故采用,才认为是不合格,故采用 单尾检验。单尾检验。单尾检验。单尾检验。分分分分析析析析(1)一个样本频率的假设检验;)一个样本频率的假设检验;(2)np 和和 nq 5,但,但nq 30nq 30,用,用u检验;检验;()假设()假设()假设()假设(2 2)水平)水平)水平)水平(3 3)检验)检验)检验)检验(4 4)推断)推断)推断)推断HH0 0:p 0.80:p 0.80,即该批种蛋不合格。,即该批种蛋不合格。,即该批种蛋不合格。,即该批种蛋不合格。HHA A:p0.80:p0.80选取显著水平选取显著水平选取显著水平选取显著水平 0.05 0.05 u uc c 1.645 0.05P0.05在在在在0.050.05显著水平上,接受显著水平上,接受显著水平上,接受显著水平上,接受HH0 0,否定,否定,否定,否定HHA A;认为这批种蛋不合格。认为这批种蛋不合格。认为这批种蛋不合格。认为这批种蛋不合格。二、两个样本频率二、两个样本频率二、两个样本频率二、两个样本频率的假设检验的假设检验的假设检验的假设检验适用范围适用范围:检验两个样本频率检验两个样本频率 和和 差异的差异的显著性。显著性。一般假定两个样本的方差是相等的,即一般假定两个样本的方差是相等的,即当当n1=n2=n时时 在总体在总体p1和和p2未知,假定未知,假定 条件下,可用两条件下,可用两样本频率的加权平均值样本频率的加权平均值 作为对作为对p1和和p2的估计,即:的估计,即:1、当、当 np 和和 nq 30,不需连续性矫正,用,不需连续性矫正,用u检验:检验:在在H0:p1=p2下,下,2、当、当 5 np 或或 nq 30,用用u检验:检验:在在H0:p1=p2下,下,2、当、当 5 np 或或 nq 30,需进行连续性矫正,需进行连续性矫正,如果如果n 30,无需连续矫正,用,无需连续矫正,用u检验;检验;()假设()假设(2)水平)水平(3)检验)检验H0:p1=p2即两块麦田锈病发病率没有显著差异。即两块麦田锈病发病率没有显著差异。HA:p1 p2选取显著水平选取显著水平0.01 在在0.01显著水平上,否定显著水平上,否定H0,接受,接受HA;认为两块麦田锈病发病率有极显著差异,即地认为两块麦田锈病发病率有极显著差异,即地势对小麦锈病的发生有极显著影响作用,低洼势对小麦锈病的发生有极显著影响作用,低洼地小麦锈病的发病率极显著高于高坡地。地小麦锈病的发病率极显著高于高坡地。(4)推断)推断u2.58,P0.01例例:某鱼场发生了药物中毒,:某鱼场发生了药物中毒,检验甲、乙两池发生药物中毒以后,鱼的死亡率检验甲、乙两池发生药物中毒以后,鱼的死亡率是否有显著性差异。是否有显著性差异。抽查甲池中的抽查甲池中的2929尾鱼,有尾鱼,有2020尾死亡尾死亡抽查乙池中的抽查乙池中的2828尾鱼,有尾鱼,有2121尾死亡尾死亡(3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。)事先不知两池鱼的死亡率孰高孰低,用双尾检验。分分分分析析析析(1)2个样本频率的假设检验;个样本频率的假设检验;(2)5 np 和和 nq 30,需进行连续矫正,需进行连续矫正,因因n130,n230,用,用t检验;检验;()假设()假设(2)水平)水平(3)检验)检验H0:p1=p2即甲乙两池鱼的死亡率没有显著差异即甲乙两池鱼的死亡率没有显著差异 HA:p1 p2选取显著水平选取显著水平0.05 df=29+28-2=55在在0.05显著水平上,接受显著水平上,接受H0,否定,否定HA;认为发生药物中毒后,甲、乙两鱼池鱼的死亡率认为发生药物中毒后,甲、乙两鱼池鱼的死亡率没有显著差异。没有显著差异。(4)推断)推断t 0.05(55)=2.004,t c t 0.05(55)第四节:参数的区间估计与点估计第四节:参数的区间估计与点估计一、参数区间估计与点估计的原理一、参数区间估计与点估计的原理三、三、二、总体平均数的区间估计与点估计二、总体平均数的区间估计与点估计总体频率的区间估计与点估计总体频率的区间估计与点估计一、参数区间估计与点估计的原理一、参数区间估计与点估计的原理参数的区间估计与点估计是建立在一定理论基础参数的区间估计与点估计是建立在一定理论基础上的一种方法。上的一种方法。由中心极限定理和大数定律,只要抽样为大样本,由中心极限定理和大数定律,只要抽样为大样本,不论其总体是否为正态分布,其样本平均数都近似不论其总体是否为正态分布,其样本平均数都近似服从正态分布服从正态分布N(N(,2 2/n)/n)。00.950.95(接受区)(接受区)0.0250.025临界值临界值接受区接受区 0-1.96 x 0+1.96 x样本平均数的分布样本平均数的分布u:正态分布下置信度:正态分布下置信度P=1-时的时的u临界值临界值1-:置信水平:置信水平知道知道 x,但不知道,但不知道1-置信区间置信区间用用样样本本平平均均数数 x 对对总总体体平平均均数数的的置置信信度度为为P=1-的的区间估计区间估计。用用样样本本平平均均数数 x 对对总总体体平平均均数数的的置置信信度度为为P=1-的的点估计点估计。当为大样本时,不论总体方差当为大样本时,不论总体方差2为已为已知或未知(或为小样本,总体方差已知知或未知(或为小样本,总体方差已知时),可以利用样本平均数时),可以利用样本平均数x和总体方和总体方差差2作出置信度为作出置信度为P1-的中体平均数的中体平均数的区间估计为:的区间估计为:二、总体平均数二、总体平均数的区间估计和点估计的区间估计和点估计其置信区间的下限其置信区间的下限L1和上限和上限L2为为总体平均数的点估计总体平均数的点估计L为为 当样本为小样本且总体方差当样本为小样本且总体方差2未知时,未知时,2需由样本方差需由样本方差s2来估计,于是置信度为来估计,于是置信度为P1-的总体平均数的总体平均数的置信区间可估计为的置信区间可估计为其置信区间的下限其置信区间的下限L1和上限和上限L2为:为:总体平均数的点估计总体平均数的点估计L为:为:T为为正正态态分布下置信度分布下置信度P1 时的时的t临界值临界值 例:测得某批例:测得某批25个小麦样本的平均蛋白质含量个小麦样本的平均蛋白质含量14.5,已知,已知2.50,试进行,试进行95置信度置信度下的蛋白质含量的区间估计和点估计。下的蛋白质含量的区间估计和点估计。分析:本例分析:本例为已知为已知,置信度置信度P P1-1-=0.95=0.95,u u0.050.05=1.96=1.96。蛋白质含量的点估计为:蛋白质含量的点估计为:说明小麦蛋白质含量有说明小麦蛋白质含量有95的把握落的把握落在在13.5215.48的区间里。的区间里。例题例题 从某渔场收对虾的总体中,随机取从某渔场收对虾的总体中,随机取20尾尾对虾,测的平均体长对虾,测的平均体长x120mm,标准差,标准差 s15mm,试估计置信度为,试估计置信度为99的对虾总体平均数的对虾总体平均数本例中,由于

    注意事项

    本文(第四章 统计推断-.ppt)为本站会员(qwe****56)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开