《第4章 参数估计与假设检验精选文档.ppt》由会员分享,可在线阅读,更多相关《第4章 参数估计与假设检验精选文档.ppt(55页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第4章 参数估计与假设检验本讲稿第一页,共五十五页一、点估计及其性质一、点估计及其性质估计量:估计量:设设 为总体为总体X X的一个未知参数,统计量的一个未知参数,统计量 称为称为 的估计量。的估计量。通过一次具体抽样值通过一次具体抽样值 ,估计,估计参数参数 取值的方法称为参数的点估计问题。取值的方法称为参数的点估计问题。一个待估参数一个待估参数 ,可以有几个不同的估计量,可以有几个不同的估计量,这就引出了如何衡量估计量好坏的标准。这就引出了如何衡量估计量好坏的标准。称为称为 的估计值。的估计值。本讲稿第二页,共五十五页1 1、无偏性、无偏性定义定义 若若 ,则,则 称为称为 的无偏估计量。
2、的无偏估计量。结论结论 设总体为设总体为X X,有,有 ,为取自为取自X X的样本,则的样本,则 、分别为分别为 的无偏估计量。的无偏估计量。即即注意注意:S S不是不是 的无偏估计量的无偏估计量,只是只是 的一个估计量的一个估计量.本讲稿第三页,共五十五页2 2、有效性、有效性例例1 1 设设 为取自总体的样本,且为取自总体的样本,且 ,。问:。问:是否为是否为 的无偏估计量的无偏估计量?和和 哪个更有效?哪个更有效?和和由证明得知,总体均数由证明得知,总体均数 和方差和方差 的有效估计的有效估计量分别为量分别为 和和 。定义定义 设设 和和 均为未知参数均为未知参数 的无偏估计量,的无偏估
3、计量,若若 ,则称,则称 比比 有效。有效。本讲稿第四页,共五十五页解:解:所以所以 和和 都是都是 的无偏估计量,由此可的无偏估计量,由此可知一个未知参数的无偏估计量不是唯一的。知一个未知参数的无偏估计量不是唯一的。本讲稿第五页,共五十五页3 3、一致性、一致性结论:结论:和和 分别是总体均数分别是总体均数 和和 的一致的一致估计量。估计量。定义定义 设设 为为 的估计量,若对的估计量,若对 ,有,有则称则称 为为 的一致估计量的一致估计量,即即 因为因为 ,故,故 比比 有效有效本讲稿第六页,共五十五页定义定义 设总体设总体X X含有未知参数含有未知参数,(0,1)(0,1)P(150f5
4、0时,时,若此题用公式若此题用公式*计算,给定计算,给定 ,自由度,自由度 ,查查u u分布临界值表,得分布临界值表,得本讲稿第十九页,共五十五页 此题因为是大样本,故用两种方法计算结果相同,此题因为是大样本,故用两种方法计算结果相同,而公式而公式*较简便。如果是小样本,只能按小样本的较简便。如果是小样本,只能按小样本的公式公式*计算。若按大样本公式计算,结果误差偏大。计算。若按大样本公式计算,结果误差偏大。本讲稿第二十页,共五十五页(2 2)未知且未知且 若为小样本,取样本函数若为小样本,取样本函数其中其中得得 的置信度为的置信度为 的置信区间为的置信区间为本讲稿第二十一页,共五十五页若为大
5、样本,取样本函数若为大样本,取样本函数(近似服从)(近似服从)得得 的置信度为的置信度为 的置信区间为的置信区间为本讲稿第二十二页,共五十五页例例6 6 用两种方法测得某药物中一种元素的含量(用两种方法测得某药物中一种元素的含量(%)得数据如下:得数据如下:方法方法I I:3.28,3.28,3.29,3.293.28,3.28,3.29,3.29方法方法IIII:3.25,3.27,3.26,3.253.25,3.27,3.26,3.25试估计这两种方法测得的元素含量的均数差的置信试估计这两种方法测得的元素含量的均数差的置信区间(置信度为区间(置信度为0.95)0.95)解:设方法解:设方法
6、I I和和IIII测得元素的含量服从正态分布,则测得元素的含量服从正态分布,则两组数据分别是从两个正态总体中抽出的样本。由于两组数据分别是从两个正态总体中抽出的样本。由于方法不同,可认为方法不同,可认为 。已知已知本讲稿第二十三页,共五十五页查临界值表查临界值表代入小样本置信区间得代入小样本置信区间得本讲稿第二十四页,共五十五页四、正态总体方差四、正态总体方差2 2的区间估计的区间估计 1 1、单个正态总体单个正态总体 的区间估计的区间估计取样本函数取样本函数由由 ,得,得本讲稿第二十五页,共五十五页fn1 例例7 某药含碳量服从正态分布某药含碳量服从正态分布,允许方差在允许方差在0.0482
7、(mg2)内内,任任取取5件测得含碳量件测得含碳量1.32,1.55,1.36,1.40,1.44(mg),根据根据0.05判断该药生产是否稳定?判断该药生产是否稳定?解:已知解:已知n5,1.414,S0.0882,fn-14 即得即得 的置信度为的置信度为 的置信区间的置信区间查表得查表得本讲稿第二十六页,共五十五页2的置信度的置信度0.95的置信区间的置信区间 (0.0028,0.0642)置信区间的下限置信区间的下限0.00280.04820.0023可认为该药生产不稳定可认为该药生产不稳定 本讲稿第二十七页,共五十五页2 2、两个正态总体方差比两个正态总体方差比 的区间估计的区间估计
8、取样本函数取样本函数对给定的置信度对给定的置信度 ,有,有则则本讲稿第二十八页,共五十五页即得即得 的置信度为的置信度为 的置信区间的置信区间F F分布的临界值性质:分布的临界值性质:例例8 8 用两种方法各用两种方法各4 4次测定次品占总产品数量的百分次测定次品占总产品数量的百分比,测定的标准差分别为比,测定的标准差分别为0.11,0.07,0.11,0.07,求方差比的置信度求方差比的置信度为为0.950.95的置信区间。的置信区间。解:已知解:已知本讲稿第二十九页,共五十五页给定给定 ,自由度,自由度 ,查表得,查表得代入置信区间得代入置信区间得本讲稿第三十页,共五十五页一、假设检验的原
9、理一、假设检验的原理小概率原理小概率原理 概率很小的事件,在一次试验中是不可能发生的,这一概率很小的事件,在一次试验中是不可能发生的,这一原理称为原理称为小概率原理小概率原理。例如有人说例如有人说,我厂生产的我厂生产的10001000个产品中只有个产品中只有1 1个是次品个是次品.即次品率为即次品率为1/1000,1/1000,现从中随机抽取一个现从中随机抽取一个,结果恰是次品结果恰是次品,此时我们会怀疑这人的说法,认为次品率不是此时我们会怀疑这人的说法,认为次品率不是1/10001/1000。所以假设检验的基本思想可以概括成一句话:所以假设检验的基本思想可以概括成一句话:“是是某种带有概率性
10、质的反证法某种带有概率性质的反证法”。类似于数学中逻辑论。类似于数学中逻辑论证的反证法,但又区别于纯数学中逻辑推理的反证法。证的反证法,但又区别于纯数学中逻辑推理的反证法。因为我们这里的所谓不合理,并不是绝对矛盾,而是因为我们这里的所谓不合理,并不是绝对矛盾,而是基于小概率原理。基于小概率原理。本讲稿第三十一页,共五十五页判断判断H0为真为真H0为假为假拒绝拒绝H0(接受接受H1)(弃真弃真)1-(正确正确)接受接受H01-(正确正确)(取伪取伪)概率概率不等于不等于1-,减小减小,中一个时中一个时,另一个往往会增大另一个往往会增大,要同时减小要同时减小,只有增加样本容量,只有增加样本容量,可
11、先限制检验水准可先限制检验水准,再适当确定样本容量使再适当确定样本容量使尽量小。尽量小。二、假设检验中的两类错误二、假设检验中的两类错误1、第一类错误:、第一类错误:为真时却拒绝了为真时却拒绝了 ,也称,也称弃真错误。犯这类错误的概率就是所谓的小概率弃真错误。犯这类错误的概率就是所谓的小概率事件发生的概率,常用事件发生的概率,常用 表示。通常取表示。通常取0.1,0.05,0.012 2、第二类错误:、第二类错误:为假时却接受了为假时却接受了 ,也称取伪,也称取伪错误。犯这类错误的概率常用错误。犯这类错误的概率常用 表示。表示。本讲稿第三十二页,共五十五页单侧检验单侧检验左侧检验:左侧检验:右
12、侧检验:右侧检验:双侧检验双侧检验原假设原假设备择假设备择假设(可忽略不写可忽略不写)在实际问题中在实际问题中,有时需要推断总体参数是否增大有时需要推断总体参数是否增大或者减小或者减小,如果事先有根据认为如果事先有根据认为 可能大于可能大于 ,这时这时采用右侧检验采用右侧检验;反之反之,采用左侧检验采用左侧检验.三、假设检验的一般步骤三、假设检验的一般步骤第一步:第一步:根据研究问题的需要提出原假设和备择假设。根据研究问题的需要提出原假设和备择假设。本讲稿第三十三页,共五十五页第二步:第二步:确定检验的统计量并计算出它的值。确定检验的统计量并计算出它的值。第三步:第三步:在给定的显著性水平在给
13、定的显著性水平 下,查表确定临下,查表确定临 界值。界值。(注意区分单侧、双侧检验)注意区分单侧、双侧检验)第四步:第四步:把统计量的值和临界值比较,决定是否接受把统计量的值和临界值比较,决定是否接受1、单个正态总体均数、单个正态总体均数 的检验的检验(1 1)已知已知uu检验检验 统计量统计量拒绝域拒绝域信息信息临界值临界值本讲稿第三十四页,共五十五页在上面的表格中,在上面的表格中,和和 ,即,即 ,均为小概率事件。此时小概率事件若发生,则我们均为小概率事件。此时小概率事件若发生,则我们就会怀疑原假设就会怀疑原假设 不成立,从而拒绝不成立,从而拒绝 ,接受,接受 。例例1 六味地黄丸丸重服从
14、正态分布六味地黄丸丸重服从正态分布,标准差标准差=0.5g,规定标规定标准丸重为准丸重为9g,随机抽取随机抽取100丸丸,样本均数为样本均数为9.1g,判断该批产判断该批产品是否合格品是否合格?解:首先提出原假设和备择假设,该批产品合格的解:首先提出原假设和备择假设,该批产品合格的标准是丸重为标准是丸重为9g9g,故应采用双侧检验。,故应采用双侧检验。已知已知 ,=0.5,n=100.=0.5,n=100.故采用故采用u u检验,计算检验,计算本讲稿第三十五页,共五十五页统计量得统计量得查临界值查临界值因为因为 ,故小概率事件发生,我们有理由拒绝,故小概率事件发生,我们有理由拒绝 ,认为该产品
15、不合格。,认为该产品不合格。例例2 安眠药睡眠时间服从正态分布安眠药睡眠时间服从正态分布,标准差为标准差为1.5小时小时,10人服用后人服用后,测得平均睡眠时间为测得平均睡眠时间为21.15小时小时,该批号安该批号安眠药睡眠时间的总体均数是否高于眠药睡眠时间的总体均数是否高于20小时小时=0.01=0.01 解:已知解:已知 ,故此题应采用,故此题应采用右侧检验右侧检验H0:=20,H1:20本讲稿第三十六页,共五十五页统计量的值统计量的值查临界值查临界值因为因为 ,小概率事件发生,故拒绝,小概率事件发生,故拒绝 ,接受,接受 ,认为睡眠时间总体均数显著高于,认为睡眠时间总体均数显著高于202
16、0小时。小时。(2 2)未知未知tt检验检验 统计量统计量拒绝域拒绝域信息信息临界值临界值本讲稿第三十七页,共五十五页大样本时大样本时,总体不论是否服从正态分布,统计量渐近服从总体不论是否服从正态分布,统计量渐近服从正态分布正态分布,可使用可使用u检验。检验。例例3 人人体体注注射射麻麻疹疹疫疫苗苗后后,抗抗体体强强度度服服从从正正态态分分布布,16人人注注射射测测得得抗抗体体强强度度为为1.2,2.5,1.9,1.5,2.7,1.7,2.2,2.2,3.0,2.4,1.8,2.6,3.1,2.3,2.4,2.1,根根据据样样本本能能否否证证实实该该厂厂产产品的平均抗体强度高于品的平均抗体强度
17、高于1.9?=0.05=0.05解:由已知计算得解:由已知计算得 ,S=0.5183=0.5183,n=16,f=15n=16,f=15设设 ,未知,故用未知,故用t t检验检验查临界值查临界值因为因为 ,故拒绝,故拒绝 ,认为该厂产品的平均,认为该厂产品的平均抗体强度显著高于抗体强度显著高于1.91.9。本讲稿第三十八页,共五十五页例例4 甘草流浸膏中甘草酸含量服从正态分布甘草流浸膏中甘草酸含量服从正态分布,要求甘要求甘草酸含量不得低于草酸含量不得低于8.32(%),随机抽取随机抽取4个样品测得样本个样品测得样本均数为均数为8.30(%),样本标准差样本标准差S=0.03(%),判断该厂产品
18、判断该厂产品的甘草酸含量是否低于标准?的甘草酸含量是否低于标准?=0.05=0.05 解:已知解:已知 ,未知。故应用未知。故应用左侧左侧t t检验检验 f=4-1=3,f=4-1=3,查临界值查临界值计算统计量计算统计量因为因为 ,故,故接受接受 ,认为甘草酸含量没有,认为甘草酸含量没有低于标准。低于标准。本讲稿第三十九页,共五十五页2 2、单个正态总体方差、单个正态总体方差 的假设检验的假设检验 统计量统计量拒绝域拒绝域信息信息临界值临界值或或例例5 5 某厂准备生产一批新药某厂准备生产一批新药,通常收率的标准差在通常收率的标准差在5%5%以内认为是稳定的以内认为是稳定的,现试产现试产9
19、9批批,得平均收率得平均收率(%)(%)为为75.244,75.244,方差为方差为3.3083.308。问此药的生产是否稳定?显著水平问此药的生产是否稳定?显著水平0.010.01解:已知解:已知设设本讲稿第四十页,共五十五页计算统计量计算统计量查临界值,查临界值,f=8f=8,因为因为 ,故拒绝,故拒绝 ,即标准差不大于,即标准差不大于5%5%认为生产是稳定的。认为生产是稳定的。本讲稿第四十一页,共五十五页一、配比对较两个正态总体均数的差异一、配比对较两个正态总体均数的差异 作出两组资料各对的差值作出两组资料各对的差值d,问题转化为差值样本均问题转化为差值样本均数的总体均数数的总体均数d是
20、否为是否为0的的t检验。检验。是从两正态总体中抽出的样本均数。假设两种是从两正态总体中抽出的样本均数。假设两种处理下的正态总体均数相同处理下的正态总体均数相同,记记 统计量统计量拒绝域拒绝域信息信息临界值临界值其中其中本讲稿第四十二页,共五十五页大样本时大样本时,总体不论是否正态分布总体不论是否正态分布,可用可用d的的u检验检验 例例1 考察中药眼伤宁对家兔角膜伤口愈合作用考察中药眼伤宁对家兔角膜伤口愈合作用,测得造测得造模兔用药前及用药后两月的角膜厚度值模兔用药前及用药后两月的角膜厚度值(mm),判断眼伤判断眼伤宁对促进角膜伤口愈合有无作用。宁对促进角膜伤口愈合有无作用。=0.01=0.01
21、 造模兔号造模兔号 1 2 3 4 5 6 7 8 9 10用药前后用药前后0.74 .74 .72 .72 .76 .72 .72 .76 .64 .68药后两月药后两月0.56 .58 .58 .58 .56 .60 .60 .60 .58 .60解:由样本计算解:由样本计算 =0.1360,Sd=0.0430,f=n-1=9 H0:d=0,H1:d0 本讲稿第四十三页,共五十五页查临界值,查临界值,因为因为 ,故拒绝,故拒绝 ,认为,认为眼伤宁对促进角眼伤宁对促进角膜伤口愈合有极显著作用。膜伤口愈合有极显著作用。本讲稿第四十四页,共五十五页二、方差齐性检验二、方差齐性检验FF检验检验 设
22、两总体设两总体 和和 ,和和 是分别从总体是分别从总体X X、Y Y中抽出中抽出的样本。的样本。统计量统计量拒绝域拒绝域信息信息临界值临界值()在计算在计算F F值时,总是以样本方差大的作分子,这样就值时,总是以样本方差大的作分子,这样就使使F1F1。而。而F F分布的右侧临界值分布的右侧临界值 或或 都是大于都是大于1 1的的数,根据数,根据F F分布临界值的性质分布临界值的性质本讲稿第四十五页,共五十五页 左侧临界值左侧临界值 、都是小于都是小于1 1的的数,所以在进行数,所以在进行F F值与临界值的比较值与临界值的比较 时,只需查右侧临界值即可。若把时,只需查右侧临界值即可。若把 大于大
23、于1 1的的F F与左侧临界值比较,则与左侧临界值比较,则无意义。无意义。例例1 1 现有两批中药黄连,分别随机取出现有两批中药黄连,分别随机取出4 4个样品,测个样品,测定其小檗碱的含量,第一批得数据:定其小檗碱的含量,第一批得数据:8.96,8.90,8.96,8.96,8.90,8.96,8.98.8.98.第二批得数据:第二批得数据:8.82,8.90,8.85,8.918.82,8.90,8.85,8.91。试问这两。试问这两批小檗碱的含量方差是否齐性?批小檗碱的含量方差是否齐性?解:设解:设本讲稿第四十六页,共五十五页由已知计算得由已知计算得因为因为 ,所以,所以 作分子,计算统计
24、量得作分子,计算统计量得自由度自由度 ,查临界值表,查临界值表因为因为 ,故接受,故接受 ,认为方差齐,认为方差齐本讲稿第四十七页,共五十五页例例2 2 某中西医结合医院科研室,想比较单味大黄某中西医结合医院科研室,想比较单味大黄与西药治疗急性上消化道出血的效果,以止血天数与西药治疗急性上消化道出血的效果,以止血天数为指标,结果为为指标,结果为 西药西药单味大黄单味大黄 药种药种样本容量样本容量 均数均数 标准差标准差2020 6.9 6.9 6.9 6.930 1.5 0.8830 1.5 0.88试检验两组药种下总体方差是否齐性?试检验两组药种下总体方差是否齐性?解:解:查临界值表查临界值
25、表 因为因为 ,故,故拒绝拒绝 ,认为两方差不齐。,认为两方差不齐。本讲稿第四十八页,共五十五页例例3 3 合成车间某中间体生产的工艺条件改革后,收率似有提高,合成车间某中间体生产的工艺条件改革后,收率似有提高,但工人师傅反映新工艺的条件不易控制,收率波动较大,为此,但工人师傅反映新工艺的条件不易控制,收率波动较大,为此,对新老工艺分别抽查若干批,得下表对新老工艺分别抽查若干批,得下表老工艺收率老工艺收率 84.0 83.3 82.5 82.0 84.5 83.1 84.1 82.1 83.4 84.0 83.3 82.5 82.0 84.5 83.1 84.1 82.1 83.4新工艺收率新
26、工艺收率 86.5 87.7 88.0 87.5 85.6 84.2 86.0 83.2 87.0 86.1 86.5 87.7 88.0 87.5 85.6 84.2 86.0 83.2 87.0 86.1试解释工人师傅的问题试解释工人师傅的问题.解解:这个问题我们关心的是新工艺是否比老工艺波动大这个问题我们关心的是新工艺是否比老工艺波动大,应作单侧检验应作单侧检验,由已知数据算得由已知数据算得 ,设设(,)(,)查得临界值查得临界值因为因为 ,故拒绝故拒绝 ,认为工人师傅的想法是正确的认为工人师傅的想法是正确的.本讲稿第四十九页,共五十五页三、成组比较两个正态总体均数的差异三、成组比较两个
27、正态总体均数的差异1 1、方差齐性、方差齐性 小样本小样本tt检验检验 统计量统计量拒绝域拒绝域信息信息临界值临界值其中其中若若 时时为大样本,则换成为大样本,则换成u u检验,统计量检验,统计量改用改用本讲稿第五十页,共五十五页不服从不服从t(n1+n2-2)2 2、方差不齐、方差不齐 小样本小样本tt检验检验狄克逊和马赛于狄克逊和马赛于19691969年年提出自由度修正公式提出自由度修正公式 统计量统计量拒绝域拒绝域信息信息临界值临界值本讲稿第五十一页,共五十五页n150,n250时为大样本,可用时为大样本,可用u检验近似代替检验近似代替例例4 4 现有两批中药黄连,分别随机取出现有两批中
28、药黄连,分别随机取出4 4个样品,测个样品,测定其小檗碱的含量,第一批得数据:定其小檗碱的含量,第一批得数据:8.96,8.90,8.96,8.96,8.90,8.96,8.98.8.98.第二批得数据:第二批得数据:8.82,8.90,8.85,8.918.82,8.90,8.85,8.91。试检验这。试检验这两批黄连小檗碱的含量差异是否有显著意义两批黄连小檗碱的含量差异是否有显著意义解:设解:设之前我们已经对此题的总体方差进行检验,发现方差之前我们已经对此题的总体方差进行检验,发现方差齐性,且是小样本,应用齐性,且是小样本,应用t t检验检验由已知得由已知得本讲稿第五十二页,共五十五页则则
29、自由度自由度f=4+4-2=6,f=4+4-2=6,查临界值表查临界值表因为因为 ,故拒绝,故拒绝 ,认为两批黄连小檗碱的,认为两批黄连小檗碱的含量有显著差异。含量有显著差异。本讲稿第五十三页,共五十五页例例2 2 某中西医结合医院科研室,想比较单味大黄与西药治疗急某中西医结合医院科研室,想比较单味大黄与西药治疗急性上消化道出血的效果,以止血天数为指标,结果为性上消化道出血的效果,以止血天数为指标,结果为 西药西药单味大黄单味大黄 药种药种样本容量样本容量 均数均数 标准差标准差20 6.9 6.920 6.9 6.930 1.5 0.8830 1.5 0.88试问单味大黄治疗的效果是否优于西药治疗?试问单味大黄治疗的效果是否优于西药治疗?解:之前此题我们对总体方差的检验结果为不齐性且为小样本,解:之前此题我们对总体方差的检验结果为不齐性且为小样本,故采用自由度为故采用自由度为dfdf的的t t检验。检验。由样本信息由样本信息 ,故用单侧检验,故用单侧检验设设已知已知本讲稿第五十四页,共五十五页计算统计量计算统计量自由度自由度查临界值表查临界值表因因 ,故拒绝,故拒绝 ,认为在这次疗效观察中单味大黄治疗,认为在这次疗效观察中单味大黄治疗上消化道出血的效果优于西药。上消化道出血的效果优于西药。本讲稿第五十五页,共五十五页
限制150内