研究生统计学讲义第3讲总体均数估计和假设检验.ppt
《研究生统计学讲义第3讲总体均数估计和假设检验.ppt》由会员分享,可在线阅读,更多相关《研究生统计学讲义第3讲总体均数估计和假设检验.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章第四章 第一节第一节 总体均数的估计总体均数的估计一一.样本均数的分布和样本均数的分布和 t 分布分布(P49P49)在抽样研究中,即使是严格遵守随机抽样原则,从在抽样研究中,即使是严格遵守随机抽样原则,从同一总体中每次抽取样本含量相等同一总体中每次抽取样本含量相等(都为都为n n)的样本,计的样本,计算每一个样本的样本均数,由于变异存在,样本均数算每一个样本的样本均数,由于变异存在,样本均数有大有小,不尽相同,是随机变量,其分布称为样本有大有小,不尽相同,是随机变量,其分布称为样本均数的分布。这里介绍样本均数的两条常用性质:均数的分布。这里介绍样本均数的两条常用性质:情形情形当抽样来自
2、均数为当抽样来自均数为,方差为,方差为的的正态分布正态分布总体总体时,样本均数的分布(抽样分布)有下面的性质时,样本均数的分布(抽样分布)有下面的性质1.的分布是正态的的分布是正态的2.设设分布的均数是分布的均数是,则则=3.设设的方差是的方差是,则则=,是总体是总体标准误标准误.情形情形 当抽样来自均数为当抽样来自均数为 ,方差为,方差为 的的非正态非正态分布分布总体时,样本均数的分布(抽样分布)有下面总体时,样本均数的分布(抽样分布)有下面的性质:的性质:1的分布是近似正态的,随样本容量的增加,靠的分布是近似正态的,随样本容量的增加,靠近正态的程度就越好近正态的程度就越好一般地,一般地,的
3、抽样分布靠近正的抽样分布靠近正态分布所需要的样本容量取决于最初分布的外形态分布所需要的样本容量取决于最初分布的外形在几乎所有的情形里面,对在几乎所有的情形里面,对的抽样分布,样本容的抽样分布,样本容量在量在30或以上就可以得到很好的正态近似或以上就可以得到很好的正态近似(均数(均数的这个性质就是众所周知的的这个性质就是众所周知的中心极限定理中心极限定理CentralLimitTheorem)2.设设分布的均数是分布的均数是,则则=3.设设的方差是的方差是,则则=,是总体标是总体标准误准误.由第由第1条(均数抽样分布的正态或近似正态)将在后面条(均数抽样分布的正态或近似正态)将在后面推出强有力的
4、统计推论推出强有力的统计推论两种情形中的第两种情形中的第3条表明,与条表明,与个体观测值相比较,样本均数是变化较小的变量,那个体观测值相比较,样本均数是变化较小的变量,那是因为标准误总是比标准差小的缘故是因为标准误总是比标准差小的缘故二、二、t 分布分布在公式在公式中用中用 代替代替得到:得到:用用S 替换替换产生了一个不同的样本分布产生了一个不同的样本分布如果如果值未值未知又必须估计它,用估计值替换知又必须估计它,用估计值替换所得变量的分布称所得变量的分布称为为t分布这个分布是分布这个分布是19世纪在英国世纪在英国Guinness啤酒啤酒厂工作的发现,在厂工作的发现,在1908年以笔名年以笔
5、名“Student”发表发表因此有时称为因此有时称为Studentst分布,这个分布族取决于参分布,这个分布族取决于参数数n1(4-4)是具有是具有=0,=1的标准正态分布,而的标准正态分布,而是是具有具有=0,取决于样本容量的取决于样本容量的t 分布分布随随样本容量的增加,样本容量的增加,t 分布渐近标准正态分分布渐近标准正态分布布见图,见图,t 分布的准确外形取决于被称为自由度(分布的准确外形取决于被称为自由度(degreesoffreedom)的数量)的数量像正态分布一样,像正态分布一样,t 分布是对称的分布是对称的钟形曲线,但是有点平坦,例如,它们有大的标准差钟形曲线,但是有点平坦,例
6、如,它们有大的标准差对任何对任何t 分布,自由度恰好是样本容量减分布,自由度恰好是样本容量减1:df=n1作为为多个作为为多个t 分布的部分累积分布函数的比较已经列分布的部分累积分布函数的比较已经列在附表在附表5里里因为因为t 分布是概率密度函数,任何分布是概率密度函数,任何t 分布曲线下的面积分布曲线下的面积为为1在某些情形,我们必须使用固定概率(一个在某些情形,我们必须使用固定概率(一个t 分分布下的面积),留心并找出区间端点到中心布下的面积),留心并找出区间端点到中心0的这个的这个概率,设这个概率是概率,设这个概率是1,常常很小,规定为常常很小,规定为0.05或或0.01,于是,于是1=
7、0.95或或0.99那么为寻找这个那么为寻找这个t0,使得使得 t 分布里,定位在中间的面积分布里,定位在中间的面积1t分布有两条重要性质:分布有两条重要性质:(1)从从正正态态总总体体中中每每次次随随机机抽抽取取例例数数为为n的的样样本本,按按(式式4-4)计计算算的的统统计计量量服服从从自自由由度度为为df=n-1的的t分分布布(即即样样本本均均数数与与总总体体均均数数相相差差多多少少个个标标准准误误服服从从自自由度为由度为n-1的的t分布)。分布)。(2)从相互独立,总体均数分别为)从相互独立,总体均数分别为1,2,而标准,而标准差都为差都为的两个正态总体中,随机抽取样本含量分别为的两个
8、正态总体中,随机抽取样本含量分别为n1,n2的两个样本,分别算出样本均数和标准差为的两个样本,分别算出样本均数和标准差为X1和和S1,X2和和S2,按,按(式(式4-5)计算的统计量服从自由度)计算的统计量服从自由度为为df=n1+n22的的t分布。分布。t=自由度自由度df=n1+n22(式(式4-5)S =(式(式4-6)2T 分分布布的的规规律律如如附附表表3的的t 界界值值表表(表表中中只只列列出出正正的的t值值),表表中中横横标标目目为为自自由由度度df,纵纵标标目目为为概概率率P,表表中中数数字字表表示示自自由由度度为为df时时t分分布布的的界界值值(criticalvalue)。
9、t界界值值有有单单侧侧和和双双侧侧两两种种情情况况:自自由由度度为为df时时,t分分布布的的双双侧侧界界值值记记为为t/2,df,P(|t|t/2,df)=;t分分布布的的单单侧侧界界值值记记为为t,df,P(tt,df)=。例例如如,自自由由度度df9时时,由由附附表表3的的t界界值值表表查查出出0.05的的单单侧侧界界值值t0.05,91.833,双侧界值,双侧界值t0.05/2,92.262,则有:,则有:P(t1.833)0.05;P(t 1.833)P(t1.833)0.95。P(t2.262)0.025;P(t 2.262)P(-2.262 t 2.262)1-20.0250.95
10、。从从t分布的界值与标准正态分布的界值可发现,同样分布的界值与标准正态分布的界值可发现,同样的尾部面积,的尾部面积,t分布的界值要大于标准正态分布的界值,分布的界值要大于标准正态分布的界值,当自由度当自由度df时,时,t分布的界值逼近标准正态分布界分布的界值逼近标准正态分布界值。值。三三.总体均数的估计总体均数的估计(P51)1 1点点估估计计和和区区间间估估计计总总体体参参数数的的估估计计有有点点估估计计和和区间估计。区间估计。由由样样本本观观察察值值算算出出总总体体参参数数的的一一个个估估计计值值(为为统统计计量量)称称为为该该参参数数的的一一个个点点估估计计(pointestimatio
11、n)。点点估估计计给给出出未未知知参参数数的的一一个个近近似似值值,但但没没考考虑虑试试验验误误差差影影响响,也也未未指指出出这这种种估估计计的的可可靠靠程程度度。因因为为估估计计量量是是来来自自一一个个随随机机抽抽取取的的样样本本,每每一一次次取取值值都都有有随随机机性性,刚刚好好等等于于待待估估计计参参数数的的可可能能性性极极小小,而而在在参参数数值值左左右右的情况较多。的情况较多。统计学上更合理的估计是在一定概率(统计学上更合理的估计是在一定概率(1-)下,由)下,由含有未知参数及其点估计值所构成的统计量的分布规含有未知参数及其点估计值所构成的统计量的分布规律估计出参数可能存在的范围,称
12、为区间估计律估计出参数可能存在的范围,称为区间估计(intervalestimation),所给出的范围称为该参数的),所给出的范围称为该参数的(1-)可信区间或置信区间()可信区间或置信区间(confidenceinterval,简记为简记为CI)。这个范围包含参数值的可靠程度为()。这个范围包含参数值的可靠程度为(1-),称为可信度或置信度(),称为可信度或置信度(confidencedegree)或可)或可信概率。信概率。2 2可信区间的意义可信区间的意义现以总体均数的现以总体均数的95%可信区间为可信区间为例,总体参数例,总体参数95%可信区间的意义是:考虑总体参数可信区间的意义是:考
13、虑总体参数的可信区间取决于所抽取的样本,在同样条件下,进的可信区间取决于所抽取的样本,在同样条件下,进行许多重复的抽样,每抽取一个样本可得到待估计参行许多重复的抽样,每抽取一个样本可得到待估计参数的一个可信区间,在这些区间中,有的包含待估计数的一个可信区间,在这些区间中,有的包含待估计的参数,有的不包含,平均说来每的参数,有的不包含,平均说来每100个中有个中有95个正个正确。确。实践中一般不会去抽取许多个样本,通常只抽取一个实践中一般不会去抽取许多个样本,通常只抽取一个样本,计算出一个区间,虽然无法确认这个区间是否样本,计算出一个区间,虽然无法确认这个区间是否包含了待估计的参数,但可知这种估
14、计可信的程度为包含了待估计的参数,但可知这种估计可信的程度为95,会冒,会冒5%犯错误的风险。因犯错误的风险。因5%是小概率,在实是小概率,在实际应用中就认为待估计的总体参数在算得的区间内。际应用中就认为待估计的总体参数在算得的区间内。3可信区间有两要素:一是准确度,反映在可信度(可信区间有两要素:一是准确度,反映在可信度(1-)的)的大小,即区间包含总体参数的可能性(概率)的大小,准确大小,即区间包含总体参数的可能性(概率)的大小,准确度越接近度越接近1越好,例如,可信度越好,例如,可信度99%比比95%犯错误的风险小;犯错误的风险小;二是精密度,反映在区间的长度,区间的长度愈小愈精密。二是
15、精密度,反映在区间的长度,区间的长度愈小愈精密。在可信度确定的情况下,增大样本含量,相应的界值(如在可信度确定的情况下,增大样本含量,相应的界值(如t界界值)减少,标准误也减小,可减小区间长度,提高精密度。值)减少,标准误也减小,可减小区间长度,提高精密度。在样本含量确定的情况下,可信度(在样本含量确定的情况下,可信度(1-)愈大,总体参数估)愈大,总体参数估计的准确度愈高,但精密度愈差。二者是矛盾的,为兼顾准计的准确度愈高,但精密度愈差。二者是矛盾的,为兼顾准确度和精密度,常用确度和精密度,常用95%可信区间。可信区间。4.4.单个总体均数的估计单个总体均数的估计 样本均数是总体均数样本均数
16、是总体均数的一的一个点估计。个点估计。已知时,按(式已知时,按(式4-34-3)计算的统计量服从)计算的统计量服从标准正态分布,根据标准正态分布的规律标准正态分布,根据标准正态分布的规律 P(-u/2u u/2)=1-,有,有 已已知知时时,正正态态总总体体均均数数的的双双侧侧(1 1)可可信区间计算公式为(信区间计算公式为(4-74-7)未知时,按(式未知时,按(式4-4)计算的统计量服从)计算的统计量服从t 分布,由分布,由t分布的规律分布的规律P(-t/2t72次次/分分对于这两种可能,统计上通过检验前一种可能来对于这两种可能,统计上通过检验前一种可能来作出判断,假设检验的目的是排除差异
17、完全由抽样误作出判断,假设检验的目的是排除差异完全由抽样误差所致的可能性。方法是:先假设差异完全由抽样误差所致的可能性。方法是:先假设差异完全由抽样误差所致,在这个假设下,计算检验统计量差所致,在这个假设下,计算检验统计量(如如t值、值、u值等值等),按样本统计量的概率分布规律,求出获得现,按样本统计量的概率分布规律,求出获得现有样本检验统计量值的概率有样本检验统计量值的概率如果出现了小概率事件,就拒绝这个假设;如果如果出现了小概率事件,就拒绝这个假设;如果没有出现小概率事件,则没有理由怀疑这个假设,所没有出现小概率事件,则没有理由怀疑这个假设,所以不拒绝这个假设。这种推断方法的特点是依据小概
18、以不拒绝这个假设。这种推断方法的特点是依据小概率原理,采用类似于数学中逻辑论证的反证法,但又率原理,采用类似于数学中逻辑论证的反证法,但又区别于纯数学中逻辑推理的反证法。因为这里并不是区别于纯数学中逻辑推理的反证法。因为这里并不是形式逻辑中的绝对矛盾,而是基于人们在实践中广泛形式逻辑中的绝对矛盾,而是基于人们在实践中广泛应用的小概率原理。所以,可以说假设检验的基本思应用的小概率原理。所以,可以说假设检验的基本思想是某种带有概率性质的反证法。想是某种带有概率性质的反证法。假假设设检检验验有有两两种种类类型型:(1)参参数数检检验验(nparametric):在在许许多多问问题题中中,总总体体分分
19、布布的的类类型型为为已已知知,只只是是一一个个或或几几个个参参数数未未知知,只只对对未未知知参参数数作作出出假假设设,然然后后根根据据随随机机样样本本提提供供的的信信息息,选选取取检检验验统统计计量量,按按检检验验统统计计量量的分布规律,用的分布规律,用“小概率原理小概率原理”推断假设是否成立。推断假设是否成立。绍的绍的t 检验、检验、u 检验,第五章介绍的方差分析等。检验,第五章介绍的方差分析等。(2)非参数检验非参数检验(nonparametric):是一种与总体分布):是一种与总体分布无关的统计检验方法,它不比较参数,而是比较分布的无关的统计检验方法,它不比较参数,而是比较分布的位置。当
20、不知道样本来自的总体分布类型或已知总体分位置。当不知道样本来自的总体分布类型或已知总体分布与检验所要求的条件不符,可用非参数检验。详见第布与检验所要求的条件不符,可用非参数检验。详见第十一章。十一章。二、假设检验的一般步骤二、假设检验的一般步骤1.1.建立假设并确定检验水准建立假设并确定检验水准 (1)(1)建立假设:建立假设:假设需根据研究的目的对总体的特征而提出。假假设需根据研究的目的对总体的特征而提出。假设有两种:一种是检验假设设有两种:一种是检验假设(hypothesistobetested),假设差异完全由抽样误差造成,常称无效假设,假设差异完全由抽样误差造成,常称无效假设(hull
21、hypothesis),用,用H0表示。表示。另一种是和另一种是和H0相对立的备择假设相对立的备择假设(alternativehypothesis),用,用H1表示,表示,H1通常是希望证实的情况。假通常是希望证实的情况。假设检验是针对设检验是针对H0进行的,希望用样本数据推断进行的,希望用样本数据推断H0是假的,是假的,从而证实从而证实H1是真的。假设检验的结果是在零假设是真的。假设检验的结果是在零假设H0和对和对立假设立假设H1之间作出抉择。当拒绝之间作出抉择。当拒绝H0时,接受时,接受H1,认为差,认为差异有统计意义;当不拒绝异有统计意义;当不拒绝H0时,认为差异无统计意义,时,认为差异
22、无统计意义,则不接受则不接受H1。建立假设涉及检验方向:以建立假设涉及检验方向:以H0为准,如果根据专业为准,如果根据专业知识或研究目的,知识或研究目的,H1不能肯定方向,则假设检验的方不能肯定方向,则假设检验的方向是双侧的,称为双侧检验向是双侧的,称为双侧检验(twosidedtest)。如果根据。如果根据专业知识或研究目的,专业知识或研究目的,H1肯定方向,则假设检验方向肯定方向,则假设检验方向是单侧的,称为有单侧检验是单侧的,称为有单侧检验(onesidedtest)。也就是说,。也就是说,单侧指实验结果向一个方向变化的。单侧指实验结果向一个方向变化的。以样本均数以样本均数(其总体均数为
23、其总体均数为)与已知的总体均数与已知的总体均数(已已知的总体均数用知的总体均数用0表示表示)比较为例,如例比较为例,如例4.2,如果根据,如果根据专业知识已知此类脾虚病人的脉博不会低于健康人,或专业知识已知此类脾虚病人的脉博不会低于健康人,或是研究者只关心此类脾虚病人的脉博是否快于正常人,是研究者只关心此类脾虚病人的脉博是否快于正常人,不关心是否慢于正常人,可用单侧检验。如果如果没有不关心是否慢于正常人,可用单侧检验。如果如果没有专业知识,不知此类脾虚病人的脉博快于或慢于健康人,专业知识,不知此类脾虚病人的脉博快于或慢于健康人,两种可能性都存在,或是研究者只关心此类脾虚病人的两种可能性都存在,
24、或是研究者只关心此类脾虚病人的脉博是否不同于正常人,目的只是推断两总体均数有无脉博是否不同于正常人,目的只是推断两总体均数有无差别,不管是此类脾虚病人的脉博快于正常人还是慢于差别,不管是此类脾虚病人的脉博快于正常人还是慢于正常人,研究者都同等关心,应当用双侧检验。正常人,研究者都同等关心,应当用双侧检验。例例4.2的目的是推断此类脾虚病人的脉博是否快于的目的是推断此类脾虚病人的脉博是否快于正常人正常人(正常人的脉博总体均数为正常人的脉博总体均数为0=72次次/分分),H0为此类脾虚病对脉博数无影响,即此类脾虚病人的为此类脾虚病对脉博数无影响,即此类脾虚病人的脉博总体均数脉博总体均数 等于正常人
25、等于正常人,用符号表示为用符号表示为:H0:=72次次/分分,即,即=0与之对应的备择假设为该类脾虚病的脉博数快于正常与之对应的备择假设为该类脾虚病的脉博数快于正常人人,用符号表示为:用符号表示为:H1:72次次/分,即分,即0(2)确定检验水准:检验水准确定检验水准:检验水准(sizeofatest)亦称显亦称显著性水平著性水平(significancelevel),常用符号,常用符号表示。表示。是假设检验时预先确定的,用以作为判断多小的概率是假设检验时预先确定的,用以作为判断多小的概率可以认为是小概率的水准,故称为检验水准。可以认为是小概率的水准,故称为检验水准。的大的大小视具体情况而定,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 研究生 统计学 讲义 总体 估计 假设检验
限制150内