《均数的抽样误差与总体均数估计PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《均数的抽样误差与总体均数估计PPT讲稿.ppt(61页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、均数的抽样误差与总体均数估计第1页,共61页,编辑于2022年,星期六抽样研究:样本信息 总体特征统计推断:总体参数的估计 假设检验第2页,共61页,编辑于2022年,星期六复习:抽样误差 抽样误差(抽样误差(抽样误差(抽样误差(sampling errorsampling errorsampling errorsampling error):由于个体变异的存在,抽样:由于个体变异的存在,抽样:由于个体变异的存在,抽样:由于个体变异的存在,抽样研究所造成的样本统计量与总体参数之间的差异或各样本研究所造成的样本统计量与总体参数之间的差异或各样本研究所造成的样本统计量与总体参数之间的差异或各样本研
2、究所造成的样本统计量与总体参数之间的差异或各样本统计量之间的差异,称为抽样误差。统计量之间的差异,称为抽样误差。统计量之间的差异,称为抽样误差。统计量之间的差异,称为抽样误差。n n抽样误差产生的两个前提条件:抽样误差产生的两个前提条件:抽样误差产生的两个前提条件:抽样误差产生的两个前提条件:个体变异个体变异个体变异个体变异 抽样研究抽样研究抽样研究抽样研究n n抽样误差的大小与两个因素有关:抽样误差的大小与两个因素有关:抽样误差的大小与两个因素有关:抽样误差的大小与两个因素有关:总体中个体变异的程度总体中个体变异的程度总体中个体变异的程度总体中个体变异的程度 抽样时的样本含量大小抽样时的样本
3、含量大小抽样时的样本含量大小抽样时的样本含量大小第3页,共61页,编辑于2022年,星期六第一节 均数的抽样误差 一、均数的抽样误差的概念一、均数的抽样误差的概念 由于抽样造成的样本均数与总体均数之间的由于抽样造成的样本均数与总体均数之间的差异称为均数的抽样误差。差异称为均数的抽样误差。第4页,共61页,编辑于2022年,星期六抽样实验 假设某市16岁女中学生身高值的分布服从均数 =155.4cm,标准差=5.3cm的正态分布,即xN(155.4,5.32)。从该总体中以样本含量n反复进行抽样(如抽10000个样本),分别计算样本均数 ,编制频数表,绘制直方图,观察样本均数的分布。第5页,共6
4、1页,编辑于2022年,星期六从正态总体从正态总体从正态总体从正态总体N N(155.4,5.3(155.4,5.32 2)中以样本量中以样本量中以样本量中以样本量n n=10=10抽样抽样抽样抽样10000100001000010000次次次次 第6页,共61页,编辑于2022年,星期六从正态总体从正态总体N N(155.4,5.3(155.4,5.32 2)中以样本量中以样本量中以样本量中以样本量n n=20=20抽样抽样抽样抽样10000100001000010000次次次次第7页,共61页,编辑于2022年,星期六从正态总体从正态总体从正态总体从正态总体N N(155.4,5.3(15
5、5.4,5.32 2)中以样本量中以样本量中以样本量中以样本量n=30抽样抽样抽样抽样10000100001000010000次次次次第8页,共61页,编辑于2022年,星期六从正态总体从正态总体N N(155.4,5.3(155.4,5.32 2)中以样本量中以样本量中以样本量中以样本量n=50=50抽样抽样1000010000次次第9页,共61页,编辑于2022年,星期六从正态总体从正态总体N N(155.4,5.3(155.4,5.32 2)中以样本量中以样本量中以样本量中以样本量n n=100=100抽样抽样抽样抽样10000100001000010000次次次次第10页,共61页,编
6、辑于2022年,星期六抽样实验结果样本量不同时,样本均数的分布第11页,共61页,编辑于2022年,星期六抽样实验结果抽样实验结果样本量不同时样本量不同时,样本均数的标准差样本均数的标准差第12页,共61页,编辑于2022年,星期六抽样实验结果总体标准差不同时,样本均数的分布第13页,共61页,编辑于2022年,星期六抽样实验结果抽样实验结果总体标准差不同时总体标准差不同时,样本均数的标准差样本均数的标准差第14页,共61页,编辑于2022年,星期六样本均数的分布规律以特定的样本量以特定的样本量n从正态总体从正态总体N(,2)中抽取样本,中抽取样本,所得样本均数所得样本均数 的分布为正态分布。
7、的分布为正态分布。样本均数的均数等于原正态分布的总体均数,即样本均数的均数等于原正态分布的总体均数,即 。样本均数的变异程度小于原变量的变异程度,即样本均数的变异程度小于原变量的变异程度,即 。样本均数的标准差为:样本均数的标准差为:第15页,共61页,编辑于2022年,星期六 从正态总体从正态总体从正态总体从正态总体N N N N(,2 2 2 2)中以样本量)中以样本量)中以样本量)中以样本量n n进行抽样,抽得的样本进行抽样,抽得的样本进行抽样,抽得的样本进行抽样,抽得的样本均数仍服从正态分布,且此分布的均数为均数仍服从正态分布,且此分布的均数为均数仍服从正态分布,且此分布的均数为均数仍
8、服从正态分布,且此分布的均数为 ,方差为,方差为,方差为,方差为 2 2 2 2/n n 。即即即即 从偏态分布总体中以样本量从偏态分布总体中以样本量从偏态分布总体中以样本量从偏态分布总体中以样本量 n n进行进行进行进行抽样,只要抽样,只要抽样,只要抽样,只要 n n 足够大,样本均足够大,样本均足够大,样本均足够大,样本均数亦近似正态分布。数亦近似正态分布。数亦近似正态分布。数亦近似正态分布。第16页,共61页,编辑于2022年,星期六均数的标准误(standard error)样本均数的标准差(记为样本均数的标准差(记为样本均数的标准差(记为样本均数的标准差(记为 ),),),),反映的
9、是样本均数与其总体均反映的是样本均数与其总体均反映的是样本均数与其总体均反映的是样本均数与其总体均数之间的离散程度,即数之间的离散程度,即数之间的离散程度,即数之间的离散程度,即 的大小,所以可将其作为描述均的大小,所以可将其作为描述均的大小,所以可将其作为描述均的大小,所以可将其作为描述均数抽样误差大小的指标,称为数抽样误差大小的指标,称为数抽样误差大小的指标,称为数抽样误差大小的指标,称为均数的标准误均数的标准误均数的标准误均数的标准误。计算如下:。计算如下:。计算如下:。计算如下:(理论值)(理论值)(理论值)(理论值)(估计值)(估计值)(估计值)(估计值)第17页,共61页,编辑于2
10、022年,星期六第18页,共61页,编辑于2022年,星期六第二节 t 分布标准正态变换标准正态变换t变换变换 t分布分布(=n-1)N(,2/n)N(0,1)第19页,共61页,编辑于2022年,星期六均数的抽样分布 t 分布第20页,共61页,编辑于2022年,星期六t分布的概率密度函数:自由度自由度,t分布唯一的参数分布唯一的参数第21页,共61页,编辑于2022年,星期六t 分布曲线=3=5=11=第22页,共61页,编辑于2022年,星期六t-distributionstandard normal distributiondf=50df=20df=10第23页,共61页,编辑于202
11、2年,星期六t 分布的特点t分布的特征为:分布的特征为:1 1以以0 0为中心,左右对称的单峰分布。为中心,左右对称的单峰分布。2 2t分布曲线形态变化与自由度的大小有关。自分布曲线形态变化与自由度的大小有关。自由度越小,由度越小,t 值越分散,曲线越低平;自由度值越分散,曲线越低平;自由度逐渐增大时,则分布逐渐逼近正态分布(标准逐渐增大时,则分布逐渐逼近正态分布(标准正态分布)。当时,正态分布)。当时,t 分布即为分布即为u分布。分布。第24页,共61页,编辑于2022年,星期六第25页,共61页,编辑于2022年,星期六t分布的分位数(t界值)/2/21-t/2,-t/2,第26页,共61
12、页,编辑于2022年,星期六t分布的分位数(t界值)1-t,-t,第27页,共61页,编辑于2022年,星期六-tt0第28页,共61页,编辑于2022年,星期六举例举例:第29页,共61页,编辑于2022年,星期六第三节 总体均数的可信区间估计一、总体均数的估计:一、总体均数的估计:(一)点估计(一)点估计(point estimation)(二)区间估计(二)区间估计(interval estimation)按照一定的按照一定的概率概率概率概率估计总体参数可能所在的一个估计总体参数可能所在的一个估计总体参数可能所在的一个估计总体参数可能所在的一个范围范围,称,称,称,称为区间估计。为区间估
13、计。为区间估计。为区间估计。概率概率可信度,通常取可信度,通常取 95%95%或或 99%99%。总体参数的范围总体参数的范围总体参数的范围总体参数的范围可信区间可信区间可信区间可信区间(confidence intervalconfidence interval)第30页,共61页,编辑于2022年,星期六(二)总体均数的区间估计 1 1 1 1、当、当、当、当 未知且未知且未知且未知且n n 较小时,由于较小时,由于较小时,由于较小时,由于 服从服从服从服从 t t分布,可按分布,可按分布,可按分布,可按 t t 分分分分布原理估计总体均数的可信区间。布原理估计总体均数的可信区间。布原理估
14、计总体均数的可信区间。布原理估计总体均数的可信区间。由于由于由于由于 即即即即 故总体均数(故总体均数(故总体均数(故总体均数(1-1-1-1-)100%100%100%100%的可信区间为的可信区间为的可信区间为的可信区间为第31页,共61页,编辑于2022年,星期六(二)总体均数的区间估计 2 2 2 2、当、当、当、当 未知但未知但未知但未知但n n足够大时(足够大时(足够大时(足够大时(n n 100 100 100 100),),),),t t分布近似分布近似分布近似分布近似u u分布,可以分布,可以分布,可以分布,可以 u u 界值代替界值代替界值代替界值代替 t t 界值,估计总
15、体均数的可信区间。界值,估计总体均数的可信区间。界值,估计总体均数的可信区间。界值,估计总体均数的可信区间。3 3 3 3、当当当当 已知时,可按正态分布的原理,估计总体均数的可信区间。已知时,可按正态分布的原理,估计总体均数的可信区间。已知时,可按正态分布的原理,估计总体均数的可信区间。已知时,可按正态分布的原理,估计总体均数的可信区间。第32页,共61页,编辑于2022年,星期六第33页,共61页,编辑于2022年,星期六 例例3 某地抽取正常成年人某地抽取正常成年人200名,测得其血清胆固名,测得其血清胆固醇的均数为醇的均数为3.64 mmol/L,标准差为,标准差为1.20mmol/L
16、,估,估计该地正常成年人血清胆固醇均数的计该地正常成年人血清胆固醇均数的95%可信区间。可信区间。故故该该地地正正常常成成年年人人血血清清胆胆固固醇醇均均数数的的95%可可信信区区间间为为(3.47,3.81)mmol L。第34页,共61页,编辑于2022年,星期六二、可信区间的确切涵义二、可信区间的确切涵义第35页,共61页,编辑于2022年,星期六 1.95%1.95%的可信区间的理解:的可信区间的理解:(1 1)所要估计的总体参数有)所要估计的总体参数有95%95%的可能在我们所估计的可能在我们所估计的可信区间内。的可信区间内。(2 2 2 2)从正态总体中随机抽取)从正态总体中随机抽
17、取)从正态总体中随机抽取)从正态总体中随机抽取100100100100个样本,可算得个样本,可算得个样本,可算得个样本,可算得100100100100个样个样个样个样本均数和标准差,也可算得本均数和标准差,也可算得本均数和标准差,也可算得本均数和标准差,也可算得100100100100个均数的可信区间,平个均数的可信区间,平个均数的可信区间,平个均数的可信区间,平均约有均约有均约有均约有95959595个可信区间包含了总体均数个可信区间包含了总体均数个可信区间包含了总体均数个可信区间包含了总体均数 。(3 3 3 3)但在实际工作中,只能根据一次试验结果估计可信)但在实际工作中,只能根据一次试
18、验结果估计可信)但在实际工作中,只能根据一次试验结果估计可信)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数区间,我们就认为该区间包含了总体均数区间,我们就认为该区间包含了总体均数区间,我们就认为该区间包含了总体均数。第36页,共61页,编辑于2022年,星期六 2.2.2.2.可信区间的两个要素可信区间的两个要素可信区间的两个要素可信区间的两个要素(1 1 1 1)准确度准确度:用可信度(:用可信度(:用可信度(:用可信度(1 1 1 1 )表示,表示,表示,表示,即区间包含总即区间包含总即区间包含总即区间包含总体均数体均数体均数体均数 的理论概率大小的理论
19、概率大小的理论概率大小的理论概率大小 。当然它愈接近当然它愈接近当然它愈接近当然它愈接近1 1 1 1愈好,如愈好,如愈好,如愈好,如99%99%99%99%的可信区间比的可信区间比的可信区间比的可信区间比95%95%95%95%的的的的可信区间要好可信区间要好可信区间要好可信区间要好 。(2 2 2 2)精确度精确度精确度精确度:反映在区间的宽度上。:反映在区间的宽度上。:反映在区间的宽度上。:反映在区间的宽度上。区间愈窄愈好,如区间愈窄愈好,如区间愈窄愈好,如区间愈窄愈好,如95%95%95%95%的可信区间比的可信区间比的可信区间比的可信区间比99%99%99%99%的可信的可信的可信的
20、可信区间要好区间要好区间要好区间要好 。第37页,共61页,编辑于2022年,星期六 当当n确定时,上述两者互相矛盾。确定时,上述两者互相矛盾。提高准确度(可信度),则精确度降低(可提高准确度(可信度),则精确度降低(可信区间会变宽),势必降低可信区间的实际信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为应用价值,故不能笼统认为99%可信区间可信区间比比95%可信区间要好。可信区间要好。在实际应用中,在实际应用中,95%可信区间更为常用。可信区间更为常用。在可信度确定的情况下,增加样本含量可减在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。小区间宽度,提高精确度。第
21、38页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=10,=0.05第39页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=10,=0.05第40页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=10,=0.10第41页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=10,=0.10第42页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=10,=
22、0.01第43页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=10,=0.01第44页,共61页,编辑于2022年,星期六n=10=0.05=0.10=0.01第45页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=30,=0.05第46页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=30,=0.05第47页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=30,=0.01第48页,共61页,编
23、辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=30,=0.01第49页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=30,=0.10第50页,共61页,编辑于2022年,星期六从正态总体从正态总体N(155.4,5.32)中抽样中抽样n=30,=0.10第51页,共61页,编辑于2022年,星期六n=30=0.01=0.05=0.10第52页,共61页,编辑于2022年,星期六=0.05n=10n=30第53页,共61页,编辑于2022年,星期六三、总体均数可信区间三、总体均数可信区间与医学参考值范围的区别与医学参考值范围的区别第54页,共61页,编辑于2022年,星期六第55页,共61页,编辑于2022年,星期六第四节第四节 方差的抽样误差方差的抽样误差 与可信区间估计(了解)与可信区间估计(了解)若x1,x2,xn为正态总体N(,2)的一个样本,样本方差为s2,则第56页,共61页,编辑于2022年,星期六参数参数:自由度:自由度第57页,共61页,编辑于2022年,星期六第58页,共61页,编辑于2022年,星期六第59页,共61页,编辑于2022年,星期六第60页,共61页,编辑于2022年,星期六第61页,共61页,编辑于2022年,星期六
限制150内