《第四章抽样及抽样分布优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第四章抽样及抽样分布优秀PPT.ppt(43页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第四章抽样及抽样分布1 1第一页,本课件共有43页学习目标n n抽样推断n n抽样调查的组织方式和抽样方法n n抽样误差n n抽样估计n n样本容量的确定2 2第二页,本课件共有43页第一节 抽样推断概述n n抽样调查按照随机性原则,从全部研究对象中抽取一部分单位进行观察的一种非全面性调查n n抽样推断在抽样调查的基础上,依据所获得的数据对全部研究对象的数量特征作出具有一定可靠性的估计和判断,从而达到对研究整体认识的一种统计分析方法3 3第三页,本课件共有43页抽样推断的特点n n目的是由部分来估计和判断整体n n抽样推断是建立在随机抽样的基础之上的n n运用概率估计的方法,其误差不仅可以事先
2、计算,而且可以控制4 4第四页,本课件共有43页抽样推断的作用n n在无法进行全面调查或进行全面调查有困难的时候,可以运用抽样调查来推断总体n n采用抽样调查,可以节省费用和时间,提高调查的时效性和经济效果n n可以用来对全面资料做检验和修正n n可以用于工业生产过程的质量控制n n可以对某种总体的假设进行检验,来判断这种假设是否正确以决定行动的取舍5 5第五页,本课件共有43页几个基本的概念n n总体中国计量学院所有学生的身高总体,杭州所有居民的收入总体,金融资产收益总体n n样本从中国计量学院随机抽取的200个学生的身高随机抽取的1000个杭州居民的收入观察到的金融资产的收益6 6第六页,
3、本课件共有43页总体指标和样本指标7 7第七页,本课件共有43页样本容量和样本个数n n样本容量一个样本中所包含的单位数nn n样本个数从总体中可能抽取或可能构成的样本的数目8 8第八页,本课件共有43页第二节 抽样中常用的分布及定理9 9第九页,本课件共有43页第二节 抽样调查的组织方式和方法1010第十页,本课件共有43页1111第十一页,本课件共有43页1212第十二页,本课件共有43页1313第十三页,本课件共有43页1414第十四页,本课件共有43页1515第十五页,本课件共有43页抽样方法和样本可能数目n n考虑顺序的不重复抽样数目n n考虑顺序的重复抽样数目n n不考虑顺序的不重
4、复抽样数目n n不考虑顺序的重复抽样数目1616第十六页,本课件共有43页统计学的分析思路统计学的分析思路 总体总体population样本样本samplesamplinginferring1717第十七页,本课件共有43页变 异“世界上没有两片完全相同的叶子世界上没有两片完全相同的叶子”-植物学家植物学家 “世界的丰富多彩来源于其多样性世界的丰富多彩来源于其多样性”-哲学家哲学家“个体差异是生物医学领域里普遍存在的现象个体差异是生物医学领域里普遍存在的现象”-医学家医学家统计学就是研究统计学就是研究变异(变异(variation)的科学。的科学。1818第十八页,本课件共有43页抽样误差 变
5、变 异异 -抽样误差抽样误差 (variation)-(sampling error)联系联系?1919第十九页,本课件共有43页抽样实验例例1 1:假定某地正常成年男子的红细胞计数服从正态分假定某地正常成年男子的红细胞计数服从正态分布布N N(5.00(5.00,0.500.502 2)的总体,单位的总体,单位10101212/L L。用计算机。用计算机模拟从该总体中随机抽样,每次抽模拟从该总体中随机抽样,每次抽1010例组成一个例组成一个样本,重复样本,重复100100次抽样。结果见表次抽样。结果见表1 1。2020第二十页,本课件共有43页抽样实验表表表表1 1 1 1 正常成年男子红细
6、胞计数抽样实验结果正常成年男子红细胞计数抽样实验结果正常成年男子红细胞计数抽样实验结果正常成年男子红细胞计数抽样实验结果样本样本样本样本号号号号红细胞计数红细胞计数红细胞计数红细胞计数S S1 15.595.595.115.114.264.265.115.114.744.74 5.555.555.045.040.440.442 24.654.654.654.655.595.595.705.704.464.46 5.325.325.035.030.520.523 34.564.564.874.875.215.214.534.534.534.53 4.234.234.714.710.330.334
7、 44.084.084.734.734.844.844.884.884.654.65 5.335.334.664.660.460.46 :1001005.165.164.494.495.265.265.025.024.644.64 4.564.564.904.900.290.292121第二十一页,本课件共有43页抽样实验总体总体2222第二十二页,本课件共有43页抽样误差由于事物间普遍存在着由于事物间普遍存在着变异变异,由此产生,由此产生了这么一个现象:了这么一个现象:由于抽样而引起的误差由于抽样而引起的误差 抽样误差抽样误差2323第二十三页,本课件共有43页抽样误差 定义:定义:抽样误差
8、(抽样误差(sampling errorsampling error):):是指由于是指由于样本的随机性样本的随机性引起的统计量与参数的差别,或引起的统计量与参数的差别,或同一总体的相同统计量之间的差别。同一总体的相同统计量之间的差别。2424第二十四页,本课件共有43页了解抽样误差规律的重要性总体同质个体、个体变异同质个体、个体变异总体参数未知样本代表性、抽样误差代表性、抽样误差随机随机抽样抽样样本统计量已知统计统计推断推断风风 险险2525第二十五页,本课件共有43页均值的模拟试验n n考察:样本均值的均值与总体均值有何关系?样本均值的标准差与总体标准差有何关系?样本均值的分布形状如何?不
9、同的样本含量对上述性质的影响如何?2626第二十六页,本课件共有43页正态分布样本均值的分布样样本本编编号号n n=4=4样样本本均均值值样样本本标标准差准差最小最小值值最大最大值值抽抽样样误误差差1 198989898104104979799.499.42.92.99797104104-0.6-0.62 299999898100100959597.897.81.71.79595100100-2.2-2.23 31031031091091091099595104.1104.16.16.195951091094.14.14 493939494999910010096.496.43.13.1939
10、3100100-3.6-3.65 51041041051059090106106101.2101.26.46.490901061061.21.26 61041049292103103838395.695.68.68.68383104104-4.4-4.47 799991071079494979799.499.44.94.99494107107-0.6-0.68 81001001031039696929297.997.94.14.19292103103-2.1-2.19 9929297979494949494.394.31.91.992929797-5.7-5.71010100100102102
11、9595979798.298.22.82.89595102102-1.8-1.8从从从从N N(100,6(100,62 2)中随机抽样,样本含量为中随机抽样,样本含量为中随机抽样,样本含量为中随机抽样,样本含量为4 4的的的的 10 10份独立样本的份独立样本的份独立样本的份独立样本的均值、标准差、抽样误差均值、标准差、抽样误差均值、标准差、抽样误差均值、标准差、抽样误差2727第二十七页,本课件共有43页样本均值的均值和标准差2828第二十八页,本课件共有43页从从N N(100,6(100,62 2)中随机抽样,样本含量为中随机抽样,样本含量为4 4的的10001000个样本均值的频数分
12、布图个样本均值的频数分布图0 0.05.05.1.1.15.1580.080.090.090.0100.0100.0110.0110.0120.0120.0Sample MeanSample Mean正态总体分布正态总体分布样本均值服从正态分布样本均值服从正态分布2929第二十九页,本课件共有43页 Sampling DistributionSampling Distributionof sample meansof sample meansSampling DistributionSampling Distributionof sample meansof sample means Samp
13、ling DistributionSampling Distributionof sample meansof sample meansPopulation BPopulation BX X X XPopulation CPopulation C X XPopulation DPopulation DX XPopulation APopulation An n=10=10n n=4=4n n=25=25n n=2=2Sampling DistributionSampling Distributionof sample meansof sample meansSampling distribut
14、ion for means 3030第三十页,本课件共有43页均值的抽样误差之特点n n各样本均值未必等于总体均值;n n样本均值间存在差异;n n样本均值的分布很有规律,围绕总体均值,中间多两边少,左右基本对称;n n样本均值的变异范围较之原变量的变异范围大大缩小;n n随着样本含量的增加,样本均值的变异范围逐渐缩小。3131第三十一页,本课件共有43页抽样误差在实际工作中在实际工作中,由于各种条件所限由于各种条件所限,一般不一般不可能也没有必要观察总体中的每一个个体可能也没有必要观察总体中的每一个个体,常常常常是通过是通过抽样抽样来进行研究的。虽然来进行研究的。虽然抽样误差抽样误差是不可避
15、是不可避免的免的,但其大小是可以度量的。但其大小是可以度量的。问题:问题:如何度量抽样误差的大小?如何度量抽样误差的大小?3232第三十二页,本课件共有43页标准误标准误(Standard Error,SE)统计学上将样本均数统计学上将样本均数 X X、样本率、样本率P等等统计量的标统计量的标准差准差称为称为标准误标准误,它可用于说明抽样误差的大小。,它可用于说明抽样误差的大小。抽样误差3333第三十三页,本课件共有43页标准误(standard error)n n样本统计量的标准差称为标准误。样本统计量的标准差称为标准误。n n样本均值的标准差称为均值的标准误。称为均值的标准误。n n均值的
16、标准误表示样本均值的变异度。均值的标准误表示样本均值的变异度。n n当总体标准差未知时,用样本标准差代替,当总体标准差未知时,用样本标准差代替,n n前者称为理论标准误,后者称为样本标准误。前者称为理论标准误,后者称为样本标准误。3434第三十四页,本课件共有43页抽样误差的计算n n样本平均值的标准误差样本平均值的标准误差n n在重复抽样下n n在不重复抽样下3535第三十五页,本课件共有43页n n样本成数的的标准误差样本成数的的标准误差n n在重复抽样下n n在不重复抽样下3636第三十六页,本课件共有43页 综合练习 1 某电子元件厂对10000个元件使用寿命抽取1%进行检验,结果如表
17、所示。3737第三十七页,本课件共有43页表表表表1 1%1 1%1 1%1 1%样品测试数据样品测试数据样品测试数据样品测试数据 1.1.样本平均数样本平均数 =105550/100=1055.5(=105550/100=1055.5(小时小时)使用寿命(小时)使用寿命(小时)抽检数抽检数f f组中值组中值x xx xf f900900以下以下1 18758758758759009009509502 292592518501850950950100010006 697597558505850100010001050105035351025102535875358751050105011001
18、100434310751075462254622511001100115011509 911251125101251012511501150120012003 3117511753525352512001200以上以上1 11225122512251225合合 计计1001001055501055503838第三十八页,本课件共有43页 将表将表1 1整理为表整理为表2 2表表表表2 1%2 1%2 1%2 1%样品标准差计算表样品标准差计算表样品标准差计算表样品标准差计算表 x xx-x-(x-)(x-)2 2f f(x-)(x-)2 2f f875875-180.5-180.532580.
19、2532580.251 132580.2532580.25925925-130.5-130.517030.2517030.252 234060.534060.5975975-80.5-80.56480.256480.256 638881.538881.510251025-30.5-30.5930.25930.25353532558.7532558.751075107519.519.5380.25380.25434316350.7516350.751125112569.569.54820.254820.259 943472.2543472.2511751175199.5199.514280.25
20、14280.253 342840.7542840.7512251225169.5169.528730.2528730.251 128730.2528730.25合计合计1001002694752694753939第三十九页,本课件共有43页 重复抽样:重复抽样:不重复抽样:不重复抽样:2.2.质量标准规定使用寿命不足质量标准规定使用寿命不足10001000小时为不合格小时为不合格品,试分别计算不同抽样方法条件下该厂元件成数品,试分别计算不同抽样方法条件下该厂元件成数(合格率)与抽样误差。如表(合格率)与抽样误差。如表3 3所示。所示。4040第四十页,本课件共有43页表表表表3 3 3 3 成
21、数抽样误差计算表成数抽样误差计算表成数抽样误差计算表成数抽样误差计算表使用寿命使用寿命(小时)(小时)元件质量元件质量抽检数抽检数(个)(个)比重(成数)比重(成数)(%)900900以下以下90090095095095095010001000不合格不合格不合格不合格不合格不合格1 12 26 6 9.0 9.010001000105010501050105011001100110011001150115011501150120012001200 1200 以上以上合格合格合格合格合格合格合格合格合格合格353543439 93 31 191.091.0合合 计计100100100.0100.04141第四十一页,本课件共有43页 重复抽样:重复抽样:不重复抽样:不重复抽样:4242第四十二页,本课件共有43页 影响抽样误差的因素影响抽样误差的因素 抽样理论研究和实践证明影响抽样误差大小的因素主要有:(一)总体各变量值X 间差异的大小 如果其他条件不变,离散程度(X或P)越大,抽样误差x或p越大;反之,则越小。(二)样本单位数(样本容量)的多少 其他条件不变,样本单位数n 越少,抽样误差越大;反之,则越小。(三)抽样方法 重复抽样误差大于不重复抽样误差。(四)抽样调查组织形式 不同的抽样组织形式会产生不同的抽样误差。4343第四十三页,本课件共有43页
限制150内