统计学原理抽样推断及参数估计.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《统计学原理抽样推断及参数估计.pptx》由会员分享,可在线阅读,更多相关《统计学原理抽样推断及参数估计.pptx(130页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 内容内容提要提要第一节第一节 抽样调查的一般抽样调查的一般问题问题第二节第二节 抽样抽样误差误差第三节第三节 总体指标的总体指标的推断推断第四节第四节 必要抽样数目的确定第五节 统计量及抽样分布第1页/共130页内容提要 本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。抽样估计推断;点估计和区间估计;必要抽样数目的确定。第2页/共130页抽
2、样调查的一般问题抽样调查的一般问题抽样调查的一般问题抽样调查的一般问题第一节第一节返回2第3页/共130页一、抽样调查的概念、特点与作用 (一)抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。第4页/共130页抽样调查具有下列三个主要特点:(1)(1)按随机原则抽取调查单位。(2)(2)由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。第5页/共130页 (二)抽样调查的作用 (1)(1)用于不可能进行全面调查的无限总体。(2)(2)用于不可能进行全面调查而又需要了解全面情况的现象。
3、(3)(3)用于不必要进行全面调查的现象。(4)(4)用于对全面调查的资料进行评价与修正。(5)(5)用于工业生产过程的质量控制。第6页/共130页二、抽样调查中的几个基本概念 (一)全及总体和抽样总体 1.1.全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。2.2.抽样总体。抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。第7页/共130页(二)总体指标和样本指标 1.1.总体指标。总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指
4、标也是唯一确定的。第8页/共130页2.2.样本指标。样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。第9页/共130页三、抽样调查的组织方式 (一)简单随机抽样 简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。(1)(1)抽签法。(2)(2)随机数字法。第10页/共130页 (二)类型抽样 类型抽样又称分类抽样或分层抽样,它是先将总体按某个主要标志
5、进行分组(或分类),再按随机原则从各组中抽取样本单位的一种抽样方式。第11页/共130页 (1)(1)等数分配类型抽样法。(2)(2)等比例类型抽样法。公式6 61 1第12页/共130页(3)(3)不等比例类型抽样法。公式6 62 2第13页/共130页(三)等距抽样 等距抽样也称机械抽样或系统抽样,它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。第14页/共130页抽样距离计算公式为:公式6 63 3第15页/共130页图6 61 1 等距抽样示意图第16页/共130页 (四)整群抽样 整群抽样也称集团抽样、区域抽样或分群随机抽样,它是将总体各
6、单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取部分群,对中选群的所有单位进行全面调查的抽样组织方式。第17页/共130页公式6 64 4公式6 65 5第18页/共130页整群抽样的优点:易于组织,节省调查费用缺点:调查的总体单位过于集中且在少数样本群中。因此,在条件相同的情况下,整群抽样的代表性低,通常需要扩大样本群的数目来弥补这个缺点。第19页/共130页阶段抽样阶段抽样也就是多级抽样,在抽样时先抽总体中某种更大范围的单位,逐次类推,最后从更小范围总体中抽选样本的基本单位,分阶段来完成抽样的组织工作。农产量抽样调查,第一阶段是从省抽县,第二阶段从中选县抽乡,第三阶
7、段从中选乡抽村,再从村抽地块,最后再从地块抽具体的样本点,以样本点的实际资料来推算平均亩产和总产量。第20页/共130页抽样误差抽样误差抽样误差抽样误差第二节第二节第21页/共130页一、抽样误差调查误差是调查所获得的统计数据域调查总体未知真实数据之间的差别,包括登记性误差和代表性误差。登记性误差是在调查过程中由于主观客观原因引起的登记差错造成的误差。代表性误差是用样本指标数值去推算总体指标数值时,由于样本各单位的结构情况不足以代表总体特征所产生的误差。第22页/共130页一、抽样误差的概念 调查误差又可分为:一是:没有遵循随机原则,二是:即使遵守了随机原则,也会由于被抽取的样本各种各样,导致
8、样本内部各单位的分布比例结构与总体实际分布状况有偶然性的差异,从而使不同的随机样本得出不同的估计量,造成样本指标数值与总体指标数值之间产生差距,如抽样平均数与总体平均数的离差,抽样成数与总体成数的离差等。这类误差通常称为抽样误差或随机误差。第23页/共130页二、影响抽样误差的主要因素 (一)样本单位数(样本容量n)n)的多少 (二)总体被研究标志变异程度(总体方差)的大小 (三)抽样组织方式 (四)抽样方法第24页/共130页三、抽样平均误差 (一)抽样平均误差的概念 抽样平均误差是指以全部可能样本指标为变量,以总体指标为平均数计算得到的标准差,以符号 表示,通常以 代表平均数的抽样平均误差
9、,以 代表成数的抽样平均误差,以K K代表可能组成的样本总数。第25页/共130页 (二)计算抽样平均误差的理论公式 根据抽样平均误差的概念可得其一般计算公式:公式8 86 6公式8 87 7第26页/共130页 (三)抽样平均误差的计算方法 1.1.平均数的抽样平均误差 (1)(1)重复抽样条件下:公式6 68 8 (2)(2)不重复抽样条件下:公式6 69 9 当N N很大时,公式6 61010第27页/共130页例6-6-为叙述简便起见,假设有10,20,3010,20,30和4040四个数字组成一个总体,从中随机抽取两个数字作为样本,求抽样平均误差。第28页/共130页 2.2.成数的
10、抽样平均误差 (1)(1)重复抽样条件下:公式6 61111 (2)(2)不重复抽样条件下:公式6 61212 当N N很大时,公式6 61313第29页/共130页 例6-26-2 某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为85%85%。今按简单随机抽样方式从800800只仪表中抽取10%10%进行检验,求合格品比率的抽样平均误差。在重复条件下,采用公式6 61111:在不重复条件下,采用公式6 61313:第30页/共130页例6-36-3某大学有45004500名学生,采用不重复简单随机抽样方式从中抽取10%10%的学生,调查其每月生活费用支出情况。抽样结果显示,学生平
11、均每人每月生活费支出350350元,标准差8080元,生活费用支出在500500元以上的学生占全部学生的20%20%。试求抽样平均误差。第31页/共130页 (四)其他抽样组织方式抽样平均误差的计算方法 1.1.类型比例抽样平均误差的计算。(1)(1)平均数的抽样平均误差 重复抽样条件下:公式6 61414 不重复抽样条件下:公式6 61515第32页/共130页 (2)(2)成数的抽样平均误差 重复抽样条件下:公式6 61616 不重复抽样条件下:公式6 61717第33页/共130页 其中:公式6 61818 公式6 61919第34页/共130页 例6-46-4 某县对本县的某种农作物的
12、产量作了一次类型比例抽样调查。调查资料整理的结果见表6 6-4-4,试求抽样平均误差。第35页/共130页表6-4返回33第36页/共130页 2.2.等距抽样平均误差的计算。3.3.整群抽样平均误差的计算。(1)(1)平均数的抽样平均误差 公式6 62020 (2)(2)成数的抽样平均误差公式6 62121第37页/共130页 其中:公式6 62222 公式6 62323第38页/共130页例6-5 某商店购进300箱(50只/箱)苹果,入库前随机抽取1%检查其质量。检验结果的整理资料见表6-5,试求抽样平均误差。第39页/共130页 例6 65 5 首先,分别计算样本平均数和样本成数:第4
13、0页/共130页 然后,分别求出样本平均数群间方差和成数群间方差:第41页/共130页 最后,根据公式6 62020和公式6 62121求出xx和pp为:第42页/共130页总体指标的推断总体指标的推断总体指标的推断总体指标的推断第三节第三节第43页/共130页一、统计比较的概念和作用 总体指标的推断是指对总体平均数 总体成数P P推断估计的问题。抽样调查的直接目的,就是为了推断 ,P P,然后,再结合总体单位数N N去推算总体的有关标志总量。总体指标的推断有点估计和区估计两种方法。第44页/共130页 一、点估计 点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标
14、的实际值 、p p 直接作为总体未知参数 、P P的估计值的一种推断方法。第45页/共130页比如:某电子元件厂,某天共生产电子元件20000件,耐用时间和合格率没进行全面检测,而是随机抽查5%检测,经计算,样本的平均耐用时间 小时,合格率p=98.56%。因此,推算这天生产的全部电子元件平均耐用时间 小时,合格率p=98.56%。第46页/共130页 估计量评判标准:1.1.一致性。设 为未知参数的估计量,当nn时,要求 按概率收敛于,即公式6 62 24 4第47页/共130页一致性(consistency)一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本量较
15、小的样本量较大的样本量较大的样本量P P()第48页/共130页 2.2.无偏性。若要求估计量 的数学期望等于未知参数的真值,即 公式6 62 25 5P P()B BA A无偏无偏有偏有偏有偏第49页/共130页 3.3.有效性。无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。设 ,为的两个无偏估计量,若 的方差小于 的方差,即公式6 62828第50页/共130页有效性(efficiency)有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布 的抽样分布的抽样分布P P()第51
16、页/共130页 二、区间估计 区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。它包括两方面内容:一、这一可能范围的大小,二、总体指标落在这个可能范围内的概率。第52页/共130页考虑表6-6样本平均数的概率分布第53页/共130页由表6-6知:第54页/共130页 将表6-6所示的变量数列绘成图形,即可得到一个钟形的平滑曲线,这条曲线叫正态分布曲线。如图6-2第55页/共130页图8 82 2 正态分布曲线图第56页/共130页 根据数理统计证明,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布的;如果总体单位的标志值不
17、是正态分布的,只要是大样本(即n30)n30),全部可能样本指标也会接近正态分布。从正态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样本指标接近于总体指标的概率越大(小),出现的可能性也越大(小)。第57页/共130页中心极限定理(central limit theorem)x x 的的分分布布趋趋于于正正态态分分布布的过程的过程第58页/共130页样本指标置信度根据数学证明,在 到 的区间中,这一部分曲线下的面积,占曲线下全部面积的68.27%;在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的95.45%;在 到 的区间内,这一部分曲线下的
18、面积,占曲线下全部面积的99.73%。如图6-3 第59页/共130页图8 83 3 样本指标置信度图第60页/共130页 误差范围 与概率度(t)(t)和抽样平均误差 三者之间的关系为:公式6 62 27 7 由此得到平均数和成数的误差范围公式:公式6 62828公式6 62929第61页/共130页 进而得到总体平均指标和总体成数指标的区间估计公式为:公式6 63 30 0公式6 63 31 1第62页/共130页(95%的置信区间)重复构造出重复构造出 的的2020个个置信区间置信区间 点估计值点估计值第63页/共130页总体均值的区间估计(大样本)1.假定条件总体服从正态分布,且方差(
19、)已知如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为第64页/共130页例6-6某自行车厂从生产的一批10000个自行车轮胎中随机抽取1%进行质量检验。调查结果显示,轮胎的平均寿命为5000英里。试以95%的把握对该批自行车的平均寿命作出估计。(注:根据长期生产这种类型的轮胎数据可知,总体标准差为400公里)第65页/共130页例6 6第66页/共130页 有了区间估计的结果,就可以对这批轮胎的使用寿命得出结论,因为区间估计最低公里数为4921.994921.99公里,可将49004900
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学原理 抽样推断及参数估计 统计学 原理 抽样 推断 参数估计
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内