抽样推断 (2)优秀课件.ppt
《抽样推断 (2)优秀课件.ppt》由会员分享,可在线阅读,更多相关《抽样推断 (2)优秀课件.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样推断第1页,本讲稿共68页第一节 推断方法概述 一、抽样的概念和特点1、抽样的概念一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行调查,并运用数理统计的原理,用被抽取的那部分单位的指标数值,对总体的数量特征作出具有一定可靠程度的估计与推断,以达到认识总体的一种统计方法。第2页,本讲稿共68页v 2、抽样的特点v(1)抽样必须遵循随机原则。v(2)抽样推断从数量 上推断总体v(3)抽样 推断运用的是概率估计的方法v(4)误差可以事先计算并加以控制。v 3、抽样的作用(见书)第3页,本讲稿共68页二、抽样调查的基本概念(一)总体和样本1、总体(母体)总
2、体是调查对象的全部单位构成的整体。对于某一具体问题来说,总体是客观存在的,是唯一确定的。2、样本总体(样本或子样)样本总体是从总体中按随机原则抽取的部分单位构成的集合体。其中被抽取的每一个单位称谓样本单位。第4页,本讲稿共68页v 样本来源于总体,是总体 中的一部分,但v 不是唯一 的,是不确定的,是可变的。v(二)总体容量和样本容量1、总本容量指总体所含总体单位的个数。用N表示 总体容量是唯一确定的2、样本容量指一个样本中所包含的单位数。样本的容量用n表示。n 30 大样本 n 30 小样本抽样比 f=n 样本容量与总体容量之比。N(三)样本个数:从总体中最多能抽取的不同样本 的总数 第5页
3、,本讲稿共68页v(四)抽样的方法v 1、重复抽样(回置式抽样)v 有放回的抽取样本。抽中的样本再放回总体重复参加 以后多次抽取,总体中的单位数始终相同。v 重复抽样的特点(1)同一总体单位可能被重复抽中v(2)每个单位抽中的概率1/Nv(3)每个单位抽中的机会均等v 2、不重复抽样(不回置式抽样)v 不放回的抽取样本,每次抽取一个单位。凡被抽中的单位 不再放回到总体里,不参加下一次抽选。v 不重复抽样的特点(1)同一总体 单位不可能被重复抽中v(2)每个单位抽中的可能性各次不相等v(3)每次抽取不是独立的v 第6页,本讲稿共68页(五)总体指标和样本指标1.总体指标(总体参数或母体参数)总体
4、指标又称全及指标,是根据全及总体各单位的标志值计算的,反映总体数量特征的综合指标。总体指标是唯一确定的,但也是未知的,是一个待估计值.常用的总体指标有:X 总体平均数 P 总体成数 2 总体方差 总体标准差第7页,本讲稿共68页 2 样本方差2、样本指标(样本统计量)样本指标是根据样本各单位的标志值计算的综合指标。样本指标是一个随机变量,是推断总体的依据。常用的样本指标有:样本平均数 p 样本成数 样本标准差第8页,本讲稿共68页第二节 抽样分布与抽样推断进行抽样调查目的在于抽样推断第9页,本讲稿共68页v 一、抽样分布v 在抽样推断中,样本统计量即样本平均数,样本方差,样本成数是一个随机变量
5、。随机变量有两个特点:1、取值的随机性 2、取值的统计规律性,即可以确定随机变量取值的概率置信区间。v 抽样分布:就是指样本平均数,样本方差,样本成数v 的分布。v 二、三部份内容是介绍抽样推断的理论依据,通过数理统计证明:样本平均数和样本成数的抽样分布,都服从于正态分布。v 第10页,本讲稿共68页四、抽样平均误差和抽样极限误差 1、抽样误差的概念1、抽样误差的概念在统计调查中,调查资料与实际情况不一致,两者之间存在一定的差别,称为统计误差。第11页,本讲稿共68页抽样误差即指随机误差,这种误差是抽样的随机性而带来的偶然性代表误差,是抽样调查特有的,不可能通过任何方式消除的无法避免的误差。但
6、是这种误差是可以运用概率与数理统计理论来计算并加以控制。抽样误差又可分为实际误差和抽样平均误差,实际误差是指一个样本与总体指标之间的误差,故是未知的不可计算。以下所讨论的抽样误差就是指抽样平均误差的概念和计算。第12页,本讲稿共68页2、抽样平均误差的概念和计算(1)抽样平均误差的概念 是样本指标(平均数或成数)的标准差。它反映的是所有可能出现的样本指标和总体指标之间的平均离散程度(平均离差)。通常用表示。现举例说明抽样平均数的抽样平均误差。第13页,本讲稿共68页(2)抽样平均误差的计算 计算平均数的抽样平均误差如前所述,抽样平均数的抽样平均误差就是抽样平均数的标准差,用公式表示 x=(xi
7、X总)2(为定义式不可计算)n 根据数理统计知识证明抽样平均误差的计算式为 1.重复抽样(计算式即为等价公式)第14页,本讲稿共68页注意:在实际计算时为一个样本的标准差。N为一个样本的容量。第15页,本讲稿共68页 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,例第16页,本讲稿共68页2.不重复抽样:(用校正因子修正)第17页,本讲稿共68页计算成数的抽样平均误差 已证明:成数的方差为p(1-p)第18页,本讲稿共68页 某玻璃器皿厂某日生产15000只
8、印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例第19页,本讲稿共68页3、抽样极限误差的概念和计算v(1)抽样极限误差的概念v 抽样极限误差是抽样估计准确程度的v 误差范围。具体的说是样本指标与总体指标之间抽样误差的最大可能范围。这个范围的绝对值叫抽样极限误差。v 设 Xx-X x-XX x+Xv pp-P p-pPp+p第20页,本讲稿共68页v 上式表明,总体平均数是以抽样平均数为中心v 在X-XX+X之间变动,v 区间 X-X,X+X 称为平均数的估计区间(置信区间)。v 区间 P-P,
9、P+P称为成数的估计区间v(置信区间)。第21页,本讲稿共68页v 例1 要估计某乡粮食亩产量及总产量从8000亩中用不重复抽样抽取400亩求得平均水平450v 公斤,如果抽样极限误差为5公斤,这就说明8000亩粮食亩产量在445455之间总产量就在8000X4508000X455即356364之间(万公斤)v 例2 要估计农作物的成活率,随机 抽取1000棵秧苗,其中死苗80棵,则秧苗成活率v P=920/1000=92%,如果抽样极限误差为2%v 则该农作物的成活率90%94%之间。第22页,本讲稿共68页v(2)抽样极限误差的计算v 基于概率估计的要求,通常以抽样平均误差为标准单位来衡量
10、v 即用 t=Xt=PvXPv 得出相对数t,称为概率度,表示相对误差范围第23页,本讲稿共68页根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:抽样极限误差计算公式=t,(t为概率度)包含 X=tX P=tP第24页,本讲稿共68页v 4、抽样估计的可信程度v 抽样的误差范围不是固定不变的,要以调查的要求及把握程度(置信程度)来确定。所谓把握程度就是指总体指标包含在给定范围内的概率有多大。v 抽样估计的可信程度用F(t)表示。v其中,t 是概
11、率度,用来估计可靠程度 的一个参数,用概率论和数理统计证明给定不同的t 可以计算出相应的F(t)。如下表。第25页,本讲稿共68页 t 1 1.28 1.64 1.96 2 2.58 3F(t)(%)68.27 80 90 95 95.45 99 99.73第26页,本讲稿共68页当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。例第27页,本讲稿共68页v 例 某农场种
12、植小麦5000亩抽取25亩实测,测v 得平均亩产500千克,标准差50千克。v 试求:5000亩小麦的平均亩产在480千克520千克 之间 的概率。第28页,本讲稿共68页v 例 在概率保证程度为95.45%的下,按简单v 随机抽样,总体平均数的区间为(9981002)v 总体方差是25,v 求(1)样本平均数,抽样平均误差v(2)样本数第29页,本讲稿共68页第三节 抽样估计的方法与应用一、点估计例第30页,本讲稿共68页v 衡量样本估计量是否是总体 参数的最优估计量,有三个评价标准,即所有的估计量应具有:无偏性,一致性和有效性v 1、无偏性 v 这是一个好的估计量应有的一条理想标准。即样本
13、指标的数学期望等于总体参数,这个估计量称为被估计参数 的无偏估计量。v 则用数学表示:v E()=第31页,本讲稿共68页v 2、一致性 v 随着样本容量 n 的无限增大,样本估计值就越来越接近总体参数,这个估计量就是一致估计量。根据大数定律可知,0 有v lim p(xX)1v lim P(pp)1v 3、有效性v 要求样本指标做为优良估计量必须具有方差最小的性质。可以证明样本均值和中位数都是总体均值的无偏估计,但在相同容量下,样本均值更有效。v 数理统计知识证明,样本平均数和样本成数是总体平均数和总体成数的最优估计量。第32页,本讲稿共68页二、区间估计是根据样本指标和抽样误差去推断全及指
14、标的可能范围。抽样估计的特点是,根据给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存在的区间范围。总体参数的区间估计必须同时具备三个要素:估计值、概率保证程度和抽样误差范围,缺一不可。第33页,本讲稿共68页v 3、区间估计的步骤v(1)求样本估计量 X,Pv(2)求抽样平均误差 X,Pv(3)由概率可信程度F(t)t v 求抽样极限误差XPv(4)求出与置信度相对应的置信区间v(X-X,X+X)v(P-P,P+P)v第34页,本讲稿共68页 某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样推断 2优秀课件 抽样 推断 优秀 课件
限制150内