抽样推断 (2)优秀PPT.ppt
《抽样推断 (2)优秀PPT.ppt》由会员分享,可在线阅读,更多相关《抽样推断 (2)优秀PPT.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样推断你现在浏览的是第一页,共68页第一节第一节 推断方法概述推断方法概述 一、抽样的概念和特点一、抽样的概念和特点1 1、抽样的概念、抽样的概念一一般所讲的抽样调查,即指狭义的抽样调查般所讲的抽样调查,即指狭义的抽样调查(随机抽样随机抽样):按照随机原则从总体中抽取一部分:按照随机原则从总体中抽取一部分单位进行调查,并运用数理统计的原理,用被抽单位进行调查,并运用数理统计的原理,用被抽取的那部分单位的指标数值,对总体的数量特征取的那部分单位的指标数值,对总体的数量特征作出具有一定可靠程度的估计与推断,以达到认作出具有一定可靠程度的估计与推断,以达到认识总体的一种统计方法。识总体的一种统计方
2、法。你现在浏览的是第二页,共68页v2、抽样的特点、抽样的特点v(1)抽抽样必须遵循随机原则。样必须遵循随机原则。v(2)抽抽样推断从数量样推断从数量 上推断总体上推断总体v(3)抽抽样样 推断运用的是概率估计的方法推断运用的是概率估计的方法v(4)误误差可以事先计算并加以控制。差可以事先计算并加以控制。v3、抽样的作用(见书)、抽样的作用(见书)你现在浏览的是第三页,共68页二、抽样调查的基本概念二、抽样调查的基本概念(一一)总体和样本总体和样本1 1、总、总体(母体)体(母体)总体是调查对象的全部单位构成的总体是调查对象的全部单位构成的整体整体。对于某一。对于某一具体问题来说,总体是客观存
3、在的,是唯一确定的。具体问题来说,总体是客观存在的,是唯一确定的。2 2、样、样本总体(样本或子样)本总体(样本或子样)样本总体是从总体中按随机原则抽取的部分单样本总体是从总体中按随机原则抽取的部分单位构成的集合体。其中被抽取的每一个单位位构成的集合体。其中被抽取的每一个单位称谓样本单位。称谓样本单位。你现在浏览的是第四页,共68页v 样本来源于总体,是总体样本来源于总体,是总体 中的一部分,但中的一部分,但v不是唯一不是唯一 的,是不确定的,是可变的的,是不确定的,是可变的。v(二)总体容量和样本容量(二)总体容量和样本容量1、总、总本容量本容量指总体所含总体单位的个数。用指总体所含总体单位
4、的个数。用N表示表示 总体容量是唯一确定的总体容量是唯一确定的2、样、样本容量本容量指一个样本中所包含的单位数。指一个样本中所包含的单位数。样本的容量用样本的容量用n表示。表示。n 30 大样本大样本 n 30 小样本小样本抽抽样比样比 f=n 样本容量与总体容量之比。样本容量与总体容量之比。N(三)(三)样本个数:从总体中最多能抽取的不同样本样本个数:从总体中最多能抽取的不同样本 的总数的总数 你现在浏览的是第五页,共68页v(四)抽样的方法(四)抽样的方法v 1、重重复抽样(回置式抽样)复抽样(回置式抽样)v 有放回的抽取样本。抽中的样本再放回总体重复参加有放回的抽取样本。抽中的样本再放回
5、总体重复参加 以后多次抽取,以后多次抽取,总体中的单位数始终相同。总体中的单位数始终相同。v重复抽样的特点(重复抽样的特点(1)同一总体单位可能被重复抽中同一总体单位可能被重复抽中v (2)每个单位抽中的概率)每个单位抽中的概率1/Nv (3)每个单位抽中的机会均等每个单位抽中的机会均等v2、不不重复抽样(不回置式抽样)重复抽样(不回置式抽样)v 不放回的抽取样本,每次抽取一个单位。凡被抽中的单位不放回的抽取样本,每次抽取一个单位。凡被抽中的单位 不再放回到总体里,不参加下一次抽选。不再放回到总体里,不参加下一次抽选。v不重复抽样的特点(不重复抽样的特点(1)同一总体)同一总体 单位不可能被重
6、复抽中单位不可能被重复抽中v (2)每个单位抽中的可能性各次不相等)每个单位抽中的可能性各次不相等v (3)每次抽取不是独立的)每次抽取不是独立的v 你现在浏览的是第六页,共68页(五五)总体指标和样本指标总体指标和样本指标1.1.总总体指标(总体参数或母体体指标(总体参数或母体参数参数)总总体指标又称全及指标,是根据全及总体体指标又称全及指标,是根据全及总体各单位的标志值计算的,反映总体数量特各单位的标志值计算的,反映总体数量特征的综合指标。征的综合指标。总体指标是唯一确定的,但也是未知的,是总体指标是唯一确定的,但也是未知的,是一个一个待估计值待估计值.常用的总体指标有:常用的总体指标有:
7、X X 总体平均数总体平均数 P P 总体成数总体成数 2 2 总体方差总体方差 总体标准差总体标准差你现在浏览的是第七页,共68页 2 样本方差样本方差2 2、样样本指标(样本统计量)本指标(样本统计量)样样本指标是根据样本各单位的标志值计算的本指标是根据样本各单位的标志值计算的综合指标。样本指标是一个随机变量,是推断综合指标。样本指标是一个随机变量,是推断总体的依据。总体的依据。常常用的样本指标有:用的样本指标有:样本平均数样本平均数 p p 样本成数样本成数 样本标准差样本标准差你现在浏览的是第八页,共68页第二节第二节 抽样分布与抽样推断抽样分布与抽样推断进行抽样调查目的在于抽样推断进
8、行抽样调查目的在于抽样推断你现在浏览的是第九页,共68页v一、抽样分布一、抽样分布v 在在抽样推断中,样本统计量即样本平均数,样本方抽样推断中,样本统计量即样本平均数,样本方差,样本成数是一个随机变量。差,样本成数是一个随机变量。随随机变量有两个特点:机变量有两个特点:1、取值的随机性、取值的随机性 2、取值的统计规律性,即可以确定随机变量取值的概率置、取值的统计规律性,即可以确定随机变量取值的概率置信区间。信区间。v抽样分布:抽样分布:就是指样本平均数,样本方差,样本成数就是指样本平均数,样本方差,样本成数v 的分布。的分布。v 二、三部份内容是介绍抽样推断的理论依据,通过数理统二、三部份内
9、容是介绍抽样推断的理论依据,通过数理统计证明:样本平均数和样本成数的抽样分布,都服从于正计证明:样本平均数和样本成数的抽样分布,都服从于正态分布。态分布。v 你现在浏览的是第十页,共68页四、四、抽样平均误差和抽样极限误差抽样平均误差和抽样极限误差 1 1、抽样误差的概念、抽样误差的概念1 1、抽样误差的概念在统计调查中,调查资料与实、抽样误差的概念在统计调查中,调查资料与实际情况不一致,两者之间存在一定的差别,称为统计际情况不一致,两者之间存在一定的差别,称为统计误差。误差。你现在浏览的是第十一页,共68页抽样误差抽样误差即指随机误差,这种误差是抽样即指随机误差,这种误差是抽样的随机性而带来
10、的偶然性代表误差,是抽样调的随机性而带来的偶然性代表误差,是抽样调查特有的,不可能通过任何方式消除的无法避查特有的,不可能通过任何方式消除的无法避免的误差。但是这种误差是可以运用概率与数免的误差。但是这种误差是可以运用概率与数理统计理论来计算并加以控制。理统计理论来计算并加以控制。抽样误差抽样误差又可分为又可分为实实际误差和际误差和抽抽样平均误样平均误差,实际误差是指一个样本与总体指标之间的误差,实际误差是指一个样本与总体指标之间的误差,故是未知的不可计算。差,故是未知的不可计算。以下所讨论的抽样误差就是指以下所讨论的抽样误差就是指抽抽样平均误样平均误差的概念和计算。差的概念和计算。你现在浏览
11、的是第十二页,共68页2 2、抽样平均误差的概念和计算、抽样平均误差的概念和计算(1 1)抽样平均误差的概念)抽样平均误差的概念 是样本指标(平均数或成数)的标准差。它是样本指标(平均数或成数)的标准差。它反映的是所有可能出现的样本指标和总体指标之反映的是所有可能出现的样本指标和总体指标之间的平均离散程度(平均离差)。通常用间的平均离散程度(平均离差)。通常用表示。表示。现举例说明抽样平均数的抽样平均误差现举例说明抽样平均数的抽样平均误差 。你现在浏览的是第十三页,共68页(2 2)抽样平均误差的计算)抽样平均误差的计算 计算平均数的抽样平均误差计算平均数的抽样平均误差如前所述,抽样平均数的抽
12、样平均误差就是抽如前所述,抽样平均数的抽样平均误差就是抽样平均数的标准差,用公式表示样平均数的标准差,用公式表示 xx=(xiX总总)2 (为定义式不可计算)(为定义式不可计算)n 根据数理统计知识证明抽样平均误差的计算式为根据数理统计知识证明抽样平均误差的计算式为 1.1.重重复抽样(计算式即为等价公式复抽样(计算式即为等价公式)你现在浏览的是第十四页,共68页注意:注意:在实际计算时在实际计算时为一个样本的标准差。为一个样本的标准差。N N为一个样本的容量。为一个样本的容量。你现在浏览的是第十五页,共68页 某灯泡厂从一天所生产的产品某灯泡厂从一天所生产的产品10,00010,000个中抽
13、取个中抽取100100个检查其寿命,得平均寿命为个检查其寿命,得平均寿命为20002000小时小时(一般一般为重复抽样为重复抽样),根据以往资料:,根据以往资料:=20=20小时,小时,根据以往资料,产品质量不太稳定,若根据以往资料,产品质量不太稳定,若=200=200小时,小时,例例你现在浏览的是第十六页,共68页2.2.不不重复抽样:(用校正因子修正)重复抽样:(用校正因子修正)你现在浏览的是第十七页,共68页计算成数的抽样平均误差计算成数的抽样平均误差 已证明:已证明:成数的方差为成数的方差为p(1-p)p(1-p)你现在浏览的是第十八页,共68页 某玻璃器皿厂某日生产某玻璃器皿厂某日生
14、产1500015000只印花玻璃杯,现只印花玻璃杯,现按重复抽样方式从中抽取按重复抽样方式从中抽取150150只进行质量检验,结果有只进行质量检验,结果有147147只合格,其余只合格,其余3 3只为不合格品,试求这批印花玻璃杯只为不合格品,试求这批印花玻璃杯合格率合格率(成数成数)的抽样平均误差的抽样平均误差。例例你现在浏览的是第十九页,共68页3、抽样极限误差的概念和计算抽样极限误差的概念和计算v(1)抽样极限误差的概念)抽样极限误差的概念v 抽样极限误差是抽样估计准确程度的抽样极限误差是抽样估计准确程度的v误差范围误差范围。具体的说是样本指标与总体指标之间。具体的说是样本指标与总体指标之
15、间抽样误差的最大可能范围。这个范围的绝对值叫抽样误差的最大可能范围。这个范围的绝对值叫抽样极限误差。抽样极限误差。v 设设 Xx-X x-XX x+Xv pp-P p-pPp+p你现在浏览的是第二十页,共68页v上式表明,总体平均数是以抽样平均数为中心上式表明,总体平均数是以抽样平均数为中心v在在X-XX+X之之间变动,v区区间 X-X,X+X 称为平均数的估计区称为平均数的估计区间(置信区间)。间(置信区间)。v区间区间 P-P ,P+P称为成数的估计区间称为成数的估计区间v(置信区间)。(置信区间)。你现在浏览的是第二十一页,共68页v例例1 要估计某乡粮食亩产量及总产量从要估计某乡粮食亩
16、产量及总产量从8000亩中亩中用不重复抽样抽取用不重复抽样抽取400亩求得平均水平亩求得平均水平450v公斤,如果抽样极限误差为公斤,如果抽样极限误差为5公斤,这就说明公斤,这就说明8000亩粮食亩产量在亩粮食亩产量在445455之间总产量就在之间总产量就在8000X4508000X455即即356364之间(万公斤)之间(万公斤)v例例2 要估计农作物的成活率,随机要估计农作物的成活率,随机 抽取抽取1000棵棵秧苗,其中死苗秧苗,其中死苗80棵,则秧苗成活率棵,则秧苗成活率v P=920/1000=92%,如果抽样极限误差为如果抽样极限误差为2%v则该农作物的成活率则该农作物的成活率90%
17、94%之间。之间。你现在浏览的是第二十二页,共68页v(2)抽样极限误差的计算)抽样极限误差的计算v 基于概率估计的要求,通常以抽样平均误差基于概率估计的要求,通常以抽样平均误差为标准单位来衡量为标准单位来衡量v 即用即用 t=XXt=t=PPv XX P Pv得出相得出相对对数数t t,称称为为概率度,表示相概率度,表示相对误对误差范差范围围你现在浏览的是第二十三页,共68页根据中心极限定理,得知当根据中心极限定理,得知当n足够大时,抽样总体为正态分足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间
18、内,统计上把这个给定的区间叫抽样极限误某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率差,也称置信区间,即在概率F(t)的保证下:的保证下:抽样极限误差计算公式抽样极限误差计算公式 =t,(,(t为概率度)为概率度)包含包含 X=tX P=tP你现在浏览的是第二十四页,共68页v4、抽样估计的可信程度、抽样估计的可信程度v 抽抽样的误差范围不是固定不变的,要样的误差范围不是固定不变的,要以调查的要求及把握程度(置信程度)以调查的要求及把握程度(置信程度)来确定。所谓把握程度就是指总体指标来确定。所谓把握程度就是指总体指标包含在给定范围内的概率有多大。包含在给定范围
19、内的概率有多大。v 抽抽样估计的可信程度用样估计的可信程度用F(t)表示。)表示。v其中,其中,t 是概率度,用来估计可靠程度是概率度,用来估计可靠程度 的一个参数,用概率论和数理统计证明的一个参数,用概率论和数理统计证明给定不同的给定不同的t 可以计算出相应的可以计算出相应的F(t)。如。如下表。下表。你现在浏览的是第二十五页,共68页 t 11.281.641.96 22.58 3F(t)(%)68.27 80 90 9595.45 9999.73你现在浏览的是第二十六页,共68页当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限
20、误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);可见,抽样极限误差,即扩大或缩小了以后的抽样误差范可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。围。例例你现在浏览的是第二十七页,共68页v例例 某农场种植小麦某农场种植小麦5000亩抽取亩抽取25亩实测,测亩实测,测v得平均亩产得平均亩产500千克,标准差千克,标准差50千克。千克。v试求:试求:5000亩小麦的平均亩产在亩小麦的平均亩产在480千克千克520千千克克 之间之间 的概率。的概率。你现在浏览的是第二十八页,共68页v例例 在概率保证程度为在概率保证程度为95.
21、45%的下,按简单的下,按简单v随机抽样,总体平均数的区间为(随机抽样,总体平均数的区间为(9981002)v总体方差是总体方差是25,v求(求(1)样本平均数,抽样平均误差)样本平均数,抽样平均误差v (2)样本数)样本数你现在浏览的是第二十九页,共68页第三节第三节 抽样估计的方法与应用抽样估计的方法与应用一、点估计一、点估计例例你现在浏览的是第三十页,共68页v 衡量样本估计量是否是总体衡量样本估计量是否是总体 参数的最优估计量,参数的最优估计量,有三个评价标准,即所有的估计量应具有:无偏性,有三个评价标准,即所有的估计量应具有:无偏性,一致性和有效性一致性和有效性v1、无偏性、无偏性
22、v 这是一个好的估计量应有的一条理想标准。这是一个好的估计量应有的一条理想标准。即即样本指标的数学期望等于总体参数,这个估计量称样本指标的数学期望等于总体参数,这个估计量称为被估计参数为被估计参数 的无偏估计量。的无偏估计量。v 则用数学表示则用数学表示:v E()=你现在浏览的是第三十一页,共68页v2、一致性、一致性 v 随着样本容量随着样本容量 n 的无限增大,样本估计值就越来越接近的无限增大,样本估计值就越来越接近总体参数,这个估计量就是一致估计量。根据大数定律可知,总体参数,这个估计量就是一致估计量。根据大数定律可知,0 有有v lim p(xX)1 1v lim P(pp)1 1v
23、3 3、有效性、有效性v 要求样本指标做为优良估计量必须具有方差最小的性要求样本指标做为优良估计量必须具有方差最小的性质。可以证明样本均值和中位数都是总体均值的无偏估计,质。可以证明样本均值和中位数都是总体均值的无偏估计,但在相同容量下,样本均值更有效。但在相同容量下,样本均值更有效。v数理统计知识证明,样本平均数和样本成数是总体平均数理统计知识证明,样本平均数和样本成数是总体平均数和总体成数的最优估计量。数和总体成数的最优估计量。你现在浏览的是第三十二页,共68页二、区间估计二、区间估计是是根据样本指标和抽样误差去推断全及根据样本指标和抽样误差去推断全及指标的可能范围。抽样估计的特点是,根据
24、指标的可能范围。抽样估计的特点是,根据给定的概率保证程度的要求,给定的概率保证程度的要求,利用实际抽样资料,指出总体被估计值利用实际抽样资料,指出总体被估计值的上限和下限,即指出总体参数可能存的上限和下限,即指出总体参数可能存在的区间范围。在的区间范围。总总体参数的区间估计必须同时具备体参数的区间估计必须同时具备三个要素:三个要素:估估计值、计值、概概率保证程度和率保证程度和抽抽样样误差范围,缺一不可。误差范围,缺一不可。你现在浏览的是第三十三页,共68页v3、区间估计的步骤、区间估计的步骤v(1)求样本估计量)求样本估计量 X,Pv(2)求抽样平均误差)求抽样平均误差 XX,PPv(3 3)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样推断 2优秀PPT 抽样 推断 优秀 PPT
限制150内