第七章抽样调查精选PPT.ppt
《第七章抽样调查精选PPT.ppt》由会员分享,可在线阅读,更多相关《第七章抽样调查精选PPT.ppt(169页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章 抽样调查第1页,本讲稿共169页第一节 抽样调查的意义 一、抽样调查的概念和特点一、抽样调查的概念和特点 (一一)抽样调查的概念抽样调查的概念 抽样调查是一种科学的非全面调查。它是抽样调查是一种科学的非全面调查。它是按照随机原则从调查对象的总体中抽取部分单按照随机原则从调查对象的总体中抽取部分单位进行调查,并根据这部分单位的调查结果推位进行调查,并根据这部分单位的调查结果推断总体的数量特征。断总体的数量特征。抽样调查必须按照随机原则来抽取被调查单位。抽样调查必须按照随机原则来抽取被调查单位。第七章 抽样调查第2页,本讲稿共169页第一节 抽样调查的意义(二二)抽样调查的特点抽样调查的特
2、点1.随机抽取样本单位随机抽取样本单位2.推断总体数量特征推断总体数量特征3.抽样调查结果只有可控性误差抽样调查结果只有可控性误差第七章 抽样调查第3页,本讲稿共169页第一节 抽样调查的意义 二、抽样调查的应用范围1.用于不可能进行全面调查的现象用于不可能进行全面调查的现象2.用于进行全面调查就会失去现实意义的现象用于进行全面调查就会失去现实意义的现象3.用于经济上不允许或精度上用于经济上不允许或精度上 不必要进行全不必要进行全 面调查的现象面调查的现象4.用于时效性要求较强的调查用于时效性要求较强的调查第七章 抽样调查第4页,本讲稿共169页第一节 抽样调查的意义 三、抽样调查的作用三、抽
3、样调查的作用1.经济性好经济性好2.准确性高准确性高3.速度快速度快4.可以取得比较详细的统计资料可以取得比较详细的统计资料5.可以对全面调查的资料进行补充和修正可以对全面调查的资料进行补充和修正第七章 抽样调查第5页,本讲稿共169页第二节 总体和样本 一、全及总体和样本总体(一)全及总体也叫母体,简称为总体。也叫母体,简称为总体。(二)抽样框在实际进行抽样的总体范围内,包括全部抽样单位的在实际进行抽样的总体范围内,包括全部抽样单位的名单框架称为抽样框。名单框架称为抽样框。抽样框的抽样框的主要形式主要形式有三种:有三种:名单抽样框名单抽样框 区域抽样框区域抽样框 时间表抽样框。时间表抽样框。
4、第七章 抽样调查第6页,本讲稿共169页区域抽样框区域抽样框在商场的大门口在商场的大门口在微波炉柜台前在微波炉柜台前在市区街道旁边在市区街道旁边在某个住宅小区在某个住宅小区中山路中山路桥西区桥西区桥东区桥东区华北地区华北地区东北地区东北地区居民一组居民一组居民二组居民二组某外国公司在大连进某外国公司在大连进行微波炉市场调查:行微波炉市场调查:第7页,本讲稿共169页时间表抽样框时间表抽样框连续出产的产品总体连续出产的产品总体可以编制抽样框:可以编制抽样框:均均匀的出产时间、可以匀的出产时间、可以预见到的产品总量。预见到的产品总量。连续到加油站加油的连续到加油站加油的汽车总体无法编制抽汽车总体无
5、法编制抽样框:样框:时间不定、总时间不定、总量也无法确定。量也无法确定。第8页,本讲稿共169页第二节 总体和样本(三)样本总体样本总体,又叫子样,简称样本(样本总体,又叫子样,简称样本(sample)。它是从全)。它是从全及总体中随机抽取出来(具体是从抽样框中抽取出来的),及总体中随机抽取出来(具体是从抽样框中抽取出来的),用来代表全及总体的那部分单位构成的总体。用来代表全及总体的那部分单位构成的总体。样本总体的单位数称为样本容量,通常用小写字母样本总体的单位数称为样本容量,通常用小写字母n来表示。来表示。样本容量n与总体单位数N的比值()称为抽样比。样本容量样本容量n在在30以下时,称为小
6、样本;达到或超过以下时,称为小样本;达到或超过30时称为时称为大样本。大样本。第七章 抽样调查第9页,本讲稿共169页第二节 总体和样本 二、总体指标和样本指标(一一)总体指标总体指标总体指标是根据全及总体所有单位的标志值计算出来的,总体指标是根据全及总体所有单位的标志值计算出来的,反映总体的数量特征。反映总体的数量特征。总体指标也称为总体指标也称为总体参数总体参数(Parameter),或,或参数参数。总体指标主要有:总体平均数:总体方差:总体标准差:总体比率 (或 )第七章 抽样调查第10页,本讲稿共169页第二节 总体和样本(二二)样本指标样本指标由样本总体各个单位的标志值计算的综合指标
7、称为样本由样本总体各个单位的标志值计算的综合指标称为样本指标,样本指标又称为指标,样本指标又称为样本统计量样本统计量(Statistic),简),简称为称为统计量统计量。样本指标主要有:样本平均数:样本方差:样本标准差:样本比率 (或 )第七章 抽样调查第11页,本讲稿共169页第二节第二节 总体和样本总体和样本 三、抽样方法和样本可能数目(一)抽样方法1.1.重复抽样重复抽样重复抽样(重复抽样(sampling with replacementsampling with replacement)也叫重置抽样,)也叫重置抽样,是指每次抽取一个单位记录其标志表现后又放回,重新是指每次抽取一个单位
8、记录其标志表现后又放回,重新参加下一次的抽选。参加下一次的抽选。2.2.不重复抽样不重复抽样不重复抽样(不重复抽样(sampling without replacementsampling without replacement)也叫不)也叫不重置抽样,是指每次从总体中抽取一个单位记录其标志重置抽样,是指每次从总体中抽取一个单位记录其标志表现后不再放回,从剩余的单位中抽取下一个单位。表现后不再放回,从剩余的单位中抽取下一个单位。第七章 抽样调查第12页,本讲稿共169页第二节 总体和样本(二)样本可能数目样本可能数目是指抽样组织和抽样方法一定时,从总体样本可能数目是指抽样组织和抽样方法一定时,
9、从总体N N个单位中随机抽取一个容量为个单位中随机抽取一个容量为n n的样本,该样本不同构成的样本,该样本不同构成的可能数目,一般用的可能数目,一般用m m来表示。来表示。1.重复抽样的样本可能数目(通常为考虑单位排列顺序)2.不重复抽样的样本可能数目(通常为考虑单位排列顺序)第七章 抽样调查第13页,本讲稿共169页第三节 抽样调查的数理基础 一、抽样分布抽样分布(抽样分布(sampling distribution)就是指样本统计)就是指样本统计量的概率分布。量的概率分布。例如,设总体有例如,设总体有3名学生名学生A、B和和C,他们的考试成绩,他们的考试成绩分别为分别为5分、分、4分和分和
10、3分。分。现在采用抽样调查方法抽取其中的现在采用抽样调查方法抽取其中的2名学生作为样本,了名学生作为样本,了解这解这3名学生的平均成绩。名学生的平均成绩。样本统计量为:第七章 抽样调查第14页,本讲稿共169页第三节 抽样调查的数理基础 若采用重复抽样,样本构成情况如下表所示。若采用重复抽样,样本构成情况如下表所示。样本均值第二次ABC第一次AAAABACBBABBBCCCACBCC重复抽样的样本统计量取值情况重复抽样的样本统计量取值情况 样本均值第二次543第一次554.5444.543.5343.53第七章 抽样调查第15页,本讲稿共169页第三节 抽样调查的数理基础 重复抽样的样本统计量
11、分布表重复抽样的样本统计量分布表 33.544.551232191/92/93/92/91/91第七章 抽样调查第16页,本讲稿共169页第三节 抽样调查的数理基础 二、大数定律及其意义大数定律是阐述大量随机变量的平均结果具有稳定性的一大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。系列定律的总称。1.独立同分布大数定律 独立随机变量独立随机变量 具有相同分布,且存在有限的具有相同分布,且存在有限的数学期望数学期望 和方差和方差 ,则对于任意小的正数,则对于任意小的正数,有,有第七章 抽样调查第17页,本讲稿共169页第三节 抽样调查的数理基础 2.贝努力大数定律贝努力大数定
12、律设设m是是 n 次独立随机试验中事件次独立随机试验中事件A发生发生(“成功成功”)的次数,的次数,p是事件是事件A在每次试验中发生的概率,则对于任意小的正数在每次试验中发生的概率,则对于任意小的正数,有,有大数定理从理论上揭示了样本和总体之间的内在联系,大数定理从理论上揭示了样本和总体之间的内在联系,即随着抽样单位数即随着抽样单位数n的增大,样本平均数(或比率)有接的增大,样本平均数(或比率)有接近于总体平均数(或比率)的趋势。近于总体平均数(或比率)的趋势。第七章 抽样调查第18页,本讲稿共169页第三节 抽样调查的数理基础 大数定律可归纳如下:大数定律可归纳如下:1)现象的某种总体性规律
13、(或称统计规律现象的某种总体性规律(或称统计规律),只有当具,只有当具有这种现象的足够多数的单位综合汇总在一起的时候,有这种现象的足够多数的单位综合汇总在一起的时候,才能显示出来。因此,只有从大量现象的总体中,才才能显示出来。因此,只有从大量现象的总体中,才能研究这些现象的规律性。能研究这些现象的规律性。2)现象的总体性规律或倾向通常是以平均数(或比率现象的总体性规律或倾向通常是以平均数(或比率)的形式表现出来的。的形式表现出来的。3)当所研究的现象总体包含的单位越多,平均数(或当所研究的现象总体包含的单位越多,平均数(或比率比率)也就越能够正确反映出这些现象的规律性。也就越能够正确反映出这些
14、现象的规律性。第七章 抽样调查第19页,本讲稿共169页第三节 抽样调查的数理基础 4)各单位的共同倾向(这些表现为主要的、基本的因素)决各单位的共同倾向(这些表现为主要的、基本的因素)决定着平均数(或比率)的水平,而各单位对平均数(或比率)定着平均数(或比率)的水平,而各单位对平均数(或比率)的离差(这些表现为次要的、偶然的因素)则会由于足够多的离差(这些表现为次要的、偶然的因素)则会由于足够多数单位的综合汇总的结果,而相互抵消,趋于消失。数单位的综合汇总的结果,而相互抵消,趋于消失。大数定律可归纳如下:大数定律可归纳如下:根据大数定律的内容特点,运用抽样法时,必须注意以下两根据大数定律的内
15、容特点,运用抽样法时,必须注意以下两个问题:个问题:第一、抽样必须遵循随机原则。第一、抽样必须遵循随机原则。第二、抽样必须遵循大量原则。第二、抽样必须遵循大量原则。第七章 抽样调查第20页,本讲稿共169页第三节 抽样调查的数理基础 三、正态分布及其意义(一)正态分布的概念及其特点1.正态分布的概念正态分布的概念正态分布的分布密函数为:x为随机变量,为随机变量,e为自然对数的底,为自然对数的底,为圆周率,为圆周率,为变量为变量x的平均数,的平均数,为变量标准差。为变量标准差。第七章 抽样调查第21页,本讲稿共169页第三节 抽样调查的数理基础 2.关于密度函数 的二个参数 和平均数 决定密度函
16、数 的中心位置。第七章 抽样调查第22页,本讲稿共169页第三节 抽样调查的数理基础 标准差 决定密度函数曲线 的陡缓程度 第七章 抽样调查第23页,本讲稿共169页第三节 抽样调查的数理基础 3.正态分布密度函数的特点正态分布密度函数的特点1)对称性。对称性。2)非负性。非负性。3)在 时达到极大值4)的曲线在 处有拐点。5)当 时,的曲线以x轴为渐近线。第七章 抽样调查第24页,本讲稿共169页第三节 抽样调查的数理基础 4.标准正态分布标准正态分布标准正态分布的概率密度为:若随机变量 服从标准正态分布,则记为它具有如下性质或结论。第七章 抽样调查第25页,本讲稿共169页第三节 抽样调查
17、的数理基础(二)正态分布的应用求正态变量的概率,通常是先将一般正态变量转换为标准求正态变量的概率,通常是先将一般正态变量转换为标准正态变量,然后从标准正态分布概率表中查出相应标准正正态变量,然后从标准正态分布概率表中查出相应标准正态变量值所对应的分布函数值,再计算出所求正态变量研态变量值所对应的分布函数值,再计算出所求正态变量研究区间的概率。究区间的概率。第七章 抽样调查第26页,本讲稿共169页第三节 抽样调查的数理基础(二)正态分布的应用部分常用部分常用z值和相应概率值值和相应概率值 z011.6451.96230.00000.68270.90000.95000.95450.9973第七章
18、 抽样调查第27页,本讲稿共169页第三节 抽样调查的数理基础 四、中心极限定理及其意义中心极限定理论证了如下几点中心极限定理论证了如下几点:1)如果总体服从正态分布,样本平均数也同样服从正态分布。如果总体服从正态分布,样本平均数也同样服从正态分布。2)如果总体很大,但不服从正态分布,只要样本足够大,如果总体很大,但不服从正态分布,只要样本足够大,样本的总和或平均数就会趋近于正态分布。样本的总和或平均数就会趋近于正态分布。3)样本平均数分布的数学期望(该抽样的所有可能样本平均数的均值)等于总体均值。即 。4)样本平均数分布的方差 为:重复抽样时:不重复抽样时:第七章 抽样调查第28页,本讲稿共
19、169页第四节 总体参数估计 第七章 抽样调查一、参数估计的优良标准(一)无偏性(二)有效性(三)一致性第29页,本讲稿共169页评价准则评价准则的数学期望等的数学期望等于总体参数,于总体参数,即即该估计量称为该估计量称为无偏估计无偏估计无偏性无偏性有效性有效性当当 为为 的无偏估的无偏估计时,计时,方差方差 越小,无偏估计越越小,无偏估计越有效。有效。一致性一致性对于无限总体,对于无限总体,如果对任意如果对任意则称则称 是是的一致估计。的一致估计。估计量估计量第七章 抽样调查第30页,本讲稿共169页第四节 总体参数估计 第七章 抽样调查二、抽样误差二、抽样误差(一一)抽样误差的意义抽样误差
20、的意义1.抽样误差的概念抽样误差的概念抽样调查过程中的误差根据其来源大体上可以归纳为抽样调查过程中的误差根据其来源大体上可以归纳为两类:一类是两类:一类是登记性误差登记性误差,另一类是,另一类是代表性误差代表性误差。代表性误差包括系统误差和随机误差两种。代表性误差包括系统误差和随机误差两种。第31页,本讲稿共169页第四节 总体参数估计 第七章 抽样调查2.影响抽样误差的因素影响抽样误差的因素1)总体变异度总体变异度 2)样本容量样本容量 3)抽样方法抽样方法 4)抽样组织方式抽样组织方式 第32页,本讲稿共169页第四节 总体参数估计 抽样平均误差一般如下抽样平均误差一般如下公式公式表示:表
21、示:为第 可能样本的平均数 为总体平均数 是样本可能数目 第七章 抽样调查(二)抽样平均误差1.概念:概念:抽样平均误差是指所有可能样本的估计值与抽样平均误差是指所有可能样本的估计值与所要估计参数离差的平均数。所要估计参数离差的平均数。第33页,本讲稿共169页第四节 总体参数估计 2.抽样平均误差的计算抽样平均误差的计算1)样本平均数的抽样平均误差样本平均数的抽样平均误差 重复抽样情况下:不重复抽样情况下:第七章 抽样调查第34页,本讲稿共169页第四节 总体参数估计 2)样本比率的抽样平均误差样本比率的抽样平均误差在重复抽样情况下:在不重复抽样情况下:第七章 抽样调查第35页,本讲稿共16
22、9页第四节 总体参数估计(三三)抽样极限误差抽样极限误差在一次抽样中允许的最大误差范围称为抽样极限误差。在一次抽样中允许的最大误差范围称为抽样极限误差。是变动的抽样指标与唯一确定的但又是未知的全及指标是变动的抽样指标与唯一确定的但又是未知的全及指标之间离差的可能范围。之间离差的可能范围。设设x与与p分别表示样本平均数与样本比率的抽分别表示样本平均数与样本比率的抽样极限误差,则有:样极限误差,则有:第七章 抽样调查第36页,本讲稿共169页第四节 总体参数估计 抽样极限误差通常需要以抽样平均误差为标准单位来抽样极限误差通常需要以抽样平均误差为标准单位来加以衡量,把抽样极限误差除以相应的抽样平均误
23、差,得加以衡量,把抽样极限误差除以相应的抽样平均误差,得出数值出数值z,以表明抽样极限误差是抽样平均误差的多少倍。,以表明抽样极限误差是抽样平均误差的多少倍。在概率统计中,z称为概率度。其计算公式为:第七章 抽样调查第37页,本讲稿共169页第四节 总体参数估计 为了表示抽样误差的相对程度,需要计算抽样误差系数 和 由抽样误差系数还可以计算抽样估计精度(由抽样误差系数还可以计算抽样估计精度(Ax或或Ap)。)。第七章 抽样调查第38页,本讲稿共169页第四节 总体参数估计 三、抽样估计的置信度抽样估计时总体参数落在某个区间的概率保证程度称抽样估计时总体参数落在某个区间的概率保证程度称为抽样估计
24、的置信度。为抽样估计的置信度。抽样估计的置信度(抽样估计的置信度(confidence interval)和抽样)和抽样极限误差有着密切联系。当抽样极限误差范围增大极限误差有着密切联系。当抽样极限误差范围增大时,抽样估计的置信度也随之有规律地增大,抽样时,抽样估计的置信度也随之有规律地增大,抽样估计的精确程度则随之有规律地降低,反之亦然。估计的精确程度则随之有规律地降低,反之亦然。第七章 抽样调查第39页,本讲稿共169页第四节 总体参数估计 四、点估计与区间估计点估计也称定值估计,它是以样本指标的计算结果作点估计也称定值估计,它是以样本指标的计算结果作为总体参数估计的结果,即用样本指标值直接
25、作为全为总体参数估计的结果,即用样本指标值直接作为全及总体指标的代表值。及总体指标的代表值。(一一)点估计点估计用于点估计的估计量一般应满足优良估计量三个标准。用于点估计的估计量一般应满足优良估计量三个标准。第七章 抽样调查第40页,本讲稿共169页第四节 总体参数估计(二)区间估计区间估计就是根据样本估计量以一定可靠程度推断总体区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。参数所在的区间范围。区间估计有三项区间估计有三项基本要素基本要素:估计值,主要是样本的平均数、比率和方差;估计值,主要是样本的平均数、比率和方差;估计值的可能误差范围(或说允许误差范围),即抽样估计值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第七章 抽样调查精选PPT 第七 抽样调查 精选 PPT
限制150内