抽样调查理论与方法课件.pptx
《抽样调查理论与方法课件.pptx》由会员分享,可在线阅读,更多相关《抽样调查理论与方法课件.pptx(77页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、2023/1/118-18.1 抽样调查的意义8.1.1 抽样调查的概念8.1.2 抽样调查的作用8.1.3 抽样调查的应用领域第1页/共77页2023/1/118-28.1.1 抽样调查的概念统计调查:是获取数据资料的一种重要手段,它又分为全面调查与非全面调查两类。全面调查:普查 非全面调查:又称为抽样调查,它是指从研究对象的全体(总体)中抽取一部分单元作为样本进行观察,并根据观察结果来推断全体,以此达到对全体目标量的了解。这是广义的抽样调查的概念。例:调查北京市民对出租车行业的满意度调查第2页/共77页2023/1/118-3抽样调查的分类依据样本抽取的同,抽样可以分为非概率抽样和概率抽样
2、两类。第3页/共77页2023/1/118-4非概率抽样(non-probability sampling)与概率抽样相对的一种抽样。又称非随机抽样,是指抽样时不遵循随机原则,而是按照研究人员的主观经验或其他条件来抽取样本的一种抽样方法。问题:(1)其效果好坏依赖于抽样者的主观判断能力和经验 (2)无法计算和控制抽样误差。无法用样本的量化数据来推断总体。第4页/共77页2023/1/118-5便利抽样是根据调查者的方便与否来抽取样本的一种非概率抽样方法。典型的形式是“拦截式”调查。调查过程中由调查员依据方便的原则,自行确定入抽样本的单位调查员在街头、公园、商店等公共场所进行拦截调查厂家在出售产
3、品柜台前对路过顾客进行的调查优点:容易实施,调查的成本低缺点:样本单位的确定带有偶然性,样本无法代表有明确定义的总体,调查结果无法根据样本信息对总体进行数量特征的推断,样本不适合描述性研究和因果关系研究 第5页/共77页2023/1/118-6判断抽样是一种凭研究人员的主观意愿、经验和知识,从总体中选择具有典型意义和代表性的样本点构成样本作为调查客体的一种非概率抽样方法。一般选择“平均型”、“众数型”、“特殊型”单元作为样本样本量小及样本不易分门别类挑选时有其较大的优越性由于其估计精度严重依赖于研究者对调查对象的了解程度、判断水平和对结果的解释情况,所以,一般不轻易地用于对总体进行数量方面的判
4、断第6页/共77页2023/1/118-7配额抽样先将总体中的所有单元按一定的标志分为若干(组),然后在每个类(组)中按照事先规定的比例或数量(即配额)用便利抽样或判断抽样方法选取样本点 分类依据通常就是总体单元的某些属性、特征,如受调查者的年龄、性别、社会阶层等方法简单易行,可以保证总体的各个类别都能包括在所抽样本之中,使得样本的结构和总体的结构类似第7页/共77页2023/1/118-8配额抽样独立控制配额抽样:根据调查总体的不同特性,对具有某个特性的调查样本分别规定单独分配数额 优点:方法简单易行,调查人员选择余地较大 缺点:调查人员可能图一时方便,选择样本过于偏向某一组别,从而影响样本
5、的代表性交叉控制配额抽样:是根据调查对象的各个特性的样本数额交叉分配 由于各个特性都同时得到了控制,从而克服了独立控制配额抽样的缺点,提高了样本的代表性。第8页/共77页2023/1/118-9滚雪球抽样是以“滚雪球”的方式抽取样本,即通过一些“种子”样本点以获取更多样本点的信息,样本量逐渐扩大优点:便于有针对性找到被调查者,调查的成本也比较低缺点:要求样本单元之间必须有一定的联系并且愿意保持和提供这种关系 第9页/共77页2023/1/118-10概率抽样(probability sampling)又称随机抽样,是指依据随机原则,按照某种事先设计的程序,从总体中抽取部分单元的抽样方法 特点按
6、一定的概率以随机原则抽取样本抽取样本时使每个单位都有一定的机会(概率)被抽中“随机”不等于“随便”“随机”不等于“等概率”用样本指标数值去推断总体的指标数值抽样调查会产生抽样误差,这个误差可以计算,并且可以加以控制第10页/共77页2023/1/118-11概率抽样(probability sampling)概率抽样被视为狭义的抽样调查,在实践中被广泛加以采用,通常所谓的抽样调查,均指概率抽样调查。概率抽样有多种形式:简单随机抽样、分层抽样、系统抽样、整群抽样等,这些方法将在8.4节逐一介绍。第11页/共77页2023/1/118-128.1.2 抽样调查的作用实际工作不可能进行全面调查,而又
7、需要了解其全面情况的现象 对虽然可以进行全面调查,但调查时范围大、单位数目多,又缺乏原始记录作依据的现象对普查资料的质量进行检查和修正抽样调查方法可以用于工业生产过程中的质量控制 第12页/共77页2023/1/118-138.1.3 抽样调查的应用领域社会经济现象的调查 如:人口变动、农产量、城市居民家计、农村经济、小型工业企业生产情况、小型商业企业交易情况调查 社会性的民意调查 市场调查卫生调查 资源环境调查第13页/共77页2023/1/118-148.2 抽样调查的基本概念 8.2.1 总体与样本8.2.2 总体参数与统计量8.2.3 抽样单元与抽样框 8.2.4 抽样方法与样本可能数
8、目8.2.5 精度与费用第14页/共77页2023/1/118-158.2.1 总体与样本总体:研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体(individual)所组成 1)总体的限定是人为的 2)在一项调查中,总体是唯一的,样本不是唯一的 3)总体中包含的单元数称为总体容量,记为个体:构成总体的基本单元 第15页/共77页2023/1/118-16统计总体的种类指总体中所包含的单位数目是有限的总体指总体中所包含的单位数目是有限的总体指总体中所包含的单位数目是无限的总体指总体中所包含的单位数目是无限的总体有限总体有限总体无限总体无限总体对对有有限限总总体
9、体可可以以进进行行全全面面调调查查,也可以进行也可以进行非全面调查;非全面调查;对无限总体只能采取对无限总体只能采取非全面调查非全面调查 第16页/共77页2023/1/118-17样本:是总体的一部分,从总体中按一定程序抽取的那部分抽样单元或个体组成。1)样本也是一个集合,每个被抽中的进入样本的单元称为入样单元,2)样本包含的单元数称为样样本容量,记为n 3)样本量对总体容量之比称为抽样比,记为fn/N(一般是一个很小的数)4)大样本 ;小样本 第17页/共77页2023/1/118-188.2.2 总体参数与统计量总体参数:是根据总体中各单位的变量值计算出来的用于反映总体的数量特征的指标
10、调查的目标量都是由总体的某些指标来表示的总体参数表现为一系列唯一的常数,但往往却是未知的,需要去推断和估计 第18页/共77页2023/1/118-19统计量:是根据样本的n个单元的变量值计算出来一个量,也叫估计量(estimator),1)样本指标是随机变量 2)往往构成了用于估计总体参数的估计量。第19页/共77页2023/1/118-20常见的总体参数包括:总体均值(平均数)(population mean)总体总值(总和)(population total)总体比例(proportion)总体方差(population variance)标准差(population standard
11、deviation)第20页/共77页2023/1/118-218.2.3 抽样单元与抽样框抽样单元与抽样框总体是由个体组成的,可以是有限的,也可以是无限的,当从抽样角度而言,总将总体看成是有限的。将总体划分为互不重迭而又穷尽的有限多个部分,将这样的每个部分称为抽样单元(sampling unit)。1)每个抽样单元都由或多或少的个体组成,当然也可以是一个个体。第21页/共77页2023/1/118-22 2)抽样单元可大可小,可以分级。分别称为一级抽样单元(psu)、二级抽样单元(ssu),基本抽样单元(最小一级抽样单元)。3)抽样单元可以是人为划分的,也可以是自然形成的。第22页/共77页
12、2023/1/118-23包含所有抽样单元的名单或者清册,称为抽样框。1)抽样框的形式是多样的 2)抽样框中的单元原则上既不应有重复,也不应有遗漏抽样框的种类:名录框、区域框、自然框第23页/共77页2023/1/118-248.2.4 抽样方法与样本可能数目从总体中抽取样本方式的不同,构成了不同的抽样方法 1)放回抽样/回置抽样、不放回抽样 2)等概率抽样、不等概率抽样对样本开展调查,获得样本数据,形成样本指标,构造适当的统计量作为总体指标的估计是抽样调查的必要工作第24页/共77页2023/1/118-25重复抽样:指每次从总体中抽取一个单元进行观察后,再把这个单元重新放回总体,使之继续参
13、加下次抽选(回置抽样或重置抽样)。不重复抽样:指每次从总体中抽取一个单元进行观察后,不再把这个单元重新放回总体,这个总体单元不再继续参加下次抽选(不回置抽样或不重置抽样)。第25页/共77页2023/1/118-26考虑顺序的重复抽样不考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样第26页/共77页2023/1/118-278.2.5 精度与费用精度与费用 抽样调查的精度误差的大小 抽样误差的大小 (可用估计量,大样本)方差或标准差大小 抽样调查中,精度的估计主要就是估计量的方差估计 影响方差的最重要的因素是样本量,样本量又与费用有关 影响精度和费用的另一因素是抽样方法和估计方法
14、 对于一个具体的抽样设计,应尽量做到在固定费用的限制下使精度最高,或在要求达到的精度的约束下使调查费用最省,称这样的设计为最优设计第27页/共77页2023/1/118-28 对精度的讨论基于两个方向:对于某类抽样方案,构造合适的估计量并讨论这一估计量的方差估计对于既定的抽样方案,依据给定的精度要求(误差限要求)讨论方案的细节(如样本量的确定问题)第28页/共77页2023/1/118-298.3 抽样误差 8.3.1抽样调查中误差的来源8.3.2抽样平均误差、方差与偏差 8.3.3抽样平均误差的计算 8.3.4抽样极限误差与置信度 第29页/共77页2023/1/118-308.3.1 抽样
15、调查中的误差来源抽样调查中的误差来源凡调查就一定有误差,不可能完全避免。抽样调查中误差可分为非抽样误差及抽样误差两大类。非抽样误差(nonsampling error):指不是由于抽样引起的,在全面普查中也存在。包括:1)调查误差:调查所得数据与样本单元的真值不一致所造成的误差。原因包括测量误差、失真回答等。2)不完整的抽样框误差:抽样框的重复和遗漏。3)不回答误差(无相应误差):抽中的样本单元找不到或者拒绝回答问题或缺失所需要的信息 4)填写录入误差第30页/共77页2023/1/118-31#抽样误差(sampling error):指由于抽样所造成的误差(用样本估计总体而产生的误差)。其
16、根源在于样本的随机性,使得样本指标值和总体真实值之间存在差异 1)只要是抽样调查,这个误差不可避免 2)能够计量和控制,可用各种量值表示 3)通常样本量愈大,则抽样误差愈小(抽样误差与样本量的平方根成反比)第31页/共77页2023/1/118-328.3.2 抽样平均误差、方差和偏差抽样平均误差、方差和偏差第32页/共77页2023/1/118-33均方误差可以分解:其中:称为的(抽样)方差 称为的偏差(Bias)特别地,对于无偏估计量,满足:因此:即:对于无偏估计量,其方差可以表征抽样平均误差程度第33页/共77页2023/1/118-34均方误差的平方根称为抽样平均误差,方差的平方根称为
17、标准差(standard deviation)。抽样平均误差 、标准差 和偏差 三者之间的关系:第34页/共77页2023/1/118-358.3.3 抽样平均误差的计算F本章主要讨论简单随机抽样条件下,以及估计量是无偏估计量的抽样平均误差的计算(一)样本平均数的抽样平均误差1.重复抽样第35页/共77页2023/1/118-36 某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:=20小时,根据以往资料,产品质量不太稳定,若=200小时,例第36页/共77页2023/1/118-372.不重复抽样:第37页/共77页2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 理论 方法 课件
限制150内