抽样调查的一般原理与抽样估计.pptx
《抽样调查的一般原理与抽样估计.pptx》由会员分享,可在线阅读,更多相关《抽样调查的一般原理与抽样估计.pptx(132页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、安徽理工大学统统 计计 学学第第 三十二三十二 讲讲主讲主讲 雷思友雷思友 副教授副教授/ /硕导硕导/ /系主任系主任1市场营销2009-1/2/3/4Be quiet!Shut your mouth!2第第 七七 章章 抽抽 样样 调调 查查 第一节第一节 抽样调查概述抽样调查概述 第二节第二节 抽样调查的一般原理抽样调查的一般原理 第三节第三节 抽样估计抽样估计 第四节第四节 抽样的组织形式抽样的组织形式3(一一)抽样推断的含义抽样推断的含义 抽样调查是按随机原则,从全部研究对象中抽取一抽样调查是按随机原则,从全部研究对象中抽取一部分单位进行观察,并根据样本的实际数据,对总体的部分单位进
2、行观察,并根据样本的实际数据,对总体的数量特征做出具有一定可靠程度的估计和判断,从而达数量特征做出具有一定可靠程度的估计和判断,从而达到对全部研究对象的认识的一种统计方法。到对全部研究对象的认识的一种统计方法。其中心问题其中心问题是如何根据已知的部分资料来推断未知的总体情况是如何根据已知的部分资料来推断未知的总体情况。第一节第一节 抽样调查概述抽样调查概述一、抽样调查的含义一、抽样调查的含义4(二二)抽样推断的特点抽样推断的特点1抽样推断是非全面调查抽样推断是非全面调查2抽样推断是按随机原则抽选调查单位。抽样推断是按随机原则抽选调查单位。3抽样推断是用样本的指标数值去推算总体的指标数值。抽样推
3、断是用样本的指标数值去推算总体的指标数值。4抽样推断中产生的抽样误差,可以事先计算并加以控制。抽样推断中产生的抽样误差,可以事先计算并加以控制。5二、抽样调查的主要内容二、抽样调查的主要内容(一一)随机抽样:按照随机原则从总体中抽取部分单随机抽样:按照随机原则从总体中抽取部分单位构成样本的过程。位构成样本的过程。(二二)统计估计:根据随机抽取的部分单位的特性来对统计估计:根据随机抽取的部分单位的特性来对总体的分布函数、分布参数或数字特征等进行推测估算的过程。总体的分布函数、分布参数或数字特征等进行推测估算的过程。(三三)假设检验:根据经验或认识,提出某一假设,并判断该假假设检验:根据经验或认识
4、,提出某一假设,并判断该假设正确性的过程。设正确性的过程。6三、抽样推断的作用三、抽样推断的作用(一一)解决了无法进行全面调查或很难进行解决了无法进行全面调查或很难进行全面调查的问题全面调查的问题(二二)可以补充或修正全面调查的数据可以补充或修正全面调查的数据(三三)可以节省调查费用和调查时间可以节省调查费用和调查时间7四、抽样推断涉及的基本概念四、抽样推断涉及的基本概念(一一)总体和样本总体和样本1全及总体(总体、母体)全及总体(总体、母体) 它是指调查对象的全部单位,是由具有某种共同性它是指调查对象的全部单位,是由具有某种共同性质的许多单位组成的。总体既是我们所要研究的对象,质的许多单位组
5、成的。总体既是我们所要研究的对象,又是样本所赖以抽取的母体。组成总体的单位称为又是样本所赖以抽取的母体。组成总体的单位称为总体单总体单位位,总体的单位数通常用,总体的单位数通常用N表示。表示。82抽样总体(样本、子样)抽样总体(样本、子样) 是指在总体中按随机原则抽取的那一部分是指在总体中按随机原则抽取的那一部分单位所构成的集合体。单位所构成的集合体。 组成样本的单位称为组成样本的单位称为样本单位样本单位,样本单位数亦称样本,样本单位数亦称样本容量,通常用容量,通常用n表示。样本单位数总是大于表示。样本单位数总是大于1而小于总体单而小于总体单位数位数N的,即的,即1nN。9 样本单位数样本单位
6、数n相对于总体的单位数相对于总体的单位数N要小得多。要小得多。统计把统计把nN称为抽样比例。样本单位数达到或超过称为抽样比例。样本单位数达到或超过30个个(n30)称为称为大样本大样本,而在,而在30个以下个以下(n30)称为称为小样本小样本。社会经济现象的抽样调查多取大样本,而自然实。社会经济现象的抽样调查多取大样本,而自然实验观察则多取小样本。以很小的样本来推断很大的总体,验观察则多取小样本。以很小的样本来推断很大的总体,这是抽样推断法的重要特点。这是抽样推断法的重要特点。10(二二)总体指标和抽样指标总体指标和抽样指标1总体指标总体指标总体指标是指根据总体各单位的标志值计算出来总体指标是
7、指根据总体各单位的标志值计算出来的,反映总体某种属性或特征的综合指标,亦称的,反映总体某种属性或特征的综合指标,亦称为总体参数。由于总体是惟一确定的,因此,根为总体参数。由于总体是惟一确定的,因此,根据总体计算的总体指标也是据总体计算的总体指标也是惟一确定惟一确定的。的。常用的总体指标有:常用的总体指标有:总体平均数、总体成数、总体标总体平均数、总体成数、总体标准差和总体方差。准差和总体方差。11X(1)总体平均数总体平均数代表总体单位数量标志一般水平的指标,它表明变代表总体单位数量标志一般水平的指标,它表明变量量变动的集中趋势,通常用变动的集中趋势,通常用 表示。表示。NXNXXXXXnii
8、n11.其中:其中:X1,X2,Xn为总体中每一为总体中每一 个调查单位的取值个调查单位的取值 N是总体单位数是总体单位数 是总和符号是总和符号12NNp1NNQ0(2)总体成数总体成数当总体的一个现象有两种表现时,其中具有某当总体的一个现象有两种表现时,其中具有某一种表现的单位数占总体单位数目的比重,叫一种表现的单位数占总体单位数目的比重,叫总体成数,用总体成数,用P或或Q表示。其计算公式为:表示。其计算公式为: N代表总体单位数;代表总体单位数; N1代表具有某一种表现的总体单位数;代表具有某一种表现的总体单位数; No代表具有另一种表现的总体单位数;代表具有另一种表现的总体单位数; P、
9、Q代表成数。代表成数。13PQNNNQPNNN110101则14例例1 某公司生产的某公司生产的10000件产品中,有件产品中,有500件件为不合格品。则为不合格品。则 产品不合格率产品不合格率 P N5001000050 产品合格率产品合格率 Q1P15095N115(3)总体标准差和总体方差。总体标准差和总体方差。 表示单位之间标志值的变异程度指标,叫做总表示单位之间标志值的变异程度指标,叫做总体标准差,又称体标准差,又称总体均方差(标准差)总体均方差(标准差)。总体标准差的。总体标准差的平方称为平方称为总体方差总体方差。其计算公式为:。其计算公式为:NXX2NXX22162.抽样指标抽样
10、指标抽样指标是指根据抽样总体各单位标志值计算的综合指抽样指标是指根据抽样总体各单位标志值计算的综合指标,又称样本指标。常用的抽样指标有:标,又称样本指标。常用的抽样指标有:抽样平均数、抽样平均数、抽样成数、抽样总体标准差和抽样总体方差。抽样成数、抽样总体标准差和抽样总体方差。17(1)抽样平均数。抽样平均数。代表样本单位数量标志一般水平的指标称抽样平代表样本单位数量标志一般水平的指标称抽样平均数或样本平均数。均数或样本平均数。nxnxxxxxniin1321.18(2)抽样成数。抽样成数。在抽样总体中,一个现象有两种表现时,其中具有在抽样总体中,一个现象有两种表现时,其中具有某一种表现的单位数
11、占抽样总体单位数的比重,叫某一种表现的单位数占抽样总体单位数的比重,叫做抽样成数,亦称样本成数。用做抽样成数,亦称样本成数。用p或或q表示。其计算表示。其计算公式为:公式为:nnp1nnq019同总体成数同总体成数p1q1)(0101则nnnqpnnn20例例52) 从某公司生产的产品中,抽样检查了从某公司生产的产品中,抽样检查了100件产品,其中有件产品,其中有5件不合格,则:件不合格,则: 样本产品不合格率样本产品不合格率 : 样本产品合格率样本产品合格率 %510051nnp%95%511pq21(3)抽样总体标准差和抽样总体方差。抽样总体标准差和抽样总体方差。说明抽样总体之间标志值变异
12、程度的指标,说明抽样总体之间标志值变异程度的指标,叫做抽样叫做抽样总体标准差总体标准差。抽样总体标准差的平方称为。抽样总体标准差的平方称为抽样总体方抽样总体方差差(简称样本方差)。其计算公式为:(简称样本方差)。其计算公式为:nxxs2nxxs2222 一个总体可以抽取许多个样本,而样本不同,一个总体可以抽取许多个样本,而样本不同,抽样指标的数值也各不相同。可见,抽样指标的数值也各不相同。可见,抽样指标的数抽样指标的数值不是惟一确定的值不是惟一确定的。因为抽样指标是样本变量的函数,。因为抽样指标是样本变量的函数,是随机可变的变量。也就是说,由是随机可变的变量。也就是说,由 样本观测值所决定的样
13、本观测值所决定的统计量是随机变量。统计量是随机变量。23 (三三)重复抽样和不重复抽样重复抽样和不重复抽样1重复抽样(重置抽样)重复抽样(重置抽样)采用这种方法抽取样本单位的特点是:同一单位采用这种方法抽取样本单位的特点是:同一单位有多次重复被抽中的机会,并且总体单位数目始有多次重复被抽中的机会,并且总体单位数目始终不变,每个单位抽中或抽不中的机会在各次都终不变,每个单位抽中或抽不中的机会在各次都是相同的。是相同的。242不重复抽样(不重置抽样)不重复抽样(不重置抽样)采用这种方法抽取样本单位的特点是:同一单位采用这种方法抽取样本单位的特点是:同一单位只有一次被抽中的机会,并且总体单位数目随着
14、只有一次被抽中的机会,并且总体单位数目随着样本单位数目抽取的次数的增多而愈变愈少。每样本单位数目抽取的次数的增多而愈变愈少。每个单位抽中或抽不中的机会在各次是不同的。个单位抽中或抽不中的机会在各次是不同的。25 抽样推断是通过样本对总体进行推算。其中,统计抽样推断是通过样本对总体进行推算。其中,统计量与被估算的总体指标之间的关系,是推算的关键。两量与被估算的总体指标之间的关系,是推算的关键。两者的关系主要通过统计量的分布来反映,且因样本量的者的关系主要通过统计量的分布来反映,且因样本量的大小而有差别。大小而有差别。第二节第二节 抽样推断的一般原理抽样推断的一般原理一、抽样推断的理论依据一、抽样
15、推断的理论依据26(一一)大样本统计量的推断依据大样本统计量的推断依据大数定律大数定律 在重复试验中,事件频率的稳定性是大量随机在重复试验中,事件频率的稳定性是大量随机现象的统计规律性的典型表现。人们根据频率的稳定性现象的统计规律性的典型表现。人们根据频率的稳定性预见到概率的存在和概率的性质,同样,在长期的统计预见到概率的存在和概率的性质,同样,在长期的统计实践中,人们也找到了大量随机现象的平均结果也具有实践中,人们也找到了大量随机现象的平均结果也具有稳定性的理论依据,即大数定律。稳定性的理论依据,即大数定律。27大数定律大数定律在统计中是指一切关于大量随机现象的平在统计中是指一切关于大量随机
16、现象的平均结果稳定性的定理,它为那些均值存在稳定性及均结果稳定性的定理,它为那些均值存在稳定性及整个统计推断提供了最基本的理论依据。整个统计推断提供了最基本的理论依据。大数定律的本质意大数定律的本质意义在于,尽管单个随机现象的具体表现不可避免地引起随机义在于,尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋于稳定。互相抵消、补偿和拉平,致使总的平均结果趋于稳定。28比雪夫大数定理:设比雪夫大数定理:设x1,x2,x3,xn为独立的随机为独立的随机变量序列,
17、服从同一分布,且具有相同的期望值变量序列,服从同一分布,且具有相同的期望值以及方差,则对于任意正数以及方差,则对于任意正数 有有1)1(lim1niinxnp29安徽理工大学统统 计计 学学第第 三十三三十三 讲讲主讲主讲 雷思友雷思友 副教授副教授/ /硕导硕导/ /系主任系主任30(二二)大样本统计量分布的依据一大样本统计量分布的依据一中心极限定理中心极限定理 中心极限定理是指在一定的条件下,大量相互中心极限定理是指在一定的条件下,大量相互独立的随机现象的概率分布是以正态分布为极限。因正独立的随机现象的概率分布是以正态分布为极限。因正态分布在概率论中占有中心地位,所以把该定理叫做中态分布在
18、概率论中占有中心地位,所以把该定理叫做中心极限定理。心极限定理。31大数定律只揭示了大量随机变量的平均结果,但并大数定律只揭示了大量随机变量的平均结果,但并没有涉及到随机变量的分布规律,而中心极限定理没有涉及到随机变量的分布规律,而中心极限定理则说明了许多随机变量的分布是正态或近似正态的。这则说明了许多随机变量的分布是正态或近似正态的。这就可以简化统计推断中许多统计量的分布问题,所以它就可以简化统计推断中许多统计量的分布问题,所以它是统计学中的重要工具之一。是统计学中的重要工具之一。32 二、抽样推断的原理二、抽样推断的原理 抽样估计就是以样本的实际资料为依据,计抽样估计就是以样本的实际资料为
19、依据,计算一定的样本指标,并以此对总体做出数量上的算一定的样本指标,并以此对总体做出数量上的估计和判断。其原理是:估计和判断。其原理是: (一一)抽样推断运用的是归纳推理方法抽样推断运用的是归纳推理方法抽样推断的方法是归纳法,而归纳法推断结论的正确性抽样推断的方法是归纳法,而归纳法推断结论的正确性必须过事实的验证。必须过事实的验证。33(二二)抽样推断运用的是概率原理抽样推断运用的是概率原理 抽样推断的结论,其可靠性究竟是多少,需要抽样推断的结论,其可靠性究竟是多少,需要运用概率的原理加以说明。运用概率的原理加以说明。(三(三)抽样推断的结论存在着一定的抽样误差抽样推断的结论存在着一定的抽样误
20、差抽样误差是抽样调查所特有的,而且是不可避免的。抽样误差是抽样调查所特有的,而且是不可避免的。34抽样推断结论的可靠程度和抽样推断结论的可靠程度和抽样误差抽样误差的大小是联的大小是联系在一起的。在其他条件不变的情况下,允许的系在一起的。在其他条件不变的情况下,允许的误差范围愈大,则概率的保证程度也愈大;反之,误差范围愈大,则概率的保证程度也愈大;反之,如果精确度的要求愈高,允许的误差范围愈小,则概率如果精确度的要求愈高,允许的误差范围愈小,则概率的保证程度也愈小。抽样误差范围可以事先通过的保证程度也愈小。抽样误差范围可以事先通过定资定资料加以计算,并能采取一定的组织措施来控制这个误差料加以计算
21、,并能采取一定的组织措施来控制这个误差范围,保证抽样推断的结果达到一定的可靠程度。范围,保证抽样推断的结果达到一定的可靠程度。35 三、抽样推断的优良标准三、抽样推断的优良标准(一一)无偏性无偏性用抽样指标推断总体指标要求抽样指标的平均数用抽样指标推断总体指标要求抽样指标的平均数等于被估计的总体指标。就是说,虽然每个可能等于被估计的总体指标。就是说,虽然每个可能样本的抽样指标不一定等于未知的总体指标,但在多次反复估样本的抽样指标不一定等于未知的总体指标,但在多次反复估计中,要求各个抽样指标的平均数应该等于总体指标,亦即从计中,要求各个抽样指标的平均数应该等于总体指标,亦即从平均来说,抽样指标的
22、估计是没有偏误的,叫做平均来说,抽样指标的估计是没有偏误的,叫做无偏性无偏性。36例如,样本平均数总是总体平均数例如,样本平均数总是总体平均数X的无偏估计量,亦即的无偏估计量,亦即样本平均数的平均数等于总体平均数。因为样本平均数的平均数等于总体平均数。因为XxEnxEnxExE)()()()(37(二)一致性二)一致性用抽样指标推断总体指标要求其样本的单位数充分用抽样指标推断总体指标要求其样本的单位数充分大时,抽样指标也充分地靠近总体指标。也可以说该抽大时,抽样指标也充分地靠近总体指标。也可以说该抽样指标对总体指标是一个一致估计量。样指标对总体指标是一个一致估计量。 381)(limxExnX
23、xE)(1)(limXxpn证明:设证明:设 为任意正数,根据大数定律有:为任意正数,根据大数定律有:抽样平均数的期望值等于总体平均数,即抽样平均数的期望值等于总体平均数,即39(三三)有效性有效性 用抽样指标推断总体指标时,要求作为优良估用抽样指标推断总体指标时,要求作为优良估计量的方差应比其他估计量的方差小。即用抽样计量的方差应比其他估计量的方差小。即用抽样平均数和总体某一变量来估计总体平均数,虽然两者都平均数和总体某一变量来估计总体平均数,虽然两者都是无偏的估计量,而且在每一次估计中两种估计量和总是无偏的估计量,而且在每一次估计中两种估计量和总体平均数都可能有离差,但样本平均数更靠近在总
24、体平体平均数都可能有离差,但样本平均数更靠近在总体平均数的周围,平均说来它的离差比较小,所以对比来说,均数的周围,平均说来它的离差比较小,所以对比来说,抽样平均数是更为优良的估计值抽样平均数是更为优良的估计值40第三节第三节 抽样估计抽样估计一、抽样误差的概念一、抽样误差的概念 1.由样本得到的估计值与被估计的总体未知真实特征值由样本得到的估计值与被估计的总体未知真实特征值之差,就是误差。或样本指标数值与总体指标数值之间的差之差,就是误差。或样本指标数值与总体指标数值之间的差数。数。 2.抽样误差就是指按随机原则抽样时,单纯由不同的随机抽样误差就是指按随机原则抽样时,单纯由不同的随机样本得出不
25、同的估计量而产生的误差。样本得出不同的估计量而产生的误差。413. 由于总体平均数和成数是惟一确定的,抽样平均由于总体平均数和成数是惟一确定的,抽样平均4. 数和成数则是随机变量,因而抽样误差也不是惟数和成数则是随机变量,因而抽样误差也不是惟5. 一确定的,而是随机变量。抽样误差愈小,表示样本一确定的,而是随机变量。抽样误差愈小,表示样本的代表性愈高;反之,样本的代表性就愈低。同样,抽的代表性愈高;反之,样本的代表性就愈低。同样,抽样误差还说明样本指标与总体指标的相差范围,因此,样误差还说明样本指标与总体指标的相差范围,因此,它也是推算总体的依据。它也是推算总体的依据。424.抽样误差是抽样调
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样调查 一般 原理 抽样 估计
限制150内