统计学原理第七章抽样调查.ppt
《统计学原理第七章抽样调查.ppt》由会员分享,可在线阅读,更多相关《统计学原理第七章抽样调查.ppt(78页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章第七章抽样调查抽样调查1 1第一节第一节 抽样调查的基本概念抽样调查的基本概念及理论依据及理论依据一、估计量和估计值一、估计量和估计值二、全及总体和抽样总体二、全及总体和抽样总体三、全及指标和样本指标三、全及指标和样本指标四、抽样方式和样本可能数目四、抽样方式和样本可能数目五、抽样理论依据五、抽样理论依据2一、估计量和估计值一、估计量和估计值1.估计量估计量:是指用于估计相关的总体参数的:是指用于估计相关的总体参数的统计量。样本均值、样本比例(样本成数)统计量。样本均值、样本比例(样本成数)和样本方差都是估计量,估计量是随机的。和样本方差都是估计量,估计量是随机的。2.估计值估计值:是指
2、估计量的具体数值。根据具:是指估计量的具体数值。根据具体样本数据,按照估计量的计算公式,计算体样本数据,按照估计量的计算公式,计算出的样本均值、样本比例和样本方差的具体出的样本均值、样本比例和样本方差的具体数值就是估计值。是抽样推断的基础。数值就是估计值。是抽样推断的基础。3二、全及总体和抽样总体二、全及总体和抽样总体1.全及总体全及总体(总体总体):是指所要认识对象的):是指所要认识对象的全体,是同一性质的许多个体的集合体。有全体,是同一性质的许多个体的集合体。有变量总体与属性总体之分,全及总体是惟一变量总体与属性总体之分,全及总体是惟一的、确定的但却是未知的,常用的、确定的但却是未知的,常
3、用“N”表示。表示。2.抽样总体抽样总体(样本样本):是从全及总体中随机):是从全及总体中随机抽取出来一部分单位的集合体。有大样本和抽取出来一部分单位的集合体。有大样本和小样本之分,以小样本之分,以30个样本单位为划分依据。个样本单位为划分依据。样本总体是随机的、已知的,常用样本总体是随机的、已知的,常用“n”表示。表示。4三、全及指标和样本指标三、全及指标和样本指标(一)(一)全及指标全及指标根据全体总体各个单位的标志值或标志根据全体总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合特征计算的、反映总体某种属性的综合指标。全及指标也是惟一确定的,但也指标。全及指标也是惟一确定的,但
4、也是未知的。是未知的。1.总体平均数总体平均数:根据变量总体的标志值:根据变量总体的标志值计算的。计算的。52.总体成数总体成数(总体比例总体比例):):常用常用“P”表示表示是指总体中具有某种标志的单位数在总体中是指总体中具有某种标志的单位数在总体中所占的比重。变量总体也可以计算成数。所占的比重。变量总体也可以计算成数。具有某种属性的单位数具有某种属性的单位数总体单位总数总体单位总数总体总体成数成数不具有某种属性的单位数不具有某种属性的单位数不具有某种属不具有某种属性的单位数所性的单位数所占的比重占的比重6 3.总体标准差总体标准差和总体方差和总体方差2 2 2 2都是测量总体标志值分散程度
5、的指标。都是测量总体标志值分散程度的指标。(二)抽样指标(二)抽样指标是指根据抽样总体各个标志值或标志特征计是指根据抽样总体各个标志值或标志特征计算的综合指标。与全及指标相对应也有抽样算的综合指标。与全及指标相对应也有抽样平均数、抽样成数、样本标准差和样本方差平均数、抽样成数、样本标准差和样本方差等估计量。抽样指标是随机的。等估计量。抽样指标是随机的。7 1.样本平均数:样本平均数:2.样本成数数:样本成数数:3.样本标准差样本标准差 和样本方差:和样本方差:8四、抽样方式和样本可能数目四、抽样方式和样本可能数目(一)抽样方式(一)抽样方式1.重复抽样(放回抽样):从总体重复抽样(放回抽样):
6、从总体N中随机中随机抽取抽取n个单位,每次抽取均为独立试验。个单位,每次抽取均为独立试验。2.不重复抽样(不放回抽样):每次抽中的不重复抽样(不放回抽样):每次抽中的单位不再放回总体中,为不独立试验。单位不再放回总体中,为不独立试验。3.考虑顺序抽样:即考虑总体单位的性质,考虑顺序抽样:即考虑总体单位的性质,还考虑各单位排序的抽样。还考虑各单位排序的抽样。4.不考虑顺序抽样:只考虑总体单位的性质不考虑顺序抽样:只考虑总体单位的性质差异,而不考虑其排序的抽样。差异,而不考虑其排序的抽样。9(二)样本可能数目(二)样本可能数目是指从既定的总体中可以抽取多少个样本,是指从既定的总体中可以抽取多少个样
7、本,即样本总体的数量有多少。即样本总体的数量有多少。1.考虑顺序的不重复抽样可能数目考虑顺序的不重复抽样可能数目即不重复排列的可能样本数目。计算公式:即不重复排列的可能样本数目。计算公式:!设:设:N=10,n=5,则:,则:ANn=109876=30240个可能样本数目个可能样本数目102.考虑顺序的重复抽样可能数目考虑顺序的重复抽样可能数目即可重复排列的可能样本数目。公式:即可重复排列的可能样本数目。公式:BNn=Nn=105=100000个可能样本数目个可能样本数目3.不考虑顺序的不重复抽样可能数目不考虑顺序的不重复抽样可能数目即不重复组合。计算公式:即不重复组合。计算公式:!114.不
8、考虑顺序的重复抽样可能数目不考虑顺序的重复抽样可能数目即可重复组合。计算公式:即可重复组合。计算公式:DNn=CnN+n-1 对于同一总体,采用四种不同的抽样组织形对于同一总体,采用四种不同的抽样组织形式,其样本可能数目也是不同的。按样本可式,其样本可能数目也是不同的。按样本可能数目的多少排序依次是:考虑顺序的重复能数目的多少排序依次是:考虑顺序的重复抽样考虑顺序的不重复抽样不考虑顺序抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的不重复抽样的重复抽样不考虑顺序的不重复抽样12五、抽样理论依据五、抽样理论依据抽样调查的理论依据是概率论的大数定律。抽样调查的理论依据是概率论的大数定律。(
9、一)大数定律(一)大数定律1.独立同分布大数定律独立同分布大数定律:证明当:证明当n足够大时,足够大时,平均数具有稳定性,为用样本平均数估计总平均数具有稳定性,为用样本平均数估计总体平均数提供了理论依据。体平均数提供了理论依据。2.贝努力大数定律贝努力大数定律:证明当:证明当n足够大时,频足够大时,频率具有稳定性,为用频率代替概率提供了理率具有稳定性,为用频率代替概率提供了理论依据。大数的重要意义论依据。大数的重要意义P25313 (二)中心极限定律(二)中心极限定律1.独立同分布中心极限定理独立同分布中心极限定理:证明不论变量:证明不论变量总体服从何种分布,只要它的数学期望和方总体服从何种分
10、布,只要它的数学期望和方差存在,从中抽取容量为差存在,从中抽取容量为n 的样本,则这个的样本,则这个样本的总和或平均数是个随机变量,当样本的总和或平均数是个随机变量,当n 充充分大时,样本的总和或平均数趋于正态分布分大时,样本的总和或平均数趋于正态分布.2.德莫佛德莫佛-拉普拉斯中心极限定理拉普拉斯中心极限定理:证明属性:证明属性总体的样本成数和样本方差,在总体的样本成数和样本方差,在n足够大时,足够大时,同样趋于正态分布。同样趋于正态分布。14第二节第二节 抽样平均误差抽样平均误差一、抽样平均误差的概念一、抽样平均误差的概念二、影响抽样平均误差的因素二、影响抽样平均误差的因素三、抽样平均误差
11、的意义三、抽样平均误差的意义四、抽样平均误差的计算四、抽样平均误差的计算15一、抽样平均误差的概念一、抽样平均误差的概念(一)抽样误差(一)抽样误差是指样本指标和总体指标之间在数量上的差是指样本指标和总体指标之间在数量上的差别,是随机性的代表性误差。是抽样推断的别,是随机性的代表性误差。是抽样推断的依据,不包括登记误差和可能产生的偏差。依据,不包括登记误差和可能产生的偏差。(二)抽样平均误差(二)抽样平均误差是指所有可能出现的样本指标的标准差,即是指所有可能出现的样本指标的标准差,即所有可能出现的样本指标和总体指标的平均所有可能出现的样本指标和总体指标的平均离差。抽样实际误差无法知道,而平均误
12、差离差。抽样实际误差无法知道,而平均误差是可能计算的。是可能计算的。16二、影响抽样平均误差的因素二、影响抽样平均误差的因素(一)总体标志的变动程度(一)总体标志的变动程度(x)总体标志的变动程度与抽样平均误差总体标志的变动程度与抽样平均误差成同成同向变动关系。向变动关系。(二)抽样单位数(二)抽样单位数(n)的多少)的多少在其他条件不变的情况下,抽样单位数与抽在其他条件不变的情况下,抽样单位数与抽样平均误差样平均误差成反向变动关系。成反向变动关系。(三)抽样组织方式(三)抽样组织方式重复抽样方式的重复抽样方式的高于不重复抽样,分类抽高于不重复抽样,分类抽样的样的低于机械抽样或整群抽样。低于机
13、械抽样或整群抽样。17三、抽样平均误差的意义三、抽样平均误差的意义抽样平均误差是一种标准差的概念,是所有抽样平均误差是一种标准差的概念,是所有可能样本指标与总体指标之间离差平方的平可能样本指标与总体指标之间离差平方的平均数的平方根。它概括了一系列抽样可能结均数的平方根。它概括了一系列抽样可能结果所产生的所有抽样误差。它有三点意义:果所产生的所有抽样误差。它有三点意义:1.是衡量抽样指标对于总体指标代表性程是衡量抽样指标对于总体指标代表性程度的一个尺度;度的一个尺度;2.是计算极限误差的依据;是计算极限误差的依据;3.是确定抽样单位数多少的计算依据之一是确定抽样单位数多少的计算依据之一18 四、
14、抽样平均误差的计算四、抽样平均误差的计算(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差x是是变量总体变量总体一系列抽样平均数对总体平均数一系列抽样平均数对总体平均数的标准差。其理论计算公式:的标准差。其理论计算公式:平均数平均数平均数平均数抽样平抽样平抽样平抽样平均误差均误差均误差均误差样本平均样本平均样本平均样本平均数(随机数(随机数(随机数(随机变量)变量)变量)变量)总体平均数(惟总体平均数(惟总体平均数(惟总体平均数(惟一确定的,但通一确定的,但通一确定的,但通一确定的,但通常是未知的)常是未知的)常是未知的)常是未知的)样本可能数目样本可能数目191.重复抽样抽样平均数
15、的抽样平均误差重复抽样抽样平均数的抽样平均误差x根据数理统计理论,在重复抽样方式下,抽根据数理统计理论,在重复抽样方式下,抽样平均误差与全及总体的标准差成正比关系,样平均误差与全及总体的标准差成正比关系,而与抽样总体单位数的平方根成反比关系,而与抽样总体单位数的平方根成反比关系,可推导出如下公式:可推导出如下公式:平均数平均数平均数平均数抽样平抽样平抽样平抽样平均误差均误差均误差均误差全及总体全及总体全及总体全及总体的标准差的标准差的标准差的标准差抽样单位数抽样单位数抽样单位数抽样单位数抽样平均误差仅为全及总体标准差的抽样平均误差仅为全及总体标准差的注意理解注意理解注意理解注意理解P259P2
16、59例题例题例题例题重要重要202.不重复抽样抽样平均数的抽样平均误差不重复抽样抽样平均数的抽样平均误差x不重复抽样与重复抽样相比,样本可能数目不重复抽样与重复抽样相比,样本可能数目减少,且样本变量之间不是互相独立的。因减少,且样本变量之间不是互相独立的。因此,在重复抽样的基础上考虑一个修正系数此,在重复抽样的基础上考虑一个修正系数即可。证明过程见即可。证明过程见P261-262总体总体总体总体单位总数单位总数单位总数单位总数样本样本样本样本单位总数单位总数单位总数单位总数抽样比例抽样比例抽样比例抽样比例总体总体总体总体标准差标准差标准差标准差重要重要重要重要21(一)抽样成数的抽样平均误差(
17、一)抽样成数的抽样平均误差p属性总体属性总体的标志值是用文字表示的,且标志的标志值是用文字表示的,且标志只有两个取值,非此即彼,故将属性总体的只有两个取值,非此即彼,故将属性总体的标志称为标志称为“交替标志交替标志”或或“是非标志是非标志”。交替标志也可以计算平均数交替标志也可以计算平均数(即(即成数成数)和)和标标准差准差。为了计算交替标志的平均数和标准差。为了计算交替标志的平均数和标准差必须将交替变异的标志过渡到数量标志。必须将交替变异的标志过渡到数量标志。交替标志仍以交替标志仍以x表示,设:表示,设:x=1表示单位具有表示单位具有某一标志,某一标志,x=0表示单位不具有某一标志。表示单位
18、不具有某一标志。具有某一标志的单位数用具有某一标志的单位数用N1表示;表示;22不具有某不具有某一标志的单位数用一标志的单位数用N0表示。表示。总体成数和标准差与样本成数和标准差的计总体成数和标准差与样本成数和标准差的计算方法相同。只是总体指标用大写字母表示,算方法相同。只是总体指标用大写字母表示,样本指标用小写字母表示。例如:样本指标用小写字母表示。例如:具有某一标志的单位数占总体的比重具有某一标志的单位数占总体的比重:总体成数总体成数总体成数总体成数样本成数样本成数样本成数样本成数不具有某一标志的单位数占总体的比重不具有某一标志的单位数占总体的比重:23交替标志的平均数和标准差计算表交替标
19、志的平均数和标准差计算表P265样本样本样本样本成数成数成数成数 属性总体属性总体抽样平均误差的计算也有重复抽抽样平均误差的计算也有重复抽样和不重复抽样之分:样和不重复抽样之分:241.重复抽样抽样成数的抽样平均误差重复抽样抽样成数的抽样平均误差2.不重复抽样抽样成数的抽样平均误差不重复抽样抽样成数的抽样平均误差样本成数样本成数样本成数样本成数样本单位数样本单位数样本单位数样本单位数总体单位总数总体单位总数总体单位总数总体单位总数抽样比例抽样比例抽样比例抽样比例解决未知的总体指标的解决未知的总体指标的4点办法:点办法:P263251.用过去调查所得到的资料用过去调查所得到的资料。如果有几个。如
20、果有几个不同的总体方差,应该用数值较大的。不同的总体方差,应该用数值较大的。谨慎性要求。谨慎性要求。2越大,说明总体的离散程越大,说明总体的离散程度越高,要抽取更多的样本单位度越高,要抽取更多的样本单位(n)才才具有代表性。具有代表性。2.用样本方差代替总体方差用样本方差代替总体方差2()3.用小规模调查资料计算的方差代替用小规模调查资料计算的方差代替24.用估计材料计算的方差代替用估计材料计算的方差代替226(三)抽样平均误差计算实例(三)抽样平均误差计算实例P266使用时间使用时间使用时间使用时间(小时)(小时)(小时)(小时)抽取灯泡个抽取灯泡个抽取灯泡个抽取灯泡个数(个)数(个)数(个
21、)数(个)组中值组中值组中值组中值(x x)xfxf900900以下以下以下以下2 2875875175017509009509009504 492592537003700950100095010001111975975107251072510001050100010507171102510257277572775105011001050110084841075107590300903001100115011001150181811251125202502025011501200115012007 7117511758225822512001200以上以上以上以上3 3122512253675
22、3675合合合合 计计计计20020021140021140027样本平均数样本平均数样本成数样本成数28使用时间使用时间使用时间使用时间(小时)(小时)(小时)(小时)抽取灯泡抽取灯泡抽取灯泡抽取灯泡个数个数个数个数(个个个个)组中值组中值组中值组中值(x x)900900以下以下以下以下2 2875875-8-8(-4-4)32329009509009504 4925925-12-12(-3 3)3636950100095010001111975975-22-22(-2 2)44441000105010001050717110251025-71-71(-1 1)71711050110010
23、5011008484107510750 0(0 0)0 011001150110011501818112511251818(1 1)181811501200115012007 7117511751414(2 2)282812001200以上以上以上以上3 3122512259 9(3 3)2727合合合合 计计计计200200-72722562562930第三节第三节 全及指标的推断全及指标的推断一、全及指标的点估计一、全及指标的点估计二、全及指标的区间估计二、全及指标的区间估计31一、全及指标的点估计一、全及指标的点估计(一)点估计的概念(一)点估计的概念点估计又称定值估计,它是直接以样本点
24、估计又称定值估计,它是直接以样本指标作为相应总体指标的估计量。指标作为相应总体指标的估计量。例如,以样本平均数直接估计总体平均例如,以样本平均数直接估计总体平均数,即数,即:x=X。例如,某地区根据样本例如,某地区根据样本资料计算的粮食亩产量为资料计算的粮食亩产量为600公斤,就公斤,就以以600公斤作为全地区粮食亩产水平的公斤作为全地区粮食亩产水平的估计值。估计值。32(二)点估计的优缺点(二)点估计的优缺点1.优点优点:点估计能够提供总体指标的具:点估计能够提供总体指标的具体数值,可以作为行动决策的数量依据。体数值,可以作为行动决策的数量依据。例如,企业的市场部门对产品销量的预例如,企业的
25、市场部门对产品销量的预测直接决定着生产部门和采购部门的作测直接决定着生产部门和采购部门的作业计划。业计划。2.缺点缺点:任何点估计的结果不是对就是:任何点估计的结果不是对就是错,并不能提供误差情况和误差程度等错,并不能提供误差情况和误差程度等相关的信息。相关的信息。33(三)点估计量的评价标准(三)点估计量的评价标准估计一个总体指标可以用多种样本统计估计一个总体指标可以用多种样本统计量,例如估计总体平均数,可以用样本量,例如估计总体平均数,可以用样本平均数,也可以用样本中位数、样本众平均数,也可以用样本中位数、样本众数等。具体应以哪一个统计量来估计总数等。具体应以哪一个统计量来估计总体平均数才
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 原理 第七 抽样调查
限制150内