(本科)[9]第九章 抽样技术《统计学》(第二版)ppt课件.ppt
《(本科)[9]第九章 抽样技术《统计学》(第二版)ppt课件.ppt》由会员分享,可在线阅读,更多相关《(本科)[9]第九章 抽样技术《统计学》(第二版)ppt课件.ppt(169页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、课程主讲人:9第九章 抽样技术统计学(第二版)第第九九章章 抽样技术抽样技术 Chapter 9 Sampling Techniques 第一节第一节 抽样技术的概述抽样技术的概述 一、抽样技术的概念及随机原则一、抽样技术的概念及随机原则 事实上,我们对事物的认识从理论上讲通常只限事实上,我们对事物的认识从理论上讲通常只限于整个事物的一个缩影,假如这个缩影能用数据来描于整个事物的一个缩影,假如这个缩影能用数据来描述,那么该缩影即为统计样本。述,那么该缩影即为统计样本。 抽样技术(抽样技术(Sampling Techniques)是遵循随机原)是遵循随机原则从全及总体中抽选部分单位构成样本,用样
2、本特征则从全及总体中抽选部分单位构成样本,用样本特征值对全及总体的数量特征和分布特征做出具有一定可值对全及总体的数量特征和分布特征做出具有一定可靠性的估计和判断的统计调查方法。靠性的估计和判断的统计调查方法。 所谓随机原则,又称等可能性原则、机会均等原所谓随机原则,又称等可能性原则、机会均等原则,它是指从调查对象中抽选部分单位,总体中每个则,它是指从调查对象中抽选部分单位,总体中每个单位都有均等的中选或不中选的机会,抽中或未抽中单位都有均等的中选或不中选的机会,抽中或未抽中那个单位纯粹是偶然性事件,完全排除了调查者的主那个单位纯粹是偶然性事件,完全排除了调查者的主观意识的影响。观意识的影响。
3、二、概率选样与非概率选样的区别二、概率选样与非概率选样的区别 按照选取调查单位的方式划分,选样调查分概率按照选取调查单位的方式划分,选样调查分概率选样和非概率选样。概率选样又称随机选样、或然率选样和非概率选样。概率选样又称随机选样、或然率选样,它主要包括抽样调查;非概率选样又称非随机选样,它主要包括抽样调查;非概率选样又称非随机选样,它主要包括重点调查、典型调查。这两类选样选样,它主要包括重点调查、典型调查。这两类选样的区别在于:的区别在于: 第一,概率选样是按照随机原则无意识地选取调第一,概率选样是按照随机原则无意识地选取调查单位,而非概率选样是按照主观意志有意识地选取查单位,而非概率选样是
4、按照主观意志有意识地选取调查单位。调查单位。 第二,概率选样中的抽样调查可以利用部分单位第二,概率选样中的抽样调查可以利用部分单位的特征值去估计和推断总体特征,故抽样调查又称抽的特征值去估计和推断总体特征,故抽样调查又称抽样推断。而非概率选样中的重点调查目的在于通过对样推断。而非概率选样中的重点调查目的在于通过对重点单位的调查来了解认识总体的基本情况;典型调重点单位的调查来了解认识总体的基本情况;典型调查主要着眼于通过对典型单位的观察,以解剖麻雀的查主要着眼于通过对典型单位的观察,以解剖麻雀的方式来了解和掌握现象总体的结构和发展规律,以总方式来了解和掌握现象总体的结构和发展规律,以总结经验教训
5、。结经验教训。 第三,概率选样能事前计算抽样误差控制住一定第三,概率选样能事前计算抽样误差控制住一定的范围内,从而达到最优的抽样效果。而非概率选择的范围内,从而达到最优的抽样效果。而非概率选择不能计算误差,也不能说明估计的准确程度和可靠程不能计算误差,也不能说明估计的准确程度和可靠程度。度。 第二节第二节 抽样推断中的基本概念抽样推断中的基本概念 一、全及总体和样本总体一、全及总体和样本总体 (一)全及总体(一)全及总体 全及总体,又称母体,它是统计所研究对象的全全及总体,又称母体,它是统计所研究对象的全体,它由若干个相同性质的调查单位所构成的集合体。体,它由若干个相同性质的调查单位所构成的集
6、合体。全及总体单位数体现了总体的容量,通常用表示。按全及总体单位数体现了总体的容量,通常用表示。按照总体容量的大小可分为有限总体(照总体容量的大小可分为有限总体(Finite population)和无限总体(和无限总体(Infinite population)。有限总体是指总)。有限总体是指总体单位数是有限可数的;无限总体是指总体单位数是体单位数是有限可数的;无限总体是指总体单位数是无限不可数的。对于有限总体既可以进行全面调查,无限不可数的。对于有限总体既可以进行全面调查,又可以进行抽样调查;而对于无限总体则无法进行全又可以进行抽样调查;而对于无限总体则无法进行全面调查,只能进行抽样调查。无
7、论是有放回的抽选面调查,只能进行抽样调查。无论是有放回的抽选(Replacement sampling),还是无放回的抽选),还是无放回的抽选(Without replacement sampling),每一次从无限总),每一次从无限总体中抽取样本单位都可以看作是相互独立的,这为数体中抽取样本单位都可以看作是相互独立的,这为数学处理提供了便利;无放回的从有限总体中抽取样本学处理提供了便利;无放回的从有限总体中抽取样本 单位,每一次抽选不是相互独立的,前一次的抽选结单位,每一次抽选不是相互独立的,前一次的抽选结果会直接影响到以后的抽选结果。当有限总体的容量果会直接影响到以后的抽选结果。当有限总体
8、的容量很大,而抽取的样本单位相对地很少时,即使是无放很大,而抽取的样本单位相对地很少时,即使是无放回地抽选,每一次抽选所带来的影响被视为微不足道,回地抽选,每一次抽选所带来的影响被视为微不足道,基本上可以忽略不计,这样有限总体就可以看作无限基本上可以忽略不计,这样有限总体就可以看作无限总体来处理。柯赫伦(总体来处理。柯赫伦(W G Cochran)认为:凡)认为:凡样本单位数占母体单位数样本单位数占母体单位数5%5%以上的可视为有限母体,以上的可视为有限母体,不够不够5%5%的就按无限母体处理。的就按无限母体处理。 (二)样本总体(二)样本总体 样本总体,又称子样,简称样本,它是指按照随样本总
9、体,又称子样,简称样本,它是指按照随机原则从全及总体中抽取的部分单位所构成的集合体。机原则从全及总体中抽取的部分单位所构成的集合体。样本总体单位数体现了样本的容量,通常用表示。按样本总体单位数体现了样本的容量,通常用表示。按照样本容量的大小可分为大样本和小样本。当时,则照样本容量的大小可分为大样本和小样本。当时,则为大样本;当时,则为小样本。对于一个完全唯一确为大样本;当时,则为小样本。对于一个完全唯一确定的全及总体,随着样本容量和抽样方式的不同,可定的全及总体,随着样本容量和抽样方式的不同,可以从中抽选多个不同的样本。样本中包含着总体的有以从中抽选多个不同的样本。样本中包含着总体的有关信息。
10、关信息。 二、全及指标和样本指标二、全及指标和样本指标 (一)全及指标(一)全及指标 全及指标,又称总体参数,它是描述全及总体特全及指标,又称总体参数,它是描述全及总体特征的综合指标。由于全及总体是唯一确定的,所以,征的综合指标。由于全及总体是唯一确定的,所以,各全及指标值也是唯一确定的。总体参数是未知的,各全及指标值也是唯一确定的。总体参数是未知的,它是抽样推断的对象。主要的全及指标有:它是抽样推断的对象。主要的全及指标有: 1 1全及平均数(全及平均数( ),又称总体平均数。),又称总体平均数。 总体未分组:总体未分组: 总体已分组:总体已分组: 2 2全及成数(全及成数( ),又称总体成
11、数。),又称总体成数。 x1NiixxN11kiiikiix fxfP1NPN 式中:式中: 表示全及总体中具有相同标志表现的单表示全及总体中具有相同标志表现的单位数。位数。 3 3总体标准差(总体标准差( )。)。 总体未分组:总体未分组: 总体已分组:总体已分组: 4 4总体是非标志标准差(总体是非标志标准差( )。)。 (二)样本指标(二)样本指标 样本指标,又称统计量,它是描述样本特征的综合样本指标,又称统计量,它是描述样本特征的综合指标。由于从全及总体中可以抽取多个可能样本,指标。由于从全及总体中可以抽取多个可能样本,这这1N21()NiixxN211()kiiikiixxffP(1
12、)PPP 样样不同的样本就会有不同的指标值,因而样本指标是不同的样本就会有不同的指标值,因而样本指标是样本变量的函数,它是随机变量,也即由样本观测值样本变量的函数,它是随机变量,也即由样本观测值所决定的统计量是随机变量。样本指标是用来推断总所决定的统计量是随机变量。样本指标是用来推断总体数量特征的依据。主要的样本指标有:体数量特征的依据。主要的样本指标有: 1 1样本平均数(样本平均数( )。)。 样本未分组:样本未分组: 样本已分组:样本已分组: 2 2样本成数(样本成数( )。)。 式中:式中: 表示样本中具有相同标志表现的单位数。表示样本中具有相同标志表现的单位数。 x1niixxn11
13、kiiikiix fxfp1npn1n 3 3样本标准差(样本标准差( )。)。 样本未分组:样本未分组: 样本已分组:样本已分组: 4 4总体是非标志标准差(总体是非标志标准差( )。)。 三、重置抽样与不重置抽样三、重置抽样与不重置抽样 (一)重置抽样(一)重置抽样 重置抽样,又称有放回的抽样,它是指从全及总重置抽样,又称有放回的抽样,它是指从全及总体体 个单位中随机抽取一个容量为个单位中随机抽取一个容量为 的样本,每次抽的样本,每次抽中的单位经登录其有关标志表现后又放回总体中重新中的单位经登录其有关标志表现后又放回总体中重新s21()niixxsn211()kiiikiixxfsfps(
14、1)psppNn 参加下一次的抽选。每次从总体中抽取一个单位,可参加下一次的抽选。每次从总体中抽取一个单位,可看作是一次试验,连续进行看作是一次试验,连续进行 次试验就构成了一个样次试验就构成了一个样本。可见,重置抽样的样本是经本。可见,重置抽样的样本是经 次相互独立的连续次相互独立的连续试验形成的。每次试验均是在相同的条件下完全按照试验形成的。每次试验均是在相同的条件下完全按照随机原则进行的。随机原则进行的。 (二)不重置抽样(二)不重置抽样 不重置抽样,又称无放回的抽样,它是指从全及不重置抽样,又称无放回的抽样,它是指从全及总体总体 个单位中随机抽取一个容量为个单位中随机抽取一个容量为 的
15、样本,每次的样本,每次抽中的单位登录其有关标志表现后不再放回总体中参抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选。经过连续加下一次的抽选。经过连续 次不重置抽选单位构成次不重置抽选单位构成样本,实质上相当于一次性同时从总体中抽中样本,实质上相当于一次性同时从总体中抽中 个单个单位构成样本。上一次的抽选结果会直接影响到下一次位构成样本。上一次的抽选结果会直接影响到下一次抽选,因此,不重置抽样的样本是经抽选,因此,不重置抽样的样本是经 次相互联系的次相互联系的连续试验形成的。连续试验形成的。 nnNnnnn 四、抽样框与样本数四、抽样框与样本数 (一)抽样框(一)抽样框 抽样框,又
16、称抽样结构,它是指对可以选择作为抽样框,又称抽样结构,它是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。若没有的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。进行概率选样。 (二)样本数(二)样本数 样本数,又称样本的可能数目,它是指从总体样本数,又称样本的可能数目,它是指从总体 个单位中随机抽选个单
17、位中随机抽选 个单位构成样本,通常有多种抽个单位构成样本,通常有多种抽选方法,每一种抽选方法实际上是选方法,每一种抽选方法实际上是 个总体单位的一个总体单位的一种排列组合,一种排列组合便构成一个可能的样本,种排列组合,一种排列组合便构成一个可能的样本,个总体单位的排列组合总数,称为样本的可能数目。个总体单位的排列组合总数,称为样本的可能数目。Nnnn 1 1重置抽样并考虑样本单位构成顺序差异,则重置抽样并考虑样本单位构成顺序差异,则 可能的样本数可能的样本数 2 2重置抽样但不考虑样本单位构成顺序差异,则重置抽样但不考虑样本单位构成顺序差异,则 可能的样本数可能的样本数 3 3不重置抽样但考虑
18、样本单位构成顺序差异,则不重置抽样但考虑样本单位构成顺序差异,则 可能的样本数可能的样本数 4 4不重置抽样且不考虑样本单位构成顺序差异,不重置抽样且不考虑样本单位构成顺序差异,则则 可能的样本数可能的样本数 nnN NNN个1nNnC !()!nNNANn!()!nNNCn Nn 第三节第三节 抽样推断的方法论基础抽样推断的方法论基础 抽样推断的方法论基础是马克思主义认识论和概抽样推断的方法论基础是马克思主义认识论和概率论的极限定理中大数定律与中心极限定理。率论的极限定理中大数定律与中心极限定理。 一、马克思主义认识论一、马克思主义认识论 认识论指出人们认识客观事物的逻辑思维路径有认识论指出
19、人们认识客观事物的逻辑思维路径有两条:一是由一般到特殊的演绎推理;二是由特殊到两条:一是由一般到特殊的演绎推理;二是由特殊到一般的归纳推理。所谓演绎推理,它是在封闭的系统一般的归纳推理。所谓演绎推理,它是在封闭的系统中从一般命题导出特殊结论的逻辑方法,即从三段论中从一般命题导出特殊结论的逻辑方法,即从三段论中的大前提、小前提而得出结论。结论的正确已全部中的大前提、小前提而得出结论。结论的正确已全部包含在前提的正确性之中,换而言之,只要前提正确包含在前提的正确性之中,换而言之,只要前提正确则结论必定正确。所谓归纳推理。它是在开放的系统则结论必定正确。所谓归纳推理。它是在开放的系统中从研究个别命题
20、而达到一般性的结论,结论的内容中从研究个别命题而达到一般性的结论,结论的内容大于前提。前提正确未必导致结论正确,在一定情况大于前提。前提正确未必导致结论正确,在一定情况下,它还可能有错误的结论。演绎推理不增加多少知下,它还可能有错误的结论。演绎推理不增加多少知识内容,而归纳推理的结论的正确性还决定于前提以识内容,而归纳推理的结论的正确性还决定于前提以外的许多事实,所以结论必须经过事实检验,若该结外的许多事实,所以结论必须经过事实检验,若该结论是正确的,则必然会扩大人类的知识或增加知识的论是正确的,则必然会扩大人类的知识或增加知识的内容。内容。 抽样(估计)推断是运用归纳推理的逻辑思维方抽样(估
21、计)推断是运用归纳推理的逻辑思维方式,由对个别样本的研究结论归纳推理出总体的结论。式,由对个别样本的研究结论归纳推理出总体的结论。 二、大数定律二、大数定律 大数定律,又称大数法则,它是关于大量随机现大数定律,又称大数法则,它是关于大量随机现象的平均水平的稳定性的一系列定理的总称。通过对象的平均水平的稳定性的一系列定理的总称。通过对随机现象的多次试验和大量观察,得到总体大量相互随机现象的多次试验和大量观察,得到总体大量相互独立的随机变量,对这些随机变量值综合平均,使正独立的随机变量,对这些随机变量值综合平均,使正负作用于随机现象的偶然性偏差趋于相互抵消,从而负作用于随机现象的偶然性偏差趋于相互
22、抵消,从而使总体呈现出稳定的统计规律性,即随机现象趋向于使总体呈现出稳定的统计规律性,即随机现象趋向于事物固有平均水平。如:对部分年轻已婚妇女出生的事物固有平均水平。如:对部分年轻已婚妇女出生的婴儿的性别观察,可能是男孩居多或女孩居多,具有婴儿的性别观察,可能是男孩居多或女孩居多,具有很大的偶然性。如果对大量已婚年轻妇女出生婴儿的很大的偶然性。如果对大量已婚年轻妇女出生婴儿的性别观察,那么男孩、女孩的比率几乎稳定在性别观察,那么男孩、女孩的比率几乎稳定在1:11:1。 下面仅介绍与抽样估计有联系的大数法则中的下面仅介绍与抽样估计有联系的大数法则中的契契比雪夫定理比雪夫定理。 设设 , , 为相
23、互独立的随机变量序列,为相互独立的随机变量序列,服从同一概率分布,且具有相同的期望值服从同一概率分布,且具有相同的期望值 和方差和方差 ,则对于任意给定的小正数则对于任意给定的小正数 ,有,有 式中:式中: 表示抽样平均数;表示抽样平均数; 表示总体平均数;表示总体平均数; 表示抽样单位数。表示抽样单位数。 上式表明,当样本容量上式表明,当样本容量 足够大时,样本平均数足够大时,样本平均数( )与总体平均数()与总体平均数( )的偏差小于)的偏差小于 的可能性趋的可能性趋近于近于1 1的概率,亦即此时,所有观察结果的算术平均数的概率,亦即此时,所有观察结果的算术平均数 依概率收敛于期望值(依概
24、率收敛于期望值( )被观察值的真值的被观察值的真值的事件几乎成为必然事件。大数法则论证了抽样平均数事件几乎成为必然事件。大数法则论证了抽样平均数趋近于总体平均数的条件及趋势。趋近于总体平均数的条件及趋势。 ,1x2xnx211limlim1niinniPxP xxnixixE x ( )nnixxixx 三、中心极限定理三、中心极限定理 中心极限定理是指在某些条件下,即使原来并不中心极限定理是指在某些条件下,即使原来并不服从正态分布的一些独立的随机变量,当随机变量个服从正态分布的一些独立的随机变量,当随机变量个数无限增加时,随机变量之和的分布会趋于正态分布。数无限增加时,随机变量之和的分布会趋
25、于正态分布。多轮抽样可得到多个样本,相应就有多个样本值,所多轮抽样可得到多个样本,相应就有多个样本值,所有样本值随样本不同而不同,因此样本值是一个随机有样本值随样本不同而不同,因此样本值是一个随机变量。所有样本值之和除以样本个数得抽样平均数,变量。所有样本值之和除以样本个数得抽样平均数,因此,抽样平均数实际上是一种随机变量和的分布。因此,抽样平均数实际上是一种随机变量和的分布。若总体变量存在有限的平均数和方差,则不论总体分若总体变量存在有限的平均数和方差,则不论总体分布如何,当样本容量趋于无穷大时,抽样平均数的极布如何,当样本容量趋于无穷大时,抽样平均数的极限分布是正态分布。如:某一时刻城市用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 本科9第九章 抽样技术统计学第二版ppt课件 本科 第九 抽样 技术 第二 ppt 课件
限制150内