第八章抽样推断-第章抽样推断.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第八章抽样推断-第章抽样推断.pptx》由会员分享,可在线阅读,更多相关《第八章抽样推断-第章抽样推断.pptx(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第 章章 抽样推断抽样推断1 学习目的与要求:学习目的与要求: 抽样推断是统计研究中的一种重要分析方法。抽样推断是统计研究中的一种重要分析方法。学习本章要求掌握能利用统计资料来推断总体学习本章要求掌握能利用统计资料来推断总体数量特征的原理及方法,其具体要求数量特征的原理及方法,其具体要求:理解抽样推断的概念及特点理解抽样推断的概念及特点深刻理解抽样误差产生的原因深刻理解抽样误差产生的原因对抽样误差、抽样平均误差、抽样极限误差加以区对抽样误差、抽样平均误差、抽样极限误差加以区别别重点掌握简单随机抽样组织形式的区间估计方法重点掌握简单随机抽样组织形式的区间估计方法掌握必要样本单位数的确定方法掌握
2、必要样本单位数的确定方法2第八章第八章 抽样推断抽样推断 第一节第一节 抽样推断的一般问题抽样推断的一般问题第二节第二节 抽样误差抽样误差第三节第三节 抽样估计的方法抽样估计的方法第四节第四节 抽样的组织方式抽样的组织方式第五节第五节 必要抽样单位数的确定必要抽样单位数的确定 3第一节第一节 抽样推断的一般问题抽样推断的一般问题一、抽样推断的意义一、抽样推断的意义抽样推断是按照随机原则,从全部研究抽样推断是按照随机原则,从全部研究总体中抽取一部分单位进行调查,并依总体中抽取一部分单位进行调查,并依据所获得的数据对总体的某一数量特征据所获得的数据对总体的某一数量特征做出具有一定可靠程度的估计与推
3、断的做出具有一定可靠程度的估计与推断的一种统计方法。抽样推断的全过程,就一种统计方法。抽样推断的全过程,就是抽样调查。是抽样调查。 4抽样推断基本特点抽样推断基本特点 按照随机原则按照随机原则抽取样本单位抽取样本单位 抽样调查的目的抽样调查的目的在于推断总体在于推断总体 抽样误差可以事先抽样误差可以事先计算并加以控制计算并加以控制 5二、抽样调查的作用二、抽样调查的作用(一)应用抽样法可对某些不可能或不容易进行全(一)应用抽样法可对某些不可能或不容易进行全面调查而又要了解其全面情况的社会经济现象进面调查而又要了解其全面情况的社会经济现象进行数量方面的统计分析。行数量方面的统计分析。 对无限总体
4、不可能进行全面调查。对无限总体不可能进行全面调查。 有些现象总体范围过大,单位分布又过于分散,很难有些现象总体范围过大,单位分布又过于分散,很难或不必要进行全面调查。或不必要进行全面调查。 对于产品或商品具有破坏性的质量检验也不能进行全对于产品或商品具有破坏性的质量检验也不能进行全面调查。面调查。 对那些资料要求紧迫,需以较短时间,迅速了解总体对那些资料要求紧迫,需以较短时间,迅速了解总体全面情况时,也可用抽样法。全面情况时,也可用抽样法。 6(二)应用抽样法可对全面调查的结果加以补充或(二)应用抽样法可对全面调查的结果加以补充或订正订正 许多社会经济现象虽然可以全面调查,但同时开展抽许多社会
5、经济现象虽然可以全面调查,但同时开展抽样调查,把两者结合起来应用也具有重要的意义。样调查,把两者结合起来应用也具有重要的意义。全面调查不论是一次性普查,还是经常性统计报表制全面调查不论是一次性普查,还是经常性统计报表制度,由于范围广、工作量大,参加人员多,就较多地度,由于范围广、工作量大,参加人员多,就较多地存在发生登记性和计算性误差的可能。在全面调查后,存在发生登记性和计算性误差的可能。在全面调查后,随即抽取一部分单位重新再调查一次,将这些单位两随即抽取一部分单位重新再调查一次,将这些单位两次调查的资料进行对照、比较,计算其差错比率,并次调查的资料进行对照、比较,计算其差错比率,并以此为依据
6、对全面调查的资料加以修正,这样就可以以此为依据对全面调查的资料加以修正,这样就可以进一步提高全面调查资料的准确性。进一步提高全面调查资料的准确性。另外,由于抽样调查范围小,可以根据需要增加一些另外,由于抽样调查范围小,可以根据需要增加一些调查项目,以便进行某项更深入的研究,以补充全面调查项目,以便进行某项更深入的研究,以补充全面调查的不足。调查的不足。 7(三)应用抽样法可对生产过程中产品质量进行检(三)应用抽样法可对生产过程中产品质量进行检查和控制查和控制抽样调查不但广泛用于生产结果的核算和估计,而且抽样调查不但广泛用于生产结果的核算和估计,而且也有效地应用于对成批或大量连续生产的工业产品在
7、也有效地应用于对成批或大量连续生产的工业产品在生产过程中进行质量控制,观察生产工艺过程是否正生产过程中进行质量控制,观察生产工艺过程是否正常,是否存在某些系统性的偏误,及时提供有关信息,常,是否存在某些系统性的偏误,及时提供有关信息,分析可能的原因,便于采取措施,防止损失。分析可能的原因,便于采取措施,防止损失。(四)应用抽样法可对总体的某种假设进行检验,(四)应用抽样法可对总体的某种假设进行检验,来判断这种假设的真伪,决定行动的取舍来判断这种假设的真伪,决定行动的取舍8抽样推断的几个基本概念抽样推断的几个基本概念 全及总体和样本总体全及总体和样本总体 全及总体全及总体:抽样调查所要认识对象的
8、全体,也叫母体,简称:抽样调查所要认识对象的全体,也叫母体,简称总体,它是具有某种共同性质或特征的许多单位的集合体。总体,它是具有某种共同性质或特征的许多单位的集合体。全及总体的单位数通常用全及总体的单位数通常用N来表示,来表示,N总是很大的数。总是很大的数。样本总体样本总体:又叫子样或抽样总体,简称样本。它是从全及总:又叫子样或抽样总体,简称样本。它是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用样本总体的单位数称为样本容量,通常用n表示,相对表示,相对N来说,来说,n是很小的数,它可以是是
9、很小的数,它可以是N的几十分之一、几百分之一、几千的几十分之一、几百分之一、几千分之一、几万分之一。(一般来说,样本单位数达到或超过分之一、几万分之一。(一般来说,样本单位数达到或超过30个称为大样本,而在个称为大样本,而在30个以下称为小样本。社会经济现象个以下称为小样本。社会经济现象的抽样调查多取大样本的抽样调查多取大样本 ) 9全及指标和抽样指标全及指标和抽样指标 全及指标全及指标:根据全及总体各个单位的标志值或标:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种数量特征的综合指志特征计算的,反映总体某种数量特征的综合指标称为全及指标。也叫总体指标或母体参数。由标称为全及指标。
10、也叫总体指标或母体参数。由于全及总体是唯一确定的,所以根据全及总体计于全及总体是唯一确定的,所以根据全及总体计算的全及指标也是唯一确定的。算的全及指标也是唯一确定的。抽样指标抽样指标:由样本总体各单位标志值或标志特征:由样本总体各单位标志值或标志特征计算的,反映样本数量特征的综合指标,它是用计算的,反映样本数量特征的综合指标,它是用来估计全及指标的。来估计全及指标的。 10全及指标和样本指标的相关公式全及指标和样本指标的相关公式 FXFXNXXFFXXNXX22)()(FFXXNXX2222)()(fxfxnxxffxxsnxxs22)()(ffxxsnxxs2222)()(变量总体变量总体总
11、体平均数总体标准差 总体方差全及指标 样本指标 11全及指标和样本指标的相关公式全及指标和样本指标的相关公式属性总体属性总体总体成数总体成数标准差 总体成数方差全及指标 样本指标 PXNNP1)1 (PPP)1 (2PPPpxnnp1)1 (ppsp)1 (2ppsp12四、抽样方法四、抽样方法重复抽样重复抽样也称重置抽样、回置抽样。它是指从总体也称重置抽样、回置抽样。它是指从总体N个单位中随机抽取个单位中随机抽取容量为容量为n的样本时,每次从总体中抽取一个单位,把结果登记的样本时,每次从总体中抽取一个单位,把结果登记下来后,重新返回,再从全及总体中抽取下一个样本单位。下来后,重新返回,再从全
12、及总体中抽取下一个样本单位。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。例如例如不重复抽样不重复抽样也称不重置抽样、不回置抽样。它是指从总体也称不重置抽样、不回置抽样。它是指从总体N个单位中随机个单位中随机抽取容量为抽取容量为n的样本时,每次从总体中抽取一个单位,不再放的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本,就是说,每个总体单位只能被抽取一次,复构成一个样本,就是说,每个总体单位只能被抽取一次,所以从总体中每抽
13、取一次,总体就少一个单位,因此,先后所以从总体中每抽取一次,总体就少一个单位,因此,先后抽出来的各个单位被抽中机会是不相等的。抽出来的各个单位被抽中机会是不相等的。例如例如13重复抽样重复抽样总体有总体有A、B、C、D四个单位,要从中随四个单位,要从中随机抽取两个单位构成样本。可先从机抽取两个单位构成样本。可先从4个单个单位中取一个,结果登记后放回,然后再从位中取一个,结果登记后放回,然后再从相同的相同的4个中取一个,就构成一个样本。个中取一个,就构成一个样本。全部可能抽取的样本数目为全部可能抽取的样本数目为44=16个。个。它们是:它们是:AA,AB,AC,AD,BA,BB,BC,BD,CA
14、,CB,CC,CD,DA,DB,DC,DD。一般地说,从总体一般地说,从总体N个单位中,随机抽取个单位中,随机抽取n个单位构成样本,则样本可能数目为个单位构成样本,则样本可能数目为 个。个。nN14不重复抽样不重复抽样前例中,用不重复抽样的方法从中抽两个单位构前例中,用不重复抽样的方法从中抽两个单位构成样本,则全部可能抽取得样本共有成样本,则全部可能抽取得样本共有43=12个,个,它们是:它们是: AB,AC,AD,BA,BC,BD,CA,CB,CD,DA,DB,DC。一般地讲,从总体一般地讲,从总体N个单位中,随机不重复抽取个单位中,随机不重复抽取n个单位构成一样本,则样本可能数目为个单位构
15、成一样本,则样本可能数目为N(N1)(N2)(Nn+1) 个。个。由上可知,在相同的样本容量的要求下,不重复由上可知,在相同的样本容量的要求下,不重复抽样的样本可能数目比重复抽样为少。在实际工抽样的样本可能数目比重复抽样为少。在实际工作中,一般多采用不重复抽样,但有些调查如公作中,一般多采用不重复抽样,但有些调查如公交车辆乘客情况的调查,商场顾客流量情况的调交车辆乘客情况的调查,商场顾客流量情况的调查只宜用重复抽样。查只宜用重复抽样。15第二节第二节 抽样误差抽样误差一、抽样误差的概念和影响抽样误差的一、抽样误差的概念和影响抽样误差的主要因素主要因素(一)抽样误差的概念(一)抽样误差的概念抽样
16、误差是指样本指标与总体指标之间抽样误差是指样本指标与总体指标之间的离差。具体地讲,就是样本平均数与的离差。具体地讲,就是样本平均数与总体平均数的离差(即总体平均数的离差(即 ),或样),或样本成数与总体成数的离差(即本成数与总体成数的离差(即 )。)。Xx Pp 16在抽样中误差的来源有许多方面。在抽样中误差的来源有许多方面。其中一类是登记性误差,即在调查过程中其中一类是登记性误差,即在调查过程中由于观察、测量、登记、计算上的差错所由于观察、测量、登记、计算上的差错所引起的误差,这类误差是所有统计调查都引起的误差,这类误差是所有统计调查都可能发生的。可能发生的。另一类是代表性误差,即样本各单位
17、的结另一类是代表性误差,即样本各单位的结构不足以代表总体而引起的误差。构不足以代表总体而引起的误差。 17代表性误差的发生有以下两种情况:代表性误差的发生有以下两种情况:一种是由于违反抽样调查的随机原则,如有意地一种是由于违反抽样调查的随机原则,如有意地多选较好的单位或较坏的单位进行调查。这样做,多选较好的单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,所据以计算的抽样指标必然出现偏高或偏低现象,造成系统性的误差。系统性误差和登记性误差都造成系统性的误差。系统性误差和登记性误差都是不应当发生的,是可以也应该采取措施避免发是不应当发生的,是可以也应该采取措施避免发生
18、或将其减小到最小限度。生或将其减小到最小限度。另一种情况是,即使遵守随机原则,由于被抽选另一种情况是,即使遵守随机原则,由于被抽选的样本有各种各样,只要被抽中的样本其内部各的样本有各种各样,只要被抽中的样本其内部各单位被研究标志的构成比例和总体有所出入,就单位被研究标志的构成比例和总体有所出入,就会出现或大或小的偶然性代表性误差。会出现或大或小的偶然性代表性误差。 18我们所讲的抽样误差就是指这种偶然性代表性误差。我们所讲的抽样误差就是指这种偶然性代表性误差。即按随机原则抽样时,在没有登记性误差和系统性即按随机原则抽样时,在没有登记性误差和系统性误差的条件下单纯由于不同的随机样本得出不同估误差
19、的条件下单纯由于不同的随机样本得出不同估计量而产生的误差。抽样误差是抽样调查所固有的,计量而产生的误差。抽样误差是抽样调查所固有的,是无法避免与消除的,但可以运用数学方法计算其是无法避免与消除的,但可以运用数学方法计算其数量界限,并通过抽样设计程序控制其范围,所以数量界限,并通过抽样设计程序控制其范围,所以这种抽样误差也称为可控制误差。这种抽样误差也称为可控制误差。需要指出,抽样误差不是固定不变的数,它的数值需要指出,抽样误差不是固定不变的数,它的数值是随样本不同而变化的,所以它也是随机变量。是随样本不同而变化的,所以它也是随机变量。19(二)影响抽样误差大小的因素(二)影响抽样误差大小的因素
20、1、样本单位数的多少、样本单位数的多少2、总体被研究标志的变异程度、总体被研究标志的变异程度3、抽样方法、抽样方法4、抽样调查的组织形式、抽样调查的组织形式20二、抽样平均误差二、抽样平均误差(一)抽样平均数的抽样平均误差(一)抽样平均数的抽样平均误差计算平均数的抽样平均误差的理论公式为:计算平均数的抽样平均误差的理论公式为: 表示抽样平均误差表示抽样平均误差 该公式表明了抽样平均误差的意义。但是当总体单该公式表明了抽样平均误差的意义。但是当总体单位数较大,而抽取的样本单位数也较大时,样本位数较大,而抽取的样本单位数也较大时,样本可能数目就非常大。即使求出样本可能数目,上可能数目就非常大。即使
21、求出样本可能数目,上述公式仍然不适用,这是因为,在该公式中出现述公式仍然不适用,这是因为,在该公式中出现了总体平均数。这也正是抽样调查所要推算出的了总体平均数。这也正是抽样调查所要推算出的数值,实践中是不知道的。数值,实践中是不知道的。 样本可能数目2)(Xxxx21 抽样调查实践中用来计算抽样平均误差的基抽样调查实践中用来计算抽样平均误差的基本公式是根据定义公式推导出来的。数理统本公式是根据定义公式推导出来的。数理统计证明,在重复抽样条件下,抽样平均误差计证明,在重复抽样条件下,抽样平均误差与总体标准差成正比,与样本单位数的算术与总体标准差成正比,与样本单位数的算术平方根成反比。即:平方根成
22、反比。即:nnxx2或22 现以现以4个工人的日产量为例来验证两个公式个工人的日产量为例来验证两个公式的计算结果是相同的。的计算结果是相同的。例例1 设设4个工人的日产量分别为个工人的日产量分别为40、42、46、48件。则平均日产量与平均日产量的标准差件。则平均日产量与平均日产量的标准差如表如表81,则:,则:23序号 样本变量( ) 样本平均数( ) 离差( ) 离差平方12345678910111213141516 40 4040 4240 4640 4842 4041 4242 4642 4846 4046 4046 4246 4848 4048 4248 4648 484041434
23、4414244454344464745454748 4310320110230134 169109401104901916 合计 704 80 xxXx 2)(Xx 24如果从总体中随机抽出如果从总体中随机抽出2个单位进行调查,则抽样平均误差:个单位进行调查,则抽样平均误差:抽样平均误差:抽样平均误差: 件)(44448464240NXX件)(1623. 34)4448()4446()4442()4440()(22222NXXx(件)2361. 221623. 3nx(件)样本可能数目2361. 21680)2Xxx25 不重复抽样条件下计算公式为:不重复抽样条件下计算公式为: 通过比较不重复
24、抽样条件下和重复抽样条件下的公式可以通过比较不重复抽样条件下和重复抽样条件下的公式可以看出,根号下相差看出,根号下相差 我们把这个式子叫做修正因子。不难看出当我们把这个式子叫做修正因子。不难看出当N较大时,较大时, 与与 的计算结果是十分接近。因此,当的计算结果是十分接近。因此,当N较大时在不较大时在不重复抽样条件计算抽样平均误差的公式可采用时重复抽样条件计算抽样平均误差的公式可采用时 )1(2NnNnx)1(NnN)1(NnN)1 (Nn)1 (2Nnnx26例例2 从某厂生产从某厂生产的的10000只日光灯管中随机抽取只日光灯管中随机抽取100只进行检只进行检查,假如该产品平均使用寿命的标
25、准差为查,假如该产品平均使用寿命的标准差为100小时,试计算小时,试计算该厂日光灯管平均使用寿命的平均误差该厂日光灯管平均使用寿命的平均误差。解:在重复抽样条件下解:在重复抽样条件下 在不重复抽样条件下在不重复抽样条件下 (小时)10100100nx9 .99)100000101 (100100)1 (22Nnnx27抽样成数的抽样平均误差抽样成数的抽样平均误差如用如用 表示抽样成数的抽样平均误差表示抽样成数的抽样平均误差,其公式为:其公式为:在重复抽样条件下在重复抽样条件下在不重复抽样条件下在不重复抽样条件下 以上所有的公式中,不论是抽样平均数的抽样平均误以上所有的公式中,不论是抽样平均数的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 抽样 推断
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内