第5章 抽样调查.pptx
《第5章 抽样调查.pptx》由会员分享,可在线阅读,更多相关《第5章 抽样调查.pptx(80页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学统计学盐城师范学院商学院盐城师范学院商学院第五章第五章 抽样调查抽样调查1/15/20221本章内容 第一节 抽样调查概述 第二节 抽样调查的数理基础 第三节 抽样误差与抽样估计 第四节 抽样调查的组织方式1/15/20222第一节第一节 抽样调查概述 一、抽样调查的概念、特点及作用一、抽样调查的概念、特点及作用 二、抽样调查中的基本概念二、抽样调查中的基本概念 三、抽样方法三、抽样方法 四、抽样调查的设计四、抽样调查的设计1/15/20223一、抽样调查的概念、特点及作用一、抽样调查的概念、特点及作用(一)抽样调查的概念(一)抽样调查的概念抽样调查是按照随机原则从总体中抽取样本进行调抽
2、样调查是按照随机原则从总体中抽取样本进行调查,得到样本资料,并根据样本资料对总体数量查,得到样本资料,并根据样本资料对总体数量特征作出具有一定可靠程度的估计和推断,以达特征作出具有一定可靠程度的估计和推断,以达到认识总体的一种统计方法。到认识总体的一种统计方法。也称为也称为 抽样推断、抽样估计或统计推断。抽样推断、抽样估计或统计推断。 例:某地进行水质监测,考察河水中某种污染物例:某地进行水质监测,考察河水中某种污染物质是否超标。从河水中按照一定地点定时取样质是否超标。从河水中按照一定地点定时取样检验,根据检验结果推断河水中污染物是否超检验,根据检验结果推断河水中污染物是否超标。标。 1/15
3、/20224推断推断总体指标(参数)总体指标(参数)样本指标(统计量)样本指标(统计量)(红色表示样本)(红色表示样本)1/15/20225(二二) 抽样调查的特点抽样调查的特点1、与其它调查方法相比,省时、省力、快捷;2、根据样本资料对总体的数量特征作出具有一定可靠性的估计和推断;3、 按照随机性(同等可能性)原则从总体中抽取样本单位;4、 可以根据资料在调查之前计算和控制抽样误差。1/15/20226(三三)抽样调查的作用抽样调查的作用1、某些现象不可能进行全面调查,但又需要了解全面资料时,就采用抽样调查方法。2、某些理论上可以进行全面调查,但实际上难以达到的现象,可以采用抽样调查。3、可
4、以对全面调查的结果进行评价和修正。4、抽样调查可用于工业生产过程中的质量控制。5、可以对某些总体的假设进行检验,来判断假设的真伪,为决策提供依据。1/15/20227(四)抽样调查的两种类型一类是参数估计:它是根据对样本进行观测取得的数据,然后对研究对象整体的数量特征取值给出估计方法。另一类是假设检验:它是根据对样本进行观测取得的数据,然后对研究对象的数量规律性是否具有某种指定特征进行检验。 1/15/20228例:2005年中国消费者协会的主题是“健康维权”。假定我们是消费者协会的检查人员,治理缺斤少两的不法行为。对可口可乐公司的产品进行检查,他们生产的一种瓶装雪碧,包装上标明其净含量是50
5、0ml,在市场上随机抽取了50瓶,测得到其平均含量为499.5ml,标准差为2.63ml。取得这些数据我们可以:一是做一个估计:该种包装的雪碧平均含量在498.77-500.23ml之间,然后向消协写份报告;(参数估计)二是一个裁决:说“可口可乐公司有欺骗消费者的行为”的证据不足。(假设检验)1/15/20229(一)全及总体和个体 1、全及总体(总体,母体):它是由具有同一性质的许多单位组成的集合体,是指所要认识的对象。 2、个体(总体单位),组成总体的各个单位称为个体。(二)抽样总体(样本,子体) 从总体中按照一定的原则和方法抽取出来的部分个体组成的结合体。 样本容量:一个样本中包含的个体
6、(总体单位)数。 n 30 大样本 n 30 小样本二、抽样调查中几个基本概念1/15/202210(三)总体指标和样本指标1、总体指标(全及指标、参数):它是根据总体所有单位的标志值或标志特征计算的、反映总体某种属性的综合指标。 总体指标是一个确定的值。2、样本指标(抽样指标、统计量):它由样本各个单位标志值或标志特征计算的综合指标。 样本指标是一个随机变量。3、抽样调查中常用的指标 平均数(均值)、方差或标准差、比例(是非标志比重)1/15/202211总体和样本指标及符号对照表指标名称总体样本单位数Nn平均数 或 标准差 s方 差是非标志比例(成数) 或P、Q p、qx2s2X1/15/
7、202212是非标志(交替标志)的比重(成数):是非标志(交替标志)的比重(成数):是非标志的标志表现只有是非标志的标志表现只有“是是”与与“非非”两种两种结果,将其数量化,通常以结果,将其数量化,通常以1 1代表具有所研究代表具有所研究特征的变量值,以特征的变量值,以0 0代表不具有所研究特征的代表不具有所研究特征的变量值。当总体单位数为变量值。当总体单位数为N N时,假定具有所研时,假定具有所研究特征变量值的单位数为究特征变量值的单位数为 ,不具有所研究,不具有所研究特征变量值的单位数为特征变量值的单位数为 ,且,且 01NNN1N0NNN1NN01总体总体 样本样本pnnnnnqnnP1
8、,1011/15/202213是非标志的平均数与标准差计算是非标志的平均数与标准差计算是非标志X10PQP01P0PQ2PP2Q合 计1PQ2P+ P2QffffXXXffXX2)(是非标志的算术平均数为:是非标志的算术平均数为:ffXX= p是非标志的标准差为:是非标志的标准差为: ffXX2QPPQ22=P)P(11/15/202214三、抽样方法1、重复抽样(重置抽样,有放回的抽样):是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位经登录其有关标志表现后又放回总体中重新参加下一次的抽选。 2、不重复抽样(不重置抽样,无放回的抽样):是指从全及总体N个单位中随机抽取一个容
9、量为n的样本,每次抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选。 111 500050005000L L,例例111 500049994998L L,例例1/15/2022153 3、抽样框与样本的可能数目、抽样框与样本的可能数目抽样框:是指对可以选择作为样本的总体单位列抽样框:是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和出名册或排序编号,以确定总体的抽样范围和结构。它是进行概率抽样的必要条件。结构。它是进行概率抽样的必要条件。样本的可能数目:它是指从总体样本的可能数目:它是指从总体N N个单位中随机个单位中随机抽选抽选n n个单位构成样本,结果有
10、排列组合,一个单位构成样本,结果有排列组合,一种排列组合便构成一个可能的样本,排列组合种排列组合便构成一个可能的样本,排列组合的总数称为样本的可能数目。如下表:的总数称为样本的可能数目。如下表:1/15/202216nNA)!(!nNNPAnN)!( !nNnNCAnN抽样方法抽样方法重置抽样重置抽样不重置抽样不重置抽样考虑顺序考虑顺序不考虑顺序不考虑顺序-(- )!(- )! !nNnN nCNn1111/15/202217四、抽样调查的设计 1、界定调查总体 2、选择收集资料的方式 3、选择抽样框 4、设计抽样技术 5、设计样本和抽取样本 6、评估样本1/15/202218第二节 抽样调查
11、的数理基础 一、随机变量的概率分布一、随机变量的概率分布 二、随机变量的数字特征二、随机变量的数字特征 三、常用的随机变量的分布三、常用的随机变量的分布 四、大数定律与中心极限定理四、大数定律与中心极限定理 五、抽样分布五、抽样分布 (本节内容见教材,只需了解结论本节内容见教材,只需了解结论)1/15/202219第三节 抽样误差与抽样估计 一、抽样误差的概念一、抽样误差的概念 二、影响抽样误差的因素二、影响抽样误差的因素 三、抽样平均误差三、抽样平均误差 四、抽样极限误差四、抽样极限误差 五、抽样估计的可靠程度五、抽样估计的可靠程度 六、抽样估计方法六、抽样估计方法 七、样本容量的确定七、样
12、本容量的确定1/15/202220一、抽样误差的概念一、抽样误差的概念 1 1、统计误差:调查得到数据资料与实际情况的、统计误差:调查得到数据资料与实际情况的差别称为统计误差。差别称为统计误差。 统计误差统计误差= =样本指标样本指标- -总体指标总体指标 2 2、统计误差的种类:、统计误差的种类: 登登记记误误差差系系统统性性误误差差统统计计误误差差代代表表性性误误差差实实际际误误差差随随机机误误差差抽抽样样平平均均误误差差1/15/2022213 3、抽样误差:它是指在抽样调查过程中,在遵、抽样误差:它是指在抽样调查过程中,在遵守随机原则抽样的条件下,仍然会产生的样本守随机原则抽样的条件下
13、,仍然会产生的样本指标与总体指标之间的差别。指标与总体指标之间的差别。抽样误差既是一种随机性误差,也是一种代表性抽样误差既是一种随机性误差,也是一种代表性误差,它是无法避免的,但它是可以利用大数误差,它是无法避免的,但它是可以利用大数定律计算出来的并能够通过设计抽样程序控制定律计算出来的并能够通过设计抽样程序控制其大小。其大小。 px或,1/15/202222二、影响抽样误差的因素二、影响抽样误差的因素 1、样本容量的大小;、样本容量的大小; 2、总体被研究标志的变异程度、总体被研究标志的变异程度 ; 3、抽样方法的选择;、抽样方法的选择; 4、抽样的组织形式。、抽样的组织形式。1/15/20
14、2223三、抽样平均误差三、抽样平均误差(一)抽样平均误差的概念抽样平均误差是抽样平均数或成数的标准差。抽样平均误差就是说明各个抽样平均数或抽样成数与总体平均数或总体成数之间的平均误差。抽样平均误差是我们用样本指标来估计或推断总体指标时,计算误差范围的基础。1/15/202224抽样平均误差的理论计算公式:MxUMix12)(MpUMip12)(式中以 分别代表抽样平均数或抽样成数的平均差,M表示样本的可能数目。 举例上述平均误差公式只能用来解释平均误差的概念,在实际问题中无法应用。因为:首先,总体的平均数或成数通常未知;其次,也很难给出全部样本的平均数或成数。 pxUU 和1/15/2022
15、25抽样平均误差的实际计算公式1 1、抽样平均数的抽样平均误差、抽样平均数的抽样平均误差当抽样方式为重复抽样时,样本标志值当抽样方式为重复抽样时,样本标志值x1x1,x2x2,xnxn是相互独立的,样本变量是相互独立的,样本变量x x与总体变与总体变量量X X同分布。用数理统计知识证明,得:同分布。用数理统计知识证明,得:nnux2重复抽样重复抽样抽样平抽样平均误差均误差公式公式1/15/202226当抽样方式为重复抽样时,样本标志值当抽样方式为重复抽样时,样本标志值x x1 1,x x2 2,x xn n是不相互独立的。用数理统计知是不相互独立的。用数理统计知识证明,得:识证明,得:不重复抽
16、样不重复抽样抽样平均抽样平均误差公式误差公式12NnNnux1/15/202227不重复抽样误差的近似公式与重复抽样误差公式的不重复抽样误差的近似公式与重复抽样误差公式的区别是公式中多了一个区别是公式中多了一个 。这是一个修正。这是一个修正系数,也称为校正因子。系数,也称为校正因子。当当N N很大时,分母上可以不减去很大时,分母上可以不减去1 1。可以近似的表示。可以近似的表示为:为:Nn1Nnnux121/15/202228解:在重复抽样条件下为:解:在重复抽样条件下为:在不重复抽样条件下为:在不重复抽样条件下为: 公斤5 . 040010222nsnux公斤49. 080004001400
17、10122Nnnux【例例】 从某校从某校80008000名学生中随机抽取名学生中随机抽取400400人,称人,称得其平均体重为得其平均体重为5858公斤,标准差为公斤,标准差为1010公斤,计公斤,计算抽样平均误差。算抽样平均误差。1/15/2022292 2、抽样成数的抽样平均误差、抽样成数的抽样平均误差抽样成数的抽样平均误差表明各样本成数的绝对抽样成数的抽样平均误差表明各样本成数的绝对离差的平均水平。离差的平均水平。用于将属性总体变化为变量总体。用于将属性总体变化为变量总体。 (1 1)重复抽样抽样平均误差公式为:)重复抽样抽样平均误差公式为:nup1nppp)1 ( 或或总体资料总体资
18、料样本资料样本资料1/15/202230(2 2)不重复抽样抽样平均误差公式为:)不重复抽样抽样平均误差公式为:11NnNnup总体资料总体资料样本资料样本资料Nnnup11)1)1 (NnN(nppp)1)1 (Nn(nppp或或或或一般总体的成数是未知的,通常是用样本的成数一般总体的成数是未知的,通常是用样本的成数p p来来代替公式中的总体成数。代替公式中的总体成数。1/15/202231【例例】有一批食品罐头共有一批食品罐头共60 00060 000瓶,从中随机抽瓶,从中随机抽取取300300瓶,发现有瓶,发现有6 6瓶不合格,求合格率的抽样瓶不合格,求合格率的抽样平均误差。平均误差。解
19、:合格率:解:合格率: 在重复抽样条件下为:在重复抽样条件下为: %9898. 03006300p%81. 000808. 030098. 0198. 01nppup%81. 000806. 060000300130098. 0198. 011Nnnppup在不重复抽样条件下为:在不重复抽样条件下为:1/15/202232四、抽样极限误差四、抽样极限误差 抽样平均误差只是衡量误差可能范围的一种尺度。它并不等同于抽样指标与总体指标之间的真实误差。由于总体参数是一个确定的常数,而样本估计量会随抽取的样本不同而围绕总体参数上下随机取值。因此,样本统计量与总体参数之间存在一个误差范围。 所谓抽样误差范
20、围就是指变动的样本统计量与确所谓抽样误差范围就是指变动的样本统计量与确定的总体参数之间离差的可能范围,它用样本估定的总体参数之间离差的可能范围,它用样本估计值与总体参数的最大绝对误差范围来表达。计值与总体参数的最大绝对误差范围来表达。 统计上称这一误差范围抽样极限误差或抽样允许统计上称这一误差范围抽样极限误差或抽样允许误差。误差。1/15/202233设设 和和 分别表示样本平均数分别表示样本平均数 和样本和样本成数成数 的抽样极限误差,则有:的抽样极限误差,则有:xpxppxpx,上式表明,抽样平均数或抽样成数在上式表明,抽样平均数或抽样成数在 或或 之间变动。将上面绝对值不等式展开可得:之
21、间变动。将上面绝对值不等式展开可得:xpppxxpx不等式表明,样本平均数不等式表明,样本平均数 是以总体平均数是以总体平均数为中心,为中心,在在 之间变动的;之间变动的;样本成数样本成数 是以总体成数为中心,在是以总体成数为中心,在 之间之间变动的。变动的。 xxpp1/15/202234抽样误差范围是以抽样误差范围是以 或或 为中心的两个为中心的两个 的的距离。这是抽样极限误差的原意。距离。这是抽样极限误差的原意。但由于总体参数是未知的常数,而样本估计值是但由于总体参数是未知的常数,而样本估计值是可以通过调查求得的,因此,可以把上面的两可以通过调查求得的,因此,可以把上面的两个不等式改写成
22、等价的另一种形式,即:个不等式改写成等价的另一种形式,即:ppxxppxx可见,抽样极限误差的实际意义就是希望总体平均可见,抽样极限误差的实际意义就是希望总体平均数落在抽样平均数数落在抽样平均数 的范围之内;总体的范围之内;总体成数落在抽样成数成数落在抽样成数 的范围之内,这个的范围之内,这个范围也称为置信区间。范围也称为置信区间。xxpp1/15/202235对于一个总体来说,当抽样方式以及样本的单位数对于一个总体来说,当抽样方式以及样本的单位数确定后,抽样误差就是个确定的值,而抽样极限确定后,抽样误差就是个确定的值,而抽样极限误差则是根据不同情况和精确程度,由人们来确误差则是根据不同情况和
23、精确程度,由人们来确定其大小的。因此,抽样极限误差常常以抽样平定其大小的。因此,抽样极限误差常常以抽样平均误差均误差 (或(或 )为单位来衡量,并且把抽)为单位来衡量,并且把抽样极限误差样极限误差 (或(或 )除以抽样平均误差)除以抽样平均误差 (或(或 )所得的数值叫做概率度。若以)所得的数值叫做概率度。若以z表示概表示概率度,则有:率度,则有:xpxpxpppxxzz,若事先确定概率度若事先确定概率度z的大小,则可以得到抽样极的大小,则可以得到抽样极限误差为:限误差为:ppxxzz,1/15/202236五、抽样估计的可靠程度(置信度)五、抽样估计的可靠程度(置信度) 由于抽样平均数是一个
24、随机变量,由中心极限由于抽样平均数是一个随机变量,由中心极限定理可知:定理可知:n当充分大当充分大 时,时, 就服从正态就服从正态分布,从而分布,从而 服从标准正态分布。服从标准正态分布。 这样我们就可以在确定的误差范围下,求出相这样我们就可以在确定的误差范围下,求出相应的概率大小,而抽样极限误差的大小又可确应的概率大小,而抽样极限误差的大小又可确定相应概率度的大小,这样如先确定概率度定相应概率度的大小,这样如先确定概率度为为z,则可求得相应的概率(置信度)为:则可求得相应的概率(置信度)为:30nxxxdzezxPzxPzzxx022211/15/202237上式就是抽样平均数上式就是抽样平
25、均数 落在落在 之间的概率,之间的概率,如总体平均数如总体平均数 未知,则上式也可以看作是未知,则上式也可以看作是 落在落在 之间的概率。之间的概率。xxzxz上述的积分值要查正态分布概率表求得。上述的积分值要查正态分布概率表求得。现将常用的概率度现将常用的概率度z与相应的概率与相应的概率 的几个数值的几个数值对应列表如下:对应列表如下:)(zF概率度概率度z11.651.9622.583概率概率F(z) 0.68270.90000.95000.95450.990.9973可以看出:当确定的抽样极限误差愈大,则概率可以看出:当确定的抽样极限误差愈大,则概率度度z也就愈大,相应的概率也愈大,即样
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章抽样调查
限制150内