统计抽样的基本概念与方法.pptx
《统计抽样的基本概念与方法.pptx》由会员分享,可在线阅读,更多相关《统计抽样的基本概念与方法.pptx(52页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第七章统计抽样第七章统计抽样本资料来源第七章统计抽样第七章统计抽样统计抽样主要研究什么内容,解决什么问题?统计抽样主要研究什么内容,解决什么问题?统计抽样主要有哪几种方法?统计抽样主要有哪几种方法?如何确定样本容量?如何确定样本容量?第七章统计抽样第七章统计抽样7.1 7.1 统计抽样基本概念统计抽样基本概念 总体由研究对象的全体所组成。总体由研究对象的全体所组成。 样本是总体中的部分元素所组成的集合。样本是总体中的部分元素所组成的集合。 目标总体是我们要推断的总体目标总体是我们要推断的总体 抽样总体是实际抽取样本的总体抽样总体是实际抽取样本的总体 第七章统计抽样第七章统计抽样在抽样之前,应将
2、总体划分为抽样单位。抽样单在抽样之前,应将总体划分为抽样单位。抽样单位既可以是一个简单的个体,也可以是一组个体。位既可以是一个简单的个体,也可以是一组个体。 对某一个特殊研究,抽样单位的名册称为抽样框。对某一个特殊研究,抽样单位的名册称为抽样框。7.1 7.1 统计抽样基本概念统计抽样基本概念第七章统计抽样第七章统计抽样调调查查方方法法邮寄调查邮寄调查电话调查电话调查个人采访调查个人采访调查7.2 7.2 抽样调查种类和抽样方法抽样调查种类和抽样方法第七章统计抽样第七章统计抽样调调查查误误差差非抽样误差非抽样误差 抽样误差抽样误差 由于没有对总体的由于没有对总体的所有单位进行调查所有单位进行调
3、查而产生的误差而产生的误差 进行一次抽样调查进行一次抽样调查可能出现的如测量可能出现的如测量误差、采访者误差误差、采访者误差及数据处理误差等。及数据处理误差等。 7.3 7.3 调查误差调查误差第七章统计抽样第七章统计抽样从一个容量为从一个容量为N N的有限总体中抽取得到一个容量为的有限总体中抽取得到一个容量为n n的简单随机样本,使每一个容量为的简单随机样本,使每一个容量为n n的可能样本,都的可能样本,都有相同的概率被抽中。有相同的概率被抽中。建立抽样框建立抽样框根据随机数表进行抽样根据随机数表进行抽样抽样总体中所抽样总体中所有个体的名册有个体的名册使用随机数表,可使用随机数表,可以保证抽
4、样总体中以保证抽样总体中的每个个体都有相的每个个体都有相同的概率被抽中同的概率被抽中 7.4 7.4 简单随机抽样简单随机抽样第七章统计抽样第七章统计抽样总体均值总体均值总体比率总体比率样本容量的确定样本容量的确定7.4 7.4 简单随机抽样简单随机抽样第七章统计抽样第七章统计抽样如果选择大样本(如果选择大样本(n30n30),则中心极限定理),则中心极限定理可以保证可以保证 的抽样分布近似服从正态概率分布,的抽样分布近似服从正态概率分布,的区间估计为的区间估计为 式中,式中, 为均值的标准差。为均值的标准差。 1 1称为置信度,称为置信度, 为与之对应的临界值。为与之对应的临界值。例如,若置
5、信度为例如,若置信度为9595,则,则 。xxxx2/x2/96. 1025. 07.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样当从一个容量为当从一个容量为N N的有限总体中,抽取一个容量的有限总体中,抽取一个容量为为n n的简单随机样本时,均值的标准差的估计值为的简单随机样本时,均值的标准差的估计值为此时总体均值的区间估计为此时总体均值的区间估计为 在抽样调查中,当构造置信区间时,通常取在抽样调查中,当构造置信区间时,通常取=2=2。因此,在使用简单随机样本时,总体均值的。因此,在使用简单随机样本时,总体均值的近似近似9595的置信区间的表达式为:的置信区间的表达式为:
6、nsNnNsx1xsx2/xsx27.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样例例7.17.1摄影摄影是一本推介摄影作品、报道摄影是一本推介摄影作品、报道摄影发展状况、介绍摄影器材的杂志,它目前拥有发展状况、介绍摄影器材的杂志,它目前拥有80008000个个订户。根据一个订户。根据一个484484个订户的简单随机样本,得出订户个订户的简单随机样本,得出订户的年平均收入为的年平均收入为3050030500元,标准差为元,标准差为70407040元。因此,所元。因此,所有订户的年平均收入的无偏估计为有订户的年平均收入的无偏估计为 元。元。因此,这本杂志订户的年平均收入的近似
7、因此,这本杂志订户的年平均收入的近似9595的置信的置信区间为区间为即(即(2988029880,3112031120)。)。310484040 71000 8484000 8xs620500 303102500 3030500 x7.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样上述过程也可用于对诸如总体总量或总体比率上述过程也可用于对诸如总体总量或总体比率等其他总体参数的区间估计。对点估计的抽样分布等其他总体参数的区间估计。对点估计的抽样分布近似服从正态概率分布的所有情形,其近似近似服从正态概率分布的所有情形,其近似9595的的置信区间为置信区间为例如,在例如,在摄影摄影
8、的抽样调查中,点估计量的标准的抽样调查中,点估计量的标准误差的估计值为,允许误差为误差的估计值为,允许误差为2 2310310元元620620元。元。2点估计值点估计量标准误差估计值元310 xs7.4.1 7.4.1 总体均值总体均值第七章统计抽样第七章统计抽样总体比率总体比率p p是总体中具有某些感兴趣特征的个体的比是总体中具有某些感兴趣特征的个体的比重。重。 例例7.27.2在市场调查研究中,人们想了解喜欢某一品在市场调查研究中,人们想了解喜欢某一品牌的消费者比重。样本比率牌的消费者比重。样本比率 是总体比率的无偏点是总体比率的无偏点估计。总体比率的标准差的估计值为估计。总体比率的标准差
9、的估计值为因此,因此,总体比率的近似总体比率的近似9595的置信区间的表达式如下:的置信区间的表达式如下: pnppNnNsp)1 (1psp27.4.2 7.4.2 总体比率总体比率第七章统计抽样第七章统计抽样例如,在大宇国际咨询公司的抽样调查中,大宇国例如,在大宇国际咨询公司的抽样调查中,大宇国际咨询公司也想估计在它服务范围内的际咨询公司也想估计在它服务范围内的500500所学校中,所学校中,使用天然气作为取暖燃料的学校比率。如果在抽出使用天然气作为取暖燃料的学校比率。如果在抽出的的5050所学校中,有所学校中,有3535所学校使用天然气作为取暖燃所学校使用天然气作为取暖燃料,则总体料,则
10、总体500500所学校中使用天然气比率的点估计所学校中使用天然气比率的点估计值值 。比率的标准差的估计值为。比率的标准差的估计值为因此,因此,总体比率的近似总体比率的近似9595置信区间为置信区间为即(即(0.5758,0.8242 0.5758,0.8242 )。)。70. 050/35p0621. 0507 . 017 . 0150050500)(ps1242. 07 . 00621. 027 . 07.4.2 7.4.2 总体比率总体比率第七章统计抽样第七章统计抽样nsNnNsx12/nsNnNB12 回忆前面提到的允许误差为回忆前面提到的允许误差为“点估计的标准差估计值点估计的标准差估
11、计值的的2 2倍倍”,因此,因此: :222(1)4NsnBNs 均值的标准差的估计值:均值的标准差的估计值:7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样两步抽样两步抽样用试点调查或事先用试点调查或事先检验的结果估计检验的结果估计s s2 2 估估计计s s2 2的的方方法法根据以往的资料估计根据以往的资料估计s s2 2 由第一步抽取的部分由第一步抽取的部分单位,得到的单位,得到的s s2 2的估的估计值,将此值代入上计值,将此值代入上式,确定出全部样本式,确定出全部样本容量容量n n;然后对第一;然后对第一步确定的全部样本容步确定的全部样本容量,再抽取第
12、二步所量,再抽取第二步所需要的其余单位数。需要的其余单位数。 7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样 例例7.37.3某大学有某大学有50005000名毕业生,我们想构造宽度在名毕业生,我们想构造宽度在10001000元之内的近似元之内的近似9595的置信区间。的置信区间。对这样规定的置信区间,对这样规定的置信区间,B B500500。在确定。在确定n n之前,之前,需要估计需要估计 。假设根据去年所做的同样研究,得知假设根据去年所做的同样研究,得知s s30003000元。元。我们可以用这个值来估计我们可以用这个值来估计 。根据。根据B=500B=5
13、00、 s s3000 3000 及及N N50005000,则样本容量为,则样本容量为2s2s97.13930004500500030005000222n7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样在估计总体比率时,选择样本容量的公式,与估计在估计总体比率时,选择样本容量的公式,与估计总体均值的公式类似。我们只需要将估计总体均值的公总体均值的公式类似。我们只需要将估计总体均值的公式中式中 替换为替换为 ,即,即 使用上式时,我们必须规定允许误差使用上式时,我们必须规定允许误差B B和给出和给出 的一个估计值。如果没有合适的估计值,我们可以使的一个估计值。如
14、果没有合适的估计值,我们可以使用用 代替,这样将保证近似置信区间的允许误差代替,这样将保证近似置信区间的允许误差比希望的要小的多。比希望的要小的多。2s)1 (pp2(1)(1)(1)4NppnBNppp5 . 0p7.4.3 7.4.3 样本容量的确定样本容量的确定第七章统计抽样第七章统计抽样将总体划分将总体划分H H组组从第从第h h层中抽取一个容量层中抽取一个容量为为n nh h的简单随机样本的简单随机样本 由这由这H H个简单随个简单随机样本的联合资机样本的联合资料,可得出诸如料,可得出诸如总体均值、总体总体均值、总体总量及总体比率总量及总体比率等各种总体参数等各种总体参数的估计。的估
15、计。 分层简单随机抽样的步骤:分层简单随机抽样的步骤:也称为层也称为层7.5 7.5 分层简单随机抽样分层简单随机抽样第七章统计抽样第七章统计抽样如果各层内的差异比层间的差异小,则分层简单如果各层内的差异比层间的差异小,则分层简单随机样本可得到更大的精度(总体参数的区间估计将随机样本可得到更大的精度(总体参数的区间估计将更窄)。更窄)。各层的划分应依据样本设计者的判断。各层的划分应依据样本设计者的判断。根据应用,总体可按部门、地区、年龄、产品类根据应用,总体可按部门、地区、年龄、产品类型、销售水平等分层。型、销售水平等分层。7.5 7.5 分层简单随机抽样分层简单随机抽样第七章统计抽样第七章统
16、计抽样 例例7.47.4某大学管理学院想对今年的毕业生进行一次某大学管理学院想对今年的毕业生进行一次调查,以便了解他们开始工作时的年薪。调查,以便了解他们开始工作时的年薪。7.5 7.5 分层简单随机抽样分层简单随机抽样第七章统计抽样第七章统计抽样在分层抽样中,总体均值的无偏估计是各层样在分层抽样中,总体均值的无偏估计是各层样本均值的加权平均数,所用权数为总体在各层的比本均值的加权平均数,所用权数为总体在各层的比重。用重。用 表示总体均值的点估计,其定义如下:表示总体均值的点估计,其定义如下:式中:式中:H-H-层数;层数; -第第h h层的样本均值;层的样本均值; N Nh h-第第h h层
17、的单位数;层的单位数;N-N-总体单位数;总体单位数;对分层简单随机样本,计算平均值的标准差的对分层简单随机样本,计算平均值的标准差的估计公式为估计公式为stxHhhhstxNNx1hxHNNNN21HhhhhhhxnsnNNNsst122)(17.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样某大学管理学院的某大学管理学院的180180名毕业生的样本调查结果名毕业生的样本调查结果 7.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样各专业(层)的样本均值分别为:各专业(层)的样本均值分别为: 因此,总体均值的点估计为因此,总体均值的点估计为293503100
18、01500150270001500300310001500200285001500350300001500500stx7.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样抽样调查中估计均值的标准差所需要的部分计算结果抽样调查中估计均值的标准差所需要的部分计算结果 7.5.1 7.5.1 总体均值总体均值第七章统计抽样第七章统计抽样上表中上表中因此,因此,总体的近似总体的近似9595的置信区间为的置信区间为即(即(2907429074,2962629626)。)。 84290903769)(512hhhhhhnsnNN13868.1907084290903769150012stx
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计 抽样 基本概念 方法
限制150内