等概率整群抽样讲稿.ppt
《等概率整群抽样讲稿.ppt》由会员分享,可在线阅读,更多相关《等概率整群抽样讲稿.ppt(74页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于等概率整群抽样关于等概率整群抽样第一页,讲稿共七十四页哦 一一、概概述述及及符符号号说说明明二二、单单阶阶段段抽抽样样三三、两两阶阶段段抽抽样样四四、抽抽样样设设计计五五、系系统统抽抽样样六六、基基于于模模型型推推理理第二页,讲稿共七十四页哦调查目的:调查含调查目的:调查含1000010000家住户的社区中住户拥有自家住户的社区中住户拥有自行车数目;行车数目;策略一:样本容量为策略一:样本容量为400400个住户的个住户的简单随机抽样简单随机抽样;策略二:策略二:整群抽样整群抽样。整群抽样步骤:。整群抽样步骤:1 1、将社区分为、将社区分为500500个组个组(每个组每个组2020家住户家
2、住户)从从500500个组中个组中随机抽取随机抽取2020个组个组(组组:初级抽样单元初级抽样单元PSU)PSU)2 2、从随机抽取、从随机抽取2020组中普查组内的每一家住户组中普查组内的每一家住户(住户住户:二级抽样单元二级抽样单元SSU)SSU)第三页,讲稿共七十四页哦注意:注意:1 1、抽样单元抽样单元(PSU)(PSU)不同于不同于观测单元观测单元(SSU);(SSU);2 2、同容量同容量的的整群整群抽样抽样观测单元提供的观测单元提供的信息少信息少于于SRS;SRS;3 3、花费花费而言,整群抽样更而言,整群抽样更物超所值物超所值;4 4、分群的原则是:分群的原则是:群内差异尽可能
3、大群内差异尽可能大,群间,群间差异尽可能小。差异尽可能小。p第四页,讲稿共七十四页哦 社区里一些组的住户主要是由家庭构成,他们拥有更多的自行车;而社区里另外一些组的居民主要是退休人员,他们的自行车较少。同一组里的20家住户不如随机选择的20户更能反映出社区的多样性。因此这种情况下,整群抽样比同样规模的简单随机抽样的因此这种情况下,整群抽样比同样规模的简单随机抽样的每次观测所获得的信息可能更少。每次观测所获得的信息可能更少。访问组中的20家住户比随机选择20家住户更节省经费,也更容易,所以整群抽样的单位美元花费可能所以整群抽样的单位美元花费可能产生更多的信息。产生更多的信息。第五页,讲稿共七十四
4、页哦 同一群中元素比整个总体中SRS选择的元素更趋于同质性同一品种的鱼在同一湖里更容易具有相同的汞浓度;同一疗养院的居民容易对护理质量具有相同意见。由于同质性存在,在一个群里调查所有成员,在一定程度上会造成信息重复,将导致对总体的估计不足,精度下降。为了使精度提高,分群的原则是:分群的原则是:群内差异尽可能大,群间差异尽可能小群内差异尽可能大,群间差异尽可能小。第六页,讲稿共七十四页哦(一)(一)定义(定义(WhatWhat)将将总总体体划划分分为为若若干干群群(psus)(psus),然然后后以以群群为为抽抽样样单单元元,从从总总体体中中随随机机抽抽取取一一部部分分群群,对对被被选选群群内内
5、的的所所有有或部分单元或部分单元(ssus)(ssus)进行调查的一种抽样技术。进行调查的一种抽样技术。一、概述及符号说明一、概述及符号说明第七页,讲稿共七十四页哦(二)特点(二)特点(Why)优点:优点:1 1、抽样框抽样框编制得以编制得以简化简化。2 2、实施调查、实施调查便利、节省费用便利、节省费用。不足:不足:抽样误差抽样误差较大。较大。第八页,讲稿共七十四页哦(三)整群抽样与分层抽样(三)整群抽样与分层抽样第九页,讲稿共七十四页哦第十页,讲稿共七十四页哦1、根据、根据行政行政或者或者地域地域;2、调查人员、调查人员人为人为确定。确定。1、与总体各群规模、与总体各群规模相等相等;2、与
6、总体各群规模、与总体各群规模不等不等。(四)群的划分(四)群的划分(五)群的规模(五)群的规模第十一页,讲稿共七十四页哦(六)符号说明(六)符号说明 psus:初级抽样单元:初级抽样单元 ssus:次级抽样单元:次级抽样单元 :含有:含有N个个psu的总体的总体 S:N个个psu的总体中入样的的总体中入样的psus :psu中代表第中代表第i个入样的个入样的ssus :第:第i个个psu中的第中的第j个元素值个元素值第十二页,讲稿共七十四页哦 总体总值总体总值 psu psu间的方差间的方差(总值总值)psu-总体指标总体指标 总体中总体中psuspsus的个数的个数 总体中第总体中第i i个
7、个psupsu中中ssusssus的个数的个数 总体总体ssusssus的个数的个数 第第i i个个psupsu的总值的总值 第十三页,讲稿共七十四页哦ssu-总体指标总体指标 总体均值总体均值 第第i i个个psupsu的总体均值的总体均值 总体方差总体方差 总体第总体第i i个个psupsu内内ssussu间方差间方差 第十四页,讲稿共七十四页哦样本样本指标指标样本中样本中psuspsus的个数的个数样本中第样本中第i i个个psupsu中中ssusssus的个数的个数 第第i i个个psupsu中的样本均值中的样本均值 第第i i个个psupsu总值的估计量总值的估计量 总体总值的无偏估
8、计量总体总值的无偏估计量 样本样本psupsu间的方差间的方差 第第i i个个psupsu内内ssussu间的样本方差间的样本方差 第第i i个个psupsu中第中第j j个个ssussu样本权重样本权重第十五页,讲稿共七十四页哦 单单阶阶段段整整群群抽抽样样只只能能选选择择群群中中的的所所有有元元素素入入样样,或或者者群群中中的的所所有有元元素素均均不不入入样样。跟跟二二阶阶段段抽抽样样相相比比,抽抽取取SSUSSU的的成成本本相相对对于于抽抽取取PSUPSU的的成成本本可可忽忽略略不不计计,通通常常会将选中群的所有会将选中群的所有SSUSSU全部调查。全部调查。在在N N个个psupsu的
9、的总总体体,第第i i个个psupsu中中包包含含 个个ssussus s。在在单单阶阶段段整整群群抽抽样样中中,被被选选中中的的群群psuspsus中中所所有有ssusssus全全都都入样,即入样,即 。二、单阶段抽样二、单阶段抽样第十六页,讲稿共七十四页哦(一)群规模相等时的估计(一)群规模相等时的估计 总总体体N N个个群群中中,每每个个群群中中的的元元素素数数量量都都相相等等,即即有有 ,则则称称群群规规模模相相等等。将将群群的的总总值值看看成成是是观观测测值值,可可得得到到一一个个含含有有n n个个观观测测值值的的简简单单随随机机样样本本 ,此此时时全全体体群群群群总总值值的的均均值
10、值 。运运用用简简单单随随机机抽抽样样样样本本估估计计总总体体的的方方法法,求求出出总总体体的的总总值值。在在单单阶阶段段整整群群抽抽样样中中没没有有引引入入新新的的内内容容,我我们们利利用用了了简简单单随随机机抽抽样样的的结结果果,从从N N个个单单位位的的总总体体中中抽抽取取n n个个单单位位的的简简单单随随机机样样本本。这这里里我我们们把把群群总总值值看看成成是是简简单随机抽样中的观测值。单随机抽样中的观测值。第十七页,讲稿共七十四页哦 在住户调查中估计两口之家的收入,则个体观测值在住户调查中估计两口之家的收入,则个体观测值 为家庭为家庭i i中第中第j j个人的收入,而个人的收入,而
11、代表第代表第i i个家庭的总收入个家庭的总收入(是已知的,因为入样家庭的两个成员均已被调查是已知的,因为入样家庭的两个成员均已被调查),代表代表总体中每个家庭的平均收入,总体中每个家庭的平均收入,表示总体中每个人的平均表示总体中每个人的平均收入。收入。求总收入。求总收入。P170P170第十八页,讲稿共七十四页哦 方差为:方差为:(5.2)(5.2)标准误为:标准误为:(5.3)(5.3)其其中中 和和 分分别别代代表表总总体体psupsu间间的的方方差差和和样本样本psupsu间的方差。间的方差。1 1、估计总收入、估计总收入t t(总体总值总体总值):(5.1)第十九页,讲稿共七十四页哦
12、(5.4)(5.5.5 5)(5.5.6 6)2 2、估计、估计总体中每个人的平均收入总体中每个人的平均收入 第二十页,讲稿共七十四页哦 P171例5.2 一个学生想估计他所在宿舍楼里同学的绩点一个学生想估计他所在宿舍楼里同学的绩点(GPA)(GPA)的平均值。没有列出宿舍楼所有学生的名单再进行随机的平均值。没有列出宿舍楼所有学生的名单再进行随机抽样抽样,他发现宿舍区共有他发现宿舍区共有100100间套房间套房,每间有每间有4 4名学生;名学生;他从中随机抽取了他从中随机抽取了5 5间套房间套房,询问了其中每个人的询问了其中每个人的GPAGPA。PSUPSU就是套房,就是套房,N=100N=1
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率 抽样 讲稿
限制150内