抽样方法与样本量估计课件.ppt
《抽样方法与样本量估计课件.ppt》由会员分享,可在线阅读,更多相关《抽样方法与样本量估计课件.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、抽样方法与样本量估计抽样方法与样本量估计张文斌张文斌2013.122013.121A为什么要抽样为什么要抽样抽样:经济、有效,是科学的。抽样:经济、有效,是科学的。2A抽样方法创始人抽样方法创始人-盖洛普盖洛普乔治乔治盖洛普(盖洛普(Gallup,GeorgeHoraceGallup,GeorgeHorace,1901198419011984,美国数学家),美国数学家)盖洛普1925-1928年就读爱荷华州立大学(文学学士、心理学硕士、新闻学博士)。他的博士论文题目是应用客观方法衡量读者对报纸兴趣的一种新技术,这篇论文包含着后来发展为盖洛普民意测验和舆论统计的思想。1955年,盖洛普在新泽西州
2、的普林斯顿创立美国舆论研究所,正式举办有关政治和社会事业问题的各种全国性民意调查包括对世界人民的态度、恐惧、希望、宗教信仰和风俗刁惯等的调查。这个研究所的成立,迅速使盖洛普民意测验具有了权威性,该研究所也称为盖洛普民意测验所。3A盖洛普的成功盖洛普的成功4A盖洛普方法 盖洛普使用的民意调查方法是一种代表性抽样调查方法,是他在从事新闻工作中发展起来的,根据对象的年龄、性别、教育程度、职业等标准,在全国各地区按比例选择测验对象,派调查员亲自去调查访问,根据统计测验结果进行分析,做出说明。这种方法就是所谓的“定额抽样法”,即将总体各单位按某些主要标识划分类型后抽取比例样本,是一种非概率抽样。5A抽样
3、调查的特点抽样调查的特点特点特点1 1:抽取的样本作为一个“代表团”来代表总体。而不是随意挑选的个别单位代表总体。特点特点2 2:调查样本一般按随机的原则抽取,在总体中每个单位被抽取的机会相等。因此被抽中的单位在总体中是均匀分布的,不致出现倾向性误差,代表性强。特点特点3 3:所抽取的调查样本数量是根据误差的要求并经过科学的计算确定,在调查样本的数量上有可靠保证。特点特点4 4:抽样误差在调查前就可以根据样本量和总体中各单位之间的差异程度进行计算,并控制在允许范围内,调查结果的准确程度较高。6A一、定义总体一、定义总体二、确定抽样框架二、确定抽样框架三、选择抽样技术三、选择抽样技术四、确定样本
4、容量四、确定样本容量五、执行抽样过程五、执行抽样过程抽样设计过程7A抽样调查的主要问题抽样调查的主要问题8A抽样误差 抽样调查目的是用样本调查数据推断总体。但任何样本数据推断总体,都不可能得到确切的总体真值。即存在抽样误差。抽样调查理论基础在于用样本数据估计的总体值与总体真值之间的误差,不会影响数据的使用和对问题的决策。9A如何正确认识抽样误差?调查数据存在着误差是绝对的,而误差的大小是相对的,其相对性取决于研究的问题和需要的决策。在抽样方案设计时,需要对调查主要指标有一个误差的要求,即样本的抽样误差控制在什么范围,使其调查数据的使用对分析和决策问题没有影响或影响很小。这一误差标准没有统一的规
5、定,取决于数据使用者分析问题与决策的要求。指标相对误差很小,数据精度太高,样本量需求量大;指标相对误差很大,精度太低,对使用者来讲数据不能用。10A对抽样误差认识与使用的误区对抽样误差认识与使用的误区 一些研究者甚至部分官员不愿意或不习惯接受数据的误差范围,一谈到误差,惟恐别人说数据不准,将数据误差绝对。由于对数据误差的认识存在着误区,在如何使用数据上也存在着误区。抽样调查的数据拿来就用,不谈抽样误差和调查误差,认为调查数据就是总体的真值。在进行工作政绩考核或进行地区间的数据对比时,调查指标数据的高低变成了地区之间排队、政绩评比的依据,忽视了对数据误差的评估。现有的调查数据不仅没有正确地使用,
6、反而还带来地区之间数据高低的相互攀比,同时也影响了以后抽样调查的数据质量。11A如何确定恰当的抽样误差?有专家认为,抽样调查估计值的相对误差控制在以内,数据质量好,控制以内,数据质量较好,控制 以内,数据可用。一些国家在进行国家级抽样调查时,给出主要调查指标相对误差应控制的范围,规定了估计值的相对误差超过不能公布。12A案例案例1 某研究论文中按“病情和就诊的先后顺序分组”。因病人就诊的先后顺序往往暗示其病情不同,尤其是当病人的病情轻重难以判断时若将先来就诊者分在一组,后来就诊者分在另一组,就不可避免的引入顺序误差(即一组病人的病情较另一组病人的病情重),从而得出错误结论。13A案例2牛宏俐:
7、设计600户,实际只有435户(原因是拒访)胡瑞:按地区东中西(共6个县)、按县乡卫生机构(医院1-2所,卫生院10家),共抽取262人,按30%扩大样本至360人。14A案例3 研究者用15个对象做试验,先按药物作用时间长短随机均分成5组,每组3个对象;接着又按药物的3种剂量将每组中的3个对象再均分成3个小组,每小组仅有1个对象。这个试验研究中的样本含量应当是15?还是1呢?15A 常用的抽样方法常用的抽样方法抽样方法抽样方法概率抽样非概率抽样单纯系统分层整群方便滚雪球配额典型另外:不等概率抽样方法(probability proportional to size,PPS)16A便利抽样 以
8、研究者或访问者方便来选择被访者,通常被访者由于碰以研究者或访问者方便来选择被访者,通常被访者由于碰巧在恰当的时间正处在恰当的地点而被选中巧在恰当的时间正处在恰当的地点而被选中使用学生以及社会组织成员;使用学生以及社会组织成员;医院拦截患者;医院拦截患者;“街上的行人街上的行人”访谈。访谈。优点:便利抽样在所有抽样技术中成本最低、耗时最少,抽样优点:便利抽样在所有抽样技术中成本最低、耗时最少,抽样单位易于接近;单位易于接近;缺点:不能代表总体。缺点:不能代表总体。17A配额抽样 配额抽样可以被看成两阶段有约束的判断抽样配额抽样可以被看成两阶段有约束的判断抽样第一阶段,由确定总体中的个体的控制类别
9、或者配额组成,第一阶段,由确定总体中的个体的控制类别或者配额组成,配额确保了样本的组成与总体的组成在特定特征方面相同;配额确保了样本的组成与总体的组成在特定特征方面相同;第二阶段,样本个体在便利或者判断的基础上被选择出来第二阶段,样本个体在便利或者判断的基础上被选择出来缺点是缺点是:缺乏对总体的代表性,无法计算抽样误差;缺乏对总体的代表性,无法计算抽样误差;优点是优点是:低成本,为每个配额选择个体对访谈人员而言较为容易。低成本,为每个配额选择个体对访谈人员而言较为容易。18A滚雪球抽样 通常是先选出一组最初的调查对象,通常是随机选出的,通常是先选出一组最初的调查对象,通常是随机选出的,在访谈之
10、后,要求这些被访者推荐一些属于目标总体的其他在访谈之后,要求这些被访者推荐一些属于目标总体的其他人,根据这些推选出后面的被访者。与随机的方式相比,被人,根据这些推选出后面的被访者。与随机的方式相比,被推举的人将具备与推荐人更为翔实的人口及心理特征。推举的人将具备与推荐人更为翔实的人口及心理特征。优点是:主要目的是估计总体中非常稀少的某些特征。优点是:主要目的是估计总体中非常稀少的某些特征。缺点是:这种方式非常耗时。缺点是:这种方式非常耗时。19A概率抽样与非概率抽样间作抉择决择考虑方面决择考虑方面有利于使用的条件有利于使用的条件非概率抽样非概率抽样概率抽样概率抽样研究的性质研究的性质探索性探索
11、性描述性描述性抽样误差与非抽样误差的相对大小抽样误差与非抽样误差的相对大小非抽样误差较大非抽样误差较大抽样误差较大抽样误差较大总体的变异程度总体的变异程度同质(低)同质(低)异质(高)异质(高)统计上的考虑统计上的考虑不利不利有利有利操作上的考虑操作上的考虑有利有利不利不利20A第四次卫生服务调查(家庭健康调查)第四次卫生服务调查(家庭健康调查)方法:多阶段分层整群抽样方法:多阶段分层整群抽样多阶段:多阶段:省(直辖市)县(市、区)乡(街道)行政村(居委会)户分层:分层:地理位置(东、中、西),城乡结构(城市按大、中、小;农村按经济因素分1、2、3、4类地区),家庭收入(5个等级)整群:整群:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 方法 样本 估计 课件
限制150内