常用的抽样方法PPT讲稿.ppt
《常用的抽样方法PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《常用的抽样方法PPT讲稿.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、常用的抽样方法第1页,共49页,编辑于2022年,星期六一、单纯随机抽样(一、单纯随机抽样(simple random sampling)1、抽样方法、抽样方法 根据研究目的选定总体,首先对总体中所有的观察单位根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。抽取一定数量观察单位组成样本。具体方法具体方法 随机数字法随机数字法 抽签法抽签法第2页,共49页,编辑于2022年,星期六 2、优缺点、优缺点 对所有观察单位编号,当数量大时,有难度对所有观察单位编号,当数
2、量大时,有难度 抽样误差的计算较方便抽样误差的计算较方便第3页,共49页,编辑于2022年,星期六 3、抽样误差的估计、抽样误差的估计 有限总体与无限总体有限总体与无限总体 总体类型总体类型 均数标准误均数标准误 率的标准误率的标准误 无限总体无限总体 有限总体有限总体 第4页,共49页,编辑于2022年,星期六 二、系统抽样(二、系统抽样(systematic sampling)又称等距又称等距/机械抽样机械抽样 1、抽样方法、抽样方法 先将总体的观察单位按某顺序号等分成先将总体的观察单位按某顺序号等分成n n个部分再从第个部分再从第一部分随机抽第一部分随机抽第k k号观察单位,依次用相等间
3、隔,机械地号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本。从每一部分各抽取一个观察单位组成样本。第5页,共49页,编辑于2022年,星期六 2、优缺点、优缺点(1 1)抽样方法简便)抽样方法简便(2 2)易得到一个按比例分配的样本,抽样误差较小)易得到一个按比例分配的样本,抽样误差较小(3 3)仍需对每个观察单位编号)仍需对每个观察单位编号(4 4)当观察单位按顺序有周期趋势或单调性趋势时,产)当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性生明显偏性第6页,共49页,编辑于2022年,星期六 3、抽样误差、抽样误差 无固定的计算公式,常按单纯随机抽样方法来计算,
4、与总体无固定的计算公式,常按单纯随机抽样方法来计算,与总体的性质和被抽样个体间的间隔有关。的性质和被抽样个体间的间隔有关。第7页,共49页,编辑于2022年,星期六三、整群抽样(三、整群抽样(cluster sampling)1、抽样方法、抽样方法 先将总体划分为若干个先将总体划分为若干个“群群”组,每个群包括若干个观察组,每个群包括若干个观察单位,再随机抽取单位,再随机抽取n n个群,被抽到的各群的全部观察单位则组成个群,被抽到的各群的全部观察单位则组成样本。样本。第8页,共49页,编辑于2022年,星期六 2、优缺点、优缺点(1 1)在较大规模的现场调查中,易组织,较节省。)在较大规模的现
5、场调查中,易组织,较节省。(2 2)若各群间的差异较大,该抽样方法的误差较大)若各群间的差异较大,该抽样方法的误差较大。3、抽样误差、抽样误差第9页,共49页,编辑于2022年,星期六四、分层抽样(四、分层抽样(stratified sampling)1、抽样方法、抽样方法 先将总体按某种特征分成若干层,再从每一层内随先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。机抽取一定数量的观察单位,合起来组成样本。第10页,共49页,编辑于2022年,星期六(1)按比例分配:按总体各层观察单位数的多少分配)按比例分配:按总体各层观察单位数的多少分配(2)最优分配:
6、按各层观察单位数多少及其变异大小分配)最优分配:按各层观察单位数多少及其变异大小分配 第11页,共49页,编辑于2022年,星期六 2、优缺点、优缺点(1 1)在一定程度上控制了抽样误差,尤其是最优分配法)在一定程度上控制了抽样误差,尤其是最优分配法(2 2)应尽量使层内差别小而层间差别大,以提高效率)应尽量使层内差别小而层间差别大,以提高效率(3 3)事先应了解各层的总体含量,最优分配还应了解标准差)事先应了解各层的总体含量,最优分配还应了解标准差第12页,共49页,编辑于2022年,星期六多阶段随机抽样多阶段随机抽样第13页,共49页,编辑于2022年,星期六 样本含量的估计样本含量的估计
7、第14页,共49页,编辑于2022年,星期六单纯随机抽样单纯随机抽样一、先决条件一、先决条件 1 1、容许误差,预计样本统计量与相应总体参数的、容许误差,预计样本统计量与相应总体参数的最大相差控制在什么范围。常取可信区间长度一半。最大相差控制在什么范围。常取可信区间长度一半。2 2、所调查总体标准差,若不了解,须通过预、所调查总体标准差,若不了解,须通过预试验的标准差试验的标准差S S或前人的资料作出估计;或前人的资料作出估计;3 3、第一类错误的概率、第一类错误的概率 4 4、对有限总体抽样时,还须了解总体观察单位数。、对有限总体抽样时,还须了解总体观察单位数。第15页,共49页,编辑于20
8、22年,星期六二、计算公式二、计算公式第16页,共49页,编辑于2022年,星期六随机应答技术随机应答技术Randomized Response Techniques(RRT)第17页,共49页,编辑于2022年,星期六 敏感问题敏感问题(sensitive problem)是指涉及个人是指涉及个人(或单位或单位)的隐私或利益的的隐私或利益的问题以及大多数人认为不便在公开场合表问题以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括态或陈述的问题,在某些情况下,还包括一些违法犯罪的行为。一些违法犯罪的行为。第18页,共49页,编辑于2022年,星期六n n敏感问题的特点:敏感问
9、题的特点:uu一般是社会舆论导向所不认同的或反一般是社会舆论导向所不认同的或反对的行为或观点对的行为或观点uu不同特征的人群有不同的敏感问题不同特征的人群有不同的敏感问题uu不同敏感问题在敏感程度上存在差异不同敏感问题在敏感程度上存在差异n n敏感问题的分类:敏感问题的分类:uu属性特征敏感问题属性特征敏感问题uu数量特征敏感问题数量特征敏感问题第19页,共49页,编辑于2022年,星期六 对于敏感性问题,若采用直接回答的形对于敏感性问题,若采用直接回答的形式,被调查者难免产生抵触情绪,不愿据式,被调查者难免产生抵触情绪,不愿据实回答,这样导致调查数据失真、调查结实回答,这样导致调查数据失真、
10、调查结果无效。果无效。因此寻求解决敏感性问题调查的有效方因此寻求解决敏感性问题调查的有效方法至关重要。法至关重要。第20页,共49页,编辑于2022年,星期六 随机化回答是指在调查中使用特定的随机化装置,使得被调随机化回答是指在调查中使用特定的随机化装置,使得被调随机化回答是指在调查中使用特定的随机化装置,使得被调随机化回答是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地为被调查
11、者保守秘密,从而取得被调查者的信任。大限度地为被调查者保守秘密,从而取得被调查者的信任。大限度地为被调查者保守秘密,从而取得被调查者的信任。大限度地为被调查者保守秘密,从而取得被调查者的信任。RRTRRT技术的基本原理在于当被调查者确信调查者及其他人无技术的基本原理在于当被调查者确信调查者及其他人无技术的基本原理在于当被调查者确信调查者及其他人无技术的基本原理在于当被调查者确信调查者及其他人无法从被调查者的回答中获知他们的真实行为时,能更加真实地法从被调查者的回答中获知他们的真实行为时,能更加真实地法从被调查者的回答中获知他们的真实行为时,能更加真实地法从被调查者的回答中获知他们的真实行为时,
12、能更加真实地对敏感问题进行回答。并且对敏感问题进行回答。并且对敏感问题进行回答。并且对敏感问题进行回答。并且RRTRRT技术保护调查对象的个人隐私,技术保护调查对象的个人隐私,技术保护调查对象的个人隐私,技术保护调查对象的个人隐私,能充分得到调查对象的配合,最终可显著降低无应答率和误答能充分得到调查对象的配合,最终可显著降低无应答率和误答能充分得到调查对象的配合,最终可显著降低无应答率和误答能充分得到调查对象的配合,最终可显著降低无应答率和误答率,得到高质量的调查结果。率,得到高质量的调查结果。率,得到高质量的调查结果。率,得到高质量的调查结果。随机应答技术随机应答技术Randomized R
13、esponse Techniques(RRT)第21页,共49页,编辑于2022年,星期六(一一一一)沃纳模型沃纳模型沃纳模型沃纳模型(Warner model)(Warner model)1965 1965年由年由年由年由WarnerWarner提出的,其设计思想是向被调查者显示两个与提出的,其设计思想是向被调查者显示两个与提出的,其设计思想是向被调查者显示两个与提出的,其设计思想是向被调查者显示两个与敏感性问题敏感性问题敏感性问题敏感性问题(具有特征具有特征具有特征具有特征A)A)有关,但完全对立的问题,让调查者按预定有关,但完全对立的问题,让调查者按预定有关,但完全对立的问题,让调查者按
14、预定有关,但完全对立的问题,让调查者按预定的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问题,从而起到了为被调查者保密的效果。题,从而起到了为被调查者保密的效果。题,从而起到了为被调查者保密的效果。题,从而起到了为被调查者保密的效果。(二二二二)西蒙斯模型西蒙斯模型西蒙斯模型西蒙斯模型 19671967年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,年由西蒙
15、斯提出的,其基本思想仍以沃纳模型为基础,年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但有一些改进,它将沃纳模型中与敏感性问题相对的具有特但有一些改进,它将沃纳模型中与敏感性问题相对的具有特但有一些改进,它将沃纳模型中与敏感性问题相对的具有特但有一些改进,它将沃纳模型中与敏感性问题相对的具有特征征征征A A的问题改为一个与敏感性问题不相关的其它问题。的问题改为一个与敏感性问题不相关的其它问题。的问题改为一个与敏感性问题不相关的其它问题。的问题改为一个与敏感性问题不相关的其它问题。(三三三三)“)“随机变量和随机变量和随机变量和随机变量和”回答模型回答模型回答模型回答模型随机化应答模型随机化应
16、答模型第22页,共49页,编辑于2022年,星期六一、随机应答技术的步骤 设计一对问题,使两个问题的答案种数和编码完全一设计一对问题,使两个问题的答案种数和编码完全一致,应答者随机选取一个问题,将答案编码选出,在答致,应答者随机选取一个问题,将答案编码选出,在答案上做出相应的记号。由于答卷上没有问题的编号,只案上做出相应的记号。由于答卷上没有问题的编号,只有一套答案编码,人们无从知晓应答者回答的是哪一个有一套答案编码,人们无从知晓应答者回答的是哪一个问题,因而起到保密作用。问题,因而起到保密作用。1 1向应答者提出一对问题向应答者提出一对问题第23页,共49页,编辑于2022年,星期六 (1)
17、两个相关联问题模式:两个相关联问题模式:设计两个相对立的陈述。设计两个相对立的陈述。例如例如 问题问题1:你曾经吸过毒吗:你曾经吸过毒吗?是是 否否 问题问题2:你从未吸过毒吗:你从未吸过毒吗?是是 否否(2)(2)两个不相关联问题模式:两个不相关联问题模式:两个不相关联问题模式:两个不相关联问题模式:第一陈述为敏感性问题,第二陈述是与第一陈述无关第一陈述为敏感性问题,第二陈述是与第一陈述无关第一陈述为敏感性问题,第二陈述是与第一陈述无关第一陈述为敏感性问题,第二陈述是与第一陈述无关的非敏感性问题,可以得到确切的答案。的非敏感性问题,可以得到确切的答案。的非敏感性问题,可以得到确切的答案。的非
18、敏感性问题,可以得到确切的答案。例如例如例如例如 问题问题问题问题1 1:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗?是是是是 否否否否 问题问题问题问题2 2:你是工人吗:你是工人吗:你是工人吗:你是工人吗?是是是是 否否否否第24页,共49页,编辑于2022年,星期六2设置一个随机装置进行调查设置一个随机装置进行调查 使用一个内装许多黑、白两色小球的匣子,黑使用一个内装许多黑、白两色小球的匣子,黑使用一个内装许多黑、白两色小球的匣子,黑使用一个内装许多黑、白两色小球的匣子,黑白球的比例接近白球的比例接近白球的比例接近白球的比例接近1 1 1 1:1 1 1 1,但不等于
19、,但不等于,但不等于,但不等于1 1 1 1:1 1 1 1,例如可,例如可,例如可,例如可以是以是以是以是60606060和和和和40404040。混合均匀后,被调查者从匣子中随机摸取一混合均匀后,被调查者从匣子中随机摸取一混合均匀后,被调查者从匣子中随机摸取一混合均匀后,被调查者从匣子中随机摸取一球,摸取的是黑球还是白球只有被调查者知道。球,摸取的是黑球还是白球只有被调查者知道。球,摸取的是黑球还是白球只有被调查者知道。球,摸取的是黑球还是白球只有被调查者知道。若摸取的是黑球,则回答第一个问题,否则,若摸取的是黑球,则回答第一个问题,否则,若摸取的是黑球,则回答第一个问题,否则,若摸取的是
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 抽样 方法 PPT 讲稿
限制150内