《常用抽样方法.ppt》由会员分享,可在线阅读,更多相关《常用抽样方法.ppt(49页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于常用的抽样方法第一张,PPT共四十九页,创作于2022年6月一、单纯随机抽样(一、单纯随机抽样(simple random sampling)1、抽样方法、抽样方法 根据研究目的选定总体,首先对总体中所有的观察根据研究目的选定总体,首先对总体中所有的观察单位编号,遵循随机原则,采用不放回抽取方法,从总单位编号,遵循随机原则,采用不放回抽取方法,从总体中随机抽取一定数量观察单位组成样本。体中随机抽取一定数量观察单位组成样本。具体方法具体方法 随机数字法随机数字法 抽签法抽签法第二张,PPT共四十九页,创作于2022年6月 2、优缺点、优缺点 对所有观察单位编号,当数量大时,有难度对所有观察单
2、位编号,当数量大时,有难度 抽样误差的计算较方便抽样误差的计算较方便第三张,PPT共四十九页,创作于2022年6月 3、抽样误差的估计、抽样误差的估计 有限总体与无限总体有限总体与无限总体 总体类型总体类型 均数标准误均数标准误 率的标准误率的标准误 无限总体无限总体 有限总体有限总体 第四张,PPT共四十九页,创作于2022年6月 二、系统抽样(二、系统抽样(systematic sampling)又称等距又称等距/机械抽样机械抽样 1、抽样方法、抽样方法 先将总体的观察单位按某顺序号等分成先将总体的观察单位按某顺序号等分成n n个部分再个部分再从第一部分随机抽第从第一部分随机抽第k k号观
3、察单位,依次用相等间隔,机号观察单位,依次用相等间隔,机械地从每一部分各抽取一个观察单位组成样本。械地从每一部分各抽取一个观察单位组成样本。第五张,PPT共四十九页,创作于2022年6月 2、优缺点、优缺点(1 1)抽样方法简便)抽样方法简便(2 2)易得到一个按比例分配的样本,抽样误差较小)易得到一个按比例分配的样本,抽样误差较小(3 3)仍需对每个观察单位编号)仍需对每个观察单位编号(4 4)当观察单位按顺序有周期趋势或单调性趋势时,产生明)当观察单位按顺序有周期趋势或单调性趋势时,产生明显偏性显偏性第六张,PPT共四十九页,创作于2022年6月 3、抽样误差、抽样误差 无固定的计算公式,
4、常按单纯随机抽样方法来计算,与无固定的计算公式,常按单纯随机抽样方法来计算,与总体的性质和被抽样个体间的间隔有关。总体的性质和被抽样个体间的间隔有关。第七张,PPT共四十九页,创作于2022年6月三、整群抽样(三、整群抽样(cluster sampling)1、抽样方法、抽样方法 先将总体划分为若干个先将总体划分为若干个“群群”组,每个群包括若干个观组,每个群包括若干个观察单位,再随机抽取察单位,再随机抽取n n个群,被抽到的各群的全部观察单位则组个群,被抽到的各群的全部观察单位则组成样本。成样本。第八张,PPT共四十九页,创作于2022年6月 2、优缺点、优缺点(1 1)在较大规模的现场调查
5、中,易组织,较节省。)在较大规模的现场调查中,易组织,较节省。(2 2)若各群间的差异较大,该抽样方法的误差较大)若各群间的差异较大,该抽样方法的误差较大。3、抽样误差、抽样误差第九张,PPT共四十九页,创作于2022年6月四、分层抽样(四、分层抽样(stratified sampling)1、抽样方法、抽样方法 先将总体按某种特征分成若干层,再从每一层内先将总体按某种特征分成若干层,再从每一层内随机抽取一定数量的观察单位,合起来组成样本。随机抽取一定数量的观察单位,合起来组成样本。第十张,PPT共四十九页,创作于2022年6月(1)按比例分配:按总体各层观察单位数的多少分配)按比例分配:按总
6、体各层观察单位数的多少分配(2)最优分配:按各层观察单位数多少及其变异大小分配)最优分配:按各层观察单位数多少及其变异大小分配 第十一张,PPT共四十九页,创作于2022年6月 2、优缺点、优缺点(1 1)在一定程度上控制了抽样误差,尤其是最优分配法)在一定程度上控制了抽样误差,尤其是最优分配法(2 2)应尽量使层内差别小而层间差别大,以提高效率)应尽量使层内差别小而层间差别大,以提高效率(3 3)事先应了解各层的总体含量,最优分配还应了解标准差)事先应了解各层的总体含量,最优分配还应了解标准差第十二张,PPT共四十九页,创作于2022年6月多阶段随机抽样多阶段随机抽样第十三张,PPT共四十九
7、页,创作于2022年6月 样本含量的估计样本含量的估计第十四张,PPT共四十九页,创作于2022年6月单纯随机抽样单纯随机抽样一、先决条件一、先决条件 1 1、容许误差,预计样本统计量与相应总体参数的最、容许误差,预计样本统计量与相应总体参数的最大相差控制在什么范围。常取可信区间长度一半。大相差控制在什么范围。常取可信区间长度一半。2 2、所调查总体标准差,若不了解,须通过预试验的、所调查总体标准差,若不了解,须通过预试验的标准差标准差S S或前人的资料作出估计;或前人的资料作出估计;3 3、第一类错误的概率、第一类错误的概率 4 4、对有限总体抽样时,还须了解总体观察单位数。、对有限总体抽样
8、时,还须了解总体观察单位数。第十五张,PPT共四十九页,创作于2022年6月二、计算公式二、计算公式第十六张,PPT共四十九页,创作于2022年6月随机应答技术随机应答技术Randomized Response Techniques(RRT)第十七张,PPT共四十九页,创作于2022年6月 敏感问题敏感问题(sensitive problem)是指涉及个人是指涉及个人(或单位或单位)的隐私或利益的问题的隐私或利益的问题以及大多数人认为不便在公开场合表态或陈述的以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下,还包括一些违法犯罪的行问题,在某些情况下,还包括一些违法犯罪的行为。为。第
9、十八张,PPT共四十九页,创作于2022年6月n n敏感问题的特点:敏感问题的特点:uu一般是社会舆论导向所不认同的或反对一般是社会舆论导向所不认同的或反对的行为或观点的行为或观点uu不同特征的人群有不同的敏感问题不同特征的人群有不同的敏感问题uu不同敏感问题在敏感程度上存在差异不同敏感问题在敏感程度上存在差异n n敏感问题的分类:敏感问题的分类:uu属性特征敏感问题属性特征敏感问题属性特征敏感问题属性特征敏感问题uu数量特征敏感问题数量特征敏感问题第十九张,PPT共四十九页,创作于2022年6月 对于敏感性问题,若采用直接回答的形式,对于敏感性问题,若采用直接回答的形式,被调查者难免产生抵触
10、情绪,不愿据实回答,被调查者难免产生抵触情绪,不愿据实回答,这样导致调查数据失真、调查结果无效。这样导致调查数据失真、调查结果无效。因此寻求解决敏感性问题调查的有效方法至因此寻求解决敏感性问题调查的有效方法至关重要。关重要。第二十张,PPT共四十九页,创作于2022年6月 随机化回答是指在调查中使用特定的随机化装置,使得被调查者随机化回答是指在调查中使用特定的随机化装置,使得被调查者随机化回答是指在调查中使用特定的随机化装置,使得被调查者随机化回答是指在调查中使用特定的随机化装置,使得被调查者以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地以预定的概率来回答敏感性问题。这一技术的宗旨
11、就是最大限度地以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地以预定的概率来回答敏感性问题。这一技术的宗旨就是最大限度地为被调查者保守秘密,从而取得被调查者的信任。为被调查者保守秘密,从而取得被调查者的信任。为被调查者保守秘密,从而取得被调查者的信任。为被调查者保守秘密,从而取得被调查者的信任。RRTRRT技术的基本原理在于当被调查者确信调查者及其他人无法从被调技术的基本原理在于当被调查者确信调查者及其他人无法从被调技术的基本原理在于当被调查者确信调查者及其他人无法从被调技术的基本原理在于当被调查者确信调查者及其他人无法从被调查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进
12、行回答。查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进行回答。查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进行回答。查者的回答中获知他们的真实行为时,能更加真实地对敏感问题进行回答。并且并且并且并且RRTRRT技术保护调查对象的个人隐私,能充分得到调查对象的配技术保护调查对象的个人隐私,能充分得到调查对象的配技术保护调查对象的个人隐私,能充分得到调查对象的配技术保护调查对象的个人隐私,能充分得到调查对象的配合,最终可显著降低无应答率和误答率,得到高质量的调查结果。合,最终可显著降低无应答率和误答率,得到高质量的调查结果。合,最终可显著降低无应答率和误答率,得到高质量的调
13、查结果。合,最终可显著降低无应答率和误答率,得到高质量的调查结果。随机应答技术随机应答技术Randomized Response Techniques(RRT)第二十一张,PPT共四十九页,创作于2022年6月(一一一一)沃纳模型沃纳模型沃纳模型沃纳模型(Warner model)(Warner model)1965 1965年由年由年由年由WarnerWarner提出的,其设计思想是向被调查者显示两个与提出的,其设计思想是向被调查者显示两个与提出的,其设计思想是向被调查者显示两个与提出的,其设计思想是向被调查者显示两个与敏感性问题敏感性问题敏感性问题敏感性问题(具有特征具有特征具有特征具有特
14、征A)A)有关,但完全对立的问题,让调查者按预有关,但完全对立的问题,让调查者按预有关,但完全对立的问题,让调查者按预有关,但完全对立的问题,让调查者按预定的概率从中选一个回答,调查者无权过问被调查者回答的是哪定的概率从中选一个回答,调查者无权过问被调查者回答的是哪定的概率从中选一个回答,调查者无权过问被调查者回答的是哪定的概率从中选一个回答,调查者无权过问被调查者回答的是哪一个问题,从而起到了为被调查者保密的效果。一个问题,从而起到了为被调查者保密的效果。一个问题,从而起到了为被调查者保密的效果。一个问题,从而起到了为被调查者保密的效果。(二二二二)西蒙斯模型西蒙斯模型西蒙斯模型西蒙斯模型
15、19671967年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但年由西蒙斯提出的,其基本思想仍以沃纳模型为基础,但有一些改进,它将沃纳模型中与敏感性问题相对的具有特征有一些改进,它将沃纳模型中与敏感性问题相对的具有特征有一些改进,它将沃纳模型中与敏感性问题相对的具有特征有一些改进,它将沃纳模型中与敏感性问题相对的具有特征A A的的的的问题改为一个与敏感性问题不相关的其它问题。问题改为一个与敏感性问题不相关的其它问题。问题改为一个与敏感性问题不相关的其它问题。问题改为一个与敏感性问题不相关的其它
16、问题。(三三三三)“)“随机变量和随机变量和随机变量和随机变量和”回答模型回答模型回答模型回答模型随机化应答模型随机化应答模型第二十二张,PPT共四十九页,创作于2022年6月一、随机应答技术的步骤 设计一对问题,使两个问题的答案种数和编码完全一设计一对问题,使两个问题的答案种数和编码完全一致,应答者随机选取一个问题,将答案编码选出,在答案致,应答者随机选取一个问题,将答案编码选出,在答案上做出相应的记号。由于答卷上没有问题的编号,只有一上做出相应的记号。由于答卷上没有问题的编号,只有一套答案编码,人们无从知晓应答者回答的是哪一个问题,套答案编码,人们无从知晓应答者回答的是哪一个问题,因而起到
17、保密作用。因而起到保密作用。1 1向应答者提出一对问题向应答者提出一对问题第二十三张,PPT共四十九页,创作于2022年6月 (1)(1)两个相关联问题模式:两个相关联问题模式:两个相关联问题模式:两个相关联问题模式:设计两个相对立的陈述。设计两个相对立的陈述。设计两个相对立的陈述。设计两个相对立的陈述。例如例如例如例如 问题问题问题问题1 1:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗?是是是是 否否否否 问题问题问题问题2 2:你从未吸过毒吗:你从未吸过毒吗:你从未吸过毒吗:你从未吸过毒吗?是是是是 否否否否(2)(2)两个不相关联问题模式:两个不相关联问题模式:两个不
18、相关联问题模式:两个不相关联问题模式:第一陈述为敏感性问题,第二陈述是与第一陈述无关第一陈述为敏感性问题,第二陈述是与第一陈述无关第一陈述为敏感性问题,第二陈述是与第一陈述无关第一陈述为敏感性问题,第二陈述是与第一陈述无关的非敏感性问题,可以得到确切的答案。的非敏感性问题,可以得到确切的答案。的非敏感性问题,可以得到确切的答案。的非敏感性问题,可以得到确切的答案。例如例如例如例如 问题问题问题问题1 1:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗?是是是是 否否否否 问题问题问题问题2 2:你是工人吗:你是工人吗:你是工人吗:你是工人吗?是是是是 否否否否第二十四张,PPT
19、共四十九页,创作于2022年6月2设置一个随机装置进行调查设置一个随机装置进行调查 使用一个内装许多黑、白两色小球的匣子,使用一个内装许多黑、白两色小球的匣子,使用一个内装许多黑、白两色小球的匣子,使用一个内装许多黑、白两色小球的匣子,黑白球的比例接近黑白球的比例接近黑白球的比例接近黑白球的比例接近1 1 1 1:1 1 1 1,但不等于,但不等于,但不等于,但不等于1 1 1 1:1 1 1 1,例如可,例如可,例如可,例如可以是以是以是以是60606060和和和和40404040。混合均匀后,被调查者从匣子中随机摸取一球,混合均匀后,被调查者从匣子中随机摸取一球,混合均匀后,被调查者从匣子
20、中随机摸取一球,混合均匀后,被调查者从匣子中随机摸取一球,摸取的是黑球还是白球只有被调查者知道。若摸取摸取的是黑球还是白球只有被调查者知道。若摸取摸取的是黑球还是白球只有被调查者知道。若摸取摸取的是黑球还是白球只有被调查者知道。若摸取的是黑球,则回答第一个问题,否则,回答第二个的是黑球,则回答第一个问题,否则,回答第二个的是黑球,则回答第一个问题,否则,回答第二个的是黑球,则回答第一个问题,否则,回答第二个问题。问题。问题。问题。答卷上只有答案选择,没有题号,可按如下答卷上只有答案选择,没有题号,可按如下答卷上只有答案选择,没有题号,可按如下答卷上只有答案选择,没有题号,可按如下格式设计:格式
21、设计:格式设计:格式设计:“请将你的回答在相应的编号处请将你的回答在相应的编号处请将你的回答在相应的编号处请将你的回答在相应的编号处做上记号做上记号做上记号做上记号:是是是是 否否否否”。第二十五张,PPT共四十九页,创作于2022年6月3根据概率理论进行计算根据概率理论进行计算n n(1)(1)问题问题问题问题1 1:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗?是是是是 否否否否 问题问题问题问题2 2:你从未吸过毒吗:你从未吸过毒吗:你从未吸过毒吗:你从未吸过毒吗?是是是是 否否否否n n 假设黑球所占的比例为假设黑球所占的比例为假设黑球所占的比例为假设黑球所占的比例为
22、P P,白球所占的比例为,白球所占的比例为,白球所占的比例为,白球所占的比例为1-P1-P,应,应,应,应答者中回答答者中回答答者中回答答者中回答“是是是是”的总比例为的总比例为的总比例为的总比例为r r,那么对第一个问题回答,那么对第一个问题回答,那么对第一个问题回答,那么对第一个问题回答“是是是是”的比例的比例的比例的比例R RA A可以由下式推算:可以由下式推算:可以由下式推算:可以由下式推算:r rPRPRA A+(1-P)(1-R+(1-P)(1-RA A)R RA A=r-(1-P)/(2P-1)(1=r-(1-P)/(2P-1)(1P P0.50)0.50)第二十六张,PPT共四
23、十九页,创作于2022年6月n n(2)(2)问题问题问题问题1 1:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗:你曾经吸过毒吗?是是是是 否否否否 问题问题问题问题2 2:你是工人吗:你是工人吗:你是工人吗:你是工人吗?是是是是 否否否否n n 假设回答者中工人占的比例为假设回答者中工人占的比例为假设回答者中工人占的比例为假设回答者中工人占的比例为R RU U,则,则,则,则r r与与与与R RA A的关的关的关的关系为:系为:系为:系为:r r PRPRA A+(1-P)R+(1-P)RU U R RA Ar (1-P)Rr (1-P)RU U/P/P 第二十七张,PPT共四十九页,创
24、作于2022年6月例例14-1:欲调查某地已婚育龄妇女有无婚前性行为的欲调查某地已婚育龄妇女有无婚前性行为的比例。比例。(1)先把这项技术的意义、性质和方法,特别是其保密功先把这项技术的意义、性质和方法,特别是其保密功能,坦诚地告诉调查对象,以取得理解、信任和合作。能,坦诚地告诉调查对象,以取得理解、信任和合作。(2)问卷中设问卷中设A、B两个问题。两个问题。(3)备有一个口袋,里面装有黑白两种颜色的球备有一个口袋,里面装有黑白两种颜色的球(也可也可用围棋的黑子和白子用围棋的黑子和白子),两种球的比例不是,两种球的比例不是1:1,例如,例如可以是可以是60和和40。第二十八张,PPT共四十九页
25、,创作于2022年6月(4)(4)(4)(4)调查对象在填写答案前,先随机抽取一个球调查对象在填写答案前,先随机抽取一个球调查对象在填写答案前,先随机抽取一个球调查对象在填写答案前,先随机抽取一个球(球的颜色球的颜色球的颜色球的颜色对调查员保密对调查员保密对调查员保密对调查员保密),据球的颜色决定回答两个问题中,据球的颜色决定回答两个问题中,据球的颜色决定回答两个问题中,据球的颜色决定回答两个问题中的哪一个。的哪一个。的哪一个。的哪一个。(5)(5)(5)(5)由于调查员不知道某一对象抽取的球是什么颜色的,所由于调查员不知道某一对象抽取的球是什么颜色的,所由于调查员不知道某一对象抽取的球是什么
26、颜色的,所由于调查员不知道某一对象抽取的球是什么颜色的,所以无法知道某一对象回答的是问题以无法知道某一对象回答的是问题以无法知道某一对象回答的是问题以无法知道某一对象回答的是问题A A A A还是问题还是问题还是问题还是问题B B B B,也无,也无,也无,也无法知道调查对象的法知道调查对象的法知道调查对象的法知道调查对象的“秘密秘密秘密秘密”。(6)(6)(6)(6)设立两个问题:设立两个问题:设立两个问题:设立两个问题:问题问题问题问题A A A A:婚前有过性行为:婚前有过性行为:婚前有过性行为:婚前有过性行为?回答:回答:回答:回答:是是是是 否否否否 问题问题问题问题B B B B:
27、婚前没有性行为:婚前没有性行为:婚前没有性行为:婚前没有性行为?回答:回答:回答:回答:是是是是 否否否否 第二十九张,PPT共四十九页,创作于2022年6月(7)(7)如果调查对象抽取的球是黑色的,则回答问题如果调查对象抽取的球是黑色的,则回答问题如果调查对象抽取的球是黑色的,则回答问题如果调查对象抽取的球是黑色的,则回答问题A A;如果调查对象抽取的球是白色的,则回答问题;如果调查对象抽取的球是白色的,则回答问题;如果调查对象抽取的球是白色的,则回答问题;如果调查对象抽取的球是白色的,则回答问题B B。(8)(8)计算调查对象中婚前有性行为者的比例。计算调查对象中婚前有性行为者的比例。计算
28、调查对象中婚前有性行为者的比例。计算调查对象中婚前有性行为者的比例。第三十张,PPT共四十九页,创作于2022年6月若调查若调查200200人,回答人,回答“是是”的比例为的比例为=0.48=0.48,第三十一张,PPT共四十九页,创作于2022年6月第三十二张,PPT共四十九页,创作于2022年6月二、估计比例用的二、估计比例用的3 3种改进模型种改进模型1、模型、模型I 把问题把问题 B改为一个完全无关、答案为改为一个完全无关、答案为改为一个完全无关、答案为改为一个完全无关、答案为“是是是是”的概率是已知值的问题的概率是已知值的问题的概率是已知值的问题的概率是已知值的问题将沃纳模型中与敏感
29、性问题相对的具有特征将沃纳模型中与敏感性问题相对的具有特征A的问题改为一个与敏感性问题不相关的其它问的问题改为一个与敏感性问题不相关的其它问题。题。B BA A第三十三张,PPT共四十九页,创作于2022年6月例例例例14-:欲调查某地已婚育龄妇女有无婚前性行为的比欲调查某地已婚育龄妇女有无婚前性行为的比欲调查某地已婚育龄妇女有无婚前性行为的比欲调查某地已婚育龄妇女有无婚前性行为的比例。例。例。例。问题问题问题问题A A A A:婚前有过性行为:婚前有过性行为:婚前有过性行为:婚前有过性行为?回答:回答:回答:回答:是是是是 否否否否 问题问题问题问题B B B B:你生日(月日)除以余数是吗
30、:你生日(月日)除以余数是吗:你生日(月日)除以余数是吗:你生日(月日)除以余数是吗?回答:回答:回答:回答:是是是是 否否否否第三十四张,PPT共四十九页,创作于2022年6月有无性行为有无性行为第三十五张,PPT共四十九页,创作于2022年6月 如果黑球比例为如果黑球比例为如果黑球比例为如果黑球比例为p=60%p=60%p=60%p=60%,同时回答问题,同时回答问题,同时回答问题,同时回答问题A A A A和和和和B B B B均均均均为是的比例为是的比例为是的比例为是的比例=0.24=0.24=0.24=0.24,生日(月日)除以余数是,生日(月日)除以余数是,生日(月日)除以余数是,
31、生日(月日)除以余数是占占占占0 0 0 0=33.33%=33.33%=33.33%=33.33%,则,则,则,则第三十六张,PPT共四十九页,创作于2022年6月西蒙斯模型的不足之处西蒙斯模型的不足之处(1)是预先已知或待估计的值,是预先已知或待估计的值,的估计偏的估计偏差会增加估计方差。差会增加估计方差。(2)要提高估计精度,应增大要提高估计精度,应增大P值和减小值和减小 值。值。但随着但随着P值的增大和值的增大和值的增大和值的增大和 的减小,被调查者的疑的减小,被调查者的疑虑会增加。虑会增加。第三十七张,PPT共四十九页,创作于2022年6月2 2、模型、模型、模型、模型II II 将
32、模型将模型将模型将模型I I中设立无关联问题中设立无关联问题中设立无关联问题中设立无关联问题B B的方法改为两套抽取球的的方法改为两套抽取球的的方法改为两套抽取球的的方法改为两套抽取球的装置装置装置装置 优点:对问题优点:对问题优点:对问题优点:对问题B B回答回答回答回答“是是是是”的概率不必是已知的。的概率不必是已知的。的概率不必是已知的。的概率不必是已知的。要求调查对象抽取两次彩球和回答问题两次。要求调查对象抽取两次彩球和回答问题两次。要求调查对象抽取两次彩球和回答问题两次。要求调查对象抽取两次彩球和回答问题两次。装置中黑球的比例是装置中黑球的比例是装置中黑球的比例是装置中黑球的比例是P
33、 P1 1和和和和P P2 2,有专家建议,两者都不要取,有专家建议,两者都不要取,有专家建议,两者都不要取,有专家建议,两者都不要取0 0或或或或0.50.5,习惯,习惯,习惯,习惯k k常取常取常取常取P P2 2=1P=1P1 1。不论对于第一装置还是对于第二装量,摸到黑球者如实回答问不论对于第一装置还是对于第二装量,摸到黑球者如实回答问不论对于第一装置还是对于第二装量,摸到黑球者如实回答问不论对于第一装置还是对于第二装量,摸到黑球者如实回答问题题题题A A,摸到白球者如实回答问题,摸到白球者如实回答问题,摸到白球者如实回答问题,摸到白球者如实回答问题B B。要求调查对象在两次回答问题中
34、不能有矛盾。要求调查对象在两次回答问题中不能有矛盾。要求调查对象在两次回答问题中不能有矛盾。要求调查对象在两次回答问题中不能有矛盾。第三十八张,PPT共四十九页,创作于2022年6月例例例例14-3 14-3 对于前面所说的调查婚前性行为的研究中,假定共对于前面所说的调查婚前性行为的研究中,假定共对于前面所说的调查婚前性行为的研究中,假定共对于前面所说的调查婚前性行为的研究中,假定共480480名调查对象。名调查对象。名调查对象。名调查对象。问题问题问题问题A A:你在婚前有过性行为吗:你在婚前有过性行为吗:你在婚前有过性行为吗:你在婚前有过性行为吗?回答回答回答回答 是是是是 否否否否 。问
35、题问题问题问题B B:你在这:你在这:你在这:你在这3 3天内是吃过鱼吗天内是吃过鱼吗天内是吃过鱼吗天内是吃过鱼吗?回答回答回答回答 是是是是 否否否否 。第三十九张,PPT共四十九页,创作于2022年6月第四十张,PPT共四十九页,创作于2022年6月第四十一张,PPT共四十九页,创作于2022年6月课本上有误课本上有误第四十二张,PPT共四十九页,创作于2022年6月第四十三张,PPT共四十九页,创作于2022年6月两次试验模型的主要缺陷两次试验模型的主要缺陷(1)若对同一批被调查者试验两次,他们两次回答的结果必具有相关性,从若对同一批被调查者试验两次,他们两次回答的结果必具有相关性,从而
36、破坏了模型的随机性。但如果对两批被调查者分别进行试验,又不容易而破坏了模型的随机性。但如果对两批被调查者分别进行试验,又不容易保证两次的结构具有相似性,从而产生较大误差。保证两次的结构具有相似性,从而产生较大误差。(2)方差方差V()是两次试验产生的方差之和,在相同条件下,它比西蒙斯是两次试验产生的方差之和,在相同条件下,它比西蒙斯模型的方差要大得多。模型的方差要大得多。(3)P1和和P2不能太接近。当不能太接近。当p1=p2时,模型就没有意义了。要减小时,模型就没有意义了。要减小方差方差V(),就应该增大,就应该增大P1而减小而减小P2,但当,但当p1增得过大时,增得过大时,又会减又会减少被
37、调查者的配合。少被调查者的配合。第四十四张,PPT共四十九页,创作于2022年6月3模型模型模型模型III 本方法的优点是不需要设立非敏感问题。但是球本方法的优点是不需要设立非敏感问题。但是球本方法的优点是不需要设立非敏感问题。但是球本方法的优点是不需要设立非敏感问题。但是球的颜色要有的颜色要有的颜色要有的颜色要有3 3 3 3种种种种(红、黑、白红、黑、白红、黑、白红、黑、白)。每种球的比例是已知的。每种球的比例是已知的。每种球的比例是已知的。每种球的比例是已知的(P(P(P(P3 3 3 31-P1-P1-P1-P1 1 1 1-P-P-P-P2 2 2 2),要求摸到红球者如实回答问题,
38、摸,要求摸到红球者如实回答问题,摸,要求摸到红球者如实回答问题,摸,要求摸到红球者如实回答问题,摸到黑球者全部回答到黑球者全部回答到黑球者全部回答到黑球者全部回答“是是是是”,摸到白球者全部回答,摸到白球者全部回答,摸到白球者全部回答,摸到白球者全部回答“否否否否”。第四十五张,PPT共四十九页,创作于2022年6月第四十六张,PPT共四十九页,创作于2022年6月 例例例例14-4 14-4 14-4 14-4 如调查一批与媳妇一起生活的婆婆如调查一批与媳妇一起生活的婆婆如调查一批与媳妇一起生活的婆婆如调查一批与媳妇一起生活的婆婆,问婆问婆问婆问婆媳关系好不好。媳关系好不好。媳关系好不好。媳
39、关系好不好。红、黑、白球的比例是红、黑、白球的比例是红、黑、白球的比例是红、黑、白球的比例是0.50.50.50.5、0.30.30.30.3和和和和0.20.20.20.2。最后问。最后问。最后问。最后问答答答答“是是是是”的比例为的比例为的比例为的比例为55555555,要求估计婆婆真正认为,要求估计婆婆真正认为,要求估计婆婆真正认为,要求估计婆婆真正认为婆媳关系不好的比例。婆媳关系不好的比例。婆媳关系不好的比例。婆媳关系不好的比例。第四十七张,PPT共四十九页,创作于2022年6月敏感问题调查注意事项敏感问题调查注意事项 调查者态度端庄、和蔼,通俗语言调查者态度端庄、和蔼,通俗语言调查者态度端庄、和蔼,通俗语言调查者态度端庄、和蔼,通俗语言 向被调查者解释调查的目的与调查的意义,争取得到向被调查者解释调查的目的与调查的意义,争取得到向被调查者解释调查的目的与调查的意义,争取得到向被调查者解释调查的目的与调查的意义,争取得到其信任和支持其信任和支持其信任和支持其信任和支持 巧妙提问,避免转折太大巧妙提问,避免转折太大巧妙提问,避免转折太大巧妙提问,避免转折太大第四十八张,PPT共四十九页,创作于2022年6月感谢大家观看第四十九张,PPT共四十九页,创作于2022年6月
限制150内