抽样方法精选PPT.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《抽样方法精选PPT.ppt》由会员分享,可在线阅读,更多相关《抽样方法精选PPT.ppt(101页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、关于抽样方法第1页,讲稿共101张,创作于星期一 非非概概率率抽抽样样的的用用途途是是有有限限的的,因因为为抽抽选选单单元元的的倾倾向向性性不不允允许许对对调调查查总总体体进进行行推推断断。然然而而非非概概率率抽抽样样快快速速简简便便,对对探探索索性性研研究究很很有有用用,特特别别是是在在市市场场调调查查中中应应用用非非常常广广泛泛。第2页,讲稿共101张,创作于星期一 一、非概率抽样一、非概率抽样 非非概概率率抽抽样样是是用用主主观观的的(非非随随机机的的)方方法法从从总总体体中中抽抽选选单单元元,是是一一种种快快速速、简简易易且且节节省省的的从从总总体体中中选选取取样本单元的方法。样本单元
2、的方法。要要对对总总体体进进行行推推断断需需要要对对样样本本进进行行一一些些假假定定,即即要要求求样样本本对对总总体体具具有有代代表表性性。在在这这点点上上非非概概率率抽抽样样一般不具备。一般不具备。第3页,讲稿共101张,创作于星期一n 由由于于非非概概率率抽抽样样抽抽取取样样本本有有倾倾向向性性与与偏偏差差且且没没有有一一个个抽抽样样框框,不不可可能能计计算算出出各各个个单单元元的的入入样样概概率率。从从而而无无法法得得到到总总体体目目标标量量的的可可靠靠估估计计值值及及其抽样误差估计值。其抽样误差估计值。第4页,讲稿共101张,创作于星期一非概率抽样能用在下面几个方面的研究中:非概率抽样
3、能用在下面几个方面的研究中:n用来形成一种想法;用来形成一种想法;n作为设计开发概率抽样调查的初始步骤;作为设计开发概率抽样调查的初始步骤;n在后续步骤中帮助理解概率抽样调查结在后续步骤中帮助理解概率抽样调查结果。果。n有有时时,非非概概率率抽抽样样是是唯唯一一可可行行的的选选择择。例例如如,在在医医学学实实验验中中,采采用用志志愿愿者者抽抽样样可能是取得数据的唯一途径。可能是取得数据的唯一途径。第5页,讲稿共101张,创作于星期一n非非概概率率抽抽样样常常被被用用于于抽抽选选参参加加焦焦点点座谈和深入访问的个人。座谈和深入访问的个人。n另另一一个个能能较较好好发发挥挥非非概概率率抽抽样样作作
4、用用的例子是预研究。的例子是预研究。第6页,讲稿共101张,创作于星期一 非概率抽样的优点是:非概率抽样的优点是:n快速简便;快速简便;n费用相对较低;费用相对较低;n不需要抽样框;不需要抽样框;n对探索性研究和调查的设计开发很有用。对探索性研究和调查的设计开发很有用。第7页,讲稿共101张,创作于星期一非概率抽样的缺点是:非概率抽样的缺点是:n为为了了对对总总体体进进行行推推断断,需需要要对对样样本本的的代表性做很强的假定。代表性做很强的假定。n不可能得到可靠的估计值以及抽样误不可能得到可靠的估计值以及抽样误差估计值。差估计值。第8页,讲稿共101张,创作于星期一 非概率抽样的种类非概率抽样
5、的种类n 非概率抽样方法有五种:非概率抽样方法有五种:n随意抽样随意抽样n自愿抽样自愿抽样n判断抽样判断抽样n配额抽样配额抽样n修正的概率抽样。修正的概率抽样。第9页,讲稿共101张,创作于星期一 1.随意抽样随意抽样n随随意意抽抽样样的的样样本本单单元元的的抽抽选选以以无无目目标标、随随意意的的方方式式进进行行,几几乎乎没没有有或或完全没有计划。完全没有计划。n它它假假定定总总体体是是同同质质的的,即即总总体体单单元元都相似。比如都相似。比如“街道拦截街道拦截”访问法。访问法。第10页,讲稿共101张,创作于星期一 2.志愿者抽样志愿者抽样n 被调查者都是志愿者。被调查者都是志愿者。n例例如
6、如具具有有特特定定病病情情的的人人参参加加某某些些医医疗疗实实验验;打打电电话话参参与与广广播播或或电电视视节节目目的的人人;抽抽选选参参加加焦焦点点座座谈谈或或深深入入访访问问的的人。人。第11页,讲稿共101张,创作于星期一 3.判断抽样判断抽样n由由专专家家有有目目的的地地抽抽选选有有代代表表性性的的样样本本。它适用于探索性研究,它适用于探索性研究,n如如:抽抽选选参参加加焦焦点点座座谈谈或或深深入入访访谈谈的的人,但不宜用在试调查中。人,但不宜用在试调查中。第12页,讲稿共101张,创作于星期一 4.配额抽样配额抽样n 这这是是最最常常见见的的一一种种非非概概率率抽抽样样。抽抽样样要要
7、从从各各个个子子总总体体中中选选取取特特定定数数量量的的单单元元(配配额额)。总样本量:总样本量:900人人18-2526-3031-3536-4041-45男男女女比例比例28%17%17%19%19%50-55%50-45%第13页,讲稿共101张,创作于星期一 1936年总统选举预测得票率 单候候 选选 人人 实际得票率实际得票率 文摘文摘杂志预测杂志预测 盖洛普预测盖洛普预测 罗斯福罗斯福 602 430 540 兰兰 登登 398 570 460 合合 计计 1000 1000 1000 那么,那么,文摘文摘杂志失败,盖洛普成功的原因究竟何在呢杂志失败,盖洛普成功的原因究竟何在呢?第
8、14页,讲稿共101张,创作于星期一n盖盖洛洛普普采采用用的的是是一一种种叫叫作作“分分配配法法的的方方法法。这这种种方方法法力力求求使使调调查查对对象象在在州州,市市,镇镇,村村的的大大小小,年年龄龄,性性别别、社社会会阶阶层层,人人种种等等方方面面,能能准准确确地地代代表表美美国国的的所所有有选选民民。例例如如,如如果果二二十十几几岁岁的的人人占占全全体体选选民民的的27%,那那么么在在3000人人的的调调查查对对象象中中,二二十十几几岁岁的的人人也也应应占占27%,即即810人人。为为确确保保所所分分配配的的比比率率不不致致出出错错,务务必必要要求求调调查查员员直直接接面面见见调调查查对
9、对象象,以以便便确确认认。因因此此,调调查查的的实实施施多多采取访问调查的方法。采取访问调查的方法。第15页,讲稿共101张,创作于星期一 盖盖洛洛普普应应用用分分配配法法进进行行总总统统选选举举颅颅测测调调查查获获得得极极大大成成功功以以后后,该该方方法法开开始始被被广广泛泛应应用用于于民民意意调调查查和和市市场场调调查查。可可是是在在19481948年年的的总总统统选选举举中中,采采用用同同样样方方法法预预言言杜杜威威将将当当选选,结结果果与与预预测测恰恰恰恰相相反反,杜杜鲁鲁门门当当选选了。了。预预 测测 实际实际 候选人候选人 Crossley Gallup Roper Crossle
10、y Gallup Roper 结果结果杜鲁门杜鲁门 45%44%38%50%45%44%38%50%杜威杜威 50%50%53%45%50%50%53%45%第16页,讲稿共101张,创作于星期一从从此此,盖盖洛洛普普失失去去了了在在民民意意调调查查界界神神话话般般的的地地位位。不不仅仅如如此此,其其它它调调查查机机构构也也都都出出现现了了同同样样的的失失败败。人人们们开开始始向向民民意意调调查查投投来来了了怀怀疑疑的的目目光光。于于是是,由由许许多多学学者者和和专专家家组组成成了了一一个个委委员员会会,对对失失败败的的原原因因进进行行了了研研究。结果指出分配法的下列缺点:究。结果指出分配法的
11、下列缺点:第17页,讲稿共101张,创作于星期一因此,不可避免调查员的爱好,调查对象对访问的配因此,不可避免调查员的爱好,调查对象对访问的配合程度等因素的影响。即使在年龄,社会阶层等分配合程度等因素的影响。即使在年龄,社会阶层等分配调查对象时考虑到了的几个特征上,调查对象能完全调查对象时考虑到了的几个特征上,调查对象能完全代表全体选民,但其他特征还是可能出现偏差。研究代表全体选民,但其他特征还是可能出现偏差。研究结果,随机抽样方法作为消除分配法主观因素影响的结果,随机抽样方法作为消除分配法主观因素影响的手段开始受到重视。手段开始受到重视。第19页,讲稿共101张,创作于星期一盖洛普后来的成功盖
12、洛普后来的成功采用概率抽样采用概率抽样年份年份 样本容量样本容量 获胜后选人获胜后选人 盖洛普盖洛普 选举结果选举结果 误差误差 预测值预测值 1952 5385 艾森豪威尔 51%55.4%+4.4%1956 8144 艾森豪威尔 59.5%57.8%-1.7%1960 8015 肯尼迪 51%50.1%0.1%1964 6625 约翰逊 64%61.3%-2.7%1968 4414 尼克松 43%43.5%0.5%1972 3689 尼克松 62%61.8%-0.2%1976 3439 卡特 49.5%51.1%1.6%1980 3500 里根 55.3%51.6%-3.7%1984 34
13、56 里根 59.0%59.2%0.2%1988 4089 布什 56.0%53.9%-2.1%第20页,讲稿共101张,创作于星期一 5.修正的概率抽样修正的概率抽样n 修修正正的的概概率率抽抽样样是是概概率率抽抽样样与与非非概概率率抽抽样样的的结结合合。主主要要用用于于多多阶阶段段抽抽样样,前前几几个个阶阶段段用用概概率率抽抽样样,最最后后用非概率抽样,一般是配额抽样。用非概率抽样,一般是配额抽样。第21页,讲稿共101张,创作于星期一 二、概率抽样二、概率抽样n在在需需要要根根据据样样本本的的结结果果对对总总体体进进行行推推断断时时应应使使用概率抽样。用概率抽样。n最最简简单单的的概概率
14、率抽抽样样设设计计是是等等概概率率抽抽样样,包包括括简简单单随机抽样和系统抽样。随机抽样和系统抽样。n不不等等概概率率抽抽样样比比较较复复杂杂且且大大多多需需要要辅辅助助抽抽样样框框信信息息。不不等等概概率率抽抽样样有有:概概率率与与大大小小成成比比例例的的抽抽样样,整整群群抽抽样样,分分层层抽抽样样,多多阶阶段段抽抽样样和和多多相相抽抽样样。不不等等概概率率抽抽样样通通常常用用来来提提高高抽样设计方案的效率,或降低抽样费用。抽样设计方案的效率,或降低抽样费用。第22页,讲稿共101张,创作于星期一 概率抽样有两条基本准则:n 1)单元是随机抽取的;单元是随机抽取的;n 2)调调查查总总体体中
15、中的的每每个个单单元元都都有有一一个个非非零零的的入入样样概概率率,并并且且能能计计算算出出这这些些概率。概率。第23页,讲稿共101张,创作于星期一 概率抽样的主要优点优点有:n能得到总体的可靠估计值并能计算每个估计值的抽样误差,因而能对总体进行推断。第24页,讲稿共101张,创作于星期一 概率抽样的主要缺点缺点有:n与非概率抽样相比,概率抽样比较复杂,更费时,通常也更费钱。但总的说来,其利远大于弊。第25页,讲稿共101张,创作于星期一 概率抽样的种类n 概率抽样有七种:n简单随机抽样,n系统抽样,n等比例抽样,n整群抽样,n分层抽样,n多阶抽样,n多相抽样。第26页,讲稿共101张,创作
16、于星期一 简单随机抽样(简单随机抽样(SRS)n是所有概率抽样的出发点和理论基础。简单随机抽样是一种一步抽样法,它保证样本量为n的每个可能的样本都有相同的被抽中的概率p=n/N。n抽样可以是放回的,也可以是不放回的。第27页,讲稿共101张,创作于星期一 简单随机样本(图示)简单随机样本(图示)第28页,讲稿共101张,创作于星期一n简单随机抽样在实际抽样中应用很少,常被用作评估其他抽样方法的效率的标准。n抽样的误差是通过其抽样方差来测量的,如果一种抽样方法的抽样方差比另一种抽样方法的抽样方差小,我们就称这种抽样方法更有效效率率(统计效率)。第29页,讲稿共101张,创作于星期一与其他抽样技术
17、相比,简单随机抽样有以下优点优点:n是最简单的抽样技术;n抽样框不需要其他(辅助)信息,唯一需要的只是一个关于调查总体所有单元的一个完全的清单和与其如何联系的信息;n关于样本量的确定、总体估计与方差估计都有现成的标准公式可以利用,因此技术发展已经成熟。第30页,讲稿共101张,创作于星期一 简单随机抽样的缺点缺点是:n抽样框中即使有现成的辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的样本设计低;n由于样本在总体中的地理分布范围比较广,如果采用面访,费用较高;有可能抽到一个“差的”样本;n如果不用计算机,而用随机数表抽一个大样本将十分单调劳神。第31页,讲稿共101张,创作于星期一
18、系统抽样(系统抽样(SYS)n其抽样单元是从总体中等距抽出的。n它需要一个抽样间距和一个随机起点。抽样间距是k=N/n,随机起点r是介于1到k之间的一个随机数。n被抽中的单元是:r,r十k,r+2k,r+3k,r+(n-1)k。第32页,讲稿共101张,创作于星期一 系统样本(图示)系统样本(图示)第33页,讲稿共101张,创作于星期一n在系统抽样中,样本单元是从总体中按一定的(抽样)间距抽出的。n如果N不能被n整除,则可以使用圆圆形形系系统统抽抽样样法来避免出现可能样本量不一致的情况。第34页,讲稿共101张,创作于星期一 系统抽样有以下优点优点:n在没有抽样框时,可代替简单随机抽样;n与简
19、单随机抽样一样,系统抽样不需要辅助的抽样框信息;n与简单随机抽样相比,系统抽样样本的分布较好(这还取决于抽样间隔及名录是如何排列的);n与简单随机抽样一样,估计值容易计算;n系统抽样比简单随机抽样简单。第35页,讲稿共101张,创作于星期一n系统抽样的另一个优点是,在事先没有总体单元名录的情况下,也可以用。此时,我们可以使用并构造一个概念抽样框(只需要单元的排列顺序),每隔k个抽一个单元直到总体的末尾。这种方法的一个缺点是,只有抽样完成后才知道实际样本量n。第36页,讲稿共101张,创作于星期一 系统抽样的缺点缺点有:n如果抽样间距正好碰上总体变化的某种未知的周期性,就会得到一个“差的”系统样
20、本;n由于不使用抽样框中的辅助信息,抽样策略的效率不高;n在使用概念框时,不能预先知道最终样本量;n抽样方差没有一个无偏的估计量;n在总体大小N不能被样本量n整除且不使用圆形抽样法时,会得到样本量不同的样本。第37页,讲稿共101张,创作于星期一与大小(或规模)成比例的概率与大小(或规模)成比例的概率(PPS)抽抽样nPPS抽样是一种使用辅助信息从而使入样概率不相等的抽样技术。n如果单元大小的度量是准确的,而且所研究的变量与单元的大小相关,PPS抽样能极大地提高精度。nPPS抽样的一个很好的例子是商业调查。单元大小度量可用雇员数、年销售额、经营场所数等。第38页,讲稿共101张,创作于星期一在
21、PPS抽样中,单元的大小决定入样概率的大小。这就是说,以农场作为例子,一个面积为200公顷的农场被抽入样本的概率,是面积为100公顷的农场的二倍。第39页,讲稿共101张,创作于星期一假定一个总体有六个农场,我们要 估 计 这 个 农 场 总 体 的 总 支出。假定我们已知每个农场的规模(以公顷计的农场大小),为便于说明,进一步假定我们已知它们的支出。第40页,讲稿共101张,创作于星期一考虑下面的农场名录(总体值):抽样单元:农场抽样框辅助信息:以公顷计的农场规模调查变量:支出(元)1502600021000470000312563800430014500055002300006251250
22、0总计2000947300第41页,讲稿共101张,创作于星期一 对这个六个农场的总体,真正的总支出为947,300元。假定我们没有对这六个农场进行普查的经费,预算只够对一个农 场 的 样 本 进 行 调 查(把 样 本量取为1,只是为了说明方便,在实际调查中,只 抽 一 个 单 元 的 情 况 极 少),我们可以抽简单随机样本,每个样本只含一个 单 元、每 个 单 元 入 选 的 概 率 为16、大小为n=1的样本有六种可能。第42页,讲稿共101张,创作于星期一下面我们来分析简单随机抽样的结果。对大小为1的样本,总体总支出的估计值,由抽中样本的单元的支出乘以该单元的权数1/6(权数是样本单
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样 方法 精选 PPT
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内