第三讲抽样调查(市场调查).ppt
《第三讲抽样调查(市场调查).ppt》由会员分享,可在线阅读,更多相关《第三讲抽样调查(市场调查).ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第三讲第三讲 抽样调查抽样调查 抽样调查基本理论抽样调查基本理论 抽样调查的一般程序抽样调查的一般程序 抽样技术的类别及特点抽样技术的类别及特点 随机抽样误差及样本数量的确定随机抽样误差及样本数量的确定1第一节第一节 抽样调查基本理论抽样调查基本理论u 抽样调查的含义抽样调查的含义u 抽样调查的特点抽样调查的特点u 抽样的程序与步骤抽样的程序与步骤2抽样调查的含义抽样调查的含义 抽样调查也称为抽查,是指从调研总体中抽样调查也称为抽查,是指从调研总体中抽选出一部分要素作为样本,对样本进行调抽选出一部分要素作为样本,对样本进行调查,并根据抽样所得的结果推断总体的一种查,并根据抽样所得的结果推断总
2、体的一种专门性的调查活动。专门性的调查活动。3抽样调查的特点抽样调查的特点抽样调查的优点抽样调查的优点 (1 1)时间短、收效快)时间短、收效快 (2 2)质量高、可信程度好)质量高、可信程度好 (3 3)费用省、易推广)费用省、易推广抽样调查的缺点抽样调查的缺点 抽样调查存在着抽样误差抽样调查存在着抽样误差4抽样调查的一般程序抽样调查的一般程序确确定定调调查查总总体体建建立立或或选选择择抽抽样样框框确确定定样样本本容容量量明明确确抽抽样样方方法法抽抽选选样样本本测测算算结结果果5抽样调查的步骤(一)抽样调查的步骤(一)(1 1)确定调查总体)确定调查总体 详细说明可提供信息或与所需信息有关的
3、个体或实体所详细说明可提供信息或与所需信息有关的个体或实体所具有的特性。总体的特征描述:地域特征、人口统计学特征、具有的特性。总体的特征描述:地域特征、人口统计学特征、产品或服务使用情况、认知程度等。产品或服务使用情况、认知程度等。(2 2)选择资料收集方式)选择资料收集方式 面谈访问法、街头拦截法、网络调查法、邮寄调查法等。面谈访问法、街头拦截法、网络调查法、邮寄调查法等。(3 3)建立抽样框)建立抽样框 抽样框是指总体的数据目录或单位的名单,从中可以抽抽样框是指总体的数据目录或单位的名单,从中可以抽出样本单位,如街道居委名录、企业名录、电话本、俱乐部名出样本单位,如街道居委名录、企业名录、
4、电话本、俱乐部名录等。录等。6抽样调查的步骤(二)抽样调查的步骤(二)(4 4)确定抽样方法)确定抽样方法 随机抽样或非随机抽样。随机抽样包括简单随机抽样、随机抽样或非随机抽样。随机抽样包括简单随机抽样、分层随机抽样、整群随机抽样和等距离抽样;非随机抽样分层随机抽样、整群随机抽样和等距离抽样;非随机抽样包括便利抽样、判断抽样、滚雪球抽样和配额抽样。包括便利抽样、判断抽样、滚雪球抽样和配额抽样。(5 5)确定样本容量)确定样本容量 样本容量受两方面因素影响:样本容量受两方面因素影响:一是与满足数据的可靠性要求有关的主要因素,如总一是与满足数据的可靠性要求有关的主要因素,如总体变异、调查精度、总体
5、规模、抽样方式、回答率等;体变异、调查精度、总体规模、抽样方式、回答率等;二是与实际操作上的限制有关的因素,如调查经费、二是与实际操作上的限制有关的因素,如调查经费、时间限制、人力资源等。时间限制、人力资源等。7抽样调查的步骤(三)抽样调查的步骤(三)(6 6)抽选样本)抽选样本 按照具体调查项目的要求和指定的方法抽选受访者。按照具体调查项目的要求和指定的方法抽选受访者。(7 7)实施调查、收集资料)实施调查、收集资料 运用不同的调查方法,对抽选的样本进行逐个调查,取运用不同的调查方法,对抽选的样本进行逐个调查,取得第一手资料。得第一手资料。(8 8)测算结果、评估样本正误)测算结果、评估样本
6、正误 按照确定的标准评估样本对总体的代表性及资料的代表性按照确定的标准评估样本对总体的代表性及资料的代表性.8抽样技术方案设计的基本内容抽样技术方案设计的基本内容(1 1)明确抽样调查的目的明确抽样调查的目的 (2 2)确定总体范围和总体单位确定总体范围和总体单位 (3 3)确定抽样推断的主要项目确定抽样推断的主要项目 (4 4)确定抽样的组织方式确定抽样的组织方式 (5 5)确定合适的抽样框确定合适的抽样框 (6 6)确定恰当的抽样方法确定恰当的抽样方法 (7 7)确定主要指标的抽样精确度确定主要指标的抽样精确度 (8 8)确定必要的抽样数目确定必要的抽样数目 (9 9)制定抽样的实施细则制
7、定抽样的实施细则 (1010)设计数据处理与抽样估计的方法)设计数据处理与抽样估计的方法9抽样技术方案设计的评审抽样技术方案设计的评审(1 1)抽样技术方案是否体现了调查目的和任务的要求;)抽样技术方案是否体现了调查目的和任务的要求;(2 2)抽样技术方案是否完整、周密,有无遗漏;)抽样技术方案是否完整、周密,有无遗漏;(3 3)抽样框的设计是否存在缺陷,总体单位是否有遗漏)抽样框的设计是否存在缺陷,总体单位是否有遗漏 或重复;或重复;(4 4)抽样组织方式的选择是否恰当,是否有更好的抽样)抽样组织方式的选择是否恰当,是否有更好的抽样 方式;方式;(5 5)抽样精确度的界定是否合适,是否需要提
8、高或降低)抽样精确度的界定是否合适,是否需要提高或降低 抽样精确度;抽样精确度;(6 6)样本量的大小能否满足抽样精确度的要求;)样本量的大小能否满足抽样精确度的要求;(7 7)样本量的大小能否满足调查费用的约束;)样本量的大小能否满足调查费用的约束;(8 8)样本的代表性怎样,样本分布与总体分布是否趋于)样本的代表性怎样,样本分布与总体分布是否趋于 一致;一致;(9 9)抽样估计方法设计是否科学。)抽样估计方法设计是否科学。10第二节第二节 抽样技术的类别及特点抽样技术的类别及特点抽样技术抽样技术随机抽样技术随机抽样技术(概率抽样)(概率抽样)非随机抽样技术非随机抽样技术(非概率抽样)(非概
9、率抽样)简单随机抽样技术简单随机抽样技术配额抽样配额抽样分层随机抽样技术分层随机抽样技术整群整群随机抽样技术随机抽样技术等距离随机抽样技术等距离随机抽样技术便利抽样便利抽样判断抽样判断抽样滚雪球抽样滚雪球抽样11简单随机抽样技术简单随机抽样技术简单随机抽样简单随机抽样:又称单纯随机抽样,是指在抽又称单纯随机抽样,是指在抽 样之前对总体单位不进行任何分组、排列等处样之前对总体单位不进行任何分组、排列等处理,完全按随机原则从总体中抽取样本的抽样理,完全按随机原则从总体中抽取样本的抽样方法。方法。常用方法:常用方法:抽签法抽签法随机数骰子法随机数骰子法乱数表法(计算机随机数法)乱数表法(计算机随机数
10、法)使用统计软件(使用统计软件(SAS/SPSSSAS/SPSS)直接抽取直接抽取12 通常具体的作法是,先编制一份总体成员的名单,通常具体的作法是,先编制一份总体成员的名单,即编制抽样框,然后给名单中的每一个成员编上一个号即编制抽样框,然后给名单中的每一个成员编上一个号码,然后,只要使用一些机械方法如抽签、抓阄就能确码,然后,只要使用一些机械方法如抽签、抓阄就能确保抽样的等概率性。保抽样的等概率性。随机数表是一份由数字随机数表是一份由数字随机数表是一份由数字随机数表是一份由数字0-90-9所组成的表,它是用上述所组成的表,它是用上述所组成的表,它是用上述所组成的表,它是用上述机械方法或用电子
11、计算机编制而成的。机械方法或用电子计算机编制而成的。机械方法或用电子计算机编制而成的。机械方法或用电子计算机编制而成的。大样本时,通常采用随机数表来进行随机抽样。大样本时,通常采用随机数表来进行随机抽样。较大的随机数表是美国兰德公司较大的随机数表是美国兰德公司较大的随机数表是美国兰德公司较大的随机数表是美国兰德公司19551955年编制出版的年编制出版的年编制出版的年编制出版的100100万数字表。万数字表。万数字表。万数字表。13随机数表总体元素多时,采用随机数表14简单随机抽样的优缺点简单随机抽样的优缺点缺点:缺点:缺点:缺点:(1 1 1 1)抽样数量多;)抽样数量多;)抽样数量多;)抽
12、样数量多;(2 2 2 2)覆盖面大;)覆盖面大;)覆盖面大;)覆盖面大;(3 3 3 3)数据收集过程费时费钱。)数据收集过程费时费钱。)数据收集过程费时费钱。)数据收集过程费时费钱。优点:优点:优点:优点:(1 1 1 1)完全符合随机原则,保证每个总体)完全符合随机原则,保证每个总体)完全符合随机原则,保证每个总体)完全符合随机原则,保证每个总体 单位在抽选时都有同等被抽中的概率;单位在抽选时都有同等被抽中的概率;单位在抽选时都有同等被抽中的概率;单位在抽选时都有同等被抽中的概率;(2 2 2 2)操作应用简单易行。)操作应用简单易行。)操作应用简单易行。)操作应用简单易行。15 简单随
13、机抽样应用实例简单随机抽样应用实例总体中每个单位在抽选时具有相等的被抽中机会。总体中每个单位在抽选时具有相等的被抽中机会。抽样概率公式为:抽样概率样本单位数抽样概率公式为:抽样概率样本单位数/总体单位数总体单位数例例如如,如如果果总总体体单单位位数数为为1000010000,样样本本单单位位数数为为400400,那那么么抽抽样样概概率率为为4 4,计算过程为:,计算过程为:0.040.04400/10000400/10000如果一个抽样框是可以得到的,简单随机抽样方式步骤如下:如果一个抽样框是可以得到的,简单随机抽样方式步骤如下:(1)(1)对对总总体体的的每每个个单单位位进进行行编编号号,总
14、总体体单单位位数数为为1000010000的的总总体体可可编编号为号为110000110000;(2)(2)在在随随机机数数表表中中从从任任意意的的一一个个编编号号数数开开始始向向上上数数或或向向下下数数或或跳跳跃跃数选编号,在数选编号,在0000100001和和1000010000之间选出之间选出400400个个(样本单位数样本单位数);(3)(3)在有明确总体单位的数字表中选出的数字将包括在样本中。在有明确总体单位的数字表中选出的数字将包括在样本中。16等距离随机抽样等距离随机抽样等距离随机抽样:又称机械抽样或系统抽样,先等距离随机抽样:又称机械抽样或系统抽样,先在总体中按一定标志把个体顺
15、序排列,并根据总在总体中按一定标志把个体顺序排列,并根据总体单位数和样本单位数计算出抽样距离,然后按体单位数和样本单位数计算出抽样距离,然后按相同的距离或间隔抽选样本单位。相同的距离或间隔抽选样本单位。常用方法常用方法直线法直线法圆形系统抽样法圆形系统抽样法17等距离随机抽样操作步骤等距离随机抽样操作步骤(1 1)对总体编号:将)对总体编号:将N N个个总体单位按一定顺序排列;总体单位按一定顺序排列;(2 2)确定抽样间隔:根据总体单位数)确定抽样间隔:根据总体单位数N N和样本单位数和样本单位数n n计算计算出抽样间隔出抽样间隔K K(必须是整数),必须是整数),K KN/nN/n;(3 3
16、)确定起始抽号数:在确定起始抽号数:在1 1和和K K之间随机选一个数字,称为之间随机选一个数字,称为随机起点随机起点r r;(4 4)确定别抽取单位:根据确定别抽取单位:根据r r和和K K从总体中抽取从总体中抽取n n个样本单位。个样本单位。选中的样本单位号码依次为:选中的样本单位号码依次为:r r,r+Kr+K,r+2Kr+2K,r+3Kr+3K,r+iKr+iK,r+r+(n n1 1)K K。18等距离随机抽样的优缺点等距离随机抽样的优缺点优点:优点:(1 1)操作简便,省时间,费用低;)操作简便,省时间,费用低;(2 2)如果有关设定特征的信息较易得到,则比简单随机抽样)如果有关设
17、定特征的信息较易得到,则比简单随机抽样样本的代表性更强,且更可靠;样本的代表性更强,且更可靠;(3 3)不需要抽样框的知识。)不需要抽样框的知识。缺点:缺点:(1 1)按有关标志排队时,需要有较为详细、具体的相关资料;)按有关标志排队时,需要有较为详细、具体的相关资料;(2 2)抽样的效率取决于对总体进行排列时所使用的标志值;)抽样的效率取决于对总体进行排列时所使用的标志值;(3 3)抽样误差计算较为复杂。)抽样误差计算较为复杂。19 从从1000010000户居民中抽取户居民中抽取200200户居民进行抽样调查,采用等距户居民进行抽样调查,采用等距随机抽样方法,具体做法是:随机抽样方法,具体
18、做法是:首先把首先把1000010000户居民按一定标志排列,其标志可以采用与调户居民按一定标志排列,其标志可以采用与调查内容有关的标志查内容有关的标志(与需求量有关的标志有收入水平、家庭人口与需求量有关的标志有收入水平、家庭人口数等数等),也可以采用与调查内容无关的标志,也可以采用与调查内容无关的标志(如居住地址等如居住地址等),并,并编上编上1-100001-10000序号;序号;然后求出抽样间隔,用然后求出抽样间隔,用k k表示抽样间隔,则表示抽样间隔,则k=10000/200k=10000/2005050,即间隔,即间隔5050户抽取一户,同时在第一个户抽取一户,同时在第一个k k间隔
19、即间隔即1 15050中随机中随机抽一个单位,假设抽中第抽一个单位,假设抽中第3838号单位;最后从号单位;最后从3838开始,每隔开始,每隔5050户户抽取抽取1 1户,即户,即3838,8888,138138,188188、99889988,共抽取到,共抽取到200200户组户组成样本。成样本。20需要注意的方面需要注意的方面等距随机抽样,能使样本在总体中的分布比较均匀,等距随机抽样,能使样本在总体中的分布比较均匀,从而抽样误差减小。但在应用此方法时要特别注意,从而抽样误差减小。但在应用此方法时要特别注意,抽样间隔与现象本身规律之间的关系。抽样间隔与现象本身规律之间的关系。如:对城乡集市贸
20、易商品成交量或成交价格有时间间如:对城乡集市贸易商品成交量或成交价格有时间间隔地进行调查,抽样的时间间隔不能用隔地进行调查,抽样的时间间隔不能用7 7或或3030这种与这种与周、月周期一致的数。这种方法最适用于同质性较高周、月周期一致的数。这种方法最适用于同质性较高的总体,而对于类别比较明显的总体,则采用类型随的总体,而对于类别比较明显的总体,则采用类型随机抽样法。机抽样法。21分层随机抽样技术分层随机抽样技术分层随机抽样:又称类型随机抽样,是把调查总分层随机抽样:又称类型随机抽样,是把调查总 体按其属性不同分为若干层次(类型),然后在体按其属性不同分为若干层次(类型),然后在 各层中随机抽取
21、样本。各层中随机抽取样本。选择分层变量的准则选择分层变量的准则同质性同质性异质性异质性相关性相关性经济性经济性22等比例分层抽样等比例分层抽样等比例分层抽样:按各个层(或各类型)中的单等比例分层抽样:按各个层(或各类型)中的单位数量占总体单位数量的比例来分配各层样本数位数量占总体单位数量的比例来分配各层样本数量,据此抽取样本的方法。量,据此抽取样本的方法。计算公式:计算公式:NiNini=n23举例:举例:2000020000户居民,按经济收入高低分类,高收入居民户居民,按经济收入高低分类,高收入居民40004000户,占总体户,占总体20%20%;中等收入;中等收入1200012000户,占
22、总体户,占总体60%60%;低;低收入户收入户40004000户,占总体户,占总体20%20%,从中抽取,从中抽取200200户,进行购买户,进行购买力调查。力调查。等比例分层抽样等比例分层抽样高收入层样本数:高收入层样本数:20020%=4020020%=40户户中收入层样本数:中收入层样本数:20060%=12020060%=120户户低收入层样本数:低收入层样本数:20020%=4020020%=40户户24分层最佳抽样法分层最佳抽样法分层最佳抽样法(不等比例抽样法)是指根据其它因分层最佳抽样法(不等比例抽样法)是指根据其它因素(如各层平均数或成数标准差的大小,抽取样本工素(如各层平均数
23、或成数标准差的大小,抽取样本工作量和费用大小等),调整各层的样本单位数。作量和费用大小等),调整各层的样本单位数。按分层标准差大小确定各层样本单位数的计算公式按分层标准差大小确定各层样本单位数的计算公式:NiSiNiSini=n25各层次各层次(收入)(收入)各层的调各层的调查户数查户数各层样本各层样本标准差标准差乘积乘积高高40003001200000中中120002002400000低低40001001200000200004000000高收入层样本数目:高收入层样本数目:200 1200000/4000000=60户户中收入层样本数目:中收入层样本数目:200 2400000/40000
24、00=120户户低收入层样本数目:低收入层样本数目:200 400000/4000000=20户户各层样本标准差高收各层样本标准差高收入入300元,中收入元,中收入200元,低收入元,低收入100元。元。26分层随机抽样的优缺点分层随机抽样的优缺点优点:优点:(1 1)比简单随机抽样和等距离抽样更为精确,能够通过对较)比简单随机抽样和等距离抽样更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是少的抽样单位的调查,得到比较准确的推断结果,特别是当总体较大、内部结构复杂时,效果更佳。当总体较大、内部结构复杂时,效果更佳。(2 2)在对总体推断时,还能获得对每层的推断结果。)在
25、对总体推断时,还能获得对每层的推断结果。缺点:缺点:(1 1)层的划分需要收集必要的资料,从而耗费额外的费用;)层的划分需要收集必要的资料,从而耗费额外的费用;(2 2)要求掌握各层中的单位数目和比例,增加了抽样设计的)要求掌握各层中的单位数目和比例,增加了抽样设计的复杂性,而且也会带来新的误差。复杂性,而且也会带来新的误差。27分层抽样的适用性1当一个总体内部分层明显时,分层抽样能够克服简单随机样和等距抽样的缺点。2分层抽样可以提高总体参数估计的精确度。3有些研究不仅要了解总体的情况,而且还要了解某些类别的情况。4便于行政管理。同一层可看作一个总体,因此每层可由专人进行管理。28某高一学生共
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第三讲 抽样调查市场调查 第三 抽样调查 市场调查
限制150内