欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    《抽样调查概述》PPT课件.ppt

    • 资源ID:53440719       资源大小:2.25MB        全文页数:104页
    • 资源格式: PPT        下载积分:11.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要11.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《抽样调查概述》PPT课件.ppt

    第五章第五章 抽样调查概述抽样调查概述(重难点章重难点章)第一节 抽样调查概念 第二节 抽样误差 第三节 参数估计 第四节 EXCEL的应用v “对社会经济现象进行抽样调查和推断对社会经济现象进行抽样调查和推断”任务书任务书 (五)五)v一、任务题目:一、任务题目:自选某一社会经济现象,对该现象进行抽样调查,并对调查结果进行分析推断。v二、主要内容:二、主要内容:了解抽样调查的意义及特点;学习掌握抽样误差、参数估计等指标的意义及计算方法;自选某一社会经济现象进行抽样调查,并对调查结果进行分析、推断。v三、基本要求:三、基本要求:v1.所选社会经济现象可是工商企业的生产经营资料或学校的人财物结构分布等。v2.抽样调查收集资料采用实地调查方法;v3.每人用EXCEL制作一张调查数据表;运用统计函数计算出抽样误差、参数估 计值,对该现象的特征及趋势进行分析。v4.将所作的分析存入一个文件夹,拷贝到自己的U盘备查。v四、成绩评定:四、成绩评定:v1评分标准。基础分:数据分析方法和结果正确。8分;v加分:按时提交作业,独立完成。2分。v2.成绩占学期总成绩10%。v v 任务下达日期:2012年 月 日v 任务完成日期:2012年 月 日v 指导教师签字:指导教师签字:任务书学习内容及要求学习内容及要求学习内容:理解抽样调查的含义、作用;熟悉抽样误差的计算方法及其影响因素;掌握在各种抽样组织形式下总体均值和成数的区间 估计的技能方法;掌握确定样本容量的计算方法及其影响因素。带着问题学:1、抽样调查的概念、特点、作用有哪些?2、抽样误差可以避免吗?按样本平均数(成数)计算抽样平均 误差的方法及过程、结果是什么?3、影响抽样误差大小的因素有哪些?4、区间估计的计算方法和过程是什么?5、影响抽样数目的因素有哪些?本章在统计原理中的地位本章在统计原理中的地位 抽样调查和推断是理论教学和实际工作中最常用、最重要的统计方法之一。它利用抽样调查所获得的样本信息,根据概率论所揭示的随机变量的一般规律性,对总体的一些数量特征进行估计。本章内容也是假设检验、相关回归分析的重要基础。第一节第一节 抽样调查概念抽样调查概念 (基础、重点)(基础、重点)重点:重点:抽样调查的基本概念及其作用带着问题学:带着问题学:1、抽样调查的概念及其特点有哪些?2、抽样调查的作用有哪些?第一节第一节 抽样调查概念抽样调查概念 (基础、重点)(基础、重点)一、一、抽样调查的含义抽样调查的含义 抽样调查是按照随机原则从总体总体中抽取一部分单位一部分单位进行调查,并以样本观测结果样本观测结果对未知的总体数量特征总体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。(全及总体)、(样本总体)、样本指标)、(总体参数)二、抽样调查的特点二、抽样调查的特点:(三点)三、抽样调查的作用三、抽样调查的作用:(四个)要学懂抽样推断,首先要明确总体分布、样本分布与抽样分布三者的关系。总体分布:可以是正态分布、偏态分布等;未知;唯一。样本分布:可以是正态(偏态)分布等;取样后便知;有若干个样本且形态不一。抽样分布:面宽、多样;越接近中心点,分布越密集。735055857483767075总体分布:未知;唯一的总体分布:未知;唯一的7577抽样分布:两端少(概率小),中心多(概率大)抽样分布:两端少(概率小),中心多(概率大)3090 补充:概率与分布的相关知识补充:概率与分布的相关知识 1、总体分布及其特征、总体分布及其特征 总体分布就是总体中所有个体关于某个变量(标志)的取值所形成的分布。变量分布的形态很多,例如J型分布、U型分布和钟型分布等,不同的分布会有不同的特征,认识总体分布特征是统计研究的任务之一。反映总体分布特征的指标叫总体参数,反映总体分布特征的指标叫总体参数,一般用 表示。常用的总体参数有两个:一是总体均值(包括是非变量的均值);二是总体方差或标准差(包括是非变量的方差或标准差)。2、样本分布及其特征样本分布及其特征 样本分布就是样本中所有个体关于某个变量(标志)的取值所形成的分布。由于样本来自于总体,包含了一部分关于总体的信息。当样本容量很大(或是逐渐增大)时,样本分布会接近总体分当样本容量很大(或是逐渐增大)时,样本分布会接近总体分布。布。如果样本容量很小,那么样本分布就有可能与总体分布相差很大,抽样估计的结果就会很差。反映样本分特征的指标叫样本统计量,反映样本分特征的指标叫样本统计量,通常用 来表示。常见的样本统计量也有两个:样本均值和样本方差,即:3 3、抽样分布及其特征、抽样分布及其特征 抽样分布的概念及影响因素抽样分布的概念及影响因素 一般意义上说,抽样分布就是样本统计量的概率分布,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。它由样本统计量的所有可能取值和与之对应的概率所组成。实际的抽样分布形成取决于以下五个因素因素:总体分布总体分布。总体分布越分散则抽样分布也越分散 样本容量样本容量。样本容量越小则抽样分布越分散 抽样方法抽样方法。一般情况下,重复抽样比不重复抽样的抽样分布分散 抽样组织形式抽样组织形式。简单抽样比分层抽样的抽样分布分散 估计量构造估计量构造。估计量构造不同,抽样分布也不同 抽样分布形式抽样分布形式 在抽样估计中,最基本的抽样分布是样本均值的最基本的抽样分布是样本均值的抽样分布和样本成数的抽样分布,抽样分布和样本成数的抽样分布,以此得到抽样分布的形式。抽样分布特征抽样分布特征 任一抽样分布都有自己的特征,这个特征就是样本统计量的数学期望和方差。其中,样本统计量的数学期望就是所有样本统计值的平均数,样本统计量的方差就是所有样本统计值关于数学期望的方差。当当估计量就是样本统计量时,数学期望与方差分别表示估计量就是样本统计量时,数学期望与方差分别表示 为 和 。(三)抽样分布及其特征(三)抽样分布及其特征1.1.抽样分布的概念及影响因素抽样分布的概念及影响因素 一般意义上说,抽样分布就是样本统计量的概率分布,抽样分布就是样本统计量的概率分布,它由样本统计量的所有可能取值和与之对应的概率所组成。它由样本统计量的所有可能取值和与之对应的概率所组成。如果说样本分布是关于样本观测值的分布,那么抽样分布则是关于样本统计值的分布,而样本统计值是由样本观测值计算而来的。实际的抽样分布形成取决于以下五个因素因素:总体分布总体分布。总体分布越分散则抽样分布也越分散 样本容量样本容量。样本容量越小则抽样分布越分散 抽样方法抽样方法。一般情况下,重复抽样比不重复抽样的抽样分布分散 抽样组织形式抽样组织形式。简单抽样比分层抽样的抽样分布分散 估计量构造估计量构造。估计量构造不同,抽样分布也不同补充:补充:举简例说明抽样分布及概率举简例说明抽样分布及概率v 有4名工人(N=4),日产量分别为22、24、26、28件(用A、B、C、D代表),总体均值为25件,方差为5件,标准差为件。现从中随机抽出2件检验(n=2),采用重复抽样方法,共产生16个可能样本:即“AA、AB、AC、AD、BA、BB、DA、AB、DC、DD”等共16组。所有可能样本平均数的均值=总体平均数 即:E(x)=X 样本均值的抽样分布如下表所示:例:例:4名工人日产量抽样分布(考虑顺序)名工人日产量抽样分布(考虑顺序)(重复抽样,4抽2)排列排列AAABBAACCABBADDABCCBCCBDDBCDDCDD日产量日产量22、2222、2422、2624、2422、2624、2626、2624、2826、2828、28平均数平均数22232424252526262728概率概率例:例:4名工人日产量抽样分布(考虑顺序)名工人日产量抽样分布(考虑顺序)(不重复抽样,4抽2)排列排列AAABBAACCABBADDABCCBCCBDDBCDDCDD日产量日产量22、2222、2422、2624、2422、2624、2626、2624、2826、2828、28平均数平均数22232424252526262728概率概率!样本均值的抽样分布定理样本均值的抽样分布定理 中心极限定理中心极限定理 对于任一具有平均数 和方差 的有限总体,当样本当样本 容量容量n足够大时足够大时(例如 或 ),样本均值样本均值 的分的分布也趋于服从正态分布布也趋于服从正态分布,此即为中心极限定理。分布定理分布定理 当正态总体的方差未知且n较小,或任一方差为 的总体但n较小,则样本均值的分布服从自由度为n-1的 t 分布。分布曲线与正态分布相近,其中数学期望相同。补充:常用的抽样分布定理补充:常用的抽样分布定理总体分布(未知)样本分布1(n小,误差大)样本分布3(n渐大,误差渐小)样本分布2(n渐大,误差渐小)四、抽样调查中的几个基本概念四、抽样调查中的几个基本概念(一)总体总体(全及总体全及总体)与样本与样本(抽样总体抽样总体)研究对象全体;抽取的样本构成的总体。(样本可有多个,样本容量可大可小,n50为大样本,n30为小样本)(二)总体参数和样本统计量总体参数和样本统计量(样本指标样本指标)常用:总体平均数、成数、方差等,(客观存在、唯一但未知,需推算);样本平均数、成数、方差等,(是据样本数据计算出的实际数,用以 推断总体指标)。总体参数总体参数样本统计量及其计算公式样本统计量及其计算公式总体均值样本均值总体成 数 P样本成数总体方 差样本方差(若分母为n-1则称之为样本修正方差)总体标准差样本标准差(若分母为n-1则称之为样本修正方差)(四)抽样方法和样本数目(四)抽样方法和样本数目 1.重复抽样,也叫重置抽样重复抽样,也叫重置抽样,是指从总体的个单位中抽取一个容量为n的样本,每次抽出一个单位后,再将其放回总体中参加下一次抽取,这样连续抽n次即得到一个样本。同一总体单位有可能被重复抽中;每次都是从个总体单位中抽取.(每个单位被抽中的概率没变)2.不重复抽样,也叫不重置抽样不重复抽样,也叫不重置抽样,是指抽中单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。同一总体单位不会被重复抽中;每次抽取是在不同数目的总体单位中进行的。(每个单位被抽中的概率改变)样本及样本指标x1x2x3xn重复抽样:重复抽样:每次每个单位被抽中的概率相同,1/20、1/20、。某个单位有可能被多次抽中不重复抽样:不重复抽样:每次每个单位被抽中的概率不同,1/20、1/19、1/18、。每个单位只可能被抽中一次。样本及样本指标x1x2x3xn抽样组织形式抽样组织形式基本的抽样组织方式有五种:基本的抽样组织方式有五种:纯随机抽样纯随机抽样(简单随机抽样)等距抽样等距抽样 (机械抽样)类型抽样类型抽样 (分层抽样)整群抽样整群抽样 (集团抽样)阶段抽样阶段抽样第二第二节节 抽样误差抽样误差 (重难点节)(重难点节)重点:重点:按抽样平均数和抽样成数计算抽样误差 的方法带着问题学:带着问题学:1、抽样误差可以避免吗?可以事先计算和调控吗?2、按样本平均数计算抽样平均误差的方法及过程、结果是什么?3、按样本成数计算抽样平均误差的方法及过程、结果是什么?4、用(不)重复抽样方法计算抽样误差的区别 是什么?5、影响抽样误差大小的因素有哪些?第二第二节节 抽样误差抽样误差 返回 一、抽取样本单位的方式和抽样误差一、抽取样本单位的方式和抽样误差 非抽样误差非抽样误差(系统偏差系统偏差)。如:抽样框不准确;有些观测单位数据无法取得;已取得的数据不真实等原因所致。抽样误差(代表性误差)抽样误差(代表性误差)由于抽样的非全面性和随机性引起的偶然性误差。即抽样估计值随样本不同而产生的误差。其特点是:样本容量增大而趋向于零(样本均值与总体均值之差为零)。抽样调查中的抽样误差一般是指随机误差。(如:产品质量抽查中,用抽取的50件电子产品的平均耐用时数和合格率去推断推断生产的全部1000件产品的耐用时数和合格率。)9030 75误差-45误差15(一)(一)抽样误差类型抽样误差类型1、抽样实际误差抽样实际误差样本估计值与总体参数值之间的离差。记为 .(每一次抽样的实际误差是不可知的,因为 总体参数是未知的)。2、抽样平均误差抽样平均误差抽样平均数或抽样成数的标准差。是衡量抽样误差大小的核心指标是衡量抽样误差大小的核心指标。(抽样平均误差越小,抽样分布越集中。反之,则越离散。)(三)抽样极限误差抽样极限误差(亦称允许误差范围)估计量所允许的最大(小)值与总体参数值之间的绝对离差,通常用 表示,即 。抽样极限误差取决于两个因素:1、抽样标准误。抽样标准误越大,抽样极限误差就越大;2、抽样估计概率保证程度。概率保证程度越高,抽样极限误差就越大。优良估计量优良估计量的评价标准的评价标准 估计量估计量用以估计总体参数的量,一般指样本统计量。用以估计总体参数的量,一般指样本统计量。优良估计量的标准:优良估计量的标准:1、无偏性、无偏性以样本估计总体,所有可能的估计值与总体参数值离差的均值为零。样本均值、成数、方差是总体均值、成数、方差的无偏估计量。2、一致性、一致性以样本估计总体,样本容量充分大时,样本指标也充分靠近总体参数。样本均值、成数、方差是总体均值、成数、方差的一致性估计量。3、有效性、有效性以样本估计总体,要求优良估计量的方差比其它估计量的方差小。样本均值、成数、方差是总体均值、成数、方差的有效估计量。4、充分性、充分性以样本估计总体,要求优良估计量的构造应能尽量减少有用信息损失。样本均值、成数、方差是总体均值、成数、方差的充分估计量。(二)(二)抽样平均误差的计算抽样平均误差的计算 样本均值 样本成数重复抽样不重复抽样 不重复抽样计算的 重复抽样计算的 抽 样 误 差 抽 样 误 差 影响抽样标准误大小的因素:影响抽样标准误大小的因素:(1)总体标准差(总体各单位标志值的离散程度)总体标准差(总体各单位标志值的离散程度)。其它条件不变的情况下,总体单位的离散程度大,抽样标准误大。(2)样本容量。)样本容量。其它条件不变的条件下,样本容量大,抽样标准误小。(3)抽样方法。)抽样方法。相同条件下,重复抽样的抽样标准误比不重复抽样的抽样标准误大。(4)抽样组织方式)抽样组织方式。由于不同抽样组织方式有不同的抽样误差,所以,在抽样误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同。补充补充:样本容量与抽样误差之间的数量变动关系样本容量与抽样误差之间的数量变动关系 (在其他条件不变的情况下)(在其他条件不变的情况下)1.当样本容量当样本容量n扩大扩大(或缩小)为原来的或缩小)为原来的k倍时,则抽样倍时,则抽样平均误差平均误差 缩小(或扩大)为原来的缩小(或扩大)为原来的K倍倒数的倍倒数的平方根平方根。证明证明1:设:=2,n=4 则:证明证明2:设:=2,n=4 则:2.当抽样平均误差当抽样平均误差 扩大扩大(或缩小)为原来的或缩小)为原来的k倍倍时,则样本容量时,则样本容量n 缩小(或扩大)为原来的缩小(或扩大)为原来的K倍倒数的倍倒数的平方平方。证明证明3:设:=2,n=4 则:证明证明4:设:=2,n=4 则:第三节参数估计第三节参数估计 (重点节)(重点节)重点:重点:总体参数的区间估计带着问题学:带着问题学:1、参数估计的理论基础是什么?2、抽样极限误差如何计算?3、区间估计的计算方法和过程是什么?4、影响抽样数目的因素有哪些?第三节参数估计第三节参数估计 (重点节)(重点节)一、参数估计的理论基础:大数定律和中心极限定理 抽样估计按随机原则从总体中抽取部分单位(样本)调查,用调查结果(样本指标)对总体参数做出具有一定可靠程度的估计与推断,从而认识总体的一种统计方法。例:从1000只灯管中随机抽出50只检验,进行抽样估计和推断。(总体)1000 50(样本)总体平均数总体平均数 样本平样本平均数均数 总体成总体成 数数 样本样本成成 数数 总体方总体方 差差 样本样本方方 差差特点特点:1、遵循随机原则抽样。2、用样本指标值估计总体指标值。3、以概率论和数理统计为理论基础,推断的结果有 一定的可靠程度,抽样误差可以事先计算和控制。推断抽取二、抽样极限误差二、抽样极限误差样本均值的:样本成数的:*注意:因为总体均值和总体成数是未知的,所以需要通过概率估算法去推算概率估算法去推算。概率估算涉及概率与概率保证程度 的概念与关系等知识。概率与概率保证程度的函数对应关系概率与概率保证程度的函数对应关系标准正态分布临界值与置信度图示标准正态分布临界值与置信度图示68.27%95.45%99.73%三、总体参数的估计 对不可能、不必要进行全面调查的社会现象的调查,需要用抽样调查;如:产品质量检验;职工家计(生活)调查 对全面调查结果复核或修正,需要用抽样调查。如:人口普查资料的复核抽样估计的一般步骤:抽样估计的一般步骤:1.设计设计抽抽样样方案方案(调查目的、时间、单位、组(调查目的、时间、单位、组织方式方法等)。织方式方法等)。2.随机抽取样本随机抽取样本(从总体随机抽取部分单位,(从总体随机抽取部分单位,构成样本)。构成样本)。3.搜集、整理样本资料搜集、整理样本资料(对抽出的样本单位进行(对抽出的样本单位进行登记、审查、分组、汇总、计算样本指标的有关数登记、审查、分组、汇总、计算样本指标的有关数值,即计算估计量的具体数值)。值,即计算估计量的具体数值)。4.推断总体参数推断总体参数(即估计总体均值、成数、标准(即估计总体均值、成数、标准 差)。差)。估计量的评价标准估计量的评价标准 估计量估计量用以估计总体参数的量,一般指样本统计量。用以估计总体参数的量,一般指样本统计量。优良估计量的标准:优良估计量的标准:1、无偏性、无偏性以样本估计总体,所有可能的估计值与总体参数值离差的均值为零。样本均值、成数、方差是总体均值、成数、方差的无偏估计量。2、一致性、一致性以样本估计总体,样本容量充分大时,样本指标也充分靠近总体参数。样本均值、成数、方差是总体均值、成数、方差的一致性估计量。3、有效性、有效性以样本估计总体,要求优良估计量的方差比其它估计量的方差小。样本均值、成数、方差是总体均值、成数、方差的有效估计量。4、充分性、充分性以样本估计总体,要求优良估计量的构造应能尽量减少有用信息损失。样本均值、成数、方差是总体均值、成数、方差的充分估计量。(一)点估计(一)点估计 概念概念:以一个样本的具体统计值去估计总体 的未知参数。优点优点:简便、明确、易行。缺点缺点:无法说明(客观存在的)抽样 误差范围的大小及估计结果有 多大的把握程度。9030 75误差-45误差15点估计:不考虑抽样误差。(事实上,抽样误差客观存在,且随影响因素的不同而不同。)所以,为了抽样推断准确,需要做区间估计。(二)、区间估计二)、区间估计 区间估计区间估计就是根据样本估计量和抽样分布,用一个具有一定可靠程度的区间范围来估计总体参数 (包含平均数、成数、方差)。并使 处于区间 内的概率为 。你估计明天上海股市涨多少点?我有95%的把握,估计明天上海股市要涨30点?1、总体平均数的区间估计、总体平均数的区间估计 在一定概率 下,样本指标 会落入以 为中心,以 为半径的对称区间.换言之,样本指标 的取值在 范围内的概率为 ,即:所以,给定概率 ,则总体均值的估计区间为:2、总体成数及其相应总量指标的区间估计、总体成数及其相应总量指标的区间估计 在一定概率 下,样本指标 p 会落入以 P 为中心,以 为半径的对称区间.换言之,样本指标 p 的取值在 范围内的概率为 ,即:所以,给定概率 则总体均值的估计区间为:例例5.7 总体平均数的区间估计:总体平均数的区间估计:(不)重复抽样方法例例5.8 总体成数的区间估计:总体成数的区间估计:重复抽样总体参数估计的计算关系和方法示意图总体参数估计的计算关系和方法示意图 课堂练习一:课堂练习一:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95的把握程度估计这批食品的平均每袋重量的极限误差及其区间范围。解题步骤:1、求样本均值(每袋平均重量)2、求样本方差3、求抽样标准误4、求极限误差5、求总体均值的估计区间 课堂练习二:课堂练习二:某企业对本月生产的5,000件产品按1%比例随机抽样进行质量检验,样本合格率为93。在的置信度下合格率的允许误差不超过3,请估计该批产品的合格率区间?解题步骤:四、样本容量的确定四、样本容量的确定确定样本容量的意义确定样本容量的意义 为使抽样误差在一定概率置信度下不超过允许范围所必须的抽样数目。大样本 n 30 ;小样本 n 30 对经济现象抽样调查常采用大样本。样本容量的确定的计算公式 一般由抽样极限误差(即允许误差)的计算公式推导而得。该抽取几个该抽取几个猴才合适?猴才合适?样本容量的计算分为:样本容量的计算分为:样本均值和样本成数两个系列;重复抽样和不重复抽样两种方法。若某次抽样既要估计总体均值,又要估计总体成数,则其样本容量计算结果应在两者中取最大的值。重复抽样不重复抽样 样本平均数样本成数(一)样本容量的影响因素(一)样本容量的影响因素 1、总体方差的大小、总体方差的大小(标志变异程度大小标志变异程度大小)其它条件不变的条件下,总体单位 差异程度大,则应多抽,反之可少抽一些。2、抽样极限误差、抽样极限误差(允许误差范围允许误差范围)允许误差增大,意味着推断的精度要求降低,在其他条件不变的情况下,必要的抽样数目可减少。反之,缩小允许误差,就要增加必要的抽样数目。3、概率保证程度(保证程度、置信度)、概率保证程度(保证程度、置信度)因置信度与置信区间是同方向变化的,所以在其它条件不变的情况下,要提高推断的置信程度,就必须增加抽样数目。4、抽样方法、抽样方法 相同条件下,采用重复抽样应比不重复抽样多抽一些样本单位。不过,总体单位数很大时,二者差异很小。所以为简便起见,实际中当总体单位数很大时,一般都按重复抽样公式计算必要的抽样数目。5、抽样组织方式、抽样组织方式 由于不同抽样组织方式有不同的抽样误差,所 以,在误差要求相同的情况下,不同抽样组织方式 所必需的抽样数目也不同。上述公式是简单随机抽样下确定必要抽样数目的公式。其它抽样组织方式下必要抽样数目的计算也可根据相应的误差公式来推导。课堂练习课堂练习 某食品厂要检验本月生产的10,000袋某产品的重量,根据上月资料,这种产品每袋重量的标准差为25克。要求在的概率保证程度下,平均每袋重量的误差范围不超过5克,应抽查多少袋产品?解:已知:10,000,S25克,克,即 2,五、抽样调查的组织形式五、抽样调查的组织形式 及抽样方法及抽样方法(一一)纯随机抽样纯随机抽样 简单随机抽样_是按随机的原则直接从总体中抽取容量为n的样本,每一个总体单位都有相等的被抽中机会。取样的方法有:1.直接抽选法。2.抽签法 3.随机数表取数法.根据样本提供的信息对总体的某些数字特征(总体参数)进行估计或推测.参数估计分为点估计和区间估计两类.纯随机抽样(不重复抽样)纯随机抽样(不重复抽样)(无放回抽样)(无放回抽样)样本及样本指标x1x2x3xn 1、总体平均数、总体平均数 的估计的估计 例:(大样本,采用不重复抽样方法)N=14500,n=100,2、总体成数、总体成数P的估计的估计 例(大样本,不重复抽样)N=50000,n=500,ni=60,p=ni/n=60/500=12%补充:补充:小样本条件下总体平均数的估计小样本条件下总体平均数的估计 若总体服从正态分布,则样本均值也服从正态分布,总体标准差通常未知,需用样本标准差S代替,.统计量t服从自由度为(-1)的t分布.若给定(1-a),查得对应的临界值,那么其在区间(,)内的概率为(1-a).(二)等距抽样(二)等距抽样(机械抽样(机械抽样 或系统抽样)或系统抽样)概念:概念:将总体单位按某一标志排队,计算抽样间隔距离:在第一个抽样距离内确定抽样起点 r,依次按固定的间隔和顺序抽取样本单位 (或样本点)构成样本。(可以采用半距起点半距起点等距抽样或对称等距 抽样方法抽取样本单位。)1、按无关标志排队等距抽样、按无关标志排队等距抽样(如:职工工资按住户的门牌号数排列)(如:职工工资按住户的门牌号数排列)排队标志(门牌号数)X:X X1到到X Xn由小到大排列,由小到大排列,调查标志(工资收入)Y:Y Y1到到Y Yn呈现为随机排列。呈现为随机排列。故抽样起点可随机确定,完全遵循了随机原则,不会产生系统偏差 抽样误差的计算:抽样误差的计算:通常是按简单随机抽样的抽样误差公式 近似计算的。即抽样效果近似简单随机 抽样。等距抽样(按无关标志排序)等距抽样(按无关标志排序)样本及样本指标x1x2x3xn 2、按有关标志排队等距抽样有关标志排队等距抽样 将总体单位按某一有关标志排队。(如:职工工资按高低顺序排列)排队标志(工资额)X:X X1X Xn由小(大)到大(小)排列。由小(大)到大(小)排列。调查标志(工资收入)Y:Y Y1Y Yn也大体上呈现为也大体上呈现为 由小(大)到大(小)有序排列。由小(大)到大(小)有序排列。2、按有关标志排队等距抽样有关标志排队等距抽样 将总体单位按某一有关标志排队。(如:职工工资按高低顺序排列)排队标志(工资额)X:X X1X Xn由小(大)到大(小)排列。由小(大)到大(小)排列。调查标志(工资收入)Y:Y Y1Y Yn也大体上呈现为也大体上呈现为 由小(大)到大(小)有序排列。由小(大)到大(小)有序排列。等距抽样(按有关标志排序)等距抽样(按有关标志排序)样本及样本指标x1x2x3xn*抽样误差的计算抽样误差的计算概念概念:按某一个标志将总体单位划分成若干层;然在 各层按随机抽样方法分别抽出各层的样本单位组成样本。特点特点:(类型抽样与简单随机抽样比较):抽样误差较小,样本具有很好的代表性;不仅能够满足推断总体的需要,也能够满足推断各子总体的需要(满足分层次管理需要)。分层抽样的抽样标准误与组间方差无关,仅取决于组内方差的平均水平。(三)(三)类型抽样(分层抽样)类型抽样(分层抽样)分层(类)抽样分层(类)抽样 1、将总体按某标志分类。(如:职工工资分为低、中、高三类。)2、按比例在各类中随机抽样。(如:按50%比例抽样,共抽6人组成样本。工人组:随机抽样抽3人;白领组:随机抽样抽2人;老板组:随机抽样抽1人.(注意:与按有关标志等距抽样区别。)(注意:与按有关标志等距抽样区别。)类型抽样(不重复抽样)样本及样本指标x1x2x3xn(一一)总体平均数的估计总体平均数的估计 例:(大样本,采用不重复抽样方法)N=250,n=50,n1=5,n2=15,n3=30,f1 =f2=f3=n/N=0.2(二)各层样本容量的确定(二)各层样本容量的确定 *从抽样误差公式来认识类型抽样的优越性从抽样误差公式来认识类型抽样的优越性 与简单随机抽样相比,二者的抽样误差 公式只相差一个因素方差:分层抽样的 抽样误差取决于各层方差的平均数,而简单 随机抽样的抽样误差取决于总方差。在分组条件下,总方差=各组方差平均数+组间方差 所以,总方差总是大于组间方差的,从而 分层抽样的抽样误差总是小于简单随机抽样的分层抽样的抽样误差总是小于简单随机抽样的 抽样误差。抽样误差。(四)整群抽样(四)整群抽样(集团抽样(集团抽样 )概念:概念:首先将总体划分为若干部分(R群);然后按随机的原则不重复不重复地抽出其中一部分(r 群),对中选群的所有单位进行全面调查。特点:特点:简化了抽样组织工作(调查较方便,省力)缺点:缺点:样本单位过于集中 ,抽样误差大,代表性低。A BCDEFGHIx1x2x3xnx1x2x3xnx1x14、整群抽样(不重复抽样)、整群抽样(不重复抽样)样本及样本指标 一、先分群。.二、各群不需按标志顺序排列;抽中的群内是普查。设总体的N个个体形成R群,每群M个个体。从R群中随机抽取r群(一般采用不重复抽样方法),共rM=n个个体构成样本。若以 表示第i群第j个体的变量值,那么群平均数 为:总体均值的估计量为:与该估计量相对应的抽样标准误为:其中 为群抽样比,为总体群间方差。未知 时要以样本群间方差 来估计。1、总体平均数、总体平均数 的估计的估计例例 2、总体成数、总体成数 p 的估计的估计 设 为第i群某类变量值的个数,那么群成数 为:总体成数的估计量为:与该估计量相对应的抽样标准误为:其中 为群抽样比,为总体群间方差。未知时要以样本群间方差 来估计。例例类型抽样与整群抽样的区别:类型抽样与整群抽样的区别:类型抽样整群抽样选取调查单位方法将总体分为若干层(组),每层(组)按比例随机抽一 部分单位调查,将总体分为若干 群,对中选群进 行普查。组(群)间方差的影响不存在 存在组(群)内方差的影响 存在不存在多阶段抽样多阶段抽样(农产品产量调查)(农产品产量调查)全国全国四川四川绵阳绵阳江油江油.某块田地某块田地样本框等距抽样样本框等距抽样四川省绵阳市江油市某块田地样本框庄稼 (五)(五)阶段抽样阶段抽样1、总体平均数、总体平均数 的估计的估计 设总体的N个个体形成R个群,每群M个个体。从R群中随机不重复抽取r群,抽中的群再从M个个体中随机不重复抽取m个个体。若以 表示第i群第j个个体的变量值,那么群均值 的估计量为:总体平均数 的估计量为:与该估计量相对应的抽样平均误差为:其中 为第一阶段抽样比,为第二阶段抽样比;的含义与整群抽样相同。为各群方差的平均数,未知时要以各样本群的样本方差的平均数 来估计。例例 2、总体成数、总体成数p的估计的估计 设 为第i群某类变量值的个数,为第i群样本中某类变量值的个数,那么群成数 的估计量为:总体成数的估计量为:与该估计量相对应的抽样平均误差为:其中 为各群方差的平均数,未知时要以各样本 群的样本方差的平均数 来估计。其他符号的含义与前面相同。例例回顾各种抽样方式,注意对比!回顾各种抽样方式,注意对比!纯随机抽样(不重复抽样)纯随机抽样(不重复抽样)样本及样本指标x1x2x3xn等距抽样(按无关标志排序)等距抽样(按无关标志排序)样本及样本指标x1x2x3xn等距抽样(按有关标志排序)等距抽样(按有关标志排序)样本及样本指标x1x2x3xn先将原数列(杂乱)按某一标志顺序排列(整理);形成一组新数列(大小有序、整齐);类型抽样(不重复抽样)类型抽样(不重复抽样)样本及样本指标x1x2x3xn 先分类;(类似于按有关标志等距抽样)各类排列顺序不受限;各类按比例抽样,不是按等距抽样。(有别于按有关标志等距抽样)想想:这种抽样方式与想想:这种抽样方式与按有关标志等距抽样有按有关标志等距抽样有何异同?何异同?4、整群抽样(不重复抽样)样本及样本指标x1x2x3xn 先分类群;(相似于类型抽样)各群不需按标志顺序排列;抽中的群内是普查。(有别于类型抽样的各组按比例抽样)想想:这种抽样方式与想想:这种抽样方式与类型抽样有何异同?类型抽样有何异同?多阶段抽样多阶段抽样(农产品产量调查)(农产品产量调查)全国全国四川四川绵阳绵阳江油江油.某块田地某块田地样本框等距抽样样本框等距抽样四川省绵阳市江油市某块田地样本框庄稼第四节第四节 EXCEL 的应用的应用一、总体平均数区间估计一、总体平均数区间估计:操作注意事项操作注意事项:求标准差、求极限误差要使用统计函数或用公式形式。求标准差用公式:“=SQRT(45568)”;求极限误差:用统计函数“CONFIDENCE”;或公式“=CONFIDENCE(c6,c5,c3)”。其余可用计算公式处理。总体成数区间估计总体成数区间估计操作注意事项操作注意事项:求标准差、求极限误差要使用统计函数或用公式形式。求标准差用:“=SQRT(c5*1-c5*c5)”;求极限误差:用统计函数“CONFIDENCE”;或公式“=CONFIDENCE(c7,c6,c4)”。其余可用计算公式处理。本章小结本章小结 抽样估计是用样本指标推断总体参数。抽样时应遵循随机原则,可以采用重复或不重复抽样方法。运用概率估计法推断总体参数时会产生代表性误差(即抽样误差)。抽样估计的步骤是:计算样本指标计算抽样误差(抽样平均误差、抽样极限误差)(点)区间估计。抽样估计一般包含两个系列:用抽样平均数对总体平均数进行区间估计;用抽样成数对总体成数进行区间估计。影响抽样平均误差的因素有:标准差、抽样单位数、抽样方法和组织方式(简单随机抽样、分层抽样等)四种。影响抽样单位数的因素有标准差、抽样误差、概率度、抽样方法和组织方式等五种。作业作业 P148-149一、思考题 第3、4、5题二、技能题 第2题三、根据同学们自作的统计调查作业(可以视为样本容量为50的抽样数据),运用统计函数,以95%的概率保证总体均值的估计区间。(本章布置的项目任务)返回

    注意事项

    本文(《抽样调查概述》PPT课件.ppt)为本站会员(wuy****n92)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开