欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    抽样调查简单随机抽样优秀PPT.ppt

    • 资源ID:73772477       资源大小:8.40MB        全文页数:80页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    抽样调查简单随机抽样优秀PPT.ppt

    抽样调查简单随机抽样你现在浏览的是第一页,共80页2.1 定义与符号一、定义与符号(一)定义上述抽样就称为不放回简单随机抽样 定义定义2.12.1:设有限总体共有N个单元,一次整批抽取 n个单元 使得每个单元被抽中的概率都相等,任何 n个不同单元的组合(样本)都有相同的概率被抽中,这种抽样方法称为简单随机抽样法,所抽到的样本为简单随机样本。2023/2/222你现在浏览的是第二页,共80页 定义定义2.2:(在具体实施过程中,)从总体中逐个等概率抽取单元(每次抽取到尚未入样的任何一个单元的概率都相等),直到抽满 n个为止。如果每次抽中一个单元,然后放回总体,重新抽取。这样一个单元有可能被重复抽中,故又称重复抽样重复抽样。2023/2/223你现在浏览的是第三页,共80页 定义定义2.3 按照从总体的N个单元中抽取n个单元的所有可能不同的组合构造所有可能的 CNn 个样本,从CNn 个样本随机抽取一个样本,使每个样本被抽中的概率都等于 1/CNn.上述三中定义其实是完全等价的,而定义定义2.2在实际中容易实施。2023/2/224你现在浏览的是第四页,共80页例2.1 设总体有5个单元(1,2,3,4,5),按有放回简单随机抽样的方式抽取容量为2的样本,则所有可能样本为个,如表2.1。表2.1 放回简单随机抽样所有可能样本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,52023/2/225你现在浏览的是第五页,共80页例2.2 上述总体按不放回简单随机抽样方式抽取容量为2的样本,则所有可能样本为个,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2 不放回简单随机抽样所有可能样本2023/2/226你现在浏览的是第六页,共80页(二)样本分布与符号从总体抽样单元。假设顺序被抽中的样本单元的号码为(入样号码),则样本为,称为抽样比(Sampling fraction)。中逐个不放回抽取n个作为随机变量样本有什么分布呢?2023/2/227你现在浏览的是第七页,共80页1 y1,yn同分布但不相互独立,其共同分布列为 2(yi,yj)的联合分布列均同(y1,y2)2023/2/228你现在浏览的是第八页,共80页表2.3符号总体参数样本统计量2023/2/229你现在浏览的是第九页,共80页二、抽样方法(一)抽签法 制作N个外形相同的签,将它们充分混合,然后一次抽取n个签,或一次抽取一个但不放回,抽取n次得到n个签。则这n个签上所对应号码表示入样的单元号。例如例如:某中学为了解学生身体素质的基本状况,从全校N1200人中抽取一个简单样本n100人进行检查。2023/2/2210你现在浏览的是第十页,共80页1 随机数表(二)随机数法如上例,N1200,则在表中随机连续取四列,顺序往下,选出前面100个不同(不放回抽样)的00011200之间的数字。如果不够100个,可随机再取四列,同样操作,直至抽取100个止。2023/2/2211你现在浏览的是第十一页,共80页Simple random sampling2023/2/2212你现在浏览的是第十二页,共80页Table of random numbers2023/2/2213你现在浏览的是第十三页,共80页2 随机数骰子 随机数骰子是由均匀材质制成的正20面体,每个面上刻有一个09的数字,且每个数字只出现在两个面上。要产生一个m位数的随机数(如m4,N1200),则将m(m=4)个颜色不同的骰子盒中,并规定每个颜色代表的位数,盖上盖子,充分摇动盒子后,打开读出各色骰子的数字,即可得一个随机数。重复上述过程,直至产生了n个满足条件的随机数。2023/2/2214你现在浏览的是第十四页,共80页3 利用统计软件直接抽取法 大部分统计软件都有产生随机数的功能,快捷方便。不过产生的是伪随机数,有一定循环周期的。简单介绍一下利用EXCEL产生随机数的方法.2023/2/2215你现在浏览的是第十五页,共80页2023/2/2216你现在浏览的是第十六页,共80页2023/2/2217你现在浏览的是第十七页,共80页2023/2/2218你现在浏览的是第十八页,共80页2.2 简单估计法(SE)一、总体均值的估计(一)简单估计定义.(2.6)(二)简单估计量的性质 引理引理2.1 从大小为N的总体中抽取一个样本容量为n的简单随机样本,则总体中每个特定的单元入样的概率为n/N,两个特定单元入样的概率为n(n1)/N(N-1)。2023/2/2219你现在浏览的是第十九页,共80页 引理引理2.2从大小为N的总体中抽取一个样本容量为n的简单随机样本。若令:则:2023/2/2220你现在浏览的是第二十页,共80页(二)简单估计量的性质 定理2.1上述简单估计是无偏的,即 定理2.2 上述简单估计的方差(均方误差)为:.(2.12/2.18)2023/2/2221你现在浏览的是第二十一页,共80页证明(P35证法1对称证法):为0注意样本分布2023/2/2222你现在浏览的是第二十二页,共80页推论2.7的无偏估计为.(2.25)证明:只须说明样本方差是总体方差的无偏估计即可。注意2023/2/2223你现在浏览的是第二十三页,共80页 例2.3 从某个N100的总体重抽取一个容量n=10的简单随机样本,要估计总体平均水平,并给出置信度为95的置信区间估计。如表2.4序号1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8表2.4 简单随机样本指标 2023/2/2224你现在浏览的是第二十四页,共80页2023/2/2225你现在浏览的是第二十五页,共80页(三)有放回简单随机抽样的简单估计量由于故有放回抽样的精度低于不放回抽样的精度。2023/2/2226你现在浏览的是第二十六页,共80页说明:1 抽样调查中的估计量与传统数理统计中估计量的区别(见表2.5)表2.5 抽样理论与传统数理统计关于样本均值性质异同比较抽样理论数理统计理论假设样本之间不独立,所以可能样本最多 个,欲估计总体特征为 ,当nN时可以求出样本之间独立,所有可能样本最多为无限多个;欲估计总体特征为总体(一般是随机变量X)期望,一般不能通过样本求出 符号、定义期望方差2023/2/2227你现在浏览的是第二十七页,共80页2 总体方差一般也是未知的,故计算估计量方差(估计)值时总是用样本方差直接去估计它,因为该估计无偏,故这样做相对是合理的。3 对于无限总体的简单随机抽样(或有限总体有放回简单抽样)估计中由于N一般很大,即从有限总体抽样得到简单随机样本均值得方差是从无限总体抽样得的独立样本均值的方差的1f 倍,要小些,这意味着对同等样本量,不放回简单随机抽样的精度高于有放回的。由于样本点不会重复,样本量相同时所包含的有效样本点更多,因此信息更多,效果当然好些。1f又被称为有限总体校正系数。2023/2/2228你现在浏览的是第二十八页,共80页 4样本容量n越大,估计量方差越小。当样本容量一定时,总体方差越大,估计量方差越大。由于总体方差是固定的,因此在简单随机抽样的条件下,要提高估计量精度就只有增加样本容量了。但增加样本容量也会带来计算量骤增和成本增加,所以是矛盾的一对,需要找到合适的平衡点。2023/2/2229你现在浏览的是第二十九页,共80页二、总体总量的估计(一)简单估计量.(2.7)(二)估计量性质 推论2.1 2.4 2.8 .(2.13).(2.19).(2.26)2023/2/2230你现在浏览的是第三十页,共80页例2.4(续例2.3)估计总体总量,并给出置信度为95条件下的估计相对误差。三、总体比例的估计 将总体分为两类,一类具有该特征的单元A个,另一类不具有该特征的单元NA个。调查的目的是估计或A 若令则2023/2/2231你现在浏览的是第三十一页,共80页(一)估计量的定义(二)估计量性质 推论2.2 2.5 2.9 对于简单随机抽样,p是P无偏估计。p的方差为 方差的无偏估计 (2.27)(2.20)2023/2/2232你现在浏览的是第三十二页,共80页例2.5某超市开张一段时间后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度。该超市与附近一个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为n=200人的样本。调查发现对购物表示满意或基本满意的居民有130人,估计对该超市购物环境持肯定态度的居民的比例,并在置信度95%条件下,给出估计的绝对误差和置信区间,假设抽样比可以忽略。2023/2/2233你现在浏览的是第三十三页,共80页(2)样本协方差是总体协方差的无偏估计.(2.22,2.23)(2.29)考虑二维总体2023/2/2234你现在浏览的是第三十四页,共80页证明:仍采用对称法(P40证法1)(1)注意样本分布注意为02023/2/2235你现在浏览的是第三十五页,共80页(1)证法2:(构造性)展开2023/2/2236你现在浏览的是第三十六页,共80页(2)注意由(1)2023/2/2237你现在浏览的是第三十七页,共80页一、概念与作用一、概念与作用 (一)概念(一)概念 比率(比率(Ratio)与比例()与比例(Proportion)区别)区别 (二)作用(二)作用2.3 比率估计量及其性质一种场合是待估的总体参数R是两个变量比值。如人口密度,恩格尔系数等。分子分母均为r.v.分子为r.v.2023/2/2238你现在浏览的是第三十八页,共80页另一种应用场合,虽然待估的参数是某个研究变量的均值或总体总量,它本来可以通过样本均值加以估计,但是为了提高估计的效率,它通过引进一个辅助变量xi,来计算比率,即 再通过这一比率乘以总体已知的辅助变量均值或总量来达到估计的目的。2023/2/2239你现在浏览的是第三十九页,共80页二、应用条件二、应用条件 (1)辅助变量(auxiliary variable)资料易得或已知 (2)辅助变量与目标变量之间存在高度相关性且相关 性稳定。(3)样本量一般要求比较大三、简单随机抽样下的比率估计三、简单随机抽样下的比率估计2023/2/2240你现在浏览的是第四十页,共80页(一)定义(一)定义 比率估计量(比率估计量(ratio estimator)又称比估计)又称比估计。(2.30)(2.31)2023/2/2241你现在浏览的是第四十一页,共80页(二)比率估计的性质(二)比率估计的性质引理引理2.3定理定理2.6推论推论2.112023/2/2242你现在浏览的是第四十二页,共80页引理引理2.4证:当n充分大时 2023/2/2243你现在浏览的是第四十三页,共80页定理定理2.7推论推论2.122023/2/2244你现在浏览的是第四十四页,共80页因而方差估计有两种思路(2.39)(2.40)2023/2/2245你现在浏览的是第四十五页,共80页例例2.6i123456均值XiYi011331151882910464.518表4.1 假设的总体数据2023/2/2246你现在浏览的是第四十六页,共80页解:i样本简单估计比率估计123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.7517.686442023/2/2247你现在浏览的是第四十七页,共80页2023/2/2248你现在浏览的是第四十八页,共80页解2023/2/2249你现在浏览的是第四十九页,共80页例例2.7(P51例例2.4)在二十世纪90年代初的一项工资研究中,人们发现IT行业中,从业者的现薪与起薪之间相关系数高达0.88,已知某IT企业474名员工的评鉴起薪为17 016.00元/年,现根据对100个按简单随机抽样方式选出的员工现薪的调查结果,估计该企业员工的现薪平均水平。数据如下:,2023/2/2250你现在浏览的是第五十页,共80页解:简单估计 95的置信区间 比率估计 95的置信区间 2023/2/2251你现在浏览的是第五十一页,共80页例例2.8某县在对船舶月完成的货运量进行调查,对运管部门登记的船舶台帐进行整理后获得注册船舶2 860艘,载重吨位154 626 吨。从2 860艘船舶中抽取一个n10的简单随机样本。调查得到样本船舶月完成的货运量及其载重吨位如表4.2(单位:吨)要估计该县船舶月完成货运量 1234578015001005376600100505010206789102170182314501581370120150802050表4.2样本船舶货运量及载重吨位数据 2023/2/2252你现在浏览的是第五十二页,共80页 解2023/2/2253你现在浏览的是第五十三页,共80页2023/2/2254你现在浏览的是第五十四页,共80页(三)消除比率估计偏倚的方法(三)消除比率估计偏倚的方法2023/2/2255你现在浏览的是第五十五页,共80页 哈特利哈特利-罗斯罗斯(Hartley-Ross,1954)提出的估计量 (2.51)于是可以令2023/2/2256你现在浏览的是第五十六页,共80页事实上:2023/2/2257你现在浏览的是第五十七页,共80页例2.9 2023/2/2258你现在浏览的是第五十八页,共80页四、比率估计的效率四、比率估计的效率1/22023/2/2259你现在浏览的是第五十九页,共80页2.4 回归估计量及其性质比率估计成为最优线性估计的条件:比率估计成为最优线性估计的条件:(1)样本点(yi,xi)形成过原点的直线(2)yi对直线的偏差与xi成比例2023/2/2260你现在浏览的是第六十页,共80页一、回归估计的定义一、回归估计的定义二、是已知常数时(记为0)定理定理2.8 2023/2/2261你现在浏览的是第六十一页,共80页Q:“0取何值时,回归估计量的精度最高,即最 小?”定理2.9:三、由样本回归系数计算得到三、由样本回归系数计算得到 (2.56 Y对X回归系数)定理定理2.10 这时的均值估计量是渐近无偏估计 注意b并不是B的无偏估计2023/2/2262你现在浏览的是第六十二页,共80页定理定理2.11 它的一个近似估计为:2023/2/2263你现在浏览的是第六十三页,共80页例2.10 续例2.82023/2/2264你现在浏览的是第六十四页,共80页四、精度比较四、精度比较1回归估计总优于简单估计,除非=0 2比率估计优于简单估计的条件 3回归估计优于比率估计的条件是 五、多变量回归估计(略五、多变量回归估计(略)2023/2/2265你现在浏览的是第六十五页,共80页2.5 样本量的确定一、总体均值情形1 给定标准误差上限,求满足条件的最小n 2023/2/2266你现在浏览的是第六十六页,共80页 2 给定绝对误差上限及信度,求满足条件的最小n有放回,不放回 3 给定相对误差上限及信度,求满足条件的最小n有放回不放回 2023/2/2267你现在浏览的是第六十七页,共80页给定相对标准误差上限,求满足条件 的最小n.放回不放回例2.6 在例2.3中,如果要求以95%的把握保证相对误差不超过10%,样本量应该取多少?2023/2/2268你现在浏览的是第六十八页,共80页2023/2/2269你现在浏览的是第六十九页,共80页二、总体总量情形 作业 考虑各种情行的公式例 欲估计一个农村的每月平均副业收入,已知该村共有1000户农户,月副业收入的标准差不超过300元。(1)现要求置信度为95%,估计每户月副业收入的误 差不超过50元,应抽取多少户作为样本?(2)若每户调查费用为15元,调查管理费用为800元,该项调查预计费用是多少?2023/2/2270你现在浏览的是第七十页,共80页例 如果上例目的是要估计全村1000户一月的副业总收入,允许总量的误差为40000,置信度为95%,应抽取多少样本?三、总体参数P的情形四、总体参数的预先估计2023/2/2271你现在浏览的是第七十一页,共80页(1)根据以往的经验数据 例如对同类问题获得过一个样本量n0为的简单随机样本,并且已知在一定置信度下(比如95%),该调查对总体均值(或总量)估计的相对误差上限为r0,则在相同的置信度下,如果希望本次调查的相对误差上限为r,则在抽样比可以忽略的情况下,可以近似地计算出本次调查所需的样本量:作业 证明上述结论2023/2/2272你现在浏览的是第七十二页,共80页(2)在正式调查前进行试点调查,根据试点调查的 结果作出估计,或者采用两步抽样(3)没有同类调查经验,又不能进行预调查,则只能通过有经验的专家作一些定性分析,对总体变异系数C(比较稳定)作出估计。(4)注意:针对总体参数为 时情形 当估计P0.5,则选取较小的P,如若估计P为0.6,0.8则选取P为0.6 若对P一无所知则取P=0.5。2023/2/2273你现在浏览的是第七十三页,共80页例2.7 某销售公司希望了解全部3000家客户对公司的满意度,决定用电话调查一个简单随机样本。这时销售公司希望以95的把握保证客户满意度比例P在样本比例p10,p+10范围内,但对总体比例P无法给出一个大致范围。这时调查多少个客户,才能保证满足要求?2023/2/2274你现在浏览的是第七十四页,共80页2.6 其它相关问题一、逆抽样比例P是稀有事件的比例,一般P0.2 事先给定一个正整数m,然后逐个随机抽取样本,n个单元。直到抽到m个所考虑特征的单元为止,设共取了2023/2/2275你现在浏览的是第七十五页,共80页 事实上利用负二项分布的分布列之和为1 2023/2/2276你现在浏览的是第七十六页,共80页这样给定了相对标准误差后,就可以确定m 2023/2/2277你现在浏览的是第七十七页,共80页二、设计效应(Design effect)(L.Kish)2023/2/2278你现在浏览的是第七十八页,共80页 通常的值因为总体方差未知而事先无法得知,此时需注意在经费允许的前提下,样本量取值应坚持保守原则,尽量大一点,以便留有余地。例如后续的分层抽样的deff1,而取为1.实际上,我们在调查时无法保证在每个被抽中的样本点上都能如愿地获得有效信息。例如不是每个人都愿意接受访问,也不是每个人都能按要求提供真是答案,尤其当问题涉及隐私或其它敏感内容时,所以必须考虑有效回答率。如估计有效回答率为r,则需再调整样本量为n/r.2023/2/2279你现在浏览的是第七十九页,共80页宏村宏村2023/2/2280你现在浏览的是第八十页,共80页

    注意事项

    本文(抽样调查简单随机抽样优秀PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开