欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学第5章++抽样分布.ppt

    • 资源ID:67225052       资源大小:12.86MB        全文页数:90页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学第5章++抽样分布.ppt

    第第 5章章 抽样分布抽样分布1、常、常见的抽的抽样方法方法2、三种不同性质的分布三种不同性质的分布 3、一个总体参数推断时样本统计量分布一个总体参数推断时样本统计量分布4、两个总体参数推断时样本统计量分布、两个总体参数推断时样本统计量分布学习目标学习目标1.了解常见的抽样方法了解常见的抽样方法2.区分总体分布、样本分布、抽样分布区分总体分布、样本分布、抽样分布3.理解抽样分布与总体分布的关系理解抽样分布与总体分布的关系4.掌握单总体参数推断时样本统计量的分布掌握单总体参数推断时样本统计量的分布5.掌握双总体参数推断时样本统计量的分布掌握双总体参数推断时样本统计量的分布5.1 常见的抽样方法常见的抽样方法 指样本单位的抽取不受主指样本单位的抽取不受主观因素及其他系统性因素观因素及其他系统性因素的影响,每个总体单位都的影响,每个总体单位都有均等的被抽中机会有均等的被抽中机会一、抽样推断一、抽样推断按照按照随机原则随机原则 从全部研究对象中抽取一从全部研究对象中抽取一部分单位进行调查,并以调查结果对总部分单位进行调查,并以调查结果对总体数量特征作出具有一定可靠程度的估体数量特征作出具有一定可靠程度的估计与推断,从而认识总体的一种统计方计与推断,从而认识总体的一种统计方法。法。并非所有的抽样估计都按随机原并非所有的抽样估计都按随机原则抽取样本,也有则抽取样本,也有非随机抽样非随机抽样总体总体随机样本随机样本非随机样本非随机样本与总体分布与总体分布特征相同特征相同与总体分布与总体分布特征不同特征不同q按按随机原则随机原则抽取样本单位抽取样本单位q以以样本样本的数量特征推断的数量特征推断总体总体的数量特征的数量特征q抽样推断产生抽样推断产生抽样误差抽样误差,但抽样误差可,但抽样误差可以事先以事先计算并控制计算并控制二、抽样推断的特点二、抽样推断的特点 与全面调查相比,抽样调查既节省了人力、物力、与全面调查相比,抽样调查既节省了人力、物力、财力和时间,又达到了认识总体数量特征的目的。财力和时间,又达到了认识总体数量特征的目的。我我国在国在19941994年确立了以周期性普查为基础,以经常性抽年确立了以周期性普查为基础,以经常性抽样调整为主体,同时辅之以样调整为主体,同时辅之以重点调查、科学核算等综重点调查、科学核算等综合运用的统计调查方法体系。合运用的统计调查方法体系。三、抽样推断的理论基础三、抽样推断的理论基础大数大数定律定律中心极限定律中心极限定律表明大量随机观象表明大量随机观象平均结果平均结果具有具有稳定性稳定性的性的性质。质。大数定律论证了如果独立随机变量总体大数定律论证了如果独立随机变量总体存在有限的平均数和方差,则对于充分大的存在有限的平均数和方差,则对于充分大的样本可以近乎样本可以近乎100%100%的概率,期望样本平均的概率,期望样本平均数与总体平均数的绝对离差数与总体平均数的绝对离差为任意小。为任意小。如果变量总体存在有限的平均数和方如果变量总体存在有限的平均数和方差,那么不论这差,那么不论这个总体的分布如何,个总体的分布如何,随着样本容量的增加,样本平均数的随着样本容量的增加,样本平均数的分布,便趋近于分布,便趋近于正态分布正态分布。q不可能不可能进行全面调查时进行全面调查时q不必要不必要进行全面调查时进行全面调查时q来不及来不及进行全面调查时进行全面调查时q对全面调查资料进行对全面调查资料进行补充修正补充修正时时抽样推断的应用抽样推断的应用1、根据取样方式、根据取样方式重复抽样重复抽样从总体从总体N N个单位中随机抽取一个样本容个单位中随机抽取一个样本容量为量为n n的样本,每次从总体中抽取一个,的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新并把结果登记下来,又放回总体中重新参加下一次的抽选。又称参加下一次的抽选。又称放回抽样放回抽样不重复抽样不重复抽样每次从总体中抽选一个单位后就不每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又再将其放回参加下一次的抽选。又称称不放回抽样不放回抽样.总体单位数总体单位数N N不变,同一单位可能不变,同一单位可能多次被抽中。多次被抽中。总体单位数减少总体单位数减少n n,同一单位只可能同一单位只可能被抽中一次。被抽中一次。四、抽样方法分类四、抽样方法分类2、根据对样本的要求不同、根据对样本的要求不同考虑顺序抽样考虑顺序抽样不考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。考虑各单位的中选顺序。ABCCBA不考虑各单位的中选顺序。不考虑各单位的中选顺序。ABCCBA考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样综合起来共有综合起来共有四种抽样方法四种抽样方法样本的可能数目样本的可能数目考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样不考虑顺序的重复抽样简单随机抽样简单随机抽样分层抽样分层抽样系统抽样系统抽样整群抽样整群抽样3、根据抽取的原则、根据抽取的原则(抽样调查的组织形式抽样调查的组织形式)(1)它要求被抽取样本的总体的个体数)它要求被抽取样本的总体的个体数有限有限;(2)它是从总体中)它是从总体中逐个逐个进行抽取;进行抽取;(3)它是一种)它是一种等概率等概率抽样。抽样。简简单单随随机机抽抽样样是是在在特特定定总总体体中中抽抽取取样样本本,总总体体中中每每一一个个体体被被抽抽取取的的可可能能性性是是等等同同的的,而而且且任任何何个个体体之之间间彼彼此此被被抽抽取取的的机机会会是是独独立立的的。如如果果用用从从个个体体数数为为N的的总总体体中中抽抽取取一一个个容量为容量为n的样本,那么每个个体被抽取的概卒等于的样本,那么每个个体被抽取的概卒等于 简单随机抽样简单随机抽样(纯随机抽样纯随机抽样)简单随机抽样的方法简单随机抽样的方法练习练习:先先将将总体中的所有个体(共总体中的所有个体(共N个)编号(号码可以从个)编号(号码可以从1到到N),),并把号码写在形状、大小相同的号签上(号签可以用并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续个号签,连续抽取抽取n次,就得到一个容量为次,就得到一个容量为n的样本。对个体编号时,也可的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。以利用已有的编号。例如学生的学号,座位号等。抽签法抽签法 随随机机抽抽样样并并不不是是随随意意或或随随便便抽抽取取,因因为为随随意或随便抽取都会带有主观或客观的影响因素意或随便抽取都会带有主观或客观的影响因素随随机机数数表表是是统统计计工工作作者者用用计计算算机机生生成成的的随随机机数数,并并保保证证表中的每个位置上的数字是等可能出现的。表中的每个位置上的数字是等可能出现的。随随机机数数表表并并不不是是唯唯一一的的,因因此此可可以以任任选选一一个个数数作作为为开开始始,读读数的方向可以向左,也可以向右、向上、向下等等。数的方向可以向左,也可以向右、向上、向下等等。用用随随机机数数表表进进行行抽抽样样的的步步骤骤:将将总总体体中中个个体体编编号号;选选定定开开始的数字;获取样本号码。始的数字;获取样本号码。由由于于随随机机数数表表是是等等概概率率的的,因因此此利利用用随随机机数数表表抽抽取取样样本本保保证了被抽取个体的概率是相等的。证了被抽取个体的概率是相等的。随机数表法随机数表法如何用随机数表来抽取样本。如何用随机数表来抽取样本。为了检验某种产品的质量,决定从为了检验某种产品的质量,决定从40件产品中抽取件产品中抽取10件进件进行检查,利用随机数表抽取这个样本行检查,利用随机数表抽取这个样本16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28注将总体中的注将总体中的N个个体编号时可以从个个体编号时可以从0开始,例如开始,例如N100时编号可以是时编号可以是00,01,02,99,这样总体中的所,这样总体中的所有个体均可用两位数字号码表示,便于运用随机数有个体均可用两位数字号码表示,便于运用随机数表。表。计算机模拟法计算机模拟法是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在是将随机数字编制为程序存储在计算机计算机计算机计算机中,需要时中,需要时中,需要时中,需要时将总体中各单位编上号码,启用将总体中各单位编上号码,启用将总体中各单位编上号码,启用将总体中各单位编上号码,启用随机数字发生器随机数字发生器随机数字发生器随机数字发生器输输输输出随机数字,然后从总体中找到相应总体单位形成出随机数字,然后从总体中找到相应总体单位形成出随机数字,然后从总体中找到相应总体单位形成出随机数字,然后从总体中找到相应总体单位形成样本。样本。样本。样本。由于每排的座位有由于每排的座位有40个,各排每个号码被抽取的概率都是个,各排每个号码被抽取的概率都是 ,因,因而第而第1排被抽取前,其他各排中各号码被抽取哪率也是排被抽取前,其他各排中各号码被抽取哪率也是 ,也就是,也就是说被抽取的概率是说被抽取的概率是 ,每排的抽样也是简单随机抽样,这种,每排的抽样也是简单随机抽样,这种抽样的方法是系统抽样。抽样的方法是系统抽样。(1)一一个个礼礼堂堂有有30排排座座位位,每每排排有有40个个座座位位。一一次次报报告告会会礼礼堂堂坐坐满满了了听听众众。会会后后为为听听取取意意见见留留下下了了座座位位号号为为20的的30名名听听众众进行座谈。进行座谈。当当总总体体的的个个数数较较多多时时,将将总总体体分分成成均均衡衡的的部部分分,然然后后按按照照预预先先定定出出的的规规则则,从从每每一一部部分分中中抽抽取取1个个个个体体,得得到到所需要的样本,称为所需要的样本,称为系统抽样系统抽样。系统抽样系统抽样(机械抽样、等距抽样机械抽样、等距抽样 )系统抽样的步骤为:系统抽样的步骤为:(1)采取随机方式将总体中的个体编号。)采取随机方式将总体中的个体编号。(2)将整个的编号均衡地分段,确定分段间隔)将整个的编号均衡地分段,确定分段间隔k。是整数时,是整数时,;不是整数时,从不是整数时,从N中剔除一些个体,使得其为整数为止。中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:)按照规则抽取样本:l;lk;l2k;lnk 系系统统抽抽样样时时,将将总总体体中中的的个个体体均均分分后后的的每每一一段段进进行行抽抽样样时时,采采用用简简单单随随机机抽抽样样;系系统统抽抽样样每每次次抽抽样样时时,总总体体中中各各个个个个体体被被抽抽取取的的概概率率也也是是相相等等的的;如如总总体体的的个个体体数数不不能能被被样样本本容容量量整整除除时时,可可以以先先用用简简单单随随机机抽抽样样从从总总体体中中剔剔除除几几个个个个体体,然然后后再再按按系系统统抽抽样样进进行行。需需要要说说明明的是整个抽样过程中每个个体被抽到的概率仍然相等。的是整个抽样过程中每个个体被抽到的概率仍然相等。例如例如,为了了解参加某种知识竞赛的,为了了解参加某种知识竞赛的1000名学生的成绩,名学生的成绩,打算从中抽取一个容量为打算从中抽取一个容量为50的样本。假定这的样本。假定这1000名学生名学生的编号是的编号是1,2,1000,由于,由于50:10001:20,我们,我们将总体均分成将总体均分成50个部分,其中每一部分包括个部分,其中每一部分包括20个个体,个个体,例如第例如第1部分的个体编号是部分的个体编号是1,2,20。然后在第一。然后在第一部分随机抽取一个号码,这样得到一个容量为部分随机抽取一个号码,这样得到一个容量为50的样本:的样本:18,38,58,978,998在上面的抽样中,由于在第在上面的抽样中,由于在第1部分(个体编号部分(个体编号120)中的起始号码是随机确定的,每个号码被抽取的概率中的起始号码是随机确定的,每个号码被抽取的概率都等于都等于0.05,所以在抽取第,所以在抽取第1部分的个体前部分的个体前,其他各部其他各部分中每个号码被抽取的概率也都是分中每个号码被抽取的概率也都是0.05.就是说就是说,在这个在这个系统抽样中系统抽样中,每个个体被抽到的概率都是每个个体被抽到的概率都是0.05.排列次序用的标志有两种:排列次序用的标志有两种:选选择标志与抽样调查所研究内容无关,择标志与抽样调查所研究内容无关,称称无关标志排队。无关标志排队。选选择标志与抽样调查所研究的内容有关,择标志与抽样调查所研究的内容有关,称有关标志排队。称有关标志排队。研究工人的平均收入水平时,按工号排队。研究工人的平均收入水平时,按工号排队。例例研究工人的生活水平,按工人月工资额高研究工人的生活水平,按工人月工资额高低排队。低排队。例例机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:机械抽样按样本单位抽选的方法不同,可分为三种:随随机起点等距抽样机起点等距抽样k k k k+a 2k+a (n-1)k+aak(k为抽取间隔)示意图:示意图:半半距起点等距抽样距起点等距抽样k k kk(k为抽取间隔)示意图:示意图:对对称等距抽样称等距抽样示意图:示意图:k k k 2k-a 2k+a 4k-a 4k+aak(k为抽取间隔)分层抽样分层抽样(分类抽样分类抽样)当当已已知知总总体体由由差差异异明明显显的的几几部部分分组组成成时时,为为了了使使样样本本充充分分地地反反映映总总体体的的情情况况,按按照照各各部部分分所所占比例进行抽样。各部分叫做占比例进行抽样。各部分叫做层层。分分层层抽抽样样适适用用于于总总体体由由差差异异明明显显的的几几部部分分组组成成的的情情况况,每每一一部部分分称称为为层层,在在每每一一层层中中实实行行简简单单随随机机抽抽样样。这这种种方方法法较较充充分分地地利利用用了了总总体己有信息,是一种实用、操作性强的方法体己有信息,是一种实用、操作性强的方法。分分层层抽抽样样的的一一个个重重要要问问题题是是一一个个总总体体如如何何分分层层。分分层层抽抽样样中中分分多多少少层层,要要视视具具体体情情况况而而定定。总总的的原原则则是是:层层内内样样本本的的差差异异要要小小,而而层层与与层层之之间间的的差异尽可能地大,差异尽可能地大,否则将失去分层的意义否则将失去分层的意义。类型的划分类型的划分类型的划分类型的划分:必须有清楚的划类界限;必须有清楚的划类界限;必须知道各类中的单位数目和比例;必须知道各类中的单位数目和比例;分类型的数目不宜太多。分类型的数目不宜太多。类型抽样的好处是:类型抽样的好处是:类型抽样的好处是:类型抽样的好处是:样样本代表性高、抽样误差小、抽样调查本代表性高、抽样误差小、抽样调查成本较低。如果抽样误差的要求相同的话则成本较低。如果抽样误差的要求相同的话则抽样数目可以减少。抽样数目可以减少。例例2、一一个个单单位位的的职职工工有有500人人,其其中中不不到到35岁岁的的有有125人人,3549岁岁的的有有280人人,50岁岁以以上上的的有有95人人。为为了了了了解解该该单单位位职职工工年年龄龄与与身身体体状状况况的的有有关关指指标标,从从中中抽抽取取100名名职工作为样本,应该怎样抽取?职工作为样本,应该怎样抽取?分层抽样的抽取步骤:分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。)对于不能取整的数,求其近似值。整群抽样整群抽样 整群抽样整群抽样即从全及总体中成群地抽取即从全及总体中成群地抽取样本单位,对抽中的群内的所有单位都进样本单位,对抽中的群内的所有单位都进行观察。行观察。整群抽样的好处:整群抽样的好处:组织工作比较简组织工作比较简单方便,适用于一些特殊的研究对象。单方便,适用于一些特殊的研究对象。其不足之处是,一般比其它抽样方式的其不足之处是,一般比其它抽样方式的抽样误差大。抽样误差大。三种抽样方法的比较三种抽样方法的比较 5.2 三种不同性质的分布三种不同性质的分布一一.总体分布总体分布二二.样本分布样本分布三三.抽样分布抽样分布1.总体中各元素的观察值所形成的分布 2.分布通常是未知的3.可以假定它服从某种分布 总体分布总体分布(population distribution)总体总体1.一个样本中各观察值的分布 2.也称经验分布 3.当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 样本分布样本分布(sample distribution)样样本本复习:复习:总体总体的性质的性质一个统计问题总有它明确的研究对象。然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标数量指标和该数量指标在总体中的分布分布情况.这时,每个个体具有的数量指标的全体就是总体总体.参数参数:描述总体及其概率分布的数量值称为:描述总体及其概率分布的数量值称为参数。参数。总体总体的性质的性质总体可以用一个随机变量及其分布来描述。总体可以用一个随机变量及其分布来描述。例如例如:研究某批灯泡的寿命时,关心的研究某批灯泡的寿命时,关心的数量指数量指标标就是寿命,鉴于此,总体就可用随机变就是寿命,鉴于此,总体就可用随机变量量X表示,或用其分布函数表示,或用其分布函数F(x)表示。表示。样本的性质样本的性质为样本是随机变量。容量为样本是随机变量。容量为n的样本可以看作的样本可以看作n维随机变量维随机变量。但一旦取定一组样本,得到的是n个具体的数(X1,X2,Xn),称为样本样本的一次的一次观察值观察值,简称,简称样本值样本值。样本的性质样本的性质代表性:代表性:X1,X2,Xn中每个与所考察的总体有相中每个与所考察的总体有相同的分布同的分布独立性:独立性:X1,X2,Xn是相互独立的随机变量。由是相互独立的随机变量。由简单随机抽样得到的样本称为简单随机样本,简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的它可以用与总体独立同分布的n个相互独立的个相互独立的随随机变量机变量X1,X2,Xn表示表示.若总体的分布函数为若总体的分布函数为F(x),则其简单随机样本的联,则其简单随机样本的联合分布函数为合分布函数为F(x1)F(x2)F(xn)。简单随机。简单随机样本是应用中最常见的情形,今后,当说到样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本是取自某总体的样本”时,若不特时,若不特别说明,就指别说明,就指简单随机样本简单随机样本.样本的性质样本的性质简单样本是一组独立、同分布随机变量简单样本是一组独立、同分布随机变量举例(抽样的随机性):从一批平均寿命为1000小时的灯泡中抽取一个样品,若干个样品构成总体的一个样本(随机变量):X1,X2,Xn.总体、样本、样本值的关系总体、样本、样本值的关系事实上我们抽样后得到的资料都是具体的、具体的、确定的值确定的值。如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本不是样本。我们只能观察到随机变量取的值而见不到随机变量。样本统计量样本统计量样本统计量样本统计量:设(X1,X2,Xn)是总体的一个样本,f(X1,X2,Xn)是不含任何参数的连续函数,则称f(X1,X2,Xn)为样本(X1,X2,Xn)的一个统计量。统计量的分布称为抽样分布抽样分布。常用的样本统计量常用的样本统计量 样本均值样本均值:它反映了总体均值的信息 样本方差样本方差:样本样本K阶原点矩阶原点矩:它反映了总体K阶矩的信息样本样本K阶中心矩阶中心矩:它反映了总体K阶中心矩的信息 1.样本统计量的概率分布样本统计量的概率分布2.是一种理论概率分布是一种理论概率分布3.随机变量是随机变量是 样本统计量样本统计量样本统计量样本统计量n n样本均值样本均值,样本比例,样本方差等样本比例,样本方差等4.结果来自结果来自容量相同容量相同的的所有所有可能样本可能样本5.提供了样本统计量长远我们稳定的信息,是进提供了样本统计量长远我们稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重行推断的理论基础,也是抽样推断科学性的重要依据要依据 抽样分布抽样分布(sampling distribution)抽样分布抽样分布(sampling distribution)总体总体计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计计算样本统计量量量量量量例如:样本均例如:样本均例如:样本均值、比例、方值、比例、方值、比例、方差差差样样本本样本的概率分布样本的概率分布把某一抽样方法的全部可能的样本指标与其相把某一抽样方法的全部可能的样本指标与其相应的概率排列起来,就得到样本的概率分应的概率排列起来,就得到样本的概率分布。布。若将若将样本指标的取值分别记为样本指标的取值分别记为 其相应的概其相应的概率记为率记为P1,P2,Pn,将它们按顺序排列起来,可得将它们按顺序排列起来,可得如下概率分布表。如下概率分布表。5.3 样本统计量的抽样分布样本统计量的抽样分布 (一个总体参数推断时一个总体参数推断时)一一.样本均值的抽样分布样本均值的抽样分布二二.样本比例的抽样分布样本比例的抽样分布三三.抽样方差的抽样分布抽样方差的抽样分布样本均值的抽样分布样本均值的抽样分布1.容量相同的所有可能样本的样本均值的概率分布2.一种理论概率分布3.进行推断总体总体均值的理论基础样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)【例例例例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4 4。4 4 个个个个体体分分别别为为x x1 1=1=1、x x2 2=2=2、x x3 3=3=3 、x x4 4=4=4 。总总体的均值、方差及分布如下体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2 2.3.3均值和方差均值和方差均值和方差均值和方差样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样条件下,共有样条件下,共有4 42 2=16=16个样本。所有样本的结果为个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的所有可能的所有可能的n n=2 =2 的样本(共的样本(共的样本(共的样本(共1616个)个)个)个)样本均值的抽样分布样本均值的抽样分布(例题分析例题分析)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值1616个样本的均值(个样本的均值(个样本的均值(个样本的均值(x x)X X样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(X X)1.51.53.03.04.04.03.53.52.02.02.52.5样本均值的分布与总体分布的比较样本均值的分布与总体分布的比较(例题分析例题分析)=2.5 2=1.25总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3抽样分布抽样分布抽样分布抽样分布P P(X X)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5X X样本均值的抽样分布样本均值的抽样分布与中心极限定理与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布Xn n=16=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 X X也也服服从从正正态态分分布布,X X 的的数学期望为数学期望为,方差为方差为 2 2/n n。即即 X XN N(,2 2/n n)中心极限定理中心极限定理(central limit theorem)当当样本容量足够样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布中中中中心心心心极极极极限限限限定定定定理理理理:设设从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样分布近似服从均值为样分布近似服从均值为、方差为方差为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体X X抽样分布与总体分布的关系抽样分布与总体分布的关系总体分布总体分布总体分布总体分布正态分布正态分布非正态分布非正态分布大样本大样本小样本小样本正态分布正态分布正态分布正态分布非正态分布非正态分布1.样本均值的数学期望2.样本均值的方差n n重复抽样重复抽样n n不重复抽样不重复抽样样本均值的抽样分布样本均值的抽样分布(数学期望与方差数学期望与方差)注意:有限总体校正系数注意:有限总体校正系数!由于实际工作中往往是从有限总体中做不重复的抽由于实际工作中往往是从有限总体中做不重复的抽样,尽管抽取前后的元素不再相互独立,样,尽管抽取前后的元素不再相互独立,E E(X X)不受影响不受影响,E(X)=,但,但 受受 X之间是否相之间是否相互独立的影响,如果互独立的影响,如果Xi之间不相互独立,计算需要之间不相互独立,计算需要用有限总体校正系数用有限总体校正系数 修正,一般认为如果修正,一般认为如果N/n10,不必校正。,不必校正。实例实例例例例例:160160件电子元件的重量的均值为件电子元件的重量的均值为件电子元件的重量的均值为件电子元件的重量的均值为5.025.02克,标准差为克,标准差为克,标准差为克,标准差为0.300.30克,从中采取不放回抽样抽取克,从中采取不放回抽样抽取克,从中采取不放回抽样抽取克,从中采取不放回抽样抽取6464件。件。件。件。求求求求P P(4.964.96 X 5.0X 5.0)抽样误差的概念抽样误差的概念 由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异由抽样引起的样本统计量与总体参数间的差异 两种表现形式两种表现形式两种表现形式两种表现形式 n n样本统计量与总体参数间的差异样本统计量与总体参数间的差异样本统计量与总体参数间的差异样本统计量与总体参数间的差异n n样本统计量间的差异样本统计量间的差异样本统计量间的差异样本统计量间的差异 抽样研究抽样研究抽样研究抽样研究 个体变异个体变异个体变异个体变异抽样误差产生的条件 均数的均数的抽样误差抽样误差及及标准误标准误 表现一:样本均数与总体均数之差值表现一:样本均数与总体均数之差值表现二:多个样本均数间的离散度表现二:多个样本均数间的离散度从均数为从均数为、标准差为标准差为 的总体中独立随机抽样,当样本的总体中独立随机抽样,当样本含量含量n n增加时,样本均数的分布将趋于正态分布,此增加时,样本均数的分布将趋于正态分布,此分布的均数为分布的均数为,标准差标准差为为 :标准误标准误(standard error,SE),样本统计量的标准差称为标准误样本统计量的标准差称为标准误,用来衡量抽样用来衡量抽样误差的大小。误差的大小。样本均数的标准差称为样本均数的标准差称为标准误标准误。此标准误与个体。此标准误与个体变异变异 成正比,与样本含量成正比,与样本含量n n的平方根成反比。的平方根成反比。实际工作中,实际工作中,实际工作中,实际工作中,往往是未知的,一般可用样本标准差往往是未知的,一般可用样本标准差往往是未知的,一般可用样本标准差往往是未知的,一般可用样本标准差s s s s代代代代替替替替 :因为标准差因为标准差因为标准差因为标准差s s s s随样本含量的增加而趋于稳定,故增加样本随样本含量的增加而趋于稳定,故增加样本随样本含量的增加而趋于稳定,故增加样本随样本含量的增加而趋于稳定,故增加样本含量可以降低抽样误差。含量可以降低抽样误差。含量可以降低抽样误差。含量可以降低抽样误差。均值的均值的抽样标准误抽样标准误1.所有可能的样本均值的标准差,测度所有样本均值的离散程度2.小于总体标准差3.计算公式为样本比率的抽样分布样本比率的抽样分布1.总体总体(或样本或样本)中具有某种属性的单位与全部单中具有某种属性的单位与全部单位总数之比位总数之比n n不同性别的人与全部人数之比不同性别的人与全部人数之比n n合格品合格品(或不合格品或不合格品)与全部产品总数之比与全部产品总数之比2.总体比例可表示为总体比例可表示为3.样本比例可表示为样本比例可表示为4.比率比率(proportion)1.容量相同的所有可能样本的样本比例的概率分布2.当样本容量很大时,样本比例的抽样分布可用正态分布近似 3.一种理论概率分布4.推断总体总体比例的理论基础样本比率的抽样分布样本比率的抽样分布样本比率的抽样分布(样本比率的抽样分布(实例实例)例:某地区经过长期调查计算,求得初生婴儿能活到例:某地区经过长期调查计算,求得初生婴儿能活到例:某地区经过长期调查计算,求得初生婴儿能活到例:某地区经过长期调查计算,求得初生婴儿能活到7575岁的概率为岁的概率为岁的概率为岁的概率为45%45%,问在,问在,问在,问在200200个初生婴儿的样本中,活到个初生婴儿的样本中,活到个初生婴儿的样本中,活到个初生婴儿的样本中,活到7575岁者占岁者占岁者占岁者占50%50%以上的概率以上的概率以上的概率以上的概率?解:解:n=200n=200,200*0.5=100200*0.5=100,远大于远大于远大于远大于5 5,可以认为样本比率的分布是正,可以认为样本比率的分布是正,可以认为样本比率的分布是正,可以认为样本比率的分布是正态态的,的,的,的,P P(p p0.5)=P=P(z z(0.5-0.45)/0.0352)=P=P(z z1.42)=0.0778=0.07781.样本比率的数学期望2.样本比率的方差n n重复抽样重复抽样n n不重复抽样不重复抽样样本比率的抽样分布样本比率的抽样分布(数学期望与方差数学期望与方差)样本方差的抽样分布样本方差的抽样分布样本方差的分布样本方差的分布设总体服从正态分布N (,2),X1,X2,Xn为来自该正态总体的简单随机样本,则样本方差 s2 2 的分布为将 2(n 1)称为自由度为(n-1)的卡方分布c c2 分布分布(图示图示)选择容量为选择容量为n 的的简单随机样本简单随机样本计算样本方差计算样本方差S2计算卡方值计算卡方值 2=(n-1)S2/2计算出所有的计算出所有的 2值值不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体总体例题例题:5.4 样本统计量的抽样分布样本统计量的抽样分布 (两个总体参数推断时两个总体参数推断时)一一.两个样本均值之差的抽样分布两个样本均值之差的抽样分布二二.两个样本比例之差的抽样分布两个样本比例之差的抽样分布三三.两个样本方差比的抽样分布两个样本方差比的抽样分布两个样本均值之差的抽样分布两个样本均值之差的抽样分布两个总体均值之差的抽样分布两个总体均值之差的抽样分布(1 12 2、2 22 2 已知已知)1.1.假定条件假定条件假定条件假定条件 两个样本是独立的随机样本两个样本是独立的随机样本两个样本是独立的随机样本两个样本是独立的随机样本 两个两个两个两个总体都服从正态分布总体都服从正态分布总体都服从正态分布总体都服从正态分布 若不是正态分布若不是正态分布若不是正态分布若不是正态分布,可以用正态分布来近似可以用正态分布来近似可以用正态分布来近似可以用正态分布来近似(n n n n1 1 1 1 30303030和和和和n n n n2 2 2 2 30)30)30)30)2.2.两两两两个个个个独独独独立立立立样样样样本本本本均均均均值值值值之之之之差差差差的的的的抽抽抽抽样样样样分分分分布布布布服服服服从从从从正正正正态态态态分分分分布布布布,其其其其期期期期望望望望值为值为值为值为两个样本均值之差的抽样分布两个样本均值之差的抽样分布 m m m m1 1 1 1总体总体1 2 2 m m m m2 2总体总体2抽取简单随机样抽取简单随机样样本容量样本容量 n1计算计算X1抽取简单随机样抽取简单随机样样本容量样本容量 n2计算计算X2计算每一对样本计算每一对样本的的X1-X2所有可能样本所有可能样本的的X1-X2m m m m1-1-1-1-m m m m2 22 2抽样分布抽样分布抽样分布抽样分布两个样本均值之差的抽样分布(两个样本均值之差的抽样分布(实例实例)例:求总体例:求总体N(20,3)容量分别为)容量分别为10,15的的两个独立样本的两个独立样本的均值之差的绝对值大于均值之差的绝对值大于0.30.3的的概率概率。两个样本比率之差的抽样分布两个样本比率之差的抽样分布1.1.两个总体都服从两个总体都服从二项分布二项分布二项分布二项分布2.2.分分别别从从两两个个总总体体中中抽抽取取容容量量为为n n1 1和和n n2 2的的独独独独立立立立样样本本,当当两两个个样样本本都都为为大大大大样样样样本本本本时时,两两个个样样本本比比例例之之差差的的抽抽样分布可用正态分布来近似样分布可用正态分布来近似3.3.分布的数学期望为分布的数学期望为4.4.方差为各自的方差之和方差为各自的方差之和 两个样本比率之差的抽样分布两个样本比率之差的抽样分布两个样本方差比的抽样分布两个样本方差比的抽样分布两个样本方差比的抽样分布两个样本方差比的抽样分布1.两两个个总总体体都都为为正正正正态态态态分分分分布布布布,即即X X1 1 N N(1 1,1 12 2)的的一一个个样样本本,Y Y1 1,Y Y2 2,Y Yn2n2是是来来自自正正态态总总体体X X2 2 N N(2 2,2 22 2)2.从两从两个总体中分别抽取容量为个总体中分别抽取容量为n n1 1和和n n2 2的

    注意事项

    本文(统计学第5章++抽样分布.ppt)为本站会员(s****8)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开