欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    第七章抽样和抽样分布优秀PPT.ppt

    • 资源ID:65720079       资源大小:2.22MB        全文页数:74页
    • 资源格式: PPT        下载积分:18金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要18金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第七章抽样和抽样分布优秀PPT.ppt

    第七章抽样和抽样分布现在学习的是第1页,共74页第一节 抽样及抽样中的几个基本概念一、抽样的概念和特点1、抽样:从所研究的对象中随机地取出其中一部分来观察,由此而获得有关总体的信息。现在学习的是第2页,共74页2、抽样的3个特点:1)遵守随机原则;2)推断被调查现象的总体特征;3)计算推断的准确性和可靠性。现在学习的是第3页,共74页二、抽样的基本概念二、抽样的基本概念 1、全及总体和样本总体、全及总体和样本总体 全及总体是我们所要研究的对象,而样本总体则是我们所要观察的对象,两者是有区别而又有联系的不同范畴。全及总体又称母体:具有某种共同性质的许多单位的集合体。样本总体:样本总体:又称子样,简称样本,是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用小写英文字母n来表示。现在学习的是第4页,共74页样本代表性问题:样本代表性问题:随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均数。现在学习的是第5页,共74页.全及指标和抽样指标全及指标和抽样指标n全全及及指指标标:根据全及总体各个单位的标志值或标志属性计算的,反映总体某种属性或特征的综合指示称为全及指标。常用的全及指标有总体平均数(或总体成数)、总体标准差(或总体方差)。现在学习的是第6页,共74页n抽样指标:抽样指标:由样本总体各单位标志值计算出来反映样本特征,用来估计全及指标的综合指标称为统计量(抽样指标)。统计量是样本变量的函数,用来估计总体参数,因此与总体参数相对应,统计量有样本平均数(或抽样成数)、样本标准差(或样本方差)。现在学习的是第7页,共74页n注意:注意:对于一个问题全及总体是唯一确定的,所以全及指标也是唯一确定的,全及指标也称为参数,它是待估计的数。而统计量则是随机变量,它的取值随样本的不同而发生变化。现在学习的是第8页,共74页、样本容量和样本个数 n样本容量:样本容量:指一个样本所包含的单位数。通常将样本单位数不少于个的样本称为大样本,不及个的称为小样本。社会经济统计的抽样调查多属于大样本调查。样本个数又称样本可能数目。指从一个总体中可能抽取的样本个数。一个总体有多少样本,则样本统计量就有多少种取值,从而形成该统计量的分布,此分布是抽样推断的基础。现在学习的是第9页,共74页、重复抽样和不重复抽样 有放回抽样:总体中的每个个体单位可以不止一次地被选中的抽样。无放回抽样:总体中的每个个体被选中的次数不多于一次。现在学习的是第10页,共74页名称样 本总 体定义从总体中抽出的部分单位数研究对象的全部单位总数特征统 计 量参 数符号样本容量:n 样本平均数:样本比例:样本标准差:s样本方差总体容量:N总体平均数:总体比例:p总体标准差:总体方差:5、样本统计量的总体参数符号现在学习的是第11页,共74页三、随机抽样和判断抽样vv随机抽样:按照随机原则抽取样本,在总体中所有单位被抽中的机会是均等的。vv判断抽样:根据个人或集体的设想或经验,从总体中有目的地抽取样本。现在学习的是第12页,共74页三、非抽样误差和抽样误差v1 1、非抽样误差:、非抽样误差:在调查登记过程中发生的误差和由于主观因素破坏了随机原则而产生的系统性偏差。现在学习的是第13页,共74页2、抽样误差:、抽样误差:是指由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。不包含登记性误差和不遵守随机原则造成的偏差。n影影响响抽抽样样误误差差的的因因素素有有:总体各单位标志值的差异程度;样本的单位数;抽样的方法;抽样调查的组织形式。现在学习的是第14页,共74页第二节 随机抽样设计一、纯随机抽样:一、纯随机抽样:对总体的所有容量不做任何的分类和排队,完全按随机原则逐个抽取样本容量。现在学习的是第15页,共74页纯随机抽样的常用抽样方法纯随机抽样的常用抽样方法 1)抽签法:将总体容量全部加以编号,并编成相应的号签,然后将号签充分混合后逐个抽取,直到抽到预定需要的样本容量为止。缺点:总体容量很多时,编制号签的工作量很大,且很难掺和均匀。现在学习的是第16页,共74页 2)随机数字法:用字母顺序或身份证号等任何方便的方法对总体容量编者按号,利用随机数表从1到总体容量N中随机抽取n(样本容量数)个数,遇到那些不在编号里的数字需跳过。现在学习的是第17页,共74页二、等距抽样:先将总体各单位按某一有关标志(或无关标志)排队,然后相等距离或相等间隔抽取样本单位。根据需要抽取的样本单位数(n)和全及总体单位数(N),可以计算出抽取各个样本单位之间的距离和间隔,即:K=N/n,然后按此间隔依次抽取必要的样本单位。现在学习的是第18页,共74页等距抽样的一个例子 某企业有职工5000名,现要随机抽取100人进行家庭收入水平调查。抽取方法:按与研究目的无直接关系的姓名笔划对总体进行排列,把总体划分为K=5000/100=50个相等的间隔,在第1至第50人中随机抽取一名,如抽到第10名,后面间隔依次抽取第60,110,160,210,直到4960为止,总共抽取50同名职工组成一个抽样总体。现在学习的是第19页,共74页等距抽样的优点:(1)能保证被抽取到的样本单位在全及总体中均匀分布;(2)简化抽样过程。等距抽样应注意:要避免抽样间隔或样本距离和现象本身的节奏性或循环周期相重合。现在学习的是第20页,共74页三、类型抽样三、类型抽样类型抽样:将全及总体中的所有单位按某一主要标志分组,然后在各组中采用纯随机抽样或等距抽样方式,抽取一定数目的调查单位构成所需的样本。适用范围:主要适用于总体情况比较复杂,各类型或层次之间的差异较大,而总体单位又较多的情形,分层使层内各单位之间的差异减小,层间差异扩大。现在学习的是第21页,共74页(一)类型比例抽样(一)类型比例抽样 按照总体单位数在各组之间的比例,分配各组的抽样单位数。即:各类型中抽取的样本单位数ni占该类型所有单位数Ni的比例是相等的,等同于样本单位总数n占总体单位数N的比例,即:现在学习的是第22页,共74页各类型组应抽取的样本单位数为:样本比率抽样样本容量:按前面指定的比例(n/N)从每组的Ni单位中抽取ni个单位即构成一个抽样总体,其样本容量为:n=n1+n2+n3+nk=现在学习的是第23页,共74页(二)类型适宜抽样(二)类型适宜抽样 在抽取样本单位数时,要考虑各类型组包含的单位数不同和标志变动度()的不同,变动程度()大的类型组要多抽样本单位数,变动程度()小的组要少多抽样本数,使得各类型组的变动程度()在所有类型组变动程度之和 中的比例相等,等同于是 或 。现在学习的是第24页,共74页 此外,还可将各类型组单位数 和变动程度 结合考虑,使得 在所有类型组之和 中所占比例等于 或 ,即:从而求得各类型的样本单位数为:现在学习的是第25页,共74页四、整群抽样 在全及总体中以群(或组)为单位,按纯随机方式或等距抽样方式,抽取若干群(或组),然后对所有抽中的各群(或各组)中的全部单位一一进行调查。现在学习的是第26页,共74页五、多阶段抽样五、多阶段抽样 将多个抽样程序分成若干阶段,然后逐阶段进行抽样,以完成整个抽样过程。适用范围:总体包括的单位很多,而且分布很广,通过一次抽样抽选出样本是很困难的,这时使用多阶段抽样。现在学习的是第27页,共74页多阶段抽样的一个例子 例:对我国的农产量进行抽样调查。抽样方法是:先由省抽县,由抽中的县内再抽乡、村,由抽中的乡、村抽地块,最后才由抽中的地块再抽样本单位。现在学习的是第28页,共74页第三节第三节 抽样分布抽样分布一、抽样分布:从一个给定的总体中抽取(不论是否有放回)容量(或大小)为n的所有可能的样本,对于每一个样本,计算出某个统计量(如样本均值或标准差)的值,不同的样本得到的该统计量的值是不一样的,由此得到这个统计量的分布,称之为抽样分布。现在学习的是第29页,共74页n例如:如果特指的统计量是样本均值,则此分布为均值的抽样分布。类似的有标准差、方差、中位数、比例的抽样分布。现在学习的是第30页,共74页二、统计量抽样分布的均值、标准差:对于每个统计量的抽样分布,可计算出它的均值和标准差等,称之为该统计量抽样分布的均值和标准差等。现在学习的是第31页,共74页三、均值的抽样分布(一)被抽样的总体服从正态分布,样本平均数 的抽样分布具有下列质:1、样本平均数的分布依然是正态分布;2、样本平均数 分布的平均值 等于总体平均数;3、样本平均数 分布的均方差 等于:现在学习的是第32页,共74页当为有限总体无放回抽样时,其样本均值标准差为:如果总体为无限总体的或抽取是有放回的,其样本均值标准差为:现在学习的是第33页,共74页(二)非正态总体样本平均数(二)非正态总体样本平均数 的分布及性的分布及性质?质?1、中心极限定理可以解决上述问题:一个具有任意函数形式的总体,其样本平均值和方差 有限。在对该总体进行抽样时,随着样本容量n的增大,由这些平均样本算出的平均数 的抽样分布将近似服从平均数为和方差为 的正态分布。现在学习的是第34页,共74页2 2、样本容量究竟该多大才能使抽样分布逼近于、样本容量究竟该多大才能使抽样分布逼近于正态分布?正态分布?中心极限定理说明了不仅从正态总体抽取样本时,样本平均数这一统计量要服从正态分布,即使是从非正态总体进行抽样,只要是大样本(容量n30),样本平均数也趋向于正态分布。现在学习的是第35页,共74页(三)应用举例例1:从某地区统计中得知,该地区郊区平均每一家庭年收入为3160元,标准差为800元。从此郊区抽取50个家庭为一随机样本,平均每年收入为以下数字的平均概率是多少:(1)多于3000元;(2)少于3000元;(3)在3200元到3300元之间。现在学习的是第36页,共74页使用模型描述我们的问题使用模型描述我们的问题 题中没有告知总体服从正态分布,但样本容量足够大(n=50),据中心极限定理,近似服从正态分布。(1)现在学习的是第37页,共74页同理处理(2)和(3)(2)(3)现在学习的是第38页,共74页例2:从海外A地区采购大豆10000包,已知平均每包重量为100公斤,标准差为4公斤,现按不重复抽样从中抽取样本容量n=500包的样本,来测定这批大豆的每包平均重量,要求标出样本平均重量短0.5公斤以上的概率.现在学习的是第39页,共74页问题的模型描述问题的模型描述&没有告知总体服从正态分布,但样本容量足够大(n=500),据中心极限定理,可知 近似服从正态分布。&大豆的抽样:现在学习的是第40页,共74页四、比例的抽样分布四、比例的抽样分布(一)比率的抽样分布:从一个计数的变量总体中抽取一定容量的样本,计算其具有某种特征的单位数所占的比率,其所有可能样本比率所形成的分布就是比率的抽样分布。现在学习的是第41页,共74页(二)比例的抽样分布、均值(二)比例的抽样分布、均值和方差和方差1、当样本容量很大(n30)时,比例的抽样分布 非常接近于正态分布。2、比例抽样分布的均值现在学习的是第42页,共74页3、比例抽样分布的标准差:(1)有限总体且有放回抽样:(2)有限总体且抽样无放回:现在学习的是第43页,共74页(三)比例抽样分布的例子 某选区的选取举结果表明某一位候选人得到了46%的选票。从选民中随机抽取(1)200人,(2)1000人作民意测验,求大多数人支持这位候选人的概率。现在学习的是第44页,共74页该问题的模型描述&因为样本容量n(n=200或1000)较大,故 的分布接近于正态分布。&均值&标准差(1)(2)现在学习的是第45页,共74页&(1)样本中大多数人支持候选人的选取民比例为:200人中的大多数即为:100.5/200=0.5025&要求的概率为:现在学习的是第46页,共74页&(2)样本中大多数人支持候选人的选取民比例为:1000人中的大多数即为:500.5/1000=0.5005&概率为现在学习的是第47页,共74页第四节第四节 2 2 个样本平均数个样本平均数之差的抽样分布之差的抽样分布 问题提出:在某些情况下,需要对来自2 个不同总体的平均数进行比较,例如,比较2种管理方法下的工作台效率等。为了通过样本数据对2 个总体平均数之差作出推断,就需要知道2 个样本平均值之差 的 抽样分布性质。现在学习的是第48页,共74页一、两样本平均数之差的分布、期望和方差(一)(一)两正态总体样本平均数之差的分布两正态总体样本平均数之差的分布假设有2 个给定的正态总体,其平均数分别为1和2,方差分别为 和 ,从2个正态总体中抽取的容量分别为n1和n2的2个独立样本的平均数之差 分布:服从正态分布;样本平均数:1-2;样本平均数的方差:现在学习的是第49页,共74页(二)两非正态总体样本平均数之差的分布(二)两非正态总体样本平均数之差的分布q从两个非正态总体中抽取2个独立的样本,这时,只要样本的容量足够大,即n30,根据中心极限定理,样本平均数之差的抽样分布逼近正态分布,其平均数同样为:1-2 其标准差同样为:现在学习的是第50页,共74页二、二、2 个样本比率个样本比率之差的抽样分布之差的抽样分布如果有2个总体,它们的某种特征的单位数所占的比率分别为p1和p2,现从这2个总体中分别抽出容量为n1和n2的2个独立样本随机样本,其样本比率分别为 和 。问 服从什么分布,其均值和方差分别为多少?现在学习的是第51页,共74页 当n1和n2很大时,2个样本比率之差 的抽样分布就近似于正态分布,其平均值和方差分别为:现在学习的是第52页,共74页三、应用实例 某调查研究机构经调查后所示的统计资料表明,A类企业5年内用于市场情况的市场调查预算增加了18%,而B类企业增加了10%。现在要问:(1)如果从每类企业中各抽选90个企业组成2个独立随机样本,样本比率之差的抽样分布的平均值和标准差有多大?(2)样本比率之差位于0.06和平共处1之间的概率有多大?(3)如果从每一类企业中各观察一个容量为90的简单随机样本,将观察到这一差值小于0.03的概率有多大?现在学习的是第53页,共74页解(1)因为样本容量n1=n2=90,故 的分布接近于正态分布,则现在学习的是第54页,共74页(2)为求 位于0.06和0.11之间的概率,必须先求出Z1和Z2的值:现在学习的是第55页,共74页 于是 小于或等于0.03的概率为:现在学习的是第56页,共74页(3)小于或等于0.03的概率为:现在学习的是第57页,共74页第五节 t分布、2分布和F分布 在实际工作中,抽取足够多的样本容量进行调查意味着人力、物力和财力的增加,尤其对一些具有破坏性的试验来说也不宜抽取太多的样本容量。也就是说,对于大样本进行观察受到某些条件的限制。本节主要讨论t分布、2分布和F分布。现在学习的是第58页,共74页一、t-分布 关于t 分布的早期理论工作,是英国统计学家威廉西利戈塞特(WillamSealy Gosset)在1900年进行的。t分布是小样本分布,小样本分布一般是指n30。t分布适用于当总体标准差未知时用样本标准差s代替总体标准差,由样本平均数推断总体平均数以及2个小样本之间差异的显著性检验等。现在学习的是第59页,共74页 从平均值为、方差为2的正态总体中抽取容量为n的一个样本,其样本平均数 服从平均值为,方差为2/n的正态分布,因此,。但是总体方差2总是未知的,从而只能用s2来代替,(1)如果n很大,那么,s2就是2的一个较好的估计量,仍然是一个近似的标准正态分布;现在学习的是第60页,共74页 (2)如果n较小,s2常常与2的差异较大,因此,统计量 就不再是一个标准正态分布,而是服从t分布。现在学习的是第61页,共74页(一)t分布的性质1、t分布是对称分布,且其均值为0。2、当样本容量n较小时,t分布的方差大于1;当n增大到大于或等于30时,t分布的方差就趋近于1,t分布也就趋近于标准正态分布。现在学习的是第62页,共74页3、t分布是一个分布族,对于不同的样本容量都对应不同的分布,且其均值都为0。4、与标准正态分布相比,t分布的中心部分较低,2个尾部较高。5、变量t的取值范围在 与 之间。t分布与标准正态分布的比较如下图所示:现在学习的是第63页,共74页(二)t分布的自由度 样本中独立观察值的个数(即样本容量)n减去1(由于样本要估计的总体参数的个数为1,即2)。如果用一个样本容量为n=20的样本估计总体平均数,那就要用14个自由度,以便选择适当的t分布。现在学习的是第64页,共74页(三)t分布表的使用 在使用t分布表时,必须同时具备置信度和自由度2 个条件。置信度表示被估计的总体参数落入置信区间的概率。然而,t分布给出的是值,即表示所估计的总体参数不落入置信区间的概率,或落入置信区间以外的可能性。的数值是由100%减去给定的置信度后得到的。查表时还要指定自由度。现在学习的是第65页,共74页t分布表使用的一个例子:在99%的置信度下,对容量为14的样本作出一个估计。解:从=0.10那一栏下,找到自由度为13(n-1=14-1=13)那一行相交的数字,这个数字为1.771。数值1.771表明,如果从平均数两侧分别加减1.771个标准差,那么,在这两个界限之内曲线下的面积是99%,而有曲线面积之外是10%。如下图所示:现在学习的是第66页,共74页二、2分布 2 2分布的产生和适用范围简介分布的产生和适用范围简介:2分布是海尔墨特(Hermert)和卡.皮尔生(K.Pearson)分别于1875年和1890年导出的。它主要适用于对拟合优度检验和独立性检验,以及对总体方差的估计和检验等。现在学习的是第67页,共74页 2 2分布介绍分布介绍:当我们对正态随机变量X随机地重复抽取n个数值,将每一个值变换成标准正态变量,并对这n个新的变量分别取平方再求和之后,就得到一个服从自由度为n的2 分布。2分布的变量。即:现在学习的是第68页,共74页现在学习的是第69页,共74页n(一)分布具有以下几个特点:1、2分布是一个以自由度n为参数的分布族,自由度n决定了分布的形状,对于不同的n有不同的2分布。2 2、2 2分布是一种非对称分布。一般为正偏分布。3 3、2 2分布的变量值始终为正。4、分布的平均值为n,方差为2n。现在学习的是第70页,共74页(二)2分布表的使用 在表体中给出的是与表的左端列中所列出的各具体自由度数相对应的2值。该值所切断的2分布的右端尾部所包括的面积的比例,列在表的上端横行中。如果n=10,也就是说,对于9个自由度,得到的检验统计量2的值大于或等于18.31的概率为5%.现在学习的是第71页,共74页三、F分布 F F分布分布:F分布是以统计学家R.A.Fisher姓氏的第一个字母命名的.F F分布的用途:分布的用途:用于方差分析、协方差分析和回归分析等。现在学习的是第72页,共74页 (一)(一)F F分布定义为分布定义为:设X、Y为两个独立的随机变量,X服从自由度为k1的2分布,Y服从自由度为k2的2 分布,这2 个独立的2分布被各自的自由度除以后的比率这一统计量的分布。即:上式上式F F服从第一自由度为服从第一自由度为k k1 1,第二自由度为,第二自由度为k k2 2的的F F分布分布现在学习的是第73页,共74页(二)(二)F F分布的性质分布的性质1、它是一种非对称分布;2、它有两个自由度,即n1-1和n2-1,相应的分布记为F(n1 1,n2-1),n1 1通常称为分子自由度,n2-1通常称为分母自由度;3、F分布是一个以自由度n1 1和n2-1为参数的分布族,不同的自由度决定了F 分布的形状。现在学习的是第74页,共74页

    注意事项

    本文(第七章抽样和抽样分布优秀PPT.ppt)为本站会员(石***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开