欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    统计学原理抽样推断及参数估计.pptx

    • 资源ID:77722280       资源大小:1.27MB        全文页数:130页
    • 资源格式: PPTX        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    统计学原理抽样推断及参数估计.pptx

    内容内容提要提要第一节第一节 抽样调查的一般抽样调查的一般问题问题第二节第二节 抽样抽样误差误差第三节第三节 总体指标的总体指标的推断推断第四节第四节 必要抽样数目的确定第五节 统计量及抽样分布第1页/共130页内容提要 本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响本章主要阐述了抽样调查的概念、特点、作用和几个基本概念;影响抽样误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样误差的主要因素;抽样调查几种主要组织方式的抽样平均误差的计算;抽样估计推断;点估计和区间估计;必要抽样数目的确定。抽样估计推断;点估计和区间估计;必要抽样数目的确定。第2页/共130页抽样调查的一般问题抽样调查的一般问题抽样调查的一般问题抽样调查的一般问题第一节第一节返回2第3页/共130页一、抽样调查的概念、特点与作用 (一)抽样调查的概念与特点 抽样调查又称抽样推断或抽样估计,它是从总体中按随机原则抽取一部分单位进行观测,并根据这部分单位的资料推断总体数量特征的一种方法。第4页/共130页抽样调查具有下列三个主要特点:(1)(1)按随机原则抽取调查单位。(2)(2)由部分推断全体。(3)(3)抽样误差可以事先计算并加以控制。第5页/共130页 (二)抽样调查的作用 (1)(1)用于不可能进行全面调查的无限总体。(2)(2)用于不可能进行全面调查而又需要了解全面情况的现象。(3)(3)用于不必要进行全面调查的现象。(4)(4)用于对全面调查的资料进行评价与修正。(5)(5)用于工业生产过程的质量控制。第6页/共130页二、抽样调查中的几个基本概念 (一)全及总体和抽样总体 1.1.全及总体。全及总体简称总体或母体,它是指所要调查研究对象的全体。2.2.抽样总体。抽样总体简称样本或子样,它是指在全及总体中按随机原则抽取的那部分单位所构成的集合体。第7页/共130页(二)总体指标和样本指标 1.1.总体指标。总体指标也称为母体参数或全及指标,它是根据全及总体各单位的标志值或标志特征计算的,反映总体某种属性的综合指标。由于全及总体是唯一确定的,根据全及总体计算的全及指标也是唯一确定的。第8页/共130页2.2.样本指标。样本指标也称样本统计量或抽样指标,它是根据抽样总体各单位的标志值或标志特征计算的综合指标。由于可以从一个全及总体中抽取许多个不同的样本,不同的样本其分布结构也会有差异,抽样指标的数值也就不同,所以抽样指标的数值不是唯一确定的。第9页/共130页三、抽样调查的组织方式 (一)简单随机抽样 简单随机抽样也叫纯随机抽样,它对总体单位不作任何分类排队,而是直接从总体中随机抽取一部分单位来组成样本的抽样组织方式。(1)(1)抽签法。(2)(2)随机数字法。第10页/共130页 (二)类型抽样 类型抽样又称分类抽样或分层抽样,它是先将总体按某个主要标志进行分组(或分类),再按随机原则从各组中抽取样本单位的一种抽样方式。第11页/共130页 (1)(1)等数分配类型抽样法。(2)(2)等比例类型抽样法。公式6 61 1第12页/共130页(3)(3)不等比例类型抽样法。公式6 62 2第13页/共130页(三)等距抽样 等距抽样也称机械抽样或系统抽样,它是将总体各单位按某一标志顺序排列,然后按固定顺序和相等距离或间隔抽取样本单位的抽样组织方式。第14页/共130页抽样距离计算公式为:公式6 63 3第15页/共130页图6 61 1 等距抽样示意图第16页/共130页 (四)整群抽样 整群抽样也称集团抽样、区域抽样或分群随机抽样,它是将总体各单位按时间或空间形式划分成许多群,然后按纯随机抽样或机械抽样方式从中抽取部分群,对中选群的所有单位进行全面调查的抽样组织方式。第17页/共130页公式6 64 4公式6 65 5第18页/共130页整群抽样的优点:易于组织,节省调查费用缺点:调查的总体单位过于集中且在少数样本群中。因此,在条件相同的情况下,整群抽样的代表性低,通常需要扩大样本群的数目来弥补这个缺点。第19页/共130页阶段抽样阶段抽样也就是多级抽样,在抽样时先抽总体中某种更大范围的单位,逐次类推,最后从更小范围总体中抽选样本的基本单位,分阶段来完成抽样的组织工作。农产量抽样调查,第一阶段是从省抽县,第二阶段从中选县抽乡,第三阶段从中选乡抽村,再从村抽地块,最后再从地块抽具体的样本点,以样本点的实际资料来推算平均亩产和总产量。第20页/共130页抽样误差抽样误差抽样误差抽样误差第二节第二节第21页/共130页一、抽样误差调查误差是调查所获得的统计数据域调查总体未知真实数据之间的差别,包括登记性误差和代表性误差。登记性误差是在调查过程中由于主观客观原因引起的登记差错造成的误差。代表性误差是用样本指标数值去推算总体指标数值时,由于样本各单位的结构情况不足以代表总体特征所产生的误差。第22页/共130页一、抽样误差的概念 调查误差又可分为:一是:没有遵循随机原则,二是:即使遵守了随机原则,也会由于被抽取的样本各种各样,导致样本内部各单位的分布比例结构与总体实际分布状况有偶然性的差异,从而使不同的随机样本得出不同的估计量,造成样本指标数值与总体指标数值之间产生差距,如抽样平均数与总体平均数的离差,抽样成数与总体成数的离差等。这类误差通常称为抽样误差或随机误差。第23页/共130页二、影响抽样误差的主要因素 (一)样本单位数(样本容量n)n)的多少 (二)总体被研究标志变异程度(总体方差)的大小 (三)抽样组织方式 (四)抽样方法第24页/共130页三、抽样平均误差 (一)抽样平均误差的概念 抽样平均误差是指以全部可能样本指标为变量,以总体指标为平均数计算得到的标准差,以符号 表示,通常以 代表平均数的抽样平均误差,以 代表成数的抽样平均误差,以K K代表可能组成的样本总数。第25页/共130页 (二)计算抽样平均误差的理论公式 根据抽样平均误差的概念可得其一般计算公式:公式8 86 6公式8 87 7第26页/共130页 (三)抽样平均误差的计算方法 1.1.平均数的抽样平均误差 (1)(1)重复抽样条件下:公式6 68 8 (2)(2)不重复抽样条件下:公式6 69 9 当N N很大时,公式6 61010第27页/共130页例6-6-为叙述简便起见,假设有10,20,3010,20,30和4040四个数字组成一个总体,从中随机抽取两个数字作为样本,求抽样平均误差。第28页/共130页 2.2.成数的抽样平均误差 (1)(1)重复抽样条件下:公式6 61111 (2)(2)不重复抽样条件下:公式6 61212 当N N很大时,公式6 61313第29页/共130页 例6-26-2 某仪表厂生产某种型号的精密仪表,按正常生产经验,产品合格率为85%85%。今按简单随机抽样方式从800800只仪表中抽取10%10%进行检验,求合格品比率的抽样平均误差。在重复条件下,采用公式6 61111:在不重复条件下,采用公式6 61313:第30页/共130页例6-36-3某大学有45004500名学生,采用不重复简单随机抽样方式从中抽取10%10%的学生,调查其每月生活费用支出情况。抽样结果显示,学生平均每人每月生活费支出350350元,标准差8080元,生活费用支出在500500元以上的学生占全部学生的20%20%。试求抽样平均误差。第31页/共130页 (四)其他抽样组织方式抽样平均误差的计算方法 1.1.类型比例抽样平均误差的计算。(1)(1)平均数的抽样平均误差 重复抽样条件下:公式6 61414 不重复抽样条件下:公式6 61515第32页/共130页 (2)(2)成数的抽样平均误差 重复抽样条件下:公式6 61616 不重复抽样条件下:公式6 61717第33页/共130页 其中:公式6 61818 公式6 61919第34页/共130页 例6-46-4 某县对本县的某种农作物的产量作了一次类型比例抽样调查。调查资料整理的结果见表6 6-4-4,试求抽样平均误差。第35页/共130页表6-4返回33第36页/共130页 2.2.等距抽样平均误差的计算。3.3.整群抽样平均误差的计算。(1)(1)平均数的抽样平均误差 公式6 62020 (2)(2)成数的抽样平均误差公式6 62121第37页/共130页 其中:公式6 62222 公式6 62323第38页/共130页例6-5 某商店购进300箱(50只/箱)苹果,入库前随机抽取1%检查其质量。检验结果的整理资料见表6-5,试求抽样平均误差。第39页/共130页 例6 65 5 首先,分别计算样本平均数和样本成数:第40页/共130页 然后,分别求出样本平均数群间方差和成数群间方差:第41页/共130页 最后,根据公式6 62020和公式6 62121求出xx和pp为:第42页/共130页总体指标的推断总体指标的推断总体指标的推断总体指标的推断第三节第三节第43页/共130页一、统计比较的概念和作用 总体指标的推断是指对总体平均数 总体成数P P推断估计的问题。抽样调查的直接目的,就是为了推断 ,P P,然后,再结合总体单位数N N去推算总体的有关标志总量。总体指标的推断有点估计和区估计两种方法。第44页/共130页 一、点估计 点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值 、p p 直接作为总体未知参数 、P P的估计值的一种推断方法。第45页/共130页比如:某电子元件厂,某天共生产电子元件20000件,耐用时间和合格率没进行全面检测,而是随机抽查5%检测,经计算,样本的平均耐用时间 小时,合格率p=98.56%。因此,推算这天生产的全部电子元件平均耐用时间 小时,合格率p=98.56%。第46页/共130页 估计量评判标准:1.1.一致性。设 为未知参数的估计量,当nn时,要求 按概率收敛于,即公式6 62 24 4第47页/共130页一致性(consistency)一致性:随着样本量的增大,估计量的 值越来越接近被估计的总体参数AB较小的样本量较小的样本量较大的样本量较大的样本量P P()第48页/共130页 2.2.无偏性。若要求估计量 的数学期望等于未知参数的真值,即 公式6 62 25 5P P()B BA A无偏无偏有偏有偏有偏第49页/共130页 3.3.有效性。无偏性只考虑估计量的平均结果是否等于待估计参数的真值,有效性则要求每个估计值与待估参数真值之间的偏差尽可能地小。设 ,为的两个无偏估计量,若 的方差小于 的方差,即公式6 62828第50页/共130页有效性(efficiency)有效性:对同一总体参数的两个无偏点估计 量,有更小标准差的估计量更有效 AB 的抽样分布的抽样分布 的抽样分布的抽样分布P P()第51页/共130页 二、区间估计 区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可能范围。它包括两方面内容:一、这一可能范围的大小,二、总体指标落在这个可能范围内的概率。第52页/共130页考虑表6-6样本平均数的概率分布第53页/共130页由表6-6知:第54页/共130页 将表6-6所示的变量数列绘成图形,即可得到一个钟形的平滑曲线,这条曲线叫正态分布曲线。如图6-2第55页/共130页图8 82 2 正态分布曲线图第56页/共130页 根据数理统计证明,总体单位的标志值如果是正态分布,其全部可能样本也一定是正态分布的;如果总体单位的标志值不是正态分布的,只要是大样本(即n30)n30),全部可能样本指标也会接近正态分布。从正态分布图中,可以总结两个特点:一是样本指标高于或低于总体指标的概率分布完全是对称的;二是样本指标接近于总体指标的概率越大(小),出现的可能性也越大(小)。第57页/共130页中心极限定理(central limit theorem)x x 的的分分布布趋趋于于正正态态分分布布的过程的过程第58页/共130页样本指标置信度根据数学证明,在 到 的区间中,这一部分曲线下的面积,占曲线下全部面积的68.27%;在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的95.45%;在 到 的区间内,这一部分曲线下的面积,占曲线下全部面积的99.73%。如图6-3 第59页/共130页图8 83 3 样本指标置信度图第60页/共130页 误差范围 与概率度(t)(t)和抽样平均误差 三者之间的关系为:公式6 62 27 7 由此得到平均数和成数的误差范围公式:公式6 62828公式6 62929第61页/共130页 进而得到总体平均指标和总体成数指标的区间估计公式为:公式6 63 30 0公式6 63 31 1第62页/共130页(95%的置信区间)重复构造出重复构造出 的的2020个个置信区间置信区间 点估计值点估计值第63页/共130页总体均值的区间估计(大样本)1.假定条件总体服从正态分布,且方差()已知如果不是正态分布,可由正态分布来近似(n 30)2.使用正态分布统计量 z3.总体均值总体均值 在在1-1-置信水平下的置信水平下的置信区间为置信区间为第64页/共130页例6-6某自行车厂从生产的一批10000个自行车轮胎中随机抽取1%进行质量检验。调查结果显示,轮胎的平均寿命为5000英里。试以95%的把握对该批自行车的平均寿命作出估计。(注:根据长期生产这种类型的轮胎数据可知,总体标准差为400公里)第65页/共130页例6 6第66页/共130页 有了区间估计的结果,就可以对这批轮胎的使用寿命得出结论,因为区间估计最低公里数为4921.994921.99公里,可将49004900公里规定为最低可行驶公里数。这样做虽不能保证百分之百的可靠,但可以有95%95%的把握,还是令人可信的。第67页/共130页例6 677利用例6 6-3-3的资料,在95.45%95.45%的概率保证下估计全体学生月平均生活费用的可能范围,以及月生活费用在500500元以上学生所占比重的可能范围。第68页/共130页例6 6-8 -8 从某县农民家庭中随机抽取100100户调查其年收入情况。农民家庭按年人均纯收入额分组的资料如下表6 6-7-7所示第69页/共130页根据表6-7的资料计算得表6-8第70页/共130页例6 68 8第71页/共130页例6 68 8第72页/共130页第四节第四节必要抽样数目的确定必要抽样数目的确定返回2第73页/共130页 一、影响抽样数目的主要因素 (一)总体被研究标志的变异程度 (二)对推断精确度的要求 (三)对推断可靠性的要求 (四)抽样调查的组织方式和方法 (五)人力、物力和财力的允许条件第74页/共130页二、确定抽样数目的方法 (一)在重复抽样条件下 推断总体平均数所需要的抽样数目:公式6 63 32 2 推断总体成数所需要的抽样数目:公式6 63 33 3第75页/共130页 (二)在不重复抽样条件下 推断总体平均数所需要的抽样数目:公式6 63 34 4 推断总体成数所需要的抽样数目:公式6 63 35 5第76页/共130页例6-9假定某乡有农户18000户,在某次调查中采用重复的纯随机方式进行抽样,要求人均收入的极限误差控制在150元内,把握程度为95.45%,该抽多少多少农户?如果极限抽样误差要求控制在75元内,应抽多少户?(注:全乡人均收入标准差为1500元)第77页/共130页 例6 6 (1)(1)采用重复抽样公式计算:第78页/共130页 可见,在重复抽样中,极限误差缩小一半(即为原来的1/2)时,必须把样本容量增到4倍。第79页/共130页 (2)(2)采用不重复抽样公式计算:第80页/共130页当极限抽样误差缩小为一半时,根据【公式6 6-34-34】得:第81页/共130页 如果是采用其他抽样组织方式,则公式略有不同。例如,采用重复的分层抽样,则所需的抽样数目计算公式为:公式6 63 36 6公式6 63 37 7第82页/共130页第 5节 统计量及其抽样分布第83页/共130页 统计量关于分布的几个概念 由正态分布导出的几个重要分布 样本均值的分布与中心极限定理 样本比例的抽样分布两个样本平均值之差的分布关于样本方差的分布 第84页/共130页统计量(statistic)1.设X1,X2,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,Xn),不依赖于任何未知参数,则称函数T(X1,X2,Xn)是一个统计量样本均值、样本比例、样本方差等都是统计量2.统计量是样本的一个函数3.统计量是统计推断的基础第85页/共130页例:设 是从某总体X中抽取的一个样本,则:是统计量 不是统计量第86页/共130页常用统计量第87页/共130页第88页/共130页次序统计量1.一组样本观测值X1,X2,Xn由小到大的排序 X(1)X(2)X(i)X(n)后,称X(1),X(2),X(n)为次序统计量 称为样本极差2.中位数、分位数、四分位数等都是次序统计量第89页/共130页 2分布(2 distribution)1.由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和 卡 皮 尔 逊(KPearson)分 别 于1875年和1900年推导出来2.设随机变量 相互独立,且 服从标准正态分布 则它们的平方和 服从自 由 度为n的2分布。3.设 ,则 ,若令 则 Y 服从自由度为1的2分布,即 第90页/共130页1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称 3.期望为:E(2)=n,方差为:D(2)=2n(n为自由度)4.可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 2分布(性质和特点)第91页/共130页卡方(c c2)分布 选择容量为n 的简单随机样本计算样本方差S2计算卡方值 2=(n-1)S2/2计算出所有的 2值不同容量样本的抽样分布不同容量样本的抽样分布c c c c c c2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=20 总体第92页/共130页 t 分布1.高塞特于1908年在一篇以“Student”(学生)为笔名的论文中首次提出2.t 分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散3.一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布 第93页/共130页t 分布图示x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布标准正态分布标准正态分布t t不同自由度的不同自由度的t t分布分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z z第94页/共130页 由上图可以看出:t分布的密度函数与标准正态分布N(0,1)的密度函数曲线非常相似单峰偶函数。t(n)的密度函数在两侧的尾部都要比N(0,1)的两侧尾部粗一些,t(n)的方差比N(0,1)的方差大一点。当n30时,t分布与标准正态分布就非常接近 t分布理论适用于小样本分布第95页/共130页1.由统计学家费希尔()提出的,以其姓氏的第一个字母来命名2.设 若 U为 服 从 自 由 度 为 n1的2分 布,即U2(n1),V为服从自由度为n2的2分布,即V2(n2),且U和V相互独立,则称F为服从自由度n1和n2的F分布,记为 F分布(F distribution)第96页/共130页F分布(图示)不同自由度的F分布F F F(1,10)1,10)(5,10)(5,10)(10,10)(10,10)第97页/共130页1.样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.随机变量是 样本统计量样本均值,样本比例,样本方差等3.结果来自容量相同的所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据 抽样分布(sampling distribution)第98页/共130页1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布第99页/共130页样本均值的抽样分布(一个例子)【例】设设一一个个总总体体,含含有有4 4个个元元素素(个个体体),即即总总体体单单位位数数N N=4=4。4 4 个个个个体体分分别别为为X X1 1=1=1、X X2 2=2=2、X X3 3=3=3、X X4 4=4=4。总体的均值、方差及分布如下。总体的均值、方差及分布如下均值和方差均值和方差总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3第100页/共130页样本均值的抽样分布(一个例子)现现从从总总体体中中抽抽取取n n2 2的的简简单单随随机机样样本本,在在重重复复抽抽样样条条件件下下,共共有有4 42 2=16=16个个样样本本。所所有有样样本本的的结结果果如下表如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n=2 的样本(共16个)第101页/共130页样本均值的抽样分布(一个例子)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布样本均值的抽样分布1.01.00 0.1.1.2.2.3.3P P(x x)1.51.53.03.04.04.03.53.52.02.02.52.5x x第102页/共130页所有样本均值的均值和方差式中:式中:MM为样本数目为样本数目比较及结论:比较及结论:1.1.样本均值的均值(数学期望)等于总体均值样本均值的均值(数学期望)等于总体均值 2.2.样本均值的方差等于总体方差的样本均值的方差等于总体方差的1/1/n n第103页/共130页样本均值的分布与总体分布的比较抽样分布抽样分布 =2.5 2=1.25总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3P P(x x)1.01.00 0.1.1.2.2.3.31.51.53.03.04.04.03.53.52.02.02.52.5x x第104页/共130页样本均值的抽样分布与中心极限定理 =50=50=50 =10=10=10X XX总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布xn n=16=16当当总总体体服服从从正正态态分分布布N N(,2 2)时时,来来自自该该总总体体的的所所有有容容量量为为n n的的样样本本的的均均值值 x x也也服服从从正正态态分分布布,x x 的的数数学学期望为期望为,方差为,方差为 2 2/n n。即。即 x xN N(,2 2/n n)第105页/共130页中心极限定理(central limit theorem)当样本容量足够当样本容量足够大时大时(n n 30)30),样本均值的抽样样本均值的抽样分布逐渐趋于正分布逐渐趋于正态分布态分布从从均均值值为为,方方差差为为 2 2的的一一个个任任意意总总体体中中抽抽取取容容量量为为n n的的样样本本,当当n n充充分分大大时时,样样本本均均值值的的抽抽样样分分布布近近似似服服从从均均值为值为、方差为、方差为 2 2/n n的正态分布的正态分布一个任意分一个任意分布的总体布的总体x x第106页/共130页中心极限定理(central limit theorem)x x 的的分分布布趋趋于于正正态态分分布布的过程的过程第107页/共130页例:设从一个均值为10,标准差为0.6的总体中随机选取容量为36的样本。假定该总体不是很偏,求:(1)计算样本均值小于9.9的近似概率(2)计算样本均值超过9.9的近似概率(3)计算样本均值在总体均值附近0.1范围内的近似概率第108页/共130页第109页/共130页第110页/共130页例2:某汽车电瓶商声称生产的电瓶具有均值为60个月,标准差为6个月的寿命分布。先假设质检部门决定检验该厂的说法是否准确,为此随机抽取50个该厂生产的电瓶进行寿命试验。(1)假定厂商声称正确,描述50个电瓶的平均寿命的抽样分布。(2)50个样品组成的样本的平均寿命不超过57个月的概率为多少?第111页/共130页结论:50个电瓶平均寿命不超过57个月的概率为0.0002,根据小概率原理,这是一个不可能事件。第112页/共130页1.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比2.总体比例可表示为3.样本比例可表示为比例(proportion)第113页/共130页样本比例的抽样分布1.在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布2.一种理论概率分布3.当样本容量很大时,样本比例的抽样分布可用正态分布近似,则4.如果X是随机变量,C为常数,则CX和X有相同的分布形状。第114页/共130页1.样本比例的数学期望2.样本比例的方差重复抽样不重复抽样样本比例的抽样分布(数学期望与方差)第115页/共130页例:第116页/共130页例2:假定某统计人员在填写的报表中有2%至少会有一处错误,如果我们检查了一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025-0.070之间的概率有多大?第117页/共130页第118页/共130页即该统计人员所填写的报表中至少有一处错误的报表所占的比例在0.0250.070之间的概率为0.1902第119页/共130页样本方差的分布1.在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值 的抽样分布服从自由度为(n-1)的 2分布,即第120页/共130页两个样本方差比的分布1.两两个个总总体体都都为为正正态态分分布布,即即X X1 1 N N(1 1,1 12 2),X X2 2 N N(2 2,2 22 2)2.从两从两个总体中分别抽取容量为个总体中分别抽取容量为n n1 1和和n n2 2的独立样本的独立样本3.两两个个样样本本方方差差比比的的抽抽样样分分布布,服服从从分分子子自自由由度度为为(n n1 1-1)-1),分母自由度为,分母自由度为(n n2 2-1)-1)的的F F分布,即分布,即 第121页/共130页结 束第122页/共130页1第123页/共130页2第124页/共130页3.某次语文考试成绩服从正态分布,2=81,从中抽取n=25的样本,计算得其平均分为58,试估计总体平均数的0.95的置信区间。第125页/共130页4.某高校有3000名走读学生,该校后勤部门想估计这些学生每天来回的平均时间,以置信度为95的置信区间估计,并使估计值处在真值附近1分钟的误差范围之内,一个先前抽样的小样本给出的标准差为4.8分钟,试问应抽取多大的样本?第126页/共130页5.为了解某生活小区住户的月书报费支出情况,随机抽取36户居民家庭进行调查,得平均每户居民家庭每月的书报费支出为46元,样本标准差为24元。试分析整个生活小区居民家庭平均每月的书报费支出在3854元之间的可能性有多大?第127页/共130页6.对某地区居民进行经济收入调查,设已知居民的平均年收入的标准差为3000元,要求按置信水平95%,准许抽样误差为500元,至少要对多少居民进行调查。第128页/共130页7.一项关于大学生体重状况的研究发现,男生的平均体重为60公斤,标准差为5公斤;女生的平均体重为50公斤,标准差为5公斤。请回答下面的问题:1)是男生的体重差异大还是女生的体重差异大?为什么?2)粗略地估计一下,男生中有百分之几的人体重在55公斤到65公斤之间?3)粗略地估计一下,女生中有百分之几的人体重在40公斤到60公斤之间?第129页/共130页感谢您的观看!第130页/共130页

    注意事项

    本文(统计学原理抽样推断及参数估计.pptx)为本站会员(莉***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开