第六章统计推断.ppt
《第六章统计推断.ppt》由会员分享,可在线阅读,更多相关《第六章统计推断.ppt(62页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第六章 统计推断n【内容提要】n本章介绍推断统计的内容。第一、二节介绍推断统计的几个基本概念和数学定理。第三节介绍抽样误差。第四节介绍全及指标的推断:点估计和区间估计。第五节介绍样本量的确定。第六节介绍假设检验。最后一节介绍EXCEL在区间估计与假设检验中的使用。第一节 统计推断中几个基本概念一、全及总体和抽样总体n(一)全及总体n(二)抽样总体二、全及指标和抽样指标n (一)全及指标n 根据全及总体各个单位的标志值或标志特征计算的、反映总体某种属性的综合指标,称为全及指标。n总体平均数 总体成数为P=Q=n此外,全及指标还有总体方差和总体标准差,它们都是测量总体标志值分散程度的指标。(二)抽
2、样指标 n由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标。和全及指标相对应还有抽样平均数n抽样成数p、样本标准差S和样本方差S2等等。和p用小写英文字母表示,以示区别。n抽样成数为n样本的方差和样本标准差分别为n 三、重置抽样与不重置抽样n(一)重置抽样n重置抽样,又称有放回的抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位经登录其有关标志表现后又放回总体中重新参加下一次的抽选。n(二)不重置抽样n不重置抽样,又称无放回的抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选。四、抽样框与样本
3、数n(一)抽样框n抽样框,又称抽样结构,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。n(二)样本数n样本数,又称样本的可能数目,是指从总体N个单位中随机抽选n个单位构成样本,通常有多种抽选方法,每一种抽选方法实际上是n个总体单位的一种排列组合,一种排列组合便构成一个可能的样本,n个总体单位的排列组合总数,称为样本的可能数目。第二节 大数定律与中心极限定理一、大数定律n大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使
4、现象的必然规律性显示出来。二、中心极限定理n大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在一定条件下,大量独立随机变量的平均数是以正态分布为极限的。第三节 抽样误差一、抽样误差的概念 n 当总体指标未知时,往往要安排一次抽样调查,然后用抽样调查所获得的抽样指标的观察值作为总体指标的估计值。这种处理方法是存在一定误差的,我们把抽样指标与所要估计的总体指标之间的差值称为抽样误差。抽样误差的大小能够说明抽样指标估计总体指标是否可行,抽样效果是否理想等调查性问题。常见的抽样误差有:抽样平均数与总体平均数之差 ),抽样成数与总体成数之差(p-P)。二、影
5、响抽样误差的因素n(一)抽样单位数的多少。n(二)总体各单位标志值的差异程度。n(三)抽样方法。n(四)抽样的组织形式。三、抽样平均误差n一个总体可能抽取很多个样本,因此样本指标(样本平均数、样本成数等)就有不同的数值,它们与总体指标(总体平均数、总体成数等)的离差(即抽样误差)也就不同。抽样平均误差就是反映抽样误差一般水平的指标,通常用样本平均数(或样本成数)的标准差来表示。(一)样本平均数的平均误差n以x表示样本平均数的平均误差,表示总体的标准差。根据定义:1当抽样方式为重复抽样时,样本标志值x1,x2,xn是相互独立的,样本变量x与总体变量X同分布。所以得:2当抽样方式为不重复抽样时,样
6、本标志值x1,x2,xn不是相互独立的,根据数理统计知识可知:当总体单位数N很大时,这个公式可近似表示为:例6.1:有5个工人的日产量分别为(单位:件):6,8,10,12,14,用重复抽样的方法,从中随机抽取2个工人的日产量,用以代表这5个工人的总体水平。则抽样平均误差为多少?解:根据题意可得:总体标准差若改用不重复抽样方法,则抽样平均误差为:(二)抽样成数的平均误差n根据样本平均误差和总体标准差的关系,可以得到样本成数的平均误差的计算公式。n(1)在重复抽样下n n(2)在不重复抽样下n n当总体单位数N很大时,可近似地写成:n n当总体成数未知时,可以用样本成数来代替。例6.2:某企业生
7、产的产品,按正常生产经验,合格率为90%,现从5000件产品中抽取50件进行检验,求合格率的抽样平均误差。解:根据题意,在重复抽样条件下,合格率的抽样平均误差为:在不重复抽样条件下,合格率的抽样平均误差为:四、抽样极限误差n抽样极限误差,是指在一定的把握程度下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围,记作。作为样本的随机变量抽样指标值是围绕以未知的唯一确定的全及指标真值为中心上下波动,它与全及指标值可能会产生正或负离差,这些离差均是抽样指标的随机变量,因而难以避免,只能将其控制在预先要求的误差范围内。未知的全及指标的取值可能的范围:例6.3:例如要估计北京北站整车到达货
8、物的平均运送时间。从交付的全部整车货票共26 193批中,用不重复抽样抽取2 718批货票。若允许的抽样极限误差 =0.215(天),经计算知所抽取的每批货物平均运送时间为 5.64(天)那么北京北站整车到达货物的平均运送时间区间估计为(5.640.125,5.64+0.125),即在5.515到5.765天之间。例6.4:资料同上,若要估计北京北站整车到达货物的逾期运到率(报告期内超过规定货物运到期限运到的货物批数/货物的到达总批数),从随机抽取的2718批货票中,计算得抽样逾期到率为6.43%,所确定的抽样极限误差为=0.642%,由此可得北京北站总体的逾期运到率的区间估计是(6.43%-
9、0.642%,6.43%+0.642%)。五、抽样估计的概率度、精度和可靠程度(一)抽样估计的概率度n抽样极限误差是单个样本值与总体指标值之间的绝对离差,而抽样平均误差是所有可能样本值与总体指标值之间的平均离差,用抽样极限误差与抽样平均误差相比,从而使由单一样本值得到的抽样极限误差标准化,这样可称为抽样标准极限误差,但通常称其为概率度(t)或相对误差范围。(二)抽样估计的精度n为了比较不同现象总体的抽样误差程度,必须消除总体规模大小悬殊的影响,通常还需计算抽样误差系数,抽样误差系数记作,反映了抽样误差的相对程度。其计算公式为:n则抽样估计精度(A)公式为:(三)抽样估计的可靠程度n置信区间的测
10、定总是在一定的概率保证程度下进行的,因为既然抽样误差是一个随机变量,就不能指望抽样指标落在置信区间内成为必然事件,只能视为一个可能事件,这样就必定要用一定的概率来给予保证。抽样误差的可能范围是估计的准确性问题,而保证抽样指标落在抽样误差的可能范围之内则是估计的可靠性问题。所以抽样估计可靠程度又称置信度。表6.1 常用概率面积、概率度对应表概率面积F(t)概率度t概率面积F(t)概率度t0.68270.79950.86640.900.95001.001.281.501.641.960.95450.990.99730.999940.9999992.002.583.004.005.00第四节 全及指
11、标推断n全及指标的推断是指对总体平均数和总体成数P推断估计的问题。总体指标的推断有点估计和区间估计两种方法。一、点估计n点估计也称定值估计,它是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法。点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等。二、区间估计显著性水平通常用表示,是一个临界概率值,估计总体参数落在某一区间内,可能犯错误的概率为显著性水平,用表示,1-为置信度或置信水平,表明区间估计的可靠性。(一)区间估计的思想n区间估计就是以一定的概率保证估计包含总体参数的一个值域,即根据样本指标和抽样平均误差推断总体指标的可
12、能范围。它包括两部分内容:一是这一可能范围的大小;二是总体指标落在这个可能范围内的概率。(二)当2已知时,求的置信区间n例6.7:某种零件的长度服从正态分布,从该批产品中随机抽取9件,测得它们的平均长度为21.4毫米,已知总体标准差为0.15毫米,试建立该种零件平均长度的置信区间,假定给定置信水平为0.95。n解:因为 所以对于给定的置信水平0.95,有n。n当0.05时,U/21.96,于是有n即总体均值的置信区间为21.302,21.498。(三)当2未知时,求的置信区间定理 设x1,x2,xn,(n2)是来自总体N(,2)的一个样本,则 以1置信水平保证的置信区间 例6.9:某研究机构进
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第六章 统计推断 第六 统计 推断
限制150内