应用统计学教案第4章-抽样推断.doc
《应用统计学教案第4章-抽样推断.doc》由会员分享,可在线阅读,更多相关《应用统计学教案第4章-抽样推断.doc(16页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、应用统计学教案 张敏主编第4章 抽样推断教学内容4.1 统计抽样的一般问题4.2 抽样推断的相关基本概念4.3 参数估计4.4 抽样误差4.5 抽样调查的组织方式及其误差的计算4.6 样本数目的确定4.7 Excel在参数估计中的应用教学要求1.理解不同种类抽样推断的基本原理; 2.理解统计量与统计分布、重置抽样与非重置抽样概念的内涵;3.理解置信度与置信区间、抽样实际误差与平均误差的区别和联系;4.掌握不同类型抽样的参数估计原理和方法;5.了解样本数目确定的原理和方法。教学重点统计量与统计分布、重置抽样和非重置抽样的概念;抽样平均误差的计算;不同类型抽样的参数估计原理和方法;样本数目确定的原
2、理和方法教学难点抽样平均误差的计算;不同类型抽样的参数估计原理和方法教学方法课堂讲授、多媒体教学、课堂讨论、案例分析、课堂练习、上机操作。课时数12课时(课堂讲授9课时+课堂练习2课时+上机操作1课时)导入案例某品牌手机电池经过技术改进,待机时间得以提高,从该工厂抽取一定数量的样本,测得其平均待机时间,以此推断该工厂生产的电池的待机时间。4.1 抽样推断的一般问题4.1.1抽样推断的概念及特点抽样调查是一种非全面调查,它按照随机的原则从总体中抽取部分样本加以调查,目的是对总体相关信息进行推断。抽样调查是一种非全面调查,它按照随机的原则从总体中抽取部分样本加以调查,目的是对总体相关信息进行推断。
3、抽样推断的主要特点如下。(1)按随机原则抽取样本。(2)根据部分推断总体。(3)抽样误差可以估计和控制。4.1.2样本选取方法样本选取方法有:简单随机抽样、类型抽样、整群抽样等抽样方式问题与应用:统计研究经常面对“大数据”,抽样调查选取样本可大大减少研究成本。因此,用恰当的方式去获取样本是有效研究的前提。4.2 抽样推断的相关基本概念和理论4.2.1总和样本总体是所要认识的研究对象的全体,是由所研究范围内具有某种共同性质的全体单位所组成的集合体,具有固定性。样本是指在相同的条件下对总体X进行n次重复、独立的观测,将n次观测结果按试验的次序依次记为,,这样得到的一组个体称为来自总体X的一个简单随
4、机样本,n为这个样本的容量。4.2.2总体参数和样本参数总体参数是指根据总体各个单位的标志值计算的,反映总体某种数量特征的综合指标,也称全及指标、总体指标。常用的总体参数有总体均值(或总体成数)、总体标准差(或总体方差)。样本参数是指通过样本各单位标志值计算,以此反映样本数量特征的综合指标,也被称为样本统计量。样本参数是样本各变量的函数,用来估计总体参数。常用的样本参数有样本均值(或样本成数)、样本离差(或样本方差)。4.2.3大数定理和中心极限定理大数定理和中心极限定理是与统计学密切相关的重要数学定理,它们是抽样推断的数学理论基础。4.2.4重置抽样和非重置抽样的概念重置抽样是指从总体的N个
5、单位中抽取一个容量为n的样本,每次抽出一个单位后,将所要研究的标志登记下来,再将其放回总体中参加下一次抽取,这样连续进行n次抽取便得到一组包含n个单位的样本。重置抽样具有以下特点。(1)同一总体单位有可能被重复抽中。(2)每次都是从N个总体单位中抽取。(3)n次抽取就是n次相互独立的随机试验。2. 非重置抽样非重置抽样是指将抽中的单位不再放回总体中,下一个样本单位只能从余下的总体单位中抽取。样本由n次连续抽取的结果组成,实质上相当于一次同时从总体中抽取n个单位。非重置抽样具有以下特点。(1)同一总体单位不可能被重复抽中。(2)每次抽取是在不同数目的总体单位中进行的。(3)n次抽取可看作是n次互
6、不独立的随机试验。对于上述两种抽样方式,在实际工作中,更多的是采用非重置抽样,因为在经济工作的调查研究中,很难考虑到将已经被抽中的单位再重置于总体中参加下一次抽取,即使同一个单位被连续抽中,也只是采用其一次的信息,否则将影响抽样调查的结果。在统计学中,重置抽样的意义更多在于,推断统计所建立的随机变量独立同分布理论是从重置抽样的角度出发的。4.3 参数估计参数估计就是以所计算的样本指标来估计相应的总体指标。参数估计的标准包括:无偏性、有效性和一致性。4.3.1 点估计参数的点估计是指当总体参数不清楚时,用一个特定值(一般用样本统计量)对其进行估计,称为点估计。常用的点估计方法包括数字特征法、极大
7、似然估计法。数字特征法在参数估计中,如果直接用求得的样本指标估计与之相应的总体指标,则这种方法就称为数字特征法。如用样本均值作为总体均值的估计量,则=;用样本成数作为总体成数的估计量,则=;用样本方差为总体方差的估计量,则=。例4.1 已知某班学生的身高X服从,其中,参数未知,现从该班学生中抽出6名学生作为样本,他们的身高分别为165cm、168cm、173cm、173cm、175cm、180cm,求的估计值。解:由数字特征法可知=172.33(cm)4.3.2 区间估计区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。总体均值的区间估计(1)已知方差的正态总体设样本来自正态
8、总体,这里已知,总体均值未知,在此条件下,求总体均值的置信水平为的置信区间。设样本均值为。因为总体,故,因此给定置信水平,查标准正态分布表,得临界值(见图4.1),使得,即(4.14)通过变形得(4.15)于是得到正态总体均值的置信水平为的置信区间(4.16)例4.3 某零部件生产厂家生产一种零部件,假设其质量为随机变量X,服从正态分布,其中,为50。现在从该厂生产的一批零部件中随机地抽取30个产品进行测试,测得它们的平均质量为600kg。请计算该厂生产的这一批零部件的平均质量的置信水平为95%的置信区间。解:由已知条件可得,总体方差,样本容量,样本均值。置信水平为,查表可得。,因此该厂此批零
9、部件平均质量的95%的置信区间为(597.47,602.53)。(2)未知方差的正态总体在实际中,经常会遇到总体方差未知的情况,用样本方差来代替,即构造下述统计量给定置信水平,查t分布表,得临界值,使得,即(4.17)通过变形得(4.18)于是得到正态总体均值的置信水平为的置信区间(4.19)例4.4 某生产厂家生产一种灯泡,假设其寿命为随机变量X,服从正态分布,其中,未知。现在从该厂生产的灯泡中随机地抽取50个产品进行测试,直到灯泡寿命终止,测得它们的平均寿命为1200小时,样本标准差为60小时。试计算,在置信水平为95%情况下,该厂此种灯泡平均寿命的置信区间。解:由已知条件可得,样本标准差
10、,样本容量,样本均值。置信水平为,查表可得因此该厂此种灯泡平均寿命的95%的置信区间为(1183.37,1216.63)。总体成数的区间估计成数是指在总体中具有某一特征的个体占总体的比率。对总体中具有某一特征的个体所占的比率进行估计,即对总体成数的估计。在估计时,首先从总体中抽取容量为n的一组样本,计算样本成数,根据经验法则,当与均大于5时,近似服从正态分布。的置信水平为的置信区间为(4.22)例4.7 设要检验10000件某产品的质量,现随机抽取100件,发现其中有25件废品,要求用重置抽样的方法以95%的置信度对该批产品的合格率进行区间估计。解:0.670.83于是得到10000件该产品合
11、格率的置信水平为95%的置信区间为(67%,83%)。4.4 抽样误差4.4.1 抽样误差的概念和影响因素概念:抽样误差是指用样本指标推断估计总体指标时,实际存在的绝对离差。影响因素:1. 总体各单位标志值的变异程度2. 样本单位数的数量3. 抽样方法4. 抽样的组织形式4.4.2 抽样误差的度量原理在实际抽样推断中,由于各种随机性和系统性因素的影响,推断过程中常存在着误差的困扰,误差若过大,难免会影响抽样推断结果的客观性,因此,对误差的控制极其重要,而这涉及对抽样误差的度量。那么既然抽样极限误差无法直接求取,就只能通过抽样的方式进行间接推断,也即从若干抽样样本中求取(利用样本信息求取而非总体
12、信息)一个抽样平均误差,进而通过抽样平均误差去推导抽样极限误差。4.4.3 抽样平均误差 1. 抽样平均误差的概念抽样平均误差是根据随机原则抽样时,所有可能出现的样本平均数的标准差。它反映的是样本均值(样本成数)与总体均值(总体成数)的平均误差程度,常用表示。2. 抽样平均误差的两种形式(1)在重置抽样条件下,样本平均误差为(4.24)样本成数误差为(4.25)(2)在非重置抽样条件下,样本平均误差为;(4.26)样本成数误差为(4.27)上述公式中,指总体标准差;N指总体单位数;n指样本单位数;指样本成数。例4.9 某公司出口一种名茶,规定每包规格质量不低于150克,现用简单随机抽样方法抽取
13、其中1%进行检验,茶叶样本质料如表4.2所示,试求平均抽样误差。表4.2 茶叶样本资料每包质量 / 克包数14814910149150201501515015115220合 计100解:(克)(克)在重置抽样条件下:(克)在非重置抽样条件下:(克)4.4.4 抽样极限误差抽样极限误差又称抽样的允许误差范围,是指在一定的置信度下保证样本指标与总体指标之间的抽样误差不超过某一给定的最大可能范围,记作。1. 在总体服从正态分布且已知时统计量为给定置信水平,查标准正态分布表,得临界值,使得,即通过变形得在此情况下,极限误差可表示为(4.28)2. 在总体服从正态分布且未知时统计量为给定置信水平,查t分
14、布表,得临界值, 在此情况下,极限误差可表示为(4.29)在实际抽样调查工作中,总体方差一般是未知的,故在本章我们只讨论上述第二种情况。由此可得总体均值和总体成数的极限误差表达式分如下。(1)总体均值的极限误差表达式:(4.30)(2)总体成数的极限误差表达式:(4.31)其中,t是指与置信度相对应的临界值。4.5 抽样方式及其误差的计算4.5.1 简单随机抽样1. 简单随机抽样基本概念及特征对总体中的每一个单位,都按具有同等的互相独立的被选中机会的方式进行抽样(不对总体进行分组、排序等),这种抽样方式就称为简单随机抽样。其基本表达式为:Nn(从N个总体单位中抽取n个样本单位),可以分为重置抽
15、样与非重置抽样。2.简单随机抽样下的总体参数区间估计的计算步骤(1)标志值条件下的计算步骤第一步,计算样本均值。(4.33)第二步,计算抽样平均误差。(4.34)第三步,计算极限误差。,其中(4.35)第四步,计算估计区间。(,)(4.36)例4.10 某学校进行了一次全校英语测试,为了了解考试情况,从参加测试的1000名学生中,随机重复抽取了10%的成绩进行调查,所得的分布数列如表4.3所示。表4.3 英语成绩分布表测试成绩 / 分60以下60707080809090以上学生数102022408试以95.45%的置信度求该校1000名学生英语平均成绩的估计区间。解:先求出各组组中值,再按以下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计学 教案 抽样 推断
限制150内