总体均值估计时样本容量的确定教学提纲.ppt
《总体均值估计时样本容量的确定教学提纲.ppt》由会员分享,可在线阅读,更多相关《总体均值估计时样本容量的确定教学提纲.ppt(75页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、总体均值估计时样本容量的确定 质检报告提交后,企业高层领导人提出几点意见:一是抽取的样质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估计的误差再缩小一点?比如,估计平均重量时,估计误差不超过计的误差再缩小一点?比如,估计平均重量时,估计误差不超过3 3克,克,估计合格率时误差不超过估计合格率时误差不超过10%10%;三是总体平均重量的方差是多少?因为;三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应方差的大小说明了生产过程
2、的稳定性,过大或过小的方差都意味着应对生产过程进行调整。对生产过程进行调整。第六章第六章 总体参数估计总体参数估计第六章第六章 总体参数估计总体参数估计本章重点本章重点本章重点本章重点1、参数估计的基本问题;、参数估计的基本问题;2、单个总体均值和比率的区间估计;、单个总体均值和比率的区间估计;3、小样本下的总体参数估计方法;、小样本下的总体参数估计方法;4、样本容量的确定方法;、样本容量的确定方法;5、两个总体均值和比率差异的区间估计;、两个总体均值和比率差异的区间估计;6、分层、整群和等距抽样的区间估计。、分层、整群和等距抽样的区间估计。本章难点本章难点本章难点本章难点1、一般正态分布、一
3、般正态分布标准正态分布;标准正态分布;2、区间估计的原理;、区间估计的原理;3、两总体联合方差的表达形式。、两总体联合方差的表达形式。第一节第一节 参数估计的基本问题参数估计的基本问题一、点估计点估计就是用样本估计量的一个具体观测值直接作为总体的未知参数的估计值的方法。如上例中随机抽取的100头的平均每头毛重(95.5kg)可作为10000头平均每头毛重 的点估计值 常用的估计量有:(1)样本平均数 为总体平均数 的估计量;(2)样本方差 为总体方差 的估计量;(3)样本成数 为总体成数 P 估计量。二、点估计的性质 在对总体特征做出估计时,并非所有估计量都是优良的,从而产生了评价估计量是否优
4、良的标准。作为优良的估计量应该符合如下三个标准:第六章第六章 总体参数估计总体参数估计1、无偏性 如果样本某统计量的数学期望值等于其所估计的总体参数真值,则这个估计统计量就叫做该总体参数的无偏估计量。如样本平均数的数学期望是总体平均数,则样本均值是总体均值的无偏估计量。这里无偏估计量是指没有系统偏差(非随机偏差)的平均意义上的量,即如果说一个估计量是无偏性的,并不是保证用于单独一次估计中没有随机性误差,只是没有系统性偏差而已。这是一个优良估计量的重要条件。若以 代表被估计的总体参数,代表 的无偏估计量则有:第六章第六章 总体参数估计总体参数估计2、一致性 若估计量随样本容量n的增大而越来越接近
5、总体参数值时,则称该估计量为被估计参数的一致性估计量。估计量的一致性是从极限意义上讲的,它适用于大样本的情况。如果一个估计量是一致性估计量,那么采用大样本就更加可靠。当然,样本容量n增大时,估计量的一致性会增强,但调查所需的人、财、物力也相应增加。例如,以样本平均数估计总体平均数,符合一致性的要求,即存在如下关系:式中 为任意正数。第六章第六章 总体参数估计总体参数估计3、有效性 有效性是指无偏估计量中方差最小的估计量。无偏估计量只考虑估计值的平均结果是否等于待估计参数的真值,而不考虑估计的每个可能值及其次数分布与待估计参数真值之间离差大小的离散程度。我们在解决实际问题时,不仅希望估计值是无偏
6、的,更希望这些估计值的离差尽可能地小,即要求比较各无偏估计量中与被估计参数的离差较小的为有效估计量。如样本平均数与中位数都是总体均值的无偏估计量,但在同样的样本容量下,样本平均数是有效的估计量。第六章第六章 总体参数估计总体参数估计点估计的缺点:不能反映估计的误差和精确程度 因为点估计是基于样本得到的,是随机变量,不可能期望它的值与相应的总体参数的真实值相等,也就是说点估计值和总体参数的真是值之间总会存在一定误差,并且我们是不知道这个误差有多大,这样我们估计的可信度大打折扣。在这一节中,我们将说明如何利用点估计值对单个总体均值和总体比率进行区间估计,并给出估计的可靠程度和准确程度。区间估计:利
7、用样本统计量和抽样分布估计总体参数的可能区间第六章第六章 总体参数估计总体参数估计第二节第二节 单个总体均值和比率的区间估计单个总体均值和比率的区间估计一、总体均值的区间估计:大样本(n30)情形和小样本(n30)情形。大样本的情形大样本的情形【例例1 1】Duotu公司是一家专营体育设备和附件的公司,为了监控公司的服务质量,Duotu公司每月都要随即的抽取一个顾客样本进行调查以了解顾客的满意分数。根据以往的调查,满意分数的标准差稳定在20分左右。最近一次对100名顾客的抽样显示,满意分数的样本均值为82分,试建立总体满意分数的区间。我们可以将样本满意得分的均值(我们可以将样本满意得分的均值(
8、82分)作为该公司分)作为该公司所有顾客组成的总体的平均满意得分的点估计。当然你也所有顾客组成的总体的平均满意得分的点估计。当然你也许会问:许会问:“这一估计有多好?这次估计的把握程度有多高这一估计有多好?这次估计的把握程度有多高?”有多好有多好这一问题其实是想知道以样本均值作为总这一问题其实是想知道以样本均值作为总体均值的点估计时所产生的误差有多大。体均值的点估计时所产生的误差有多大。我们把无偏点估计值与总体参数之差的绝对值称为抽样误差。当我们用样本均值估计总体均值时,抽样误差可以表达为:如果我们可以利用式6-1将抽样误差计算出来,那么就可以将式6-1变形为:(6-1)(6-2)要进行区间估
9、计,关键是将抽样误差E求解。若 E 已知,则区间可表示为:此时,可以利用样本均值的抽样分布对抽样误差的大小进行描述。上例中,已知,样本容量n=100,总体标准差 ,根据中心极限定理可知,此时样本均值服从均值为 ,标准差为 的正态分布。即:抽样误差的概率表述抽样误差的概率表述我们可以确定样本均值 在总体均值82的周围波动,波动的幅度即为抽样误差。根据抽样分布的知识,这个波动幅度即抽样误差。可以根据事先给定的概率加以计算 ,为了方便运算,通常我们先将一般的正态分布转化为标准正态分布。由概率论,若 ,服从标准正态分布,记为 。由标准正态分布,有以下式子成立 (6-4)一般称,为置信度,可靠程度等,反
10、映估计结果的可信程度。若事先给定一个置信度,则可根据标准正态分布找到其对应的临界值 。进而计算抽样误差 若,则查标准正态分布附表3可得,抽样误差 此时抽样误差的意义可表述为:以样本均值为中心的3.92的区间包含总体均值的概率是95%,或者说,样本均值产生的抽样误差是3.92或更小的概率是0.95。常用的置信度还有90%,95.45%,99.73%,他们对应的临界值分别为1.645,2和3,可以分别反映各自的估计区间所对应的精确程度和把握程度。计算区间估计:计算区间估计:在CJW公司的例子中,样本均值产生的抽样误差是3.92或更小的概率是0.95。因此,可以构建总体均值的区间为,由于,从一个总体
11、中抽取到的样本具有随机性,在一次偶然的抽样中,根据样本均值计算所的区间并不总是可以包含总体均值,它是与一定的概率相联系的。如下图所示:3.923.92图图1 根据选择的在根据选择的在 、位置的样本均值建立的区间位置的样本均值建立的区间 上图中,有上图中,有95%的样本均值落在阴影部分,这个区域的样本均的样本均值落在阴影部分,这个区域的样本均值值3.92的区间能够包含总体均值。的区间能够包含总体均值。因此,总体均值的区间的含义为,我们有因此,总体均值的区间的含义为,我们有95%的把握认为,的把握认为,以样本均值为中心的以样本均值为中心的3.92的区间能够包含总体均值。的区间能够包含总体均值。通常
12、,称该区间为置信区间,其对应的置信水平为通常,称该区间为置信区间,其对应的置信水平为 置信区间的估计包含两个部分:点估计和描述估计精确度的置信区间的估计包含两个部分:点估计和描述估计精确度的正负值。也将正负值称为误差边际或极限误差,反映样本估计正负值。也将正负值称为误差边际或极限误差,反映样本估计量与总体参数之间的最大误差范围。量与总体参数之间的最大误差范围。总结总结:计算区间估计:计算区间估计:在大多数的情况下,总体的标准差都是未知的。根据抽样分布定理,在大样本的情况下,可用样本的标准差s作为总体标准差的点估计值,仍然采用上述区间估计的方法进行总体参数的估计。【例例2 2】某市交通部门为了对
13、城市的环境进行监测,定期公布该市居民每天小汽车的里程数,抽取36个居民作为一个简单随即样本,得到资料如表6-2所示。试构造该市民每天小汽车里程数的总体均值的95%的置信区间。居民居民汽车里程数汽车里程数居民居民汽车里程数汽车里程数居民居民汽车里程数汽车里程数居民居民汽车里程数汽车里程数12345678932504024334445484410111213141516171847313639464539384519202122232425262727435436344823364228 2930313233343536343934354253284939分析:区间估计包括两个部分点估计和误差边际
14、,只需分别求出即可到的总体的区间估计。解:已知(1)样本的平均里程数(2)极限误差(误差边际)样本标准差极限误差(3)95%的置信区间为39.5 2.54 即(36.96,42.04)公里。注意注意(1)置信系数一般在抽样之前确定,根据样本所建立的区间能包含总体参数的概率为100(1-)%(2)置信区间的长度(准确度)在置信度一定的情况下,与样本容量的大小呈反方向变动,若要提高估计准确度,可以扩大样本容量来达到。二、总体均值的区间估计:小样本的情况二、总体均值的区间估计:小样本的情况 在小样本的情况下,样本均值的抽样分布依赖于总体的抽样分布。我们讨论总体服从正态分布的情况。t分布的图形和标准正
15、态分布的图形类似,如下图示:0标准正态分布t分布(自由度为20)t分布(自由度为10)图6-3 标准正态分布与t分布的比较第六章第六章 总体参数估计总体参数估计 在分布中,对于给定的置信度,同样可以通过查表找到其对应的临界值,利用临界值也可计算区间估计的极限误差 因此,总体均值的区间估计在总体标准差未知的小样本情况下可采用下式进行:假定总体服从正态分布;第六章第六章 总体参数估计总体参数估计【例例3 3】谢尔工业公司拟采用一项计算机辅助程序来培训公司的维修支援掌握及其维修的操作,以减少培训工人所需要的时间。为了评价这种培训方法,生产经理需要对这种程序所需要的平均时间进行估计。以下是利用新方对名
16、职员进行培训的培训天数资料。根据上述资料建立置信度为的总体均值的区间估计。(假定培训时间总体服从正态分布)。职员时间职员时间职员时间职员时间职员时间职员时间第六章第六章 总体参数估计总体参数估计 解:依题意,总体服从正态分布,(小样本),此时总体方差未知。可用自由度为(n-1)=14的t分布进行总体均值的区间估计。样本平均数 样本标准差 极限误差 95%的置信区间为53.87 3.78 即(50.09,57.65)天。第六章第六章 总体参数估计总体参数估计三、总体比例的区间估计三、总体比例的区间估计 对总体比例 的区间估计在原理上与总体均值的区间估计相同。同样要利用样本比例 的抽样分布来进行估
17、计。若,则样本比例近似服从正态分布。同样,抽样误差 类似的,利用抽样分布(正态分布)来计算抽样误差 上式中,是正待估计的总体参数,其值一般是未知,通常简单的用 替代 。即用样本方差 替代总体方差 。则,极限误差的计算公式为:【例例4】1997年菲瑞卡洛通讯公司对全国范围内的902名女子高尔夫球手进行了调查,以了解美国女子高尔夫球手对自己如何在场上被对待的看法。调查发现,397名女子高尔夫球手对得到的球座开球次数感到满意。试在95%的置信水平下估计总体比例的区间。分解:解:依题意已知,(1)样本比例(2)误差边际第六章第六章 总体参数估计总体参数估计 (3)95%的置信区间0.44 0.0324
18、 即(0.4076,0.4724)。结论:在置信水平为95%时,所有女子高尔夫球手中有40.76%到47.24%的人对得到的球座开球数感到满意。第三节第三节 确定样本容量确定样本容量极限误差其计算需要已知若我们选择了置信度由此,得到计算必要样本容量的计算公式:一、总体均值估计时样本容量的确定一、总体均值估计时样本容量的确定【例例5】在以前的一项研究美国租赁汽车花费的研究中发现,租赁一辆中等大小的汽车,其花费范围为,从加利福尼亚州的奥克兰市的每天36美元到康涅狄格州的哈特福德市的每天73.50美元不等,并且租金的标准差为9.65美元。假定进行该项研究的组织想进行一项新的研究,以估计美国当前总体平
19、均日租赁中等大小汽车的支出。在设计该项新的研究时,项目主管指定对总体平均日租赁支出的估计误差边际为2美元,置信水平为95%。解:依题意,可得 将以上结果取下一个整数(90)即为必要的样本容量。说明:由于总体标准差 在大多数情况下 是未知的,可以有以下方法取得 的值。(1)使用有同样或者类似单元的以前样本的样本标准差;(2)抽取一个预备样本进行试验性研究。用实验性样本的标准差作为 的估计值。(3)运用对 值的判断或者“最好的猜测”,例如,通常可用该值全距的1/4作为 的近似值。二、总体比率估计时的样本容量确定二、总体比率估计时的样本容量确定【例例6】在例中,该公司想在1997年结果的基础上进行一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 总体 均值 估计 时样 容量 的确 教学 提纲
限制150内