《统计学总体分布参数估计精品文稿.ppt》由会员分享,可在线阅读,更多相关《统计学总体分布参数估计精品文稿.ppt(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、统计学总体分布参数统计学总体分布参数估计估计第1页,本讲稿共66页 4.1 总体分布与样本分布总体分布与样本分布一、一、总体总体(母体)(母体):反映总体特征的随机变量的取值的全体。反映总体特征的随机变量的取值的全体。总体分布总体分布(母体分布):反映总体特征的随机变量的概率分(母体分布):反映总体特征的随机变量的概率分布。布。从无限次随机抽取(然后放回)的角度看,表征一个总体从无限次随机抽取(然后放回)的角度看,表征一个总体特征的变量(指标),都可以视为随机变量。特征的变量(指标),都可以视为随机变量。有限总体的概率分布,就是有限总体中不同个体的比率有限总体的概率分布,就是有限总体中不同个体
2、的比率(频率)分布。(频率)分布。二、随机样本与样本观测值(样本数据)二、随机样本与样本观测值(样本数据)1、随机样本、随机样本 表征表征n次抽取个体的随机抽样的一组随机变量次抽取个体的随机抽样的一组随机变量X1,X2,Xn。第2页,本讲稿共66页2、样本观测值、样本观测值 n次随机抽样的结果:次随机抽样的结果:x1,x2,xn(称为随机样本(称为随机样本X1,X2,Xn 的样本观测值的样本观测值)。)。n称为随机样本向量(称为随机样本向量(X1,X2,Xn)的维度,即自由)的维度,即自由度。度。3、样本(累积)分布函数、样本(累积)分布函数 设样本观测值设样本观测值x1 x2 ,xn ki为
3、小于为小于xi+1的样本的样本值出现的累积频次值出现的累积频次,n为样本容量为样本容量,则可得样本累积频率分则可得样本累积频率分布函数如下布函数如下:样本累积频率分布函数样本累积频率分布函数,又称样本又称样本(累积累积)分布函数分布函数.样本样本(累累积积)分布函数分布函数Fn(x)是对总体的累积分布函数是对总体的累积分布函数F(x)的近似的近似,n越大越大,Fn(x)对对F(x)的近似越好的近似越好.第3页,本讲稿共66页样本分布与总体分布样本分布与总体分布格利文科格利文科(Glivenko)定理定理 (样本分布与总体分布的关系样本分布与总体分布的关系)定理定理:当样本容量当样本容量 n 趋
4、于无穷大时趋于无穷大时,Fn(x)以概率以概率1(关于关于 x)均均匀地收敛于匀地收敛于F(x).该定理是该定理是运用样本推断总体的理论依据运用样本推断总体的理论依据.定理的数学表达为定理的数学表达为:第4页,本讲稿共66页 随机样本的均值函数和方差函数都是一个随机变量随机样本的均值函数和方差函数都是一个随机变量.样本数据的样本均值样本数据的样本均值 x 是随机变量是随机变量 X 的观测值;样本数据的观测值;样本数据的样本方差的样本方差 s2 是随机变量是随机变量 S2 的观测值的观测值.随机样本的均值函数:随机样本的均值函数:随机样本的方差函数随机样本的方差函数:三、统计量与统计量的分布三、
5、统计量与统计量的分布统计量定义:统计量是不含未知参数的,随机样本统计量定义:统计量是不含未知参数的,随机样本X1,X2,,Xn的函数。的函数。第5页,本讲稿共66页统计量的值的定义统计量的值的定义:统计量的值是不含未知参数的统计量的值是不含未知参数的,样本样本观测值观测值x1,x2,xn的函数的函数.四、由标准正态分布四、由标准正态分布 N(0,1)的随机样本所引出的几)的随机样本所引出的几个重要统计量分布:个重要统计量分布:2、t 与与 F分布分布 1、2(n)分布的构成)分布的构成 设随机变量设随机变量 X 服从服从N(0,1)分布,)分布,X1,X2,,Xn为为 X 样本,则样本,则 2
6、=X2i=X21+X22+X2n 服从自由度为服从自由度为n的的 2 分布,记为分布,记为 2 2(n)。)。2(n)分布的均值)分布的均值 E(2)=n,方差,方差 D(2)=2n。第6页,本讲稿共66页n=1n=4n=10 2(n)分布图)分布图 2(n)密度函数:密度函数:其中,其中,n为自由度。为自由度。(n/2)为珈玛函数,是一个含参数)为珈玛函数,是一个含参数n/2的积分,为:的积分,为:第7页,本讲稿共66页2、t 分布分布自由度为自由度为n的的t 分布,记为分布,记为 t(n),是由),是由N(0,1)分布和)分布和 2(n)分布组成的,其表达式为:)分布组成的,其表达式为:其
7、中,其中,X 服从服从 N(0,1),),Y 服从服从 2(n)分布,且)分布,且X与与Y相互独立。相互独立。密度函数为:密度函数为:第8页,本讲稿共66页t 分布图分布图3、F 分布分布F 分布是由两个分布是由两个 2 分布之比组成的:分布之比组成的:服从服从F(m,n)。)。其中,其中,U 服从服从 2(m),),V 服从服从 2(n)。)。第9页,本讲稿共66页m=100,n=20m=15,n=20重要性质:重要性质:密度函数形式为:密度函数形式为:第10页,本讲稿共66页五、由一般正态分布的随机样本所构成的若干重要统计量五、由一般正态分布的随机样本所构成的若干重要统计量 的分布的分布定
8、理:若定理:若X1,X2,,Xn 是正态总体是正态总体N(,2)的一个)的一个随机样本,则样本均值函数和样本方差函数,满足如下性随机样本,则样本均值函数和样本方差函数,满足如下性质:质:(1)X 服从服从N(,2/n)分布。)分布。(2)X 与与 S2 相互独立。相互独立。(3)服从服从N(0,1)分布;)分布;(4)服从服从 2(n-1)分布;)分布;第11页,本讲稿共66页(5)服从服从t(n-1)分布;)分布;(1)服从服从N(0,1)。)。(6)服从服从 2(n)分布;)分布;定理:若定理:若X1,X2,,Xn1 和和Y1,Y2,,Yn2 分别是正态分别是正态总体总体N(1,12)和)
9、和N(2,22)的一个随机样本,且)的一个随机样本,且它们相互独立,则满足如下性质:它们相互独立,则满足如下性质:第12页,本讲稿共66页(3)服从服从F(n1-1,n2-1)。)。其中,其中,S12是容量为是容量为n1的的X的样本方差,的样本方差,S22是容量为是容量为n2 的的Y的样本方差。的样本方差。(2)服从服从t(n1+n2-2),(),(1=2)。)。(4)服从服从F(n1,n2)。)。第13页,本讲稿共66页六、任意分布的随机样本均值函数的均值与方差六、任意分布的随机样本均值函数的均值与方差设:随机变量设:随机变量 X 服从任何均值为服从任何均值为,标准差为,标准差为 的分布,的
10、分布,X是随机样本是随机样本X1,X2,,Xn的均值函数。记随机变量的均值函数。记随机变量X的分布函数的均值为的分布函数的均值为 X,标准差为,标准差为 X,则有如下结则有如下结论成立:论成立:(1)X=;(2)X=/n 或或 2X=2/n 注注:一个应用广泛的样本均值函数的均值和方差一个应用广泛的样本均值函数的均值和方差:0-1分布分布的样本均值函数均值和方差。的样本均值函数均值和方差。反映总体中某类个体的比例的随机变量反映总体中某类个体的比例的随机变量X,可以简单地可以简单地用用0-1分布分布B(1,p)表示表示.E(X)=p,D(X)=p(1-p).p 是总体中是总体中某类个体的比例某类
11、个体的比例.由样本由样本X1,X2,,Xn产生均值函数产生均值函数X的均值的均值 X=p,第14页,本讲稿共66页方差方差 的均值也是总体中某类个体的比例的均值也是总体中某类个体的比例 p.所以所以,常用常用 x 来估计来估计p.七、大样本均值函数的分布:中心极限定理七、大样本均值函数的分布:中心极限定理设:随机变量设:随机变量 X 服从任何均值为服从任何均值为,标准差为,标准差为 的分布,的分布,X是随机样本是随机样本X1,X2,,Xn的均值函数。的均值函数。中心极限定理:当中心极限定理:当 n 充分大时,充分大时,X 近似地服从均值为近似地服从均值为,标准差为标准差为 /n的正态分布。的正
12、态分布。在在 实际问题中实际问题中n多大?但一般多大?但一般 n 30。第15页,本讲稿共66页 对于一个学生而言对于一个学生而言,来参加家长会的家长人数是来参加家长会的家长人数是一个随机变量一个随机变量.设一个学生无家长、设一个学生无家长、1名家长、名家长、2名家长名家长来参加会议的概率分别为来参加会议的概率分别为0.05、0.8、0.15.若学校共有若学校共有400名学生名学生,设各学生参加会议的家长数相互独立设各学生参加会议的家长数相互独立,且服且服从同一分布从同一分布.(1)求参加会议的家长数求参加会议的家长数X超过超过450的概率的概率;(2)求有求有1名家长来参加会议的学生数不多于
13、名家长来参加会议的学生数不多于340的的概率概率.解解中心极限定理例题解析中心极限定理例题解析第16页,本讲稿共66页根据根据中心极限定理中心极限定理第17页,本讲稿共66页中心极限定理可得:中心极限定理可得:第18页,本讲稿共66页对比总体参数和样本统计量 4.2 点估计点估计在实际问题中,人们常常判断总体分布的参数,这就需要在实际问题中,人们常常判断总体分布的参数,这就需要用样本来推断总体分布的这些参数,这就是参数估计。用样本来推断总体分布的这些参数,这就是参数估计。参数估计分为:参数估计分为:点估计点估计和和区间估计区间估计两种方法。两种方法。1、点估计概念、点估计概念 设设 是总体分布
14、中一个需要估计的参数,现从总体中抽是总体分布中一个需要估计的参数,现从总体中抽取一个随机样本取一个随机样本X1,X2,,Xn,记估计,记估计 的统计量为的统计量为 则称则称 为为 的估计量。的估计量。第19页,本讲稿共66页若得到一组样本观测值若得到一组样本观测值x1,x2,xn,就可得出,就可得出 的估计的估计值,记:值,记:。注注:在选取样本统计量:在选取样本统计量 作为点估计时,必须考虑到作为点估计时,必须考虑到“无无偏差偏差 性性”,这一点很重要。,这一点很重要。如果样本统计量的期望值(或均值)与打算估计的总体参如果样本统计量的期望值(或均值)与打算估计的总体参数值相同,则估计值不存在
15、偏差。数值相同,则估计值不存在偏差。总体分布参数总体分布参数 的点估计,就是求出的点估计,就是求出 的估计值的估计值 。第20页,本讲稿共66页对比总体参数和样本统计量 点估计点估计 第21页,本讲稿共66页2、矩法估计、矩法估计 就是用样本矩来估计总体矩。就是用样本矩来估计总体矩。矩的一般形式:矩的一般形式:E(X k)表示)表示 k 阶原点矩(以原点为中心);阶原点矩(以原点为中心);E(X-)k 表示表示k 阶中心矩(以阶中心矩(以 为中心);为中心);3、极大似然估计法、极大似然估计法设:总体设:总体 X 的(累积)概率分布函数为的(累积)概率分布函数为F(x,),概率密概率密度函数度
16、函数 f(x,),其中其中 为未知参数为未知参数(也可以表示未知参数也可以表示未知参数向量向量).若若 X 为离散型随机变量为离散型随机变量,则由离散型与连续型的对则由离散型与连续型的对应关系应关系,f(x,)对应于离散情况下的概率对应于离散情况下的概率P(X=x).第22页,本讲稿共66页X 为连续型随机变量时为连续型随机变量时,X的随机样本的随机样本X1,X2,,Xn的联的联合概率密度函数为合概率密度函数为 称为称为 的极大似然估计函数的极大似然估计函数.当当 X 为离散随机变量时为离散随机变量时,L表示概率表示概率:L关于关于 的极大值如果存在的极大值如果存在,极大值极大值 就就是是 的
17、极大似然估计值的极大似然估计值.其含义是其含义是:一组观测值一组观测值x1,x2,xn在一次实验中出现了在一次实验中出现了,其联合概率就应当是最大的其联合概率就应当是最大的,所所以选择使联合密度以选择使联合密度L最大的那个最大的那个 .第23页,本讲稿共66页例例:设设x1,x2,,xn是正态总体是正态总体N(,2)的一个样)的一个样本观测值,求本观测值,求 与与 2 的极大似然估计值的极大似然估计值.解解:极大似然函数为极大似然函数为取对数取对数,分别对分别对 与与 2 求偏导求偏导,并令偏导为并令偏导为0,可求出可求出 与与 2的极大似然估计值如下的极大似然估计值如下:如果将上述如果将上述
18、xi 换成换成 Xi,上式成为极大似然估计量上式成为极大似然估计量.第24页,本讲稿共66页例例:设设X服从区间服从区间a,b上的均匀分布,上的均匀分布,a、b是求知参数,是求知参数,(x1,x2,,xn)是来自总体)是来自总体X的样本,求的样本,求a、b的矩估的矩估计量计量解解:X的密度函数的密度函数第25页,本讲稿共66页第26页,本讲稿共66页 4.3 判别点估计的优劣标准判别点估计的优劣标准1、无偏估计量、无偏估计量如果如果 ,则称,则称 为为 的无偏估计量。的无偏估计量。2、最小方差性、最小方差性若总体参数为若总体参数为,的估计量的估计量 的方差的方差Var()小于等于)小于等于其他
19、所有对其他所有对 的估计量的估计量 的方差,即的方差,即则称则称 的估计量的估计量 具有最小方差性。具有最小方差性。3、有效估计量、有效估计量 如果一个估计量满足如果一个估计量满足(1)无偏性;()无偏性;(2)最小方差性。)最小方差性。第27页,本讲稿共66页那么,该估计量为有效估计量那么,该估计量为有效估计量。4、渐近无偏估计量、渐近无偏估计量如果:如果:,(,(n为样本容量)则称为样本容量)则称 为渐近无为渐近无偏估计量。偏估计量。5、一致估计量、一致估计量如果如果 满足:满足:则称则称 为为 的一致估计量。的一致估计量。一致估计量的另一等价定义:一致估计量的另一等价定义:(1)渐进无偏
20、的;渐进无偏的;(2)第28页,本讲稿共66页9、渐进有效性、渐进有效性如果一个估计量满足:如果一个估计量满足:(1)是一致估计量;()是一致估计量;(2)比其)比其它的估计量更小的渐进方差。它的估计量更小的渐进方差。注:在实践中广泛应用的准则:注:在实践中广泛应用的准则:(1)小样本准则)小样本准则 a、无偏性;、无偏性;b、有效性。、有效性。(2)大样本准则)大样本准则 一致估计量。一致估计量。渐进方差定义:渐进方差定义:第29页,本讲稿共66页例例:设(设(x1,x2,,xn)是来自具有有限数学期望的任)是来自具有有限数学期望的任一总体一总体X的一个样本,记的一个样本,记E(X)=a,证
21、明:证明:是是a的无偏估计。的无偏估计。第30页,本讲稿共66页第31页,本讲稿共66页 4.4 区间估计区间估计1、置信区间、置信区间若总体分布含有一个未知参数若总体分布含有一个未知参数,找出了,找出了2个依赖于样本个依赖于样本X1,X2,,Xn的估计量:的估计量:使使其中,其中,0 1,一般取一般取0.05 或或 0.01,则称随机区间则称随机区间 为为 的的100(1-)%的置信区间的置信区间.百分数百分数 100(1-)%称为置信称为置信度度.2、总体均值的置信区间(总体方差已知)、总体均值的置信区间(总体方差已知)设:总体设:总体 X 服从已知服从已知N(,2),),2已知,抽取已知
22、,抽取n 个个观观第32页,本讲稿共66页测值测值x1,x2,xn,求总体均值,求总体均值 的的100(1-)%(如(如=95%)的置信区间。)的置信区间。首先构造:首先构造:因为因为X 服从服从N(,2/n)分布,所以)分布,所以 Z 服从服从N(0,1)分布。)分布。由:由:得置信区间:得置信区间:第33页,本讲稿共66页Z/2Z1-/21-/2/2例:设:总体设:总体 X 服从已知服从已知N(,0.09),抽取),抽取4 个观测个观测值值x1,x2,x3,x4,求总体均值,求总体均值 的的95%的置信区间。的置信区间。解解:由已知由已知:1-=0.95,=0.3,n=4 根据根据:第34
23、页,本讲稿共66页得到得到:查表得查表得 z 0.025=1.96,于是置信区间为于是置信区间为(X-0.294,X+0.294),置信度为置信度为 95%.也就是说也就是说:总体均值总体均值 以以 95%的概率在该的概率在该区间内区间内.第35页,本讲稿共66页3、总体均值的置信区间(总体方差未知、总体均值的置信区间(总体方差未知)设:总体设:总体 X 服从已知服从已知N(,2),),2未知,抽取未知,抽取n 个个观测值观测值x1,x2,xn,求总体均值,求总体均值 的的100(1-)%=95%的置信区间。的置信区间。首先构造:首先构造:可得置信区间:可得置信区间:第36页,本讲稿共66页由
24、:将将n 个观测值个观测值x1,x2,xn代入上式得到置信区间。代入上式得到置信区间。4、总体方差的置信区间(未知总体均值)、总体方差的置信区间(未知总体均值)设:总体设:总体 X 服从已知服从已知N(,2),),未知,抽取未知,抽取n 个观个观测值测值x1,x2,xn,求总体,求总体方差方差 2 的的100(1-)%=95%的的置信区间。置信区间。首先构造:首先构造:第37页,本讲稿共66页得到置信区间:得到置信区间:由:将将n 个观测值个观测值x1,x2,xn代入上式得到置信区间。代入上式得到置信区间。5、总体比例的置信区间、总体比例的置信区间Let p denote the observ
25、ed proportion of“successes”in a random sample of n observations from a population with a proportion of successes.Then,if n is large enough that(n)()(1-)9,then a 100(1-)%confidence interval for the population proportionconfidence interval for the population proportion is given by第38页,本讲稿共66页or equiva
26、lently,where the margin of errormargin of error,the sampling error,or bound,B,is given byand Z/2,is the number for which a standard normal variable Z satisfies第39页,本讲稿共66页总体方差的区间估计总体方差的区间估计(例题分析例题分析)【例例例例】一一家家食食品品生生产产企企业业以以生生产产袋袋装装食食品品为为主主,现现从从某某天天生生产产的的一一批批食食品品中中随随机机抽抽取取了了2525袋袋,测测得得每每袋袋重重量量如如下下表表7
27、 7所所示示。已已知知产产品品重重量量的的分分布布服服从从正正态态分分布布。以以95%95%的的置置信信水水平平建建立立该该种种食食品品重量方差的置信区间重量方差的置信区间 25袋食品的重量 112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3第40页,本讲稿共66页总体方差的区间估计总体方差的区间估计(例题分析例题分析)解解解解:已知已知n n2525,1-1-95%,95%,根据样本数据计算得根据样本数据
28、计算得s s2 2=93.21=93.21 2 2置信度为置信度为95%95%的置信区间为的置信区间为 该企业生产的食品总体重量标准差的的置信区该企业生产的食品总体重量标准差的的置信区间为间为7.547.54克克13.4313.43克克第41页,本讲稿共66页总体均值的区间估计总体均值的区间估计(例题分析例题分析)【例例例例】已已知知某某种种灯灯泡泡的的寿寿命命服服从从正正态态分分布布,现现从从一一批批灯灯泡泡中中随随机机抽抽取取1616只只,测测得得其其使使用用寿寿命命(小小时时)如如下下。建建立立该该批批灯灯泡泡平均使用寿命平均使用寿命95%95%的置信区间的置信区间16灯泡使用寿命的数据
29、 1510152014801500145014801510152014801490153015101460146014701470第42页,本讲稿共66页总体均值的区间估计总体均值的区间估计(例题分析例题分析)解解解解:已已知知 N N(,2 2),n n=16,=16,1-1-=95%95%,t t/2/2=2.131=2.131。根据样本数据计算得:根据样本数据计算得:,总体均值总体均值 在在1-1-置信水平下的置信区间为置信水平下的置信区间为该该 种种 灯灯 泡泡 平平 均均 使使 用用 寿寿 命命 的的 置置 信信 区区 间间 为为1476.81476.8小小 时时 1503.2150
30、3.2小时小时第43页,本讲稿共66页对比总体参数和样本统计量 区间估计区间估计 总体参数总体参数值很可能落在区间估计所包括的数值范围内值很可能落在区间估计所包括的数值范围内;使我们知道被估计值可能产生多大的误差边际使我们知道被估计值可能产生多大的误差边际;给出估计的信赖程度(或置信度)给出估计的信赖程度(或置信度)。第44页,本讲稿共66页对比总体参数和样本统计量 定义定义定义定义与区间估计相联系的信赖程度,常常用与区间估计相联系的信赖程度,常常用(1 )100%来表示。来表示。置信水平置信水平 置信区间置信区间 指某一指定置信水平下的区间估计,该区指某一指定置信水平下的区间估计,该区间包括
31、了总体参数的真值。间包括了总体参数的真值。置信水平高置信水平高 置信区间就宽置信区间就宽 第45页,本讲稿共66页对比总体参数和样本统计量 置信区间就宽置信区间就宽 样本统计量样本统计量(点估计点估计)置信界限置信界限(下限下限)置信界限置信界限(上限上限)第46页,本讲稿共66页对比总体参数和样本统计量 x /2 区间的较大数值区间的较大数值在100(1-)%水平下,区间包含;在100%水平下,区间不包含;=1-/2x_x_第47页,本讲稿共66页对比总体参数和样本统计量 解释解释 95%的置信区间表达了什么含义的置信区间表达了什么含义95%的置信水平意味着:如果从总体中随机抽取容量为的置信
32、水平意味着:如果从总体中随机抽取容量为n的所有可能样本,并相应计算这些样本的置信区间,的所有可能样本,并相应计算这些样本的置信区间,则在计算之后有则在计算之后有 95%的区间将包括总体参数的真值。的区间将包括总体参数的真值。第48页,本讲稿共66页总体均值的置信区间-已知 (1)无论样本容量为多少,原有总体服从正态分布无论样本容量为多少,原有总体服从正态分布;或者或者(2)原有总体不服从正态分布,但样本容量原有总体不服从正态分布,但样本容量 n 30。服从均值服从均值 =、标准差为、标准差为 的正态分布的正态分布而且而且第49页,本讲稿共66页总体均值的置信区间-已知(1 )100%水平下的置
33、信区间水平下的置信区间 即即,因此因此,第50页,本讲稿共66页总体均值的置信区间-已知 举例举例举例举例 :根据以前获得的经验,我们知道某台机器在生产训练用的钢根据以前获得的经验,我们知道某台机器在生产训练用的钢管时,其直径的标准差为管时,其直径的标准差为0.135厘米。如果从中抽取厘米。如果从中抽取30根管子根管子作为一个简单随机样本,则这些管子的平均直径为作为一个简单随机样本,则这些管子的平均直径为3.6厘米。厘米。请问在请问在95%的置信水平下,这些管子的平均直径的置信区间的置信水平下,这些管子的平均直径的置信区间是多少?是多少?n=30,=0.135cm,=3.6cm根据根据中心极限
34、定理中心极限定理,近似服从正态分布近似服从正态分布 第51页,本讲稿共66页总体均值的置信区间-已知 在在 95%水平下的置信区间是水平下的置信区间是 而且而且=3.6 1.96 0.02465=(3.55,3.65)在在95%的的 置信水平下,由这台机器生产的训练用管子,置信水平下,由这台机器生产的训练用管子,其平均直径应当在其平均直径应当在3.55厘米至厘米至3.65厘米范围之内。厘米范围之内。第52页,本讲稿共66页如果总体的如果总体的 未知,则未知,则 的抽样分布服从自由度为的抽样分布服从自由度为 n 1的的 t 分布分布,即,即 如果样本容量足够大,我们可以用正态分布而不是如果样本容
35、量足够大,我们可以用正态分布而不是t 分布分布。总体均值的置信区间 未知 第53页,本讲稿共66页总体均值的置信区间 未知 如果是大样本如果是大样本(n 30),则,则 在在(1 )100%水平下,水平下,的置信区间是的置信区间是 如果是小样本如果是小样本(n 30)并且原有总体近似服从正态分布并且原有总体近似服从正态分布,则,则 在在(1 )100%水平下,水平下,的置信区间是的置信区间是 第54页,本讲稿共66页总体均值的置信区间 未知 一家邮购公司在圣诞节前的一周内会接听大量的订购电话。一家邮购公司在圣诞节前的一周内会接听大量的订购电话。过去经验表明,由于工作人员每天可能要接听几千个电话
36、,过去经验表明,由于工作人员每天可能要接听几千个电话,因此为了及时处理打入的电话数量,有必要增加销售人员人因此为了及时处理打入的电话数量,有必要增加销售人员人数。为此,这家公司记录了数。为此,这家公司记录了75%的员工在每的员工在每8小时之内接听小时之内接听电话的数量,结果发现他们平均要接听电话的数量,结果发现他们平均要接听89.6个电话,而且标个电话,而且标准差为准差为17.32。请问在。请问在90%的置信水平下,被接听电话的平的置信水平下,被接听电话的平均数量的置信区间是多少?均数量的置信区间是多少?举例举例举例举例:第55页,本讲稿共66页总体均值的置信区间 未知 s=17.32,n=7
37、5(大样本大样本)的抽样分布近似服从以下参数的正态分布的抽样分布近似服从以下参数的正态分布 在在 90%水平下,水平下,的置信区间的置信区间 而且而且=89.6 1.645 2=(86.31,92.89)第56页,本讲稿共66页总体均值的置信区间 未知 举例举例举例举例:一家会计公司想要设立一项时间标准,以便其工作人员能及一家会计公司想要设立一项时间标准,以便其工作人员能及时完成某类审计工作。它抽取了时完成某类审计工作。它抽取了18名初级审计员作为一个样名初级审计员作为一个样本并记录了他们的审计时间,结果发现这些人员的平均审计本并记录了他们的审计时间,结果发现这些人员的平均审计时间为时间为3.
38、2个小时,标准差为个小时,标准差为1.6个小时。请问在个小时。请问在95%的置信水的置信水平下,当完成某类审计工作时其平均审计时间的置信区间是平下,当完成某类审计工作时其平均审计时间的置信区间是多少?多少?第57页,本讲稿共66页总体均值的置信区间 未知 s=1.6,n=18(小样本小样本)的抽样分布服从自由度为的抽样分布服从自由度为17的的t 分布分布 在在 95%水平下,水平下,的置信区间的置信区间 而且而且=3.2 2.11 0.377=(2.404,3.996)第58页,本讲稿共66页总体均值的置信区间-样本容量 在在(1 )100%水平下,水平下,的置信区间是的置信区间是 置信区间的
39、中点置信区间的中点:误差边际误差边际 :误差边际误差边际 是指:在是指:在(1 )100%水平下的最大容忍抽水平下的最大容忍抽样误差样误差 。第59页,本讲稿共66页总体均值的置信区间-样本容量 举例举例举例举例:继续前面审计时间的例子,我们从过去经验知道,初级审继续前面审计时间的例子,我们从过去经验知道,初级审计员在完成某类审计工作时,其审计时间的标准差为计员在完成某类审计工作时,其审计时间的标准差为1.5个个小时,如果在小时,如果在95%的置信水平下,我们可以将总体的实际的置信水平下,我们可以将总体的实际平均审计时间控制在平均审计时间控制在0.5个小时之内,那么需要获得多大的个小时之内,那
40、么需要获得多大的样本容量?样本容量?第60页,本讲稿共66页总体比例的置信区间 近似服从近似服从 =p、标准差标准差=的正态分布的正态分布而且而且在在(1 )100%置信水平下置信水平下 第61页,本讲稿共66页总体比例的置信区间 举例举例举例举例:一项公共民意调查从新加坡不同的居民区随机抽取了一项公共民意调查从新加坡不同的居民区随机抽取了1406名名成年人,并要求他们回答这样一个问题:成年人,并要求他们回答这样一个问题:“你是否同意现有你是否同意现有的制度很难使妇女同时兼顾工作和家庭?的制度很难使妇女同时兼顾工作和家庭?”。310名被调查名被调查人员的回答是人员的回答是“非常同意非常同意”。
41、请确定在。请确定在95%置信水平下,回置信水平下,回答答“非常同意非常同意”的人其总体比例的置信区间是多少?的人其总体比例的置信区间是多少?第62页,本讲稿共66页总体比例的置信区间 n=1406,的抽样分布可以近似用的抽样分布可以近似用 正态分布来表示正态分布来表示,而且,而且在在 95%水平下,水平下,的置信区间的置信区间 而且而且=0.22 1.96 0.011=(0.1983,0.2417)第63页,本讲稿共66页总体比例的置信区间 在在(1 )100%水平下水平下,置信区间,置信区间 区间的中点区间的中点:误差边际误差边际 :误差边际误差边际 是指:在是指:在(1 )100%水平下的最大容忍抽水平下的最大容忍抽样误差样误差 。第64页,本讲稿共66页总体比例的置信区间 举例举例举例举例:继续前面公共民意调查的例子,为了在继续前面公共民意调查的例子,为了在95%的置信水平下,的置信水平下,将将“非常同意非常同意”的估计比例控制在总体真实比例的的估计比例控制在总体真实比例的3个百个百分点之内,我们最少需要获得多大的样本容量?分点之内,我们最少需要获得多大的样本容量?第65页,本讲稿共66页总体比例的置信区间 由于应当保守估计总体比例由于应当保守估计总体比例p,因此我们假设,因此我们假设p=0.5注意注意:样本容量应当取整数。样本容量应当取整数。第66页,本讲稿共66页
限制150内