第四章 统计推断估计与假设检验.ppt
《第四章 统计推断估计与假设检验.ppt》由会员分享,可在线阅读,更多相关《第四章 统计推断估计与假设检验.ppt(71页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第4章章 统计推断:估计与假设检验统计推断:估计与假设检验4.1 统计推断的含义统计推断的含义4.2 点估计及估计量的特征点估计及估计量的特征4.4 区间估计方法区间估计方法4.5 假设检验假设检验4.1 统计推断的含义统计推断的含义p统计推断研究的是总体与来自总体的样本之间的关系,统计推断研究的是总体与来自总体的样本之间的关系,根据来自总体的样本对总体的种种特征做出判断。根据来自总体的样本对总体的种种特征做出判断。p参数估计和假设检验参数估计和假设检验是统计推断的两个孪生分支是统计推断的两个孪生分支p参数估计问题包括参数估计问题包括点估计点估计(point estimation)和)和区间
2、估区间估计(计(interval estimation).p假设检验包括假设检验包括置信区间法置信区间法和和显著性检验显著性检验4.2 点估计及估计量的特征点估计及估计量的特征一、点估计的含义一、点估计的含义 所谓点估计就是给出被估计参数的一个特定的估计值。所谓点估计就是给出被估计参数的一个特定的估计值。例如随机变量例如随机变量X X服从某一未知均值和方差的正态分布,若服从某一未知均值和方差的正态分布,若有来自该正态总体的一随机样本,则这些样本数据的平有来自该正态总体的一随机样本,则这些样本数据的平均值就为总体的均值均值就为总体的均值u ux x的点的点估计值,估计值,为点估为点估计量。计量。
3、4.2 点估计及估计量的特征点估计及估计量的特征一、点估计的含义一、点估计的含义p点估计量是一个随机变量,因为其值随样本的不同而不点估计量是一个随机变量,因为其值随样本的不同而不同。同。p常用的点估计方法有三种:常用的点估计方法有三种:矩法、最大似然法、最小二矩法、最大似然法、最小二乘法。乘法。p对同一样本根据三种方法估计同一参数,所获得的估计对同一样本根据三种方法估计同一参数,所获得的估计结果可能互不相同。然而由于各种建立原则的合理性,结果可能互不相同。然而由于各种建立原则的合理性,所以三种方法在研究中都经常使用。所以三种方法在研究中都经常使用。二、点估计方法二、点估计方法(1)矩法)矩法p
4、矩法是求估计量最古老的方法。具体作法是:矩法是求估计量最古老的方法。具体作法是:以一样以一样本矩作为相应总体矩的估计量;本矩作为相应总体矩的估计量;以样本矩的函数作为以样本矩的函数作为相应的总体矩同样函数的估计量。相应的总体矩同样函数的估计量。p这种方法最常见的应用是用样本平均数这种方法最常见的应用是用样本平均数 估计总体数估计总体数学期望,用样本方差学期望,用样本方差S2估计总体的方差。估计总体的方差。p矩法比较直观,求估计量时有时也比较直接,但它求矩法比较直观,求估计量时有时也比较直接,但它求出的估计量往往不够理想。出的估计量往往不够理想。矩法点估计的例题矩法点估计的例题 例例4-1 某灯
5、泡厂某天生产了一大批灯泡,从中抽取了某灯泡厂某天生产了一大批灯泡,从中抽取了10个进行寿命试验,获得数据如下(单位:小时),问该个进行寿命试验,获得数据如下(单位:小时),问该天生产的灯泡的平均寿命是多少?天生产的灯泡的平均寿命是多少?(2)最大似然法)最大似然法(Maximum Likelihood Estimation)a、一个重要的事实、一个重要的事实p 不同的总体会产生不同的样本,对于某一特定的样本,不同的总体会产生不同的样本,对于某一特定的样本,在不了解产生它的总体究竟为何物的观察者眼中,在不了解产生它的总体究竟为何物的观察者眼中,它来它来自一些总体的可能性要比来自另一些总体的可能性
6、大自一些总体的可能性要比来自另一些总体的可能性大,即一些总体更容易产生出我们所观察到的样本。即一些总体更容易产生出我们所观察到的样本。p举例说假定我们抽取到(举例说假定我们抽取到(x1,x2,x8),知道它来自正态),知道它来自正态总体,且总体的方差是了解的,但是总体的均值未知。总体,且总体的方差是了解的,但是总体的均值未知。如下图所示。如下图所示。二、点估计方法二、点估计方法 假定样本不是来自假定样本不是来自B就是来自就是来自A。如果样本来自如果样本来自B,观察观察到它的可能性非常小;真正的母体若是到它的可能性非常小;真正的母体若是A,得到样本的得到样本的可能性很大。显然我们宁愿承认样本来自
7、可能性很大。显然我们宁愿承认样本来自A。是样本是样本“替替”我们我们“选择选择”了了A。x6 x2 x3 x4 x5 x6 x7 x8 分布B分布A概率xb、最大似然法的概念最大似然法的概念p上述事实诱导我们宁愿作出这样的抉择:上述事实诱导我们宁愿作出这样的抉择:将样本最容易来自将样本最容易来自的总体当作产生样本的总体。的总体当作产生样本的总体。p现在要根据从总体现在要根据从总体 中抽取得到的样本中抽取得到的样本(x1,xn)对总体中的对总体中的未知数未知数 进行估计。最大似然法是选择这样的估计量进行估计。最大似然法是选择这样的估计量 作为作为 的估计值,以便使观察结果的估计值,以便使观察结果
8、(x1,xn)出现的可能性(概率)出现的可能性(概率)最大。最大。p对于离散型变量,就是要选择对于离散型变量,就是要选择 使使p(x1)p(x2)p(xn)最大。最大。(连乘(连乘表示一次独立地抽取各个样本观察值)表示一次独立地抽取各个样本观察值)p对于连续型变量,就是要选择对于连续型变量,就是要选择 使使(x1)(x2).(xn)最大。注最大。注意意(xi)是随机变量在是随机变量在xi附近取值的概率,相当于离散型的附近取值的概率,相当于离散型的p(xi)。c、似然法函数似然法函数 d、最大似然法的定义和估计方法最大似然法的定义和估计方法 定义定义 如果如果L(x1,x2,,xn;)在在 处达
9、到最大值,则称处达到最大值,则称 是是的最大似然估计。的最大似然估计。为了取得为了取得 的最大似然估计,必须使似然函数的最大似然估计,必须使似然函数L达到最达到最大值。由于对数函数是单增的,大值。由于对数函数是单增的,L达到最大亦即达到最大亦即LnL达到最达到最大。这样使大。这样使LnL达到最大来估计达到最大来估计 为计算带来了许多方便。为计算带来了许多方便。根据拉格朗日定理,对未知参数求条件极值,令根据拉格朗日定理,对未知参数求条件极值,令LnL对对 的一阶导数等于的一阶导数等于0,即,即dLnL/d =0=得到似然方程,得到似然方程,所求的所求的 就是似然方程中就是似然方程中 的解。的解。
10、注意:注意:当不只一个参数需要估计时,应将当不只一个参数需要估计时,应将LnL分别对不分别对不同参数求偏导,然后解似然方程组同参数求偏导,然后解似然方程组最大似然估计法对方差的估计往往是有偏估计最大似然估计法对方差的估计往往是有偏估计量,以后对线性模型估计时也是如此。量,以后对线性模型估计时也是如此。(3)最小二乘法)最小二乘法(Least Square Estimation Method)p最小二乘法是计量经济学中应用最广泛的一种估计方最小二乘法是计量经济学中应用最广泛的一种估计方法。法。p这是本课程研究的重点问题,在以后各章中将详尽地这是本课程研究的重点问题,在以后各章中将详尽地阐述它的原
11、理、步骤、特性和优越处。阐述它的原理、步骤、特性和优越处。二、点估计方法二、点估计方法三三 点估计量的特征点估计量的特征p所谓估计量的特性指的是衡量一个统计量用以所谓估计量的特性指的是衡量一个统计量用以估计总体参数的好坏标准。估计总体参数的好坏标准。p 点估计量的一些统计性质点估计量的一些统计性质(1)线性;()线性;(2)无偏性;()无偏性;(3)有效性;)有效性;(4)最优线性无偏估计量()最优线性无偏估计量(BLUE););(5)一致性)一致性(1)线性)线性p若若估计量是样本观察值的线性函数,则称该估计量是估计量是样本观察值的线性函数,则称该估计量是线性估计量线性估计量p样本均值是一个
12、线性估计量样本均值是一个线性估计量(2)无偏性)无偏性无偏性的直观意义无偏性的直观意义 根据样本推得的估计值和真值可能不同,然而如果根据样本推得的估计值和真值可能不同,然而如果有一系列抽样依据同一估计方法就可以得到一系列估有一系列抽样依据同一估计方法就可以得到一系列估计值,很自然会要求这些估计的期望值与未知参数的计值,很自然会要求这些估计的期望值与未知参数的真值相等。这就是无偏性的概念,无偏性的直观意义真值相等。这就是无偏性的概念,无偏性的直观意义是:是:样本估计量的数值在真值周围摆动,样本估计量的数值在真值周围摆动,即无系统误即无系统误差。差。无偏性的定义无偏性的定义 的真值的真值 的真值的
13、真值有偏有偏无偏无偏例例4-3 w无偏性是估计量最重要的优良性,是一个重复抽样的无偏性是估计量最重要的优良性,是一个重复抽样的性质,它只能保证性质,它只能保证估计量的期望等于真值估计量的期望等于真值。而且,对。而且,对于总体某个待定参数,其于总体某个待定参数,其无偏估计量不只一个无偏估计量不只一个。例如。例如样本中位数也是真实均值的无偏估计量。样本中位数也是真实均值的无偏估计量。(3)有效性)有效性 总体某个参数总体某个参数 的无偏估计量往往不只一个,而且无的无偏估计量往往不只一个,而且无偏性仅仅表明偏性仅仅表明 的所有可能的取值按概率平均等于的所有可能的取值按概率平均等于,它,它的可能取值可
14、能大部分与的可能取值可能大部分与 相差很大。为保证相差很大。为保证 的取值能的取值能集中于集中于 附近,必须要求附近,必须要求 的的方差越小越好方差越小越好。所以,提出。所以,提出有效性标准。有效性标准。有效性的定义有效性的定义 例例4-4 比较总体均值两个无偏估计的有效性比较总体均值两个无偏估计的有效性 无偏有效估计量的意义无偏有效估计量的意义(1)一个无偏有效估计量的取值在可能范围内最密集于一个无偏有效估计量的取值在可能范围内最密集于 附近附近。换言之,。换言之,它以最大的概率保证估计量的取值在真它以最大的概率保证估计量的取值在真值值 附近摆动。附近摆动。(2)可以证明,)可以证明,样本均
15、值是总体数学期望的有效估计量样本均值是总体数学期望的有效估计量。(4)最优线性无偏估计量)最优线性无偏估计量 如果一个估计量是线性的和无偏的,并且在参数如果一个估计量是线性的和无偏的,并且在参数的所有线性无偏估计量中,这个估计量的方差最小,的所有线性无偏估计量中,这个估计量的方差最小,则称这个估计量是则称这个估计量是最优线性无偏估计量最优线性无偏估计量(best linear unbiased extimator,BLUE)。)。(5)一致性)一致性“依概率收敛依概率收敛”的定义的定义若存在常数若存在常数a,使对于任何,使对于任何0,有,有则称随机变量序列则称随机变量序列n依概率收敛于依概率收
16、敛于a.一致性一致性 一致性既是从概率又是从极限性质来定义的,因此只一致性既是从概率又是从极限性质来定义的,因此只有样本容量较大时才起作用有样本容量较大时才起作用。p一致性作为评价估计量好坏的一个标准,计量经济学家一致性作为评价估计量好坏的一个标准,计量经济学家在无偏性和一致性之间更偏重选择一致性。在无偏性和一致性之间更偏重选择一致性。p虽然一个一致估计量可能在平均意义上与真值不同,但虽然一个一致估计量可能在平均意义上与真值不同,但是当样本容量加大时,它会变得与真值十分接近,即有是当样本容量加大时,它会变得与真值十分接近,即有偏的一致估计量具有大样本下的无偏性。同时,根据大偏的一致估计量具有大
17、样本下的无偏性。同时,根据大数定律,当数定律,当n增大时,方差会变得很小,增大时,方差会变得很小,所以一致估计所以一致估计量具有大样本下的量具有大样本下的“无偏性无偏性”和和“有效性有效性”。4.3 区间估计区间估计p区间估计就是以一定的可靠性给出被估计参数的一个可能的取区间估计就是以一定的可靠性给出被估计参数的一个可能的取值范围。值范围。p一般的,假定随机变量一般的,假定随机变量X服从某一概率分布,若要对其参数进服从某一概率分布,若要对其参数进行估计,选取容量为行估计,选取容量为n的随机样本,找出两个统计量的随机样本,找出两个统计量 1(x1,xn)与与 2(x1,xn),使,使P(1 2)
18、=1-其中其中(1,2)称为置信区间,称为置信区间,1-称为置信系数(置信度称为置信系数(置信度),),称为显著性水平称为显著性水平或犯第一类错误的概率或犯第一类错误的概率,一般取一般取5%或或1%。如。如果建立一个置信系数为果建立一个置信系数为95%的置信区间,那么重复建立这样的置信区间,那么重复建立这样的区间的区间100次,预期有次,预期有95次包括了真实的次包括了真实的ux。对区间估计的形象比喻对区间估计的形象比喻w我们经常说某甲的成绩我们经常说某甲的成绩“大概大概80分左右分左右”,可以看成一,可以看成一个区间估计问题。(某甲的成绩个区间估计问题。(某甲的成绩 为被估计的参数)为被估计
19、的参数)P(1 2)=大概的准确程度(大概的准确程度(1-)如:如:P(75 85)=95%=1-5%“大概大概80分左右分左右”冒险率冒险率(假设检验中叫(假设检验中叫显著水平)显著水平)下限下限上限上限例例4-5 如果随机变量如果随机变量XN(2),若要根据样本估计总体均值,若要根据样本估计总体均值,且方差未知,则总体均值且方差未知,则总体均值95的置信区间可由下式求得的置信区间可由下式求得(样本容量为(样本容量为50)即即ux的的95的置信区间为的置信区间为10.63 ux 12.36 该置信区间是随机的,它依赖于样本的取值,但总体均值该置信区间是随机的,它依赖于样本的取值,但总体均值取
20、某一固定值,是非随机的,所有不能说取某一固定值,是非随机的,所有不能说ux位于区间的概位于区间的概率是率是0.95,只能说这个区间包括真实只能说这个区间包括真实ux的的概率是概率是0.95.2.5%95%2.5%0-2.00962.0096t分布分布(d.f.=49)一、对总体期望值的估计一、对总体期望值的估计(1)已知方差,对总体数学期望)已知方差,对总体数学期望E=进行区间估计进行区间估计(正态总体)(正态总体)/2/21-假设总体服从正态分布假设总体服从正态分布N(,8),求求 的的置信区间置信区间例例4-6 本节例本节例4-1中再假设总体服从正态分布,总体方差中再假设总体服从正态分布,
21、总体方差为为8,求电子管寿命的置信区间(,求电子管寿命的置信区间(=5%)。)。(2)方差未知,对数学期望)方差未知,对数学期望E 进行区间估计进行区间估计w大样本下大样本下 根据中心极限定理,根据中心极限定理,V 可以用可以用S2代替,所以仍按已知代替,所以仍按已知方差正态分布的方法进行方差正态分布的方法进行 的置信区间估计。的置信区间估计。w小样本下小样本下例例4-7 新生儿体重的置信区间新生儿体重的置信区间 假设新生儿(男)的体重服从正态分布。随机抽取假设新生儿(男)的体重服从正态分布。随机抽取12名新生儿,测得体重如下表,试以名新生儿,测得体重如下表,试以95%的置信度估计的置信度估计
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第四章 统计推断估计与假设检验 第四 统计 推断 估计 假设检验
限制150内