第5章-区间估计及假设检验.ppt





《第5章-区间估计及假设检验.ppt》由会员分享,可在线阅读,更多相关《第5章-区间估计及假设检验.ppt(48页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第第5 5章章 区间估计与假设检验区间估计与假设检验(IntervalEstimationandHypothesisTesting)5.1 5.1 统计学的预备知识统计学的预备知识 自己复习自己复习5.2 5.2 区间估计:一些基本概念区间估计:一些基本概念第三章给出了边际消费倾向(MPC)的估计值为0.5091。我们也知道,但是,由于抽样的波动性,单个估计值可能并不等于真值。因此,我们不能完全依赖一个点估计值,而是要围绕点估计量构造出一个区间,使这一区间在一定的概率保证之下包含真实的参数值(真值),这就是区间估计。我们的任务就是求出两个正数 和 ,使得随机区间(randominterval)
2、包含 的概率为 :(5.2.1)这样的区间称为置信区间(confidenceinterval);称为置信系数(confidencecoefficient);而 称为显著性水平(levelofsignificance)。置信区间的端点称置信限(confidencelimits)也称临界值(criticalvalues)。为置信下限(lowerconfidencelimit)为置信上限(upperconfidencelimit)(5.2.1)式表示的是:随机区间包含真实的概率为 。区间估计量给出了一个真实 会落入其中的数值范围。点估计与区间估计:单一的点估计量可能不同于总体真值,即存在估计误差。点
3、估计既不能给出误差范围的大小,也没有给出估计的可靠程度。区间估计则可以显示 和 是怎样的接近总体真值 和 ,以及这种接近的可靠性。5.3 5.3 回归系数回归系数 和和 的置信区间的置信区间一、的置信区间OLS估计量 和 服从正态分布,因此,若令 (5.3.1)则,Z为一个标准化正态变量,。如果总体方差已知,就可以用正态分布对作出概率上的表述。在正态曲线下,之间的面积为68.26%之间的面积为95%之间的面积为95.45%之间的面积为99.73%从而 的区间估计就容易了。选定 为95%,则 但是,在许多实际问题中,总体方差 都是未知的,只能用其无偏估计量 来替代。(5.3.1)式便为:(5.3
4、.2)为估计量 的标准误的估计值(estimatedstandarderror)。这里定义的t变量服从自由度为n-2的t分布 证明:令 (1)(2)如果 已知,(1)式就是对 进行标准化,所以Z1服从标准正态分布,。Z2服从(n-2)个自由度的 分布(证明参见有关的数理统计教程),而且,可以证明Z2的分布独立于Z1。运用P160定理5.5(附录),变量 服从自由度为n-2的t 分布。把(1)式和(2)式代入上式,即可得到(5.3.2)式。用t分布构造的 的置信区间为:(5.3.3)上式中t 值由(5.3.2)式给出。为 显著水平上的临界值,查表;显著水平 ,自由度n-2可得 的值。于是有:(5
5、.3.4)整理得:(5.3.5)即 的 水平的置信区间为:例子:P123两个游戏:掷硬币 套圈请问:区间估计更象哪一个?置信区间的两个特点:位置的随机性 长度的随机性二、的置信区间:利用和进行类似的推导,可得:(5.3.7)也就是说,的水平的置信区间为:(5.3.8)在区间估计中,置信区间的宽度与估计量的标准误或成正比例。这说明,标准误越大,置信区间越宽,对总体真值进行估计的接近程度越差。因此,估计量的标准误被看作是估计量的精度(precision),它反映了估计量的精确程度。5.4 5.4 的置信区间的置信区间 在正态性假定下,变量:(5.4.1)服从自由度为n-2的 分布。因此,可以用 分
6、布构造 的置信区间:(5.4.2)其中的 值由(5.4.1)式给出,和 可以查表得到,自由度为n-2,见P125Figure 5.1。把(5.4.1)式中的 代入(5.4.2)式整理得:(5.4.3)该式给出了的置信系数为的置信区间。5.5 假设检验(假设检验(Hypothesis Testing):):概述概述参数估计与假设检验都是在样本分布基础上作出概率性判断,两者既有联系又有区别,但其基本原理则是一致的。参数的区间估计主要解答某一总体参数真值落在什么区间内的问题;而假设检验就是要对一个已知估计值或已得出的数据进行检验,判断它是否与某一个指定的假设(statedhypothesis)相容或
7、一致(compatible)。所谓相容或一致,是指某一已知估计值充分地接近其假设的数值,从而导致接受新指定的假设。用统计上的话说,这个指定的(声称的)假设叫做虚拟假设(nullhypothesis),或维持假设(maintainedhypothesis),用H0来表示。通俗地说,是一个靶子。另外,还需要一个备择假设(对立假设)(alternativehypothesis),用H1表示。H0和H1构成一个完备事件。备择假设可以是简单的(simple)或复合的(composite)。例如,是一个简单假设,而则是一个复合假设。进行统计假设检验,就是要制定一套步骤和规则,以使决定接受或拒绝一个虚拟假设
8、(原假设)。一般来说,有两种相互联系、相互补充的方式:置信区间(confidenceinterval)和显著性检验(testofsignificance)。5.6假设检验:置信区间的方法双侧或双尾检验(Two-sidedorTwo-TailTest)利用P88页Table3.2的数据,估计出MPC(边际消费倾向)是0.5091。可以造构如下的检验假设:在虚拟假设下,MPC是0.3,在对立假设下MPC大于或小于0.3。虚拟假设是一个简单假设,而对立假设则是一个复合假设;实际上就是我们所说的双侧假设(two-sidedhypothesis)。那么,我们估计的是否与上述相容?可以用置信区间来加以判断
9、。P123页的(5.3.9)式给出的置信区间:(0.4268,0.5914)。也就是说,从长远来看,像(0.4268,0.5914)这样的很多个区间将会有95%的概率包含真实的。因而,置信区间给出了可信的(plausible)虚拟假设的一个集合。如果虚拟假设的落入这个置信区间,我们就不拒绝虚拟假设;如果它落在区间之外,我们就可以拒绝虚拟假设。图5.2的一个置信区间在假设 下,落入此区间的 值有 的可信性。因此,若 果真落入此区域,就不拒绝决策规则:构造一个的置信区间。如果在假设H0下落入此区间,就不要拒绝H0。但如果它落在此区间之外,就要拒绝H0。在上例中,很明显地落在(0.4268,0.59
10、14)这个置信区间之外,因此我们能以95%的置信度拒绝MPC的真值是0.3的假设。在统计上,当虚拟假设被我们拒绝时,就称我们的发现是统计上显著的(statisticallysignificant)。反之,当我们不拒绝虚拟假设时,我们说,我们的发现不是统计上显著的。当选择的显著性水平又比较低,比如,从而置信系数比较高,如99%时,仍然达到了统计上是显著的,我们就称它是统计上高度显著(highlystatisticallysignificant)。单侧或单尾检验One-SidedorOne-TailTest当我们有着很强的理论支撑或者先验性预期时,可以把备择假设H1取为单侧的或单向的。如:和对于这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 区间 估计 假设检验

限制150内