第5章-区间估计及假设检验.ppt

上传人：得****1

文档编号：76428864

上传时间：2023-03-10

格式：PPT

页数：48

大小：807.50KB

( 4.5 )

《第5章-区间估计及假设检验.ppt》由会员分享，可在线阅读，更多相关《第5章-区间估计及假设检验.ppt（48页珍藏版）》请在淘文阁 - 分享文档赚钱的网站上搜索。

1、第第5 5章章区间估计与假设检验区间估计与假设检验（IntervalEstimationandHypothesisTesting）5.1 5.1 统计学的预备知识统计学的预备知识自己复习自己复习5.2 5.2 区间估计：一些基本概念区间估计：一些基本概念第三章给出了边际消费倾向（MPC）的估计值为0.5091。我们也知道，但是，由于抽样的波动性，单个估计值可能并不等于真值。因此，我们不能完全依赖一个点估计值，而是要围绕点估计量构造出一个区间，使这一区间在一定的概率保证之下包含真实的参数值（真值），这就是区间估计。我们的任务就是求出两个正数和，使得随机区间（randominterval）

2、包含的概率为：（5.2.1）这样的区间称为置信区间（confidenceinterval）；称为置信系数（confidencecoefficient）；而称为显著性水平（levelofsignificance）。置信区间的端点称置信限（confidencelimits）也称临界值（criticalvalues）。为置信下限（lowerconfidencelimit）为置信上限（upperconfidencelimit）（5.2.1）式表示的是：随机区间包含真实的概率为。区间估计量给出了一个真实会落入其中的数值范围。点估计与区间估计：单一的点估计量可能不同于总体真值，即存在估计误差。点

3、估计既不能给出误差范围的大小，也没有给出估计的可靠程度。区间估计则可以显示和是怎样的接近总体真值和，以及这种接近的可靠性。5.3 5.3 回归系数回归系数和和的置信区间的置信区间一、的置信区间OLS估计量和服从正态分布，因此，若令（5.3.1）则，Z为一个标准化正态变量，。如果总体方差已知，就可以用正态分布对作出概率上的表述。在正态曲线下，之间的面积为68.26%之间的面积为95%之间的面积为95.45%之间的面积为99.73%从而的区间估计就容易了。选定为95%，则但是，在许多实际问题中，总体方差都是未知的，只能用其无偏估计量来替代。（5.3.1）式便为：（5.3

4、.2）为估计量的标准误的估计值（estimatedstandarderror）。这里定义的t变量服从自由度为n-2的t分布证明：令（1）（2）如果已知，（1）式就是对进行标准化，所以Z1服从标准正态分布，。Z2服从（n-2）个自由度的分布（证明参见有关的数理统计教程），而且，可以证明Z2的分布独立于Z1。运用P160定理5.5(附录)，变量服从自由度为n-2的t 分布。把（1）式和（2）式代入上式，即可得到（5.3.2）式。用t分布构造的的置信区间为：（5.3.3）上式中t 值由（5.3.2）式给出。为显著水平上的临界值，查表；显著水平，自由度n-2可得的值。于是有：（5

5、.3.4）整理得：（5.3.5）即的水平的置信区间为：例子：P123两个游戏:掷硬币套圈请问:区间估计更象哪一个?置信区间的两个特点:位置的随机性长度的随机性二、的置信区间：利用和进行类似的推导，可得：（5.3.7）也就是说，的水平的置信区间为：（5.3.8）在区间估计中，置信区间的宽度与估计量的标准误或成正比例。这说明，标准误越大，置信区间越宽，对总体真值进行估计的接近程度越差。因此，估计量的标准误被看作是估计量的精度（precision），它反映了估计量的精确程度。5.4 5.4 的置信区间的置信区间在正态性假定下，变量：（5.4.1）服从自由度为n-2的分布。因此，可以用分

6、布构造的置信区间：（5.4.2）其中的值由（5.4.1）式给出，和可以查表得到，自由度为n-2，见P125Figure 5.1。把（5.4.1）式中的代入（5.4.2）式整理得：（5.4.3）该式给出了的置信系数为的置信区间。5.5 假设检验（假设检验（Hypothesis Testing）：）：概述概述参数估计与假设检验都是在样本分布基础上作出概率性判断，两者既有联系又有区别，但其基本原理则是一致的。参数的区间估计主要解答某一总体参数真值落在什么区间内的问题；而假设检验就是要对一个已知估计值或已得出的数据进行检验，判断它是否与某一个指定的假设（statedhypothesis）相容或

7、一致（compatible）。所谓相容或一致，是指某一已知估计值充分地接近其假设的数值，从而导致接受新指定的假设。用统计上的话说，这个指定的（声称的）假设叫做虚拟假设（nullhypothesis），或维持假设（maintainedhypothesis），用H0来表示。通俗地说，是一个靶子。另外，还需要一个备择假设（对立假设）（alternativehypothesis），用H1表示。H0和H1构成一个完备事件。备择假设可以是简单的（simple）或复合的（composite）。例如，是一个简单假设，而则是一个复合假设。进行统计假设检验，就是要制定一套步骤和规则，以使决定接受或拒绝一个虚拟假设

8、（原假设）。一般来说，有两种相互联系、相互补充的方式：置信区间（confidenceinterval）和显著性检验（testofsignificance）。5.6假设检验：置信区间的方法双侧或双尾检验（Two-sidedorTwo-TailTest）利用P88页Table3.2的数据，估计出MPC（边际消费倾向）是0.5091。可以造构如下的检验假设：在虚拟假设下，MPC是0.3，在对立假设下MPC大于或小于0.3。虚拟假设是一个简单假设，而对立假设则是一个复合假设；实际上就是我们所说的双侧假设（two-sidedhypothesis）。那么，我们估计的是否与上述相容？可以用置信区间来加以判断

9、。P123页的（5.3.9）式给出的置信区间：(0.4268，0.5914）。也就是说，从长远来看，像（0.4268，0.5914）这样的很多个区间将会有95%的概率包含真实的。因而，置信区间给出了可信的（plausible）虚拟假设的一个集合。如果虚拟假设的落入这个置信区间，我们就不拒绝虚拟假设；如果它落在区间之外，我们就可以拒绝虚拟假设。图5.2的一个置信区间在假设下，落入此区间的值有的可信性。因此，若果真落入此区域，就不拒绝决策规则：构造一个的置信区间。如果在假设H0下落入此区间，就不要拒绝H0。但如果它落在此区间之外，就要拒绝H0。在上例中，很明显地落在（0.4268，0.59

10、14）这个置信区间之外，因此我们能以95%的置信度拒绝MPC的真值是0.3的假设。在统计上，当虚拟假设被我们拒绝时，就称我们的发现是统计上显著的（statisticallysignificant）。反之，当我们不拒绝虚拟假设时，我们说，我们的发现不是统计上显著的。当选择的显著性水平又比较低，比如，从而置信系数比较高，如99%时，仍然达到了统计上是显著的，我们就称它是统计上高度显著（highlystatisticallysignificant）。单侧或单尾检验One-SidedorOne-TailTest当我们有着很强的理论支撑或者先验性预期时，可以把备择假设H1取为单侧的或单向的。如：和对于这

11、种单尾检验，最好的方法是显著性检验方法。5.7 假设检验：显著性检验法假设检验：显著性检验法检验回归系数的显著性：t检验显著性检验法（test-of-significance approach）是由R.A.Fisher（费希尔），Negman（尼曼）和Pearson（皮尔逊）合作发明的，它是利用样本结果，来证实一个虚拟假设的真伪的一种检验程序。t分布的来历:student显著性检验的关键在于构造出一个检验统计量（teststatistic）（作为估计量），在虚拟假设下这个统计量会服从一定的抽样分布（如t分布，F分布，正态分布，分布等）。构造出统计量以后，就可以利用样本数据计算出这个

12、统计量的样本值，再把这个样本值与给定某一显著水平的临界值进行比较，看它与临界值是否有显著差别，从而作出判断，决定拒绝还是接受所作的假设。在正态性假设下的变量：（5.3.2）服从自由度为n-2的t分布。在虚拟假设下的真值被设定，就可以利用样本数据算出（5.3.2）式，即这个t统计量是可以算出来的，从而可以作出如下的置信区间：（5.7.1）其中，是在H0下的值。和是从t分布表中查得的数据，为显著水平，n-2为自由度，这些值就是所谓的临界值。将（5.7.1）式整理得：（5.7.2）上式中建立的置信区间叫做虚拟假设的接受域（regionofacceptance），而置信区间以外的区域叫做H0的拒绝域（

13、region(s)ofrejection）或临界域（criticalregion(s)）。置信限，即置信区间的端点，又叫做临界值（criticalvalues）。在实践中，并不需要估计（5.7.2）式，而可利用（5.7.1）式计算t值，看它是落在两个t临界值之间还是落在它们之外。在上例中，有:（5.7.4）这个t值显然落在P131图5.4中的临界域内。结论和前面的一样：拒绝H。越大，它越是可能落在临界域内，因而，它越是与虚拟假设相左。这种利用t分布进行的检验叫 t 检验（ttest）。一个统计量是统计上显著的统计上显著的，如果这个统计量的值落在临界域上。这时我们将拒绝虚拟假设。同样地，一个检验

14、是统计上不显统计上不显著的著的，如果这个统计量的值落在接受域中。这时我们不拒绝虚拟假设。如果把两个尾端当作拒绝域，则虚拟假设值落入任一尾端，就拒绝该假设，这种检验程序是双侧或双尾显著性检验。这样做的虚拟假设 H0 必须是一个双侧的复合假设。如果先前的经验或理论告诉我们，MPC预期要比0.3大，我们就可以这样设定：和。这里H1虽然是一个复合假设，但它却是单侧的。这样的检验就是单尾检验（右尾部检验）。二、检验的显著性：检验考虑下面的变量：（5.4.1）遵循自由度为n-2的分布。在P88页的例子中，。如果假设：对。把数据代入（5.4.1）得：取的的两个临界值为2.1797和17.5346。落在两个

15、临界值的中间，我们不拒绝H0。这个检验叫做显著性检验。见P121，Table5.2。5.9 回归分析与方差分析回归分析与方差分析已经推导出下面的恒等式：（3.5.2）这就是：TSSESSRSS，总平方和TSS可以分解为两部分：解释平方和ESS和残差平方和RSS。对TSS的这些构成部分进行研究就叫做从回归的观点做方差分析（analysisofvariance，简记ANOVA）。方差分析的主要功能在于，分析和检验某种或多种因素（或自变量）的变化对试验结果（或因变量）的观测数据是否有显著的影响。每一个平方和都是和它的自由度数相联系的，亦即与它所依据的独立观测值的变量数目有关。就一元回归而言：（1）T

16、SS的自由度数为n-1，因为在计算的离差和时，失去了一个自由度；（2）ESS的自由度为1，因为对1个自变量回归来说，回归平方和具有1个自由度数；（3）RSS的自由度数为n-2，因为计算参数和而失去两个自由度。在数理统计中，可以证明TSS，ESS和RSS分别服从自由度为n-1，1和n-2的分布。把各项平方和及其相应的df引入表5.3，成为AOV表的标准型式，有时又称ANOVA表。看P127Table5.3MSS均方和SS平方和现在考虑以下变量：（5.9.1）如果假定干扰ui是正态分布的，且，就可以证明（5.9.1）的F满足定理4.6的条件，从而它服从自由度为1和n-2的F分布。证明：令，则。由定

17、理4.3，分布。再令，则。同时，Z1的分布独立于Z2的分布。由定理4.6得：服从自由度分别为1和的F分布。在：下，上述F比率简化为方程（5.9.1）式，#。）为了直观地说明方差比F的用途，列举两个有关的方程式如下：（5.9.2）(5.9.3)求证：（5.9.2）左边代入上式左边右边#容易看出，如果，则（5.9.2）式和（5.9.3）式对真实方差提供等同的估计量。在这种情况下，解释变量X对被解释变量Y毫无线性影响，Y的总变异就由随机扰动项作出解释。反之，如果，则上述两个方程将得出不同的结果，从而Y的变异中有一部分将归因于解释变量X。因此，方差比F是适宜作为检验原假设（虚拟假设）的统计量。判断虚拟

18、假设是否可信，需要有一个判断标准，这个标准就是与选定的显著水平和自由度，相对应的临界值如果由样本数据计算的，则拒绝，表示在显著性水平之下，该一元回归模型是统计上显著的；反之，如果，就接受，认为该模型并无显著意义。F检验与t检验：在原假设下，二者是密切联系的。在相同的显著性水平下，统计量F与t之间具有以下关系：t检验和F检验是检验的两个互为补充的备选方法。其实，在双变量模型中，F检验是多余的，二者的结论总是一致的。但是,在多元回归分析中，F检验与t检验各有不同的功用。F检验：模型的显著性；t检验：系数的显著性。实质：X的贡献是否显著地大于U的贡献5.10 回归分析的应用：预测问题回归分析的应用：

19、预测问题有两种预测：一一、均均值值预预测测：对应于给定的X，比如，预测Y的条件均值，或者说是预测总体归线本身上的点。比如时，给出了这一均值预测的点估计为：谁能预测未来谁能预测未来,谁就能发财致富。谁就能发财致富。中国的投资者和富人们十分关心的问题是：中国的投资者和富人们十分关心的问题是：中国长期增长的拐点在哪里？中国长期增长的拐点在哪里？-讨论讨论一般地，如果总体回归模型为根据样本数据可以求得样本回归模型为从而求出样本回归直线为经过t检验，如果是可以接受的，就可以运用上述样本回归直线估计式进行预测。给定，真实的均值的预测由下式给出：（1）我们用（2）来估计（1）式。给定，对（2）式取数学期望得

20、，因此，这说明，是的一个无偏误的预测元（unbiasedpredictor）。由于是一个估计式，它是由样本资料计算而得出的，所得出的预测估计值可能不同于真值。这就涉及到预测的精确度问题。就是说，由于抽样波动，预测估计值与真值之间存在差异，预测具有误差。为了评定这种误差，需要查明的抽样分布。，也是服从正态分布的，其均值为，方差为：把（3.3.1）式（3.3.3）式和（3.3.9）式代入上式，整理得：由于是不可知的，可以用无偏估计式代替，则为了得出的置信区间，对构造其t统计量（5.10.3）例子：P143如果对表3.3中的每一个X值，求类似于P143（5.10.5）的95%置信区间，把这些区间的端

21、点连结起来，我们就得到P144图5.6所展示的一个关于总体回归函数的置信带（域）（confidenceband）。二、个值预测二、个值预测如果我们的兴趣在于预测对应于给定X值（比如说X0）的单个Y值（Y0），也就是要得到：（5）我们把Y0预测为：（6）预测误差是：（7）因此，对（7）式两边平方再求期望，得：直观地看,个值预测和均值预测,哪个方差大?遵循自由度为n-2的t分布。个值的置信区间为：例：P131比较（5.10.7）和（5.10.5）可见，的置信区间要比的均值的置信区间要宽。P130Figure5.6中置信带（confidencebands）有一个重要特征：当时，带的宽度最小。为什么？这可以从方差公式中看出。这说明，当远离时，人们利用回归线进行“外推”来预测或时，必须保持高度警觉。5.11 5.11 报告回归结果报告回归结果见见P P131 131 （5.11.15.11.1）一个忠告一个忠告:不要把不要把EviewsEviews等软件计算结果直接复制到等软件计算结果直接复制到作业或论文中。作业或论文中。5.12 正态性检验Story:Bera&Beda:signature第五章结束，谢谢！第五章结束，谢谢！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

30 金币

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 区间估计假设检验

淘文阁 - 分享文档赚钱的网站所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

限制150内

关于本文

本文标题：第5章-区间估计及假设检验.ppt
链接地址：https://www.taowenge.com/p-76428864.html