《第6章多元回归分析其他问题课件.ppt》由会员分享,可在线阅读,更多相关《第6章多元回归分析其他问题课件.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第6章多元回归分析其他问题第1页,此课件共30页哦6.1 测度单位对OLS估计量的影响l当变量重新测度时,系数、标准误、置信区间、t统计量和F统计量改变的方式,都不会影响所有被测度的影响程度和检验结果。以例说明:因变量测度单位的变化的影响自变量测度单位的变化的影响l贝塔系数:有时反映关键变量影响的斜率系数是一个难以解释的度量,如考试分数等。此时采用标准化系数或贝塔系数可能有帮助。设原始方程为第2页,此课件共30页哦6.1 测度单位对OLS估计量的影响进行标准化后的回归为:标准化系数 与原系数的关系为:解释为xj增加一个标准差,因变量增加的标准差个数。标准化系数不受变量测度单位的影响,可以用来判
2、断解释变量的重要性。例6.1 中利用标准化系数可说明,污染比犯罪对房价产生更大的影响。标准化系数存在使用不方便的缺点。第3页,此课件共30页哦6.2 函数形式的进一步讨论l对数函数形式:对以下模型的系数进行解释:Rooms前面的系数常解释为,多增加一个房间,结果会提高30.6%,但这种解释是近似的,精确应该是:以上的调整对小的百分数变化而言不那么重要。在应用研究中广泛应用对数形式的原因:使用对数对系数的解释具有吸引力,且不受测度单位影响使用对数比使用水平的因变量更接近CLM假定,如缓和异方差和偏态性。取对数可缩小变量取值范围,减弱对异常值的敏感度。第4页,此课件共30页哦6.2 函数形式的进一
3、步讨论使用对数形式的经验法则:对金额表示的变量通常可以取对数。对人数、雇员总数和学校注册人数等变量可取对数。以年度量的变量(受教育年限、工作经历、任职年限和年龄等)通常用原形。比例或百分比变量(如失业率、参与率、拘捕率和通过率等)既可使用原形,也可使用对数,但要区分百分点的变化与百分比的变化。第5页,此课件共30页哦6.2 函数形式的进一步讨论使用对数形式的局限:变量不能取零或负值,有时可用:使用对数形式的因变量,难以预测原变量的值。以y作为因变量的模型与以log(y)作为因变量的模型,不能比较R2,没有直接方法比较两种模型优劣l含二次型的模型:为了描述递减或递增的边际效应,常使用二次型:第6
4、页,此课件共30页哦6.2 函数形式的进一步讨论边际效应的形式为:可代入样本中的x的平均值、中位数或上下四分位数。在多数应用中,常为正,而 为负,此时具有抛物线形态,存在一个转折点:当模型中因变量为对数形式,而自变量以二次形式出现时,解释需要小心,如例6.2。对数形式的二次型可说明弹性是非参数的。第7页,此课件共30页哦6.2 函数形式的进一步讨论l含有交互作用项的模型:因变量对一个解释变量的偏效应、弹性或半弹性可能受另一解释变量的影响,这就需要交互项的使用。如:Bdrms对price的偏效应为:例6.3 解释 第8页,此课件共30页哦6.3 拟合优度和回归元选择的进一步讨论初学者往往倾向于过
5、度强调R-平方,有些情况下R平方可能人为地偏高,低R-平方只是说明仍有一些影响y的因素没有被解释,但并不意味着u中的因素与现有的自变量相关,零条件均值假定决定了,我们可以对现有自变量的偏效应进行良好的估计,这是回归模型的核心,而R-平方的大小与此无直接关系。l调整的R-平方:为了克服模型只要增加新的自变量,R-平方不会变小,且对增加自变量所带来的自由度的损失进行惩罚,调整的R-平方被采用:第9页,此课件共30页哦6.3 拟合优度和回归元选择的进一步讨论当且仅当新的自变量的t统计量的绝对值大于1时,调整的R-平方才会增加(对此推广是,在回归中增加一组变量时,当且仅当这些新变量的联合显著性检验的F
6、统计量大于1时,调整R-平方才会增加)。由此,使用调整的R-平方来决定一变量(或一组变量)是否属于模型,与标准的t或F检验是不同的。利用调整的R-平方在非嵌套模型中选择:F统计量只能让我们检验嵌套模型(nested models):一个模型(受约束模型)是另一个模型(不受约束模型)的一种特殊情况。第10页,此课件共30页哦6.3 拟合优度和回归元选择的进一步讨论非嵌套模型:对于非嵌套模型(nonnested models)的选择是一个很困难的问题。因变量相同模型的一种可能的方法是,创造一个包含原来二个模型中所有解释变量的复合模型,然后采用F检验将原来的每个模型针对复合模型进行检验。此方法的问题
7、是,两个模型既可能同时被拒绝,也可能同时均不被拒绝。利用调整的R-平方可以对非嵌套模型进行选择,但不能用于因变量不同的模型之间进行选择。如水平模型和对数模型之间的选择。例6.4第11页,此课件共30页哦6.3 拟合优度和回归元选择的进一步讨论l回归分析中控制了过多的因素:在担心模型中漏掉一个可能与自变量相关的重要因素的同时,还有另一种可能性:回归分析中控制过多的变量。对多元回归模型中其他条件不变的解释有时能帮助我们避免此类错误,以评价州啤酒税对交通死亡率影响的模型为例:关键是是否要加入啤酒消费量这个控制变量?加入后如何解释啤酒税前的系数。对某些特定因素该不该进行控制,并不总是清楚的,Betts
8、(1995)对高中学校的质量对今后收入影响的研究中,是否要控制受教育程度并没有明确的答案。第12页,此课件共30页哦6.3 拟合优度和回归元选择的进一步讨论l增加回归元以减少误差方差:从回归误差项中取出一些因素作为新的自变量加入模型中会增加多重共线性,但可以减少误差的方差。一般而言,哪方面的影响对系数估计量的方差占主导作用是不明确。如果增加的自变量与原有的自变量无关,增加自变量可减少误差方差而不会导致多重共线性。但这种情形在社会科学很少出现。第13页,此课件共30页哦6.4 多重共线性(multicollinearity)第14页,此课件共30页哦6.4 多重共线性(multicollinea
9、rity)第15页,此课件共30页哦6.4 多重共线性(multicollinearity)第16页,此课件共30页哦6.4 多重共线性(multicollinearity)第17页,此课件共30页哦6.4 多重共线性(multicollinearity)第18页,此课件共30页哦6.4 预测和残差分析l预测的置信区间:假设估计方程如下:给定解释变量的具体值:想要预测的对象是:预测值为:为了得到一个置信区间,需要获得标准误:直接的计算比较复杂,一个简便的方法是进行模型变换:将 代入原模型,变换后可得:估计以上模型,截距的估计值及标准误就是所需的预测值及其标准误,在此基础上可构造置信区间。在自由
10、度较大情况下,经验法则为:第19页,此课件共30页哦6.4 预测和残差分析 以上是对y的期望值进行预测,有时需对y的新的值进行预测:预测值与期望的预测值是相同的,不同的是预测误差增加了一项:预测区间的构造方法是完全相同的。l残差分析:对个别观测值的残差进行分析,称为残差分析(residual analysis)。将实际值与回归模型的估计值进行比较,可能具有不同的经济意义如房屋价格、法学院排名、司法决策第20页,此课件共30页哦6.4 预测和残差分析l当因变量为对数时对水平值的预测:讨论当因变量为对数形式log(y)时,如何预测水平值y。通常的作法是将log(y)的预测值转换成指数函数值:实际上
11、,此方法将系统地低估了y的预测值,因为在CLM的六个假定下有:因此y的预测值应调整为:此公式是基于误差项为正态分布,为得到更一般的情形,假定误差项u独立于解释变量,则 第21页,此课件共30页哦6.4 预测和残差分析以下步骤是计算从logy对 的回归中得到拟合值:对每个观测值,求出在不设截距下,求y对 的回归,得到的系数估计值就是能够正确计算出因变量为logy的模型中水平y的估计值后,可以计算y的实际值与y的估计值之间的相关系数,将其平方与因变量为y的模型中拟合优度R-平方进行比较,因此提供了一个比较对数模型与水平模型优劣的简单方法。第22页,此课件共30页哦A Further Example
12、:Determinants of Sovereign Credit RatingsCantor and Packer(1996)Financial background:What are sovereign credit ratings and why are we interested in them?Two ratings agencies(Moodys and Standard and Poors)provide credit ratings for many governments.Each possible rating is denoted by a grading:MoodysS
13、tandard and PoorsAaaAAA.B3B-第23页,此课件共30页哦Purposes of the Paper-to attempt to explain and model how the ratings agencies arrived at their ratings.-to use the same factors to explain the spreads of sovereign yields above a risk-free proxy-to determine what factors affect how the sovereign yields react
14、 to ratings announcements第24页,此课件共30页哦Determinants of Sovereign RatingsDataQuantifying the ratings(dependent variable):Aaa/AAA=16,.,B3/B-=1Explanatory variables(units of measurement):-Per capita income in 1994(thousands of dollars)-Average annual GDP growth 1991-1994(%)-Average annual inflation 1992
15、-1994(%)-Fiscal balance:Average annual government budget surplus as a proportion of GDP 1992-1994(%)-External balance:Average annual current account surplus as a proportion of GDP 1992-1994(%)-External debt Foreign currency debt as a proportion of exports 1994(%)-Dummy for economic development-Dummy
16、 for default historyIncome and inflation are transformed to their logarithms.第25页,此课件共30页哦The model:Linear and estimated using OLS 第26页,此课件共30页哦Interpreting the ModelFrom a statistical perspectiveVirtually no diagnosticsAdjusted R2 is highLook at the residuals:actual rating-fitted ratingFrom a finan
17、cial perspectiveDo the coefficients have their expected signs and sizes?Do Ratings Add to Publicly Available Available Information?Now dependent variable is-Log(Yield on the sovereign bond-yield on a US treasury bond)第27页,此课件共30页哦Do Ratings Add to Publicly Available Available Information?Results 第28
18、页,此课件共30页哦What Determines How the Market Reacts to Ratings Announcements?The sample:Every announcement of a ratings change that occurred between 1987 and 1994-79 such announcements spread over 18 countries.39 were actual ratings changes40 were“watchlist/outlook”changesThe dependent variable:changes
19、in the relative spreads over the US T-bond over a 2-day period at the time of the announcement.第29页,此课件共30页哦What Determines How the Market Reacts to Ratings Announcements?Explanatory variables.0/1 dummies for -Whether the announcement was positive-Whether there was an actual ratings change-Whether the bond was speculative grade-Whether there had been another ratings announcement in the previous 60 days.and-The change in the spread over the previous 60 days.-The ratings gap between the announcing and the other agency第30页,此课件共30页哦
限制150内