应用回归分析简答题及答案(8页).doc
-应用回归分析简答题及答案-第 8 页应用回归分析简答题及答案4.为什么要对回归模型进行检验?答:当模型的未知参数估计出来后,就初步建立了一个回归模型。建立回归模型的目的是应用他来研究经济问题,但如果马上就用这个模型去做预测、控制和分析,显然是不够慎重的。因为这个模型是否真正揭示了被解释变量与解释变量之间的关系,必须通过对模型的检验才能决定。5.讨论样本容量n与自变量个数p的关系,他们对模型的参数估计有何影响?答:在多元线性回归模型中,样本容量n与自变量个数p的关系是:n>p。如果n<=p对模型的参数估计会带来严重的影响。因为:(1)在多元线性回归模型中,有p+1个待估参数B,所以样本容量的个数应该大于解释变量的个数,否则参数无法估计。(2)解释变量X是确定性变量,要求rank(X)=p+1<n,表明设计矩阵X中的自变量列之间不相关,样本容量的个数应该大于解释变量的个数,X是一个满秩矩阵。7.如何正确理解回归方程显著性检验拒绝Ho,接受Ho? 答:(1)一般情况下,当Ho:B1=0被接受时,表明y的取值倾向不随x的值按线性关系变化,这种状况的原因可能是变量y与x之间的相关关系不显著,也可能虽然变量y与x之间的相关关系显著,但这种相关关系不是线性的而是非线性的。(2)当Ho:B1=0被拒绝时,没有其他信息,只能认为因变量y对自变量x是有效的,但并没有说明回归的有效程度,不能断言y与x之间就一定是线性相关关系,而不是曲线关系或其他的关系。8.一个回归方程的复相关系数R=0.99,样本决定系数R2=0.9801,我们能断定这个回归方程就很理想吗?答:1.在样本容量较少,变两个数较大时,决定系数的值容易接近1,而此时可能F检验或者关于回归系数的t检验,所建立的回归方程都没能通过。2.样本决定系数和复相关系数接近1只能说明Y与自变量X1,X2,Xp整体上的线性关系成立,而不能判断回归方程和每个自变量都是显著的,还需进行F检验和t检验。3.在应用过程中发现,在样本量一定的情况下,如果在模型中增加解释变量必定使得自由度减少,使得R2增大,因此增加解释变量个数引起的R2的增大与拟合好坏无关。9.数据中心化和标准化在回归分析中的意义是什么? 答:原始数据由于自变量的单位不同,会给分析带来一定的困难;又由于涉及的数据量较大,可能会以为舍入误差而使得计算结果并不理想。中心化和标准化回归系数有利于消除由于量纲不同、数量级不同带来的影响,避免不必要的误差。10.试举例说明产生异方差的原因。 答:由于实际问题是错综复杂的,因而在建立实际问题的回归模型时,经常会出现某一些因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响,导致随机误差项产生不同方差。引起异方差的原因很多,担当样本数据为截面数据时容易出现异方差。 例如:烟具城镇居民收入与购买量的关系:Yi=Bo+B1Xi+Ei,i=1,2,···,n其中:Yi表示第i户的消费额,Xi表示第i户的收入量由于低收入的家庭购买差异性比较小,大都购买生活必需品,但高收入的家庭购买行为差异很大,所以随即项Ei具有不同的方差。11.异方差性带来的后果是什么?答:(1)参数估计量非有效;(2)变量的显著性检验失去意义;(3)模型的预测失效。12.简述用加权最小二乘法消除线性回归中异方差性的思想与方法。 答:思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。在异方差的条件下,平方和中的每一项的地位不同,误差项方差大的项,在平方和中作用大,回归线被拉向方差大的项。加权最小二乘法是在平方和中加入一个适当的权数Wi,以调整各项在平方和中的作用。方法:加权最小二乘法、BOX-COX变换法、方差稳定性变换法。13.试举一可能产生随机误差项序列相关的例子。 答:例如,居民消费函数的模型:Ct=Bo+B1Yt+Et,t=1,2,n 由于居民收入对消费影响有滞后性,而且今年消费水平受上年消费水平影响,则可能出现序列相关性。另外由于消费习惯的影响被包含在随机误差项中,则可能出现序列相关性(往往是正相关)。14.序列相关性带来的严重后果是什么?答:(1)参数估计量非有效;(2)变量的显著性检验失去意义;(3)模型的预测失效。15.说明引起异常值的原因和消除异常值的方法。答:原因:1.数据登记误差,存在抄写或录入的错误;2.数据测量误差;3.数据随机误差;4.缺少重要自变量;5.缺少观测数据;6.存在异方差;7.模型选用错误,线性模型不适用。 方法:1.重新核实数据;2.重新测量数据;3.删除或重新官策异常值数据;4.增加必要的自变量;5.增加观测数据,适当扩大自变量取值范围;6.采用加权线性回归;7.改用非线性回归模型。、16. 在运用逐步回归法时,进和出的赋值原则是什么?说明理由。 答:原则是要求引入自变量的显著水平进小于剔除自变量的显著性水平出,否则可能出现死循环;17. 试述逐步回归的思想方法。答:逐步回归的基本思想是有进有出。具体做法是将变量一个一个的引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入变量由于后面变量的应纳入而变得不再显著时,要将其剔除。引入一个变量或从回归防方程中剔除一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包含显著的变量。这个过程反复进行,直到无显著变量引入回归方程,也无不显著变量从回归方程中剔除为止。这样就避免了前进法和后退法各自的缺陷,保证了最后得到的回归子集是最优回归子集。18. 多重共线性对回归参数的估计有何影响?答:1、完全共线性下参数估计量不存在;2、近似共线性下OLS估计量非有效;3、参数估计量经济含义不合理;4、变量的显著性检验失去意义;5、模型的预测功能失效。19. 具有严重多重共线性的回归方程能不能用来做经济预测?答:虽然参数估计值方差的变大容易使区间预测的“区间”变大,使预测失去意义。但如果利用模型去做经济预测,只要保证自变量的相关类型在未来期中一直保持不变,即使回归模型中包含严重多重共线性的变量,也可以得到较好预测结果;否则会对经济预测产生严重的影响。20. 多重共线性的产生于样本容量的个数n、自变量的个数p有无关系?答:有关系,增加样本容量不能消除模型中的多重共线性,但能适当消除多重共线性造成的后果。当自变量的个数p较大时,一般多重共线性容易发生,所以自变量应选择少而精。