古扎拉蒂_经济计量学习题答案.doc
.部分作业答案:(各题只要回答到如下程度就是满分哦)第1章 概论一、填空1. 近似,散点;2. 平均值,平均值第2章 线性回归的基础理论一、填空1. 因变量Y,解释变量X二、单项选择题1-2 AB三、名词解释总体:实验所有可能结果的集合称为总体或样本空间。样本:也叫样本点,是指总体的某个元素或某种结果。随机实验:至少有两个可能的结果,但不确定哪一个结果会出现的某个观察或测度过程。估计量:是指总体参数的估计方法或计算公式。估计值:估计量的某一具体取值称为估计值。变量线性:是指因变量的条件均值是解释变量的线性函数。参数线性:是指因变量的条件均值是参数B的线性函数,而变量之间不一定是线性的。四、简述1. 答:14世纪英国逻辑学家奥卡姆提出简单有效原理,即“如无必要,勿增实体”,亦即“切勿浪费较多东西去做用较少的东西同样可以做好的事情”。因此,模型应尽量简化,只要不遗漏重要变量即可,即便某些变量对Y有影响,但它们的综合影响如果是有限的,非随机的,都可以不予考虑,即归入u中。2. 答:对双变量回归模型而言,如果总体回归线接近于直线,可用函数表示为E(YXi)=B1+B2Xi,其中,B1为截距,B2为斜率,该函数就称为非随机总体回归函数。它表示在给定X的条件下,Y分布的均值。对双变量回归模型而言,如果总体回归线接近于直线,回归方程可表示为Yi=B1+B2Xi+ui,其中,B1+B2Xi表示在给定X的条件下Y分布的均值,ui为随机误差项。它表示真实的Y值是如何在均值附近波动的。对双变量回归模型而言,若样本回归线接近于直线,则非随机样本回归函数可表示为=b1+b2Xi,其中,=总体条件均值E(YXi)的估计量,b1=真实截距B1的估计量,b2=真实斜率B2的估计量。对双变量回归模型而言,若样本回归线接近于直线,则随机样本回归函数可表示为Yi=b1+b2Xi+ei,其中,b1+b2Xi表示总体条件均值E(YXi)的估计量,ei表示误差项ui的样本估计量,称为残差。五、论述题什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了)答:回归分析的目的是根据SRF (样本回归函数)估计PRF (总体回归函数),普通最小二乘法是获得SRF最主要的方法。随机PRF(Yi=B1+B2Xi+ui)不能直接观察,但能通过随机SRF(Yi=b1+b2Xi+ei)估计。由SRF得ei=Yi-b1-b2Xi,而=b1+b2Xi,因此,ei=Yi-=实际的Yi-估计的Yi。残差的绝对值越小,表示SRF与PRF越靠近,即估计越好。残差的平方和最小即可表示SRF与PRF越靠近,用数学公式表示为:。该式中,X和Y可由观测得到,是b1和b2的函数。因此,等价于分别对b1和b2求偏导等于0。由此,得到:其中,n为样本容量。此联立方程称为最小二乘正规方程。求解正规方程得到:其中,样本截距b1是总体截距B1的估计量,样本斜率b2是总体斜率B2的估计量。xi,yi表示变量与其相应均值的离差,即xi=Xi-,yi=Yi-。第3章 常用概率分布一、填空1. 正态;倒扣的钟形2. 随机抽样(或随机样本);独立同分布3. 正态分布;正态分布4. N(0,1);n-1;学生t分布5. 2 6. 2二、单项选择题1-5 DCBAC三、名词解释概率密度函数:是指连续型随机变量在某一特定范围或区域内的概率。期望:是随机变量的可能取值的加权平均,权重为各可能取值的概率。换言之,随机变量的期望就是该变量可能取值与其对应概率之积的加总。方差:等于随机变量与均值之差的平方的期望,即var(X)=E(X-x)2,其中,x=E(X)。方差表明随机变量X的取值与均值的偏离程度。自由度:是指计算统计量(如样本均值或方差)时独立观察值的个数。第4章 统计推断的基本理论一、填空1. 估计,假设检验2. 固定值,随机变量二、单项选择题1 B三、名词解释统计推断:是指根据来自总体的某个随机样本,对总体的某些特征作出推论。抽样误差:因样本不同而导致估计值的差异叫做抽样变异或抽样误差。估计:概率分布函数的性质由其参数决定,通常根据样本估计总体参数,假设样本容量为n的随机样本来自服从某概率的总体,用样本均值作为总体均值的估计量,样本方差作为总体方差的估计量,这个过程称为估计。BLUE:最优线性无偏估计量。如果一个估计量是线性的和无偏的,并且,在所有无偏估计量中,它的方差最小,则称它是最优线性无偏估计量。一致估计量:如果随着样本容量的增加,估计量接近参数的真实值,则称该估计量为一致估计量。p值:即概率值,定义为拒绝零假设最低的显著水平,又称为统计量的精确显著水平。第5章 回归的假设检验一、填空题1. 无自相关,正的自相关,负的自相关2. 0,2,正态分布,中心极限二、单项选择题1-3 ADB三、名词解释高斯-马尔柯夫定理:如果满足经典线性回归模型的基本假定,则在所有线性估计量中,OLS估计量具有最小方差性,即OLS估计量是最优线性无偏估计量(BLUE)。残差直方图:是用于推断随机变量概率密度函数(PDF)形状的一种简单图形工具。在横轴上,把变量值(如OLS残差)划分为若干适当的区间,在每个区间上,建立高度与观察值个数即频率相一致的长方形。第6章 多元回归模型一、填空1. 大于,大于二、单项选择题1-3. CBD三、名词解释方差分析:对因变量Y的总变异TSS的各组成部分进行分析的过程称为方差分析。受限最小二乘法:采用OLS法估计受限模型就称为受限最小二乘法。非受限最小二乘法:采用OLS法估计未受限模型就称为非受限最小二乘法。四、简答题1. 三变量总体回归函数E(Yt)=B1+B2X2t+B3X3t中,B2和B3称为偏回归系数,也称为偏斜率系数。它们的含义:B2度量了在X3保持不变的情况下,X2单位变动引起Y的均值E(Y)的变化量。同样地,B3度量了在X2保持不变的情况下,X3单位变动引起Y的均值E(Y)的变化量。五、分析题根据表1,可得出以下几点结论:(1)当仅对截距回归时,R2,和F值都为0,并且截距等于因变量的均值。(2)当价格对截距和年代回归时,年代变量的t=5.8457>1,模型2的大于模型1的,因此,应增加该变量。(3)当价格对截距和人数回归时,人数变量的t=2.3455>1,模型3的大于模型1的,因此,应增加该变量。(4)当价格对截距、年代和人数回归时,年代变量的t=13.9653>1,人数变量的t=9.7437>1。模型4的既大于模型2的,也大于模型3的,因此,应该采用两个解释变量的模型。(5)模型2中,年代变量的t值的平方等于模型的F值;模型3中,人数变量的t值的平方等于模型的F值。一般地,对于双变量模型,斜率系数的t值与模型的F值有如下关系: (1)其中,k为自由度,k=n-2,n为观察值个数。(6)对于多元回归模型,t与F之间则不存在等式(1)。第7章 回归模型的函数形式一、单项选择题1-2. DA二、名词解释不变弹性模型:双对数模型最简单的PRF形式为:lnYi=B1+B2lnXi+ui,由于斜率系数,是Y对X的点弹性。与其他点弹性值随X而变化不同,该值是个常数,因此,双对数模型又称为不变弹性模型。半对数模型:模型的因变量和解释变量一个是线性一个是对数形式,包括两种形式:一是对数线性模型,最简单的PRF形式为:lnYt=B1+B2t+ut;二是线性对数模型,最简单的PRF形式为:Yt=B1+B2lnXt+ut。增长率模型:对数线性模型最简单的PRF形式为:lnYt=B1+B2t+ut,斜率系数,可表示增长率,因此对数线性模型又称为增长率模型。倒数模型:形如Yi=B1+B2+ui的模型称为倒数模型,随着X的无限增大,趋近于0,Y的期望趋近于B1。三、简答题1. 考虑如下三变量对数线性模型:lnYi=B1+B2lnX2i+B3lnX3i+ui其中,偏斜率系数B2和B3又称为偏弹性系数。因此,B2度量了X3不变条件下,Y对X2的弹性,即在X3为常数时,X2变动1%,引起Y变化的百分数。由于X3的影响保持不变,所以称此弹性为偏弹性。类似地,B3度量了X2不变条件下Y对X3的偏弹性。总之,在多元对数线性模型中,每一个偏斜率系数都度量了在其他变量保持不变的条件下,因变量对某解释变量的偏弹性。第8章 虚拟变量回归模型一、填空题1. B1;B1+B2;差别截距系数二、名词解释ANOVA模型:方差分析模型,是指解释变量仅包括虚拟变量的回归模型。ANCOVA模型:协方差分析模型,是指回归中既有定性,又有定量解释变量的模型。三、简答题1. 虚拟变量个数选择遵循的原则:如果模型有截距项B1,且定性变量有m种分类,则需引入m-1个虚拟变量。如果违背上述原则,如选择m个虚拟变量,则将陷入虚拟变量陷阱,即虚拟变量之间存在完全共线性。凡是讲过的内容(含附录),都属于考试范围。第1章一、填空1. 拟合即( )的意思,拟合直线是指直线对( )的近似。2. 回归一词的使用始于高尔顿对人体身高的研究。他发现一个规律:父母高,子女也高;父母矮,子女也矮。当父母身高既定时,子女的身高趋向于或“回归”到身高相同父母的全部子女的( )。简记为,回归即指回归到( )。第2章一、填空1. 总体回归线代表( )与( )的变动关系。二、单项选择题1. 下列函数中,哪个是参数线性但非变量线性的函数?A. E(Y)=B1+B2 B. E(YXi)=B1+B2Xi C. Yi=B1+B2Xi+ui D. =b1+b2Xi2. 下列函数中,哪个是变量线性但非参数线性的函数?A. E(Y)=B1+B2 B. E(Y)=B1+Xi C. E(YXi)=B1+B2Xi D. =b1+b2Xi三、名词解释总体;样本;随机实验;估计量;估计值;变量线性;参数线性四、简述1. 奥卡姆剃刀原则如何应用到模型设定中?2. 什么是非随机总体回归函数?什么是随机总体回归函数?什么是非随机样本回归函数?什么是随机样本回归函数?五、论述题什么是普通最小二乘法?(按教材内容回答,不必按讲义,因它太细了)第3章一、填空1. 如果连续随机变量的概率密度函数(PDF)有如下形式:f(x)=, (-<x<)其中,和2分别是分布的均值和方差,那么该变量被称为是( )分布的,其图形呈( )。2. 如果X1,X2, ,Xn都独立抽取于同一概率分布,即Xi(i=1,2,n)的概率密度函数相同,则称其为( ),X称为( )随机变量。3. 如果随机样本X1, X2, , Xn来自均值为X, 方差为的任一总体,则随着样本容量无限增大,样本均值趋于( ),其均值为X, 方差为。如果X恰好来自正态总体,则不论样本容量如何,样本均值均服从( )。4. 如果,则变量Z=( ),前提是X和已知。如果仅已知X,而用样本估计量代替,即X用样本标准差Sx代替,则得到一个新的变量,服从自由度为( )的( )。5. 假设样本均值服从正态分布,即,前提是真实方差已知。如果未知,而用样本方差替代,则它服从( )分布。6. 令Z1, Z2, , Zk为独立的标准正态变量,则变量服从k个自由度的( )分布。二、单项选择题1. 下列描述中,( )不属于正态分布的性质。A. 它围绕其均值对称地分布B. 正态曲线下的面积约有68位于±两值之间C. 正态分布仅依赖于和2两个参数D. 图形向右偏倚2. 下列描述中,( )不属于t分布的性质。A. t分布是对称的 B. t分布的均值为0,方差为k/(k-2)C. t分布的均值为1,方差为k/(k-2) D. 随着df增大,t分布趋近于标准正态分布3. 下列描述中,( )不属于2分布的性质。A. 2分布向右偏倚,偏倚程度与自由度有关B. 2分布的图形是对称的C. 2分布的均值为k,方差为2k,其中k为自由度D. 如果Z1和Z2是两个独立的,自由度分别为k1和k2的2变量,则Z1+Z2也是2变量4. 下列描述中,( )不属于F分布的性质。A. F分布的图形是对称的B. F分布向右偏倚,随着k1和k2的增大,F分布趋向于正态分布C. F分布变量的均值是k2/(k2-2),(k2>2),方差是,(k2>4)D. 自由度为k的t分布变量的平方是自由度为1、k的F分布,记为:5. 下列分布函数中,( )不是正态分布的相关分布。A. t分布 B. 2分布 C. 累积分布 D. F分布三、名词解释概率密度函数;均值;方差;自由度第4章一、填空1. ( )和( )是统计推断的两个有次第的分支。2. 点估计值是( ),而点估计量是( ),因它是点估计值的计算公式,随样本而变化。二、单项选择题1. 下列估计量性质中,( )不是样本均值的性质。A. 线性 B. 有偏性 C. 无偏性 D. 最小方差性三、名词解释统计推断;抽样误差;估计;BLUE;一致估计量;P值第5章一、填空题1. 如图1所示,散点图的坐标轴分别为误差项ui和uj。(a)表示( ),(b)表示( ),(c)表示( )。2. 为了推导OLS估计量b1和b2的抽样分布,需在CLRM假定的基础上增加一个条件,即总体回归函数Yi=B1+B2Xi+ui的误差项ui服从均值为( ),方差为( )的( ),根据( )定理获知该假定是合理的。二、单项选择题1. 下列描述中,( )不是经典线性回归模型的假定。A. 回归模型是变量线性的 B. 回归模型是参数线性的C. 解释变量X与误差项u不相关 D. E(uXi)=02. 下列方程中,( )不属于经典线性回归模型的假定。A. E(uXi)=0 B. var(ui)=2C. cov(ui,uj)=0,ij,cov表示协方差 D. XiN(0, 2)3. 下列描述中,( )不属于OLS估计量的性质。A. b1和b2是线性估计量B. b1和b2是有偏估计量C. E()=2,即误差项的方差估计量是无偏的D. b1和b2是有效估计量三、名词解释高斯-马尔柯夫定理;残差直方图第6章一、填空1. 新增解释变量原则:只要增加解释变量后新模型的校正判定系数( )旧模型的,该新增变量就是可取的。而且,只要新增解释变量系数的( )大于1,新模型的就( )旧模型的。二、单项选择题1. 下列经典线性回归模型的假定中,( )仅属于多元回归模型而不属于双变量回归模型。A. 回归模型是参数线性的 B. 解释变量与误差项不相关C. 解释变量之间不存在完全共线性 D. 误差项ui和uj无自相关2. 判定系数R2一个重要的性质是( ),A. R2值可正可负B. R2值随着解释变量个数的增加而上升C. R2值随着解释变量个数的增加而下降D. R2,其中是校正的判定系数3. 下列性质中,唯一不属于校正判定系数的是( )。A. R2B. 模型中解释变量的个数越多,越小C. 可正可负D. 是非负的三、名词解释方差分析;受限最小二乘法;非受限最小二乘法四、简答题1. 偏回归系数的含义是什么?五、分析题1. 某钟表公司拍卖了32只古董钟,并获得了钟表年代、投标人数和钟表价格等数据,将拍卖价格分别对截距项、一个解释变量和两个解释变量回归,结果如表1所示。请对该表的结果进行分析,即根据该表你能得出哪些结论。表1 古董钟拍卖价格的4个模型比较模型因变量(Y)截距钟表年代(X1)竞标人数(X2)R2F1234拍卖价格拍卖价格拍卖价格拍卖价格1328.094(19.0850)-191.6662(-0.7248)807.9501(3.4962)-1336.049(-7.6226)10.4856(5.8457)12.7413(13.9653)54.5724(2.3455)85.7640(9.7437)0.0000.53250.15490.89060.0000.51690.12680.88300.00034.17235.5017118.0585注:=1328;小括号中为零假设(该真实总体系数的值为0)下的t值。F检验的零假设是解释变量联合对因变量无影响。第7章一、单项选择题1. 回归方程lnYi=B1+B2lnXi+ui代表的模型不是( )。A. 参数线性模型 B. 对数变量的线性模型C. 双对数模型 D. 变量线性模型2. 双对数模型lnYi=B1+B2lnXi+ui被广泛地应用,主要是因为( )。A. 其斜率系数B2度量了Y对X的弹性B. 其误差项uiN(0, 2)C. 是变量线性模型D. 是参数线性模型二、名词解释不变弹性模型;半对数模型;增长率模型;倒数模型第8章一、填空题1. ANOVA模型Yi=B1+B2Di+ui,其中,Y=每年食品支出,美元;Di=1,女性;Di=0,男性。假设模型的误差项满足CLRM的基本假定,则男性食品支出的期望E(YiDi=0)=( ),女性食品支出的期望E(YiDi=1)=( )。B2称为( ),表示两类截距值的差异。二、名词解释ANOVA模型;ANCOVA模型三、简答题1. 虚拟变量个数选择遵循的原则是什么? .页脚.