第二讲画图和线性回归基础课件.ppt
第二讲画图和线性回归基础第1页,此课件共23页哦Stata作图作图stata 提供各种曲线类型,包括点提供各种曲线类型,包括点(scatter)、线()、线(line)、面()、面(area),直),直方图(方图(histogram)、)、条形图(条形图(bar)、饼图()、饼图(pie)、函数曲线)、函数曲线(function)以及矩阵图()以及矩阵图(matrix)等。)等。同时,对时间序列数据有以同时,对时间序列数据有以ts 开头的一系列开头的一系列特殊命令,如特殊命令,如tsline。还有一类是对双变量。还有一类是对双变量的回归拟合图(的回归拟合图(lfit、qfit、lowess)等。)等。第2页,此课件共23页哦作图时命令方式比较复杂,建议多用菜单方式。作图时命令方式比较复杂,建议多用菜单方式。一起来做下列图形:一起来做下列图形:简单图形简单图形打开打开wage1.dta1。男性和女性工资均值的条形图男性和女性工资均值的条形图2。白人和其他人的工资的饼状图白人和其他人的工资的饼状图3。wage的直方图,并检验是否服从正态分布。的直方图,并检验是否服从正态分布。4。wage的核密度分布图。的核密度分布图。第3页,此课件共23页哦组合图形组合图形画出画出price与与weight的散点图,并画出其拟的散点图,并画出其拟合线。合线。图形界面设计:图形界面设计:图形标题,图形标题,X轴标志,轴标志,Y轴标志,样式选择,轴标志,样式选择,图例,分组标志。图例,分组标志。第4页,此课件共23页哦两个练习:两个练习:1。完成下列汽车拟合图。完成下列汽车拟合图。2。查阅数据,并按照要求完成图形。查阅数据,并按照要求完成图形。第5页,此课件共23页哦第6页,此课件共23页哦改上面五个标注,用改上面五个标注,用twoway graph里面的里面的legend(override default keys):1 国产车国产车 2 进口车进口车 3 国产车拟合国产车拟合 4 进口进口车拟合车拟合 5 整体拟合整体拟合 第7页,此课件共23页哦2、中国的、中国的GDP(以购买力平价计)何时能超过美国?从(以购买力平价计)何时能超过美国?从Penn World Table(最权威的跨国宏观数据集)下载两国(最权威的跨国宏观数据集)下载两国1978-2010年年“Population”与与“Real GDP per capita”数据,导入数据,导入Stata中,将两国中,将两国log(GDP)的时间趋的时间趋势画在一张图上,并做简单外推预测(假设未来的增长率与势画在一张图上,并做简单外推预测(假设未来的增长率与1978-2010年间相同)。下载地址为:年间相同)。下载地址为:http:/pwt.econ.upenn.edu/php_site/pwt_index.php。下载时选。下载时选csv格式,按网站说明存储数据。格式,按网站说明存储数据。第8页,此课件共23页哦第9页,此课件共23页哦小样本小样本OLS第10页,此课件共23页哦第11页,此课件共23页哦 OLS假设条件:假设条件:1.Eu|X=0 2.条件同方差、没有序列自相关条件同方差、没有序列自相关 3.X与与u不相关不相关 4.Y和和X之间存在线性关系。之间存在线性关系。5.解释变量解释变量 X 是非随机变量,被解释变量是非随机变量,被解释变量Y 是随是随机变量。机变量。6.X 是满秩的,是满秩的,rank(X)=k第12页,此课件共23页哦我们得到:我们得到:习惯上我们用习惯上我们用y_hat=X*b (被解释变量的拟合值)(被解释变量的拟合值)e=Y-y_hat=Y-Xb (残差残差)第13页,此课件共23页哦建立回归方程建立回归方程打开系统文件打开系统文件auto,建立如下方程:,建立如下方程:regress命令详解:命令详解:regress depvar indepvars if in weight,options sysuse auto,clear regress price mpg weight foreign第14页,此课件共23页哦1。要求方程省略常数项。要求方程省略常数项2。稳健性估计(一般用于大样本。稳健性估计(一般用于大样本OLS)3。重新设置置信区间(默认。重新设置置信区间(默认95%)4。标准化系数(回归系数对被解释变量的重。标准化系数(回归系数对被解释变量的重要性)要性)5。回归中使用部分数据(。回归中使用部分数据(if in)第15页,此课件共23页哦回归后预测值的获得回归后预测值的获得Predict1。拟合值的获得:。拟合值的获得:predict yhat,xb 或者或者 predict yhat2。残差的获得。残差的获得predict e,residuals 或者或者 predict e,res3。残差分布图残差分布图rvfplot yline(0)第16页,此课件共23页哦回归结果的存放:回归结果的存放:e()e(N)number of observations e(mss)model sum of squares e(df_m)model degrees of freedom e(rss)residual sum of squares e(df_r)residual degrees of freedom e(r2)R-squared e(r2_a)adjusted R-squared e(F)F statistic e(rmse)root mean squared error 可以使用命令可以使用命令 eret list 查看。查看。第17页,此课件共23页哦第18页,此课件共23页哦回归结果解读回归结果解读MSS:回归平方和:回归平方和 df1 自由度自由度 MMS=MSS/df1RSS:残差平方和:残差平方和 df2 RMS=RSS/df2TSS:总平方和:总平方和 df3 TMS=TSS/df3F值:系数的联合检验值:系数的联合检验 R2=MSS/TSS调整的调整的R2 Root MSE=sqrt(RMS)Coef:回归系数:回归系数 Std.Err:系数的标准误差:系数的标准误差t统计量统计量 t的临界值的临界值 p值值95%置信区间置信区间第19页,此课件共23页哦模型常用的其他形式:模型常用的其他形式:对数对数 半对数半对数 平方项平方项 n次方次方 指数指数 交乘项交乘项虽然对函数形式和自变量的选取有选择和检验虽然对函数形式和自变量的选取有选择和检验的方法,但最好还是从的方法,但最好还是从“经济意义经济意义”角度确定。角度确定。例如:考察消费受收入影响的方程,即使参数例如:考察消费受收入影响的方程,即使参数项不显著,也不能把它删除掉。项不显著,也不能把它删除掉。第20页,此课件共23页哦例题例题例一:利用例一:利用wage2的数据检验明瑟的数据检验明瑟(mincer)工资方程的简单形式:工资方程的简单形式:Ln(wage)=b0+b1*educ+b2*exper +b3*exper2+u 第21页,此课件共23页哦例二:利用例二:利用phillips的数据拟合预期增强的菲的数据拟合预期增强的菲利普斯曲线为利普斯曲线为其中,其中,unemt表示第表示第t期的失业率(期的失业率(%),),inft 表示第表示第t期的通货膨胀率(期的通货膨胀率(%),),infte表示表示预期通货膨胀率,预期通货膨胀率,0表示自然失业率(表示自然失业率(%)。)。按照适应性预期理论,按照适应性预期理论,infte=inft-1。令令inft=inft-inft-1,上述模型可以简化为:,上述模型可以简化为:第22页,此课件共23页哦例三:我国某地区例三:我国某地区1955-1984农产品收购农产品收购量量sg、库存量、库存量kc存放在文件存放在文件warehouse.dta中中估计如下方程:估计如下方程:Sgt=a+b0kct+b1kct-1+u存在滞后一期的变量存在滞后一期的变量第23页,此课件共23页哦