Stata软件之回归讲解ppt课件.ppt
计量经济软件应用计量经济软件应用Stata软件实验之一元、软件实验之一元、多元回归分析多元回归分析内容概要内容概要一、实验目的一、实验目的二、简单回归分析的二、简单回归分析的Stata基本命令基本命令三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例四、多元回归分析的四、多元回归分析的Stata基本命令基本命令五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例一、实验目的:一、实验目的: 掌握运用掌握运用Stata软件进行简单回归分析以及软件进行简单回归分析以及多元回归分析的操作方法和步骤,并能看懂多元回归分析的操作方法和步骤,并能看懂Stata软件运行结果。软件运行结果。 二、简单回归分析的二、简单回归分析的Stata基本命令基本命令u简单线性回归模型简单线性回归模型 ( simple linear regression model ) 指指只有一个解释变量的回归模型。如:只有一个解释变量的回归模型。如:其中,其中,y 为被解释变量,为被解释变量,x 为解释变量,为解释变量,u 为随机误差项,为随机误差项,表示除表示除 x 之外影响之外影响 y 的因素;的因素; 称为斜率参数或斜率系称为斜率参数或斜率系数,数, 称为截距参数或截距系数,也称为截距项或常数项。称为截距参数或截距系数,也称为截距项或常数项。简单线性回归模型的一种特殊情况:简单线性回归模型的一种特殊情况:即假定截距系数即假定截距系数 时,该模型被称为过原点回归;过时,该模型被称为过原点回归;过原点回归在实际中有一定的应用,但除非有非常明确的理原点回归在实际中有一定的应用,但除非有非常明确的理论分析表明论分析表明 ,否则不宜轻易使用过原点回归模型。,否则不宜轻易使用过原点回归模型。01yxu101yxu0000二、简单回归分析的二、简单回归分析的Stata基本命令基本命令regress y x 以以 y 为被解释变量,为被解释变量,x 为解释变量进行普通最小二乘为解释变量进行普通最小二乘(OLS)回归。回归。regress命令可简写为横线上方的三个字命令可简写为横线上方的三个字母母reg。regress y x, noconstanty 对对 x 的回归,不包含截距项的回归,不包含截距项 (constant),即过原点回归。,即过原点回归。predict z 根据最近的回归生成一个新变量根据最近的回归生成一个新变量 z,其值等于每一个观测,其值等于每一个观测的拟合值(即的拟合值(即 )。)。predict u, residual根据最近的回归生成一个根据最近的回归生成一个新变量新变量 u,其值等于每一个观测,其值等于每一个观测的残差(即的残差(即 )。)。iyiiieyy三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例实验实验 1 简单回归分析:教育对工资的影响简单回归分析:教育对工资的影响 劳动经济学中经常讨论的一个问题是劳动者工资的决定。不劳动经济学中经常讨论的一个问题是劳动者工资的决定。不难想象,决定工资的因素有很多,例如能力、性别、工作经验、难想象,决定工资的因素有很多,例如能力、性别、工作经验、教育水平、行业、职业等。在这里仅考虑其中一种因素:教育教育水平、行业、职业等。在这里仅考虑其中一种因素:教育水平,建立如下计量模型:水平,建立如下计量模型:其中,其中,wage 为被解释变量,表示小时工资,单位为元;为被解释变量,表示小时工资,单位为元;edu为解释变量,表示受教育年限,即个人接受教育的年数,单为解释变量,表示受教育年限,即个人接受教育的年数,单位为年;位为年;u为随机误差项。假定模型为随机误差项。假定模型(3.1)满足简单回归模型的满足简单回归模型的全部全部5条基本假定,这样条基本假定,这样 的的OLS估计量估计量 将是最佳线性将是最佳线性无偏估计量。请根据无偏估计量。请根据表表S-2中给出的数据采用中给出的数据采用Stata软件完成上软件完成上述模型的估计等工作。述模型的估计等工作。01,(, 3.1)wageedu u01,01,三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例1、打开数据文件。、打开数据文件。直接双击直接双击“工资方程工资方程1.dta”文件;或者点文件;或者点击击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择“工资方程工资方程1.dta”即可;或者先复制即可;或者先复制Excel表表S-2中的数据,再点击中的数据,再点击Stata窗口工具栏右起第窗口工具栏右起第4个个Data Editor键,将数据粘贴到打开的键,将数据粘贴到打开的数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左起第二个起第二个Save键保存数据,保存时需要给数据文件命名。键保存数据,保存时需要给数据文件命名。2、给出数据的简要描述。、给出数据的简要描述。使用使用describe命令,简写为:命令,简写为:des 得到以下运行结果;得到以下运行结果;三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例结果显示结果显示“工资方程工资方程1.dta”数据文件包含数据文件包含1225个样本和个样本和11个个变变量;量;11个变量的定义及说明见第个变量的定义及说明见第3列。列。 more w wa ag ge e float %9.0g h ho ou ur rl ly y w wa ag ge em mi ig gr ra an nt t float %9.0g 1 1: :m mi ig gr ra an nt t w wo or rk ke er r; ; 0 0: :l lo oc ca al l w wo or rk ke er rh he ea al lt th h float %9.0g 1 1: :b ba ad d; ; 2 2: :g go oo od d; ; 3 3: :v ve er ry y g go oo od de ex xp ps sq q float %9.0g e ex xp p 2 2 a ag ge e- -e ed du u- -6 6e ex xp p float %9.0g y ye ea ar rs s o of f w wo or rk k e ex xp pe er ri ie en nc ce e: :e ed du u float %9.0g y ye ea ar rs s o of f e ed du uc ca at ti io on n 4 4: :c co ol ll le eg ge ee ed du ul le ev ve el l float %9.0g 1 1: :p pr ri im ma ar ry y; ; 2 2: :j ju un ni io or r; ; 3 3: :s se en ni io or r; ;m ma ar rr ri ie ed d float %9.0g 1 1: :m ma ar rr ri ie ed d; ; 0 0: :u un nm ma ar rr ri ie ed df fe em ma al le e float %9.0g 1 1: :f fe em ma al le e; ; 0 0: :m ma al le ea ag ge e float %9.0g a ag ge e i in n y ye ea ar rs s variable name type format label variable label storage display value size: 5 58 8, ,8 80 00 0 (99.4% of memory free) vars: 1 11 1 2 25 5 A Au ug g 2 20 00 09 9 0 08 8: :3 38 8 obs: 1 1, ,2 22 25 5 1 10 06 64 49 92 28 89 9 s st ta at ta a1 10 0 1 1. .d dt ta aContains data from D D: : 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例3、变量的描述性统计分析。、变量的描述性统计分析。对于定量变量,使用对于定量变量,使用summarize命令:命令:su age edu exp expsq wage lnwage,得到以下运行结得到以下运行结果,保存该运行结果;果,保存该运行结果;第第1列:变量名;列:变量名; 第第2列:观测数;列:观测数;第第3列:均值;列:均值; 第第4列:标准差;列:标准差;第第5列:最小值;列:最小值; 第第6列:最大值。列:最大值。 lnwage 1 12 22 25 5 1 1. .8 80 08 83 35 52 2 . .5 53 30 07 73 39 99 9 . .2 22 23 31 14 43 35 5 3 3. .6 62 24 43 34 41 1 wage 1 12 22 25 5 7 7. .1 12 25 55 5 4 4. .7 76 66 68 82 28 8 1 1. .2 25 5 3 37 7. .5 5 expsq 1 12 22 25 5 6 61 13 3. .9 97 77 76 6 5 54 48 8. .3 30 07 72 2 0 0 2 25 50 00 0 exp 1 12 22 25 5 2 21 1. .8 80 04 49 9 1 11 1. .7 77 74 44 43 3 0 0 5 50 0 edu 1 12 22 25 5 8 8. .9 99 92 26 65 53 3 2 2. .7 71 19 90 06 68 8 0 0 1 19 9 age 1 12 22 25 5 3 36 6. .7 79 97 75 55 5 1 10 0. .6 67 76 63 31 1 1 16 6 6 60 0 Variable Obs Mean Std. Dev. Min Max三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例4、wage对对edu的的OLS回归。回归。使用使用regress命令:命令:reg wage edu,得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;(1) 表下方区域为基本的回归结果。第表下方区域为基本的回归结果。第1列依次为被解释变量列依次为被解释变量wage,解释,解释变量变量edu,截距项,截距项constant;第;第2列回归系数的列回归系数的OLS估计值;第估计值;第3列回归系列回归系数的标准误;第数的标准误;第4列回归系数的列回归系数的 t 统计量值;统计量值;写出样本回归方程为:写出样本回归方程为:即如果受教育年限增加即如果受教育年限增加1年,平均来说小时工资会增加年,平均来说小时工资会增加0.39元。元。 _cons 3 3. .5 58 84 46 69 95 5 . .4 45 58 89 90 08 88 8 7 7. .8 81 1 0 0. .0 00 00 0 2 2. .6 68 84 43 35 59 9 4 4. .4 48 85 50 03 31 1 edu . .3 39 93 37 74 44 42 2 . .0 04 48 88 84 49 91 1 8 8. .0 06 6 0 0. .0 00 00 0 . .2 29 97 79 90 06 69 9 . .4 48 89 95 58 81 15 5 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 27 78 81 12 2. .5 51 19 91 1 1 12 22 24 4 2 22 2. .7 72 22 26 64 46 63 3 Root MSE = 4 4. .6 64 46 69 9 Adj R-squared = 0 0. .0 04 49 97 7 Residual 2 26 64 40 09 9. .5 54 44 45 5 1 12 22 23 3 2 21 1. .5 59 94 40 06 67 75 5 R-squared = 0 0. .0 05 50 04 4 Model 1 14 40 02 2. .9 97 74 46 61 1 1 1 1 14 40 02 2. .9 97 74 46 61 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 6 64 4. .9 97 7 Source SS df MS Number of obs = 1 12 22 25 53.58470.3937 (0.4589) (0.0488)wageedu三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例(2) 表左上方区域为方差分析表。第表左上方区域为方差分析表。第2列从上到下依次为回归平方和列从上到下依次为回归平方和(SSE)、残差平方和残差平方和(SSR)和总离差平方和和总离差平方和(SST);第;第3列为自由度,分别为列为自由度,分别为k=1,n-k-1=1225-1-1=1223,n-1=1225-1=1224;第第4列为均方和列为均方和(MSS),由各项,由各项平方和除以相应的自由度得到。平方和除以相应的自由度得到。(3) 表右上方区域给出了样本数表右上方区域给出了样本数(Number of obs)、判定系数、判定系数(R-squared)、调整的判定系数调整的判定系数(Adj R-squared)、F统计量的值、回归方程标准误或均方统计量的值、回归方程标准误或均方根误根误(Root MSE, 或或 S.E.) 以及其他一些统计量的信息。以及其他一些统计量的信息。u上述回归分析的菜单操作实现:上述回归分析的菜单操作实现:StatisticsLinear models and relatedLinear regression弹出对话框,在弹出对话框,在Dependent Variable选项框中选择或键选项框中选择或键入入wage,在,在Independent Variables选项框中选择或键入选项框中选择或键入edu点击点击OK即可即可 _cons 3 3. .5 58 84 46 69 95 5 . .4 45 58 89 90 08 88 8 7 7. .8 81 1 0 0. .0 00 00 0 2 2. .6 68 84 43 35 59 9 4 4. .4 48 85 50 03 31 1 edu . .3 39 93 37 74 44 42 2 . .0 04 48 88 84 49 91 1 8 8. .0 06 6 0 0. .0 00 00 0 . .2 29 97 79 90 06 69 9 . .4 48 89 95 58 81 15 5 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 27 78 81 12 2. .5 51 19 91 1 1 12 22 24 4 2 22 2. .7 72 22 26 64 46 63 3 Root MSE = 4 4. .6 64 46 69 9 Adj R-squared = 0 0. .0 04 49 97 7 Residual 2 26 64 40 09 9. .5 54 44 45 5 1 12 22 23 3 2 21 1. .5 59 94 40 06 67 75 5 R-squared = 0 0. .0 05 50 04 4 Model 1 14 40 02 2. .9 97 74 46 61 1 1 1 1 14 40 02 2. .9 97 74 46 61 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 6 64 4. .9 97 7 Source SS df MS Number of obs = 1 12 22 25 5三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例5、生成新变量、生成新变量 z 为上一个回归的拟合值,生成新变量为上一个回归的拟合值,生成新变量 u 为为上一个回归的残差;上一个回归的残差;然后根据然后根据 u 对数据进行从小到大的排对数据进行从小到大的排序,并列出序,并列出 u 最小的最小的5个观测。个观测。命令如下:命令如下:predict z (生成拟合值生成拟合值)predict u, residual ( 生成残差生成残差 )sort u (根据根据 u 对数据从小到大排序对数据从小到大排序)list wage z u in 1/5 (列出列出 u 最小的最小的5个观测值以及对应的实个观测值以及对应的实际样本观测值和拟合值际样本观测值和拟合值)即对于观测即对于观测 1,小时工资的实际观测值,小时工资的实际观测值(wage)为为2.46,拟合值,拟合值(z)为为9.10,残差,残差(u)为为-6.64。 5. 1 1. .2 25 5 9 9 7 7. .1 12 28 83 39 93 3 - -5 5. .8 87 78 83 39 93 3 4. 2 2. .3 38 80 09 95 52 2 1 12 2 8 8. .3 30 09 96 62 26 6 - -5 5. .9 92 28 86 67 73 3 3. 3 3 1 14 4 9 9. .0 09 97 71 11 15 5 - -6 6. .0 09 97 71 11 14 4 2. 1 1. .7 78 85 57 71 14 4 1 11 1 7 7. .9 91 15 58 88 82 2 - -6 6. .1 13 30 01 16 67 7 1. 2 2. .4 45 55 53 35 57 7 1 14 4 9 9. .0 09 97 71 11 15 5 - -6 6. .6 64 41 17 75 57 7 w wa ag ge e e ed du u z z u u 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例6、画出以、画出以wage为纵轴,以为纵轴,以edu为横轴的散点图,并加入样本为横轴的散点图,并加入样本回归线。回归线。命令如下:命令如下:graph twoway lfit wage edu | scatter wage edu得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;01020304005101520years of educationFitted valueshourly wage三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例7、wage对对edu的的OLS回归,只使用年龄小于或等于回归,只使用年龄小于或等于30岁的样岁的样本。本。命令如下:命令如下:reg wage edu if age|t| 95% Conf. Interval Total 7 71 15 56 6. .3 34 43 37 78 8 3 36 64 4 1 19 9. .6 66 60 02 28 85 51 1 Root MSE = 4 4. .3 32 23 39 9 Adj R-squared = 0 0. .0 04 49 90 0 Residual 6 67 78 86 6. .6 63 30 09 95 5 3 36 63 3 1 18 8. .6 69 95 59 95 53 3 R-squared = 0 0. .0 05 51 17 7 Model 3 36 69 9. .7 71 12 28 82 27 7 1 1 3 36 69 9. .7 71 12 28 82 27 7 Prob F = 0 0. .0 00 00 00 0 F( 1, 363) = 1 19 9. .7 78 8 Source SS df MS Number of obs = 3 36 65 52.76070.4146 (0.9688) (0.0932)wageedu三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例8、 wage对对edu的的OLS回归,不包含截距项,即过原点回归。回归,不包含截距项,即过原点回归。命令如下:命令如下:reg wage edu, noconstant得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果; edu . .7 75 59 90 00 02 26 6 . .0 01 14 44 47 75 52 2 5 52 2. .4 43 3 0 0. .0 00 00 0 . .7 73 30 06 60 03 37 7 . .7 78 87 74 40 01 16 6 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 9 90 00 00 09 9. .1 14 42 29 9 1 12 22 25 5 7 73 3. .4 47 76 68 85 51 14 4 Root MSE = 4 4. .7 75 59 95 5 Adj R-squared = 0 0. .6 69 91 17 7 Residual 2 27 77 72 27 7. .1 15 51 19 9 1 12 22 24 4 2 22 2. .6 65 52 29 90 01 19 9 R-squared = 0 0. .6 69 92 20 0 Model 6 62 22 28 81 1. .9 99 91 11 1 1 1 6 62 22 28 81 1. .9 99 91 11 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1224) = 2 27 74 49 9. .4 40 0 Source SS df MS Number of obs = 1 12 22 25 5三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例9、取半对数模型。、取半对数模型。模型模型 (3.1) 假定增加假定增加 1 年受教育年限带来年受教育年限带来相同数量的工资增长;但美国经济学家明瑟相同数量的工资增长;但美国经济学家明瑟(J. Mincer)等人等人的研究表明,的研究表明,更合理的情况是增加更合理的情况是增加 1 年受教育年限导致相同年受教育年限导致相同百分比的工资增长百分比的工资增长。这就需要使用。这就需要使用半对数模型半对数模型(对数对数-水平模水平模型型),即:,即:其中其中lnwage是小时工资的自然对数;是小时工资的自然对数;斜率系数的经济含义是:斜率系数的经济含义是:增加增加 1 年受教育年限导致收入增长年受教育年限导致收入增长 ,该百分比值一,该百分比值一般称为般称为教育收益率或教育回报率教育收益率或教育回报率(the rate of return to education)u做做lnwage对对edu的回归,命令如下:的回归,命令如下:reg lnwage edu 得到以下运行结果,保存该运行结果得到以下运行结果,保存该运行结果(见下页见下页);01,ln(, 3.2)wageeduu1100%三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例写出样本回归方程为:写出样本回归方程为:结果表明结果表明教育收益率教育收益率的估计值为的估计值为5.03%,即平均而言,增加,即平均而言,增加 1 年受教育年限使得工资增长年受教育年限使得工资增长5.03% 。 _cons 1 1. .3 35 55 56 61 19 9 . .0 05 50 06 66 60 05 5 2 26 6. .7 76 6 0 0. .0 00 00 0 1 1. .2 25 56 62 22 28 8 1 1. .4 45 55 50 01 1 edu . .0 05 50 03 34 44 48 8 . .0 00 05 53 39 92 26 6 9 9. .3 34 4 0 0. .0 00 00 0 . .0 03 39 97 76 65 5 . .0 06 60 09 92 24 46 6 lnwage Coef. Std. Err. t P|t| 95% Conf. Interval Total 3 34 44 4. .7 78 82 22 21 1 1 12 22 24 4 . .2 28 81 16 68 84 48 81 12 2 Root MSE = . .5 51 12 29 99 9 Adj R-squared = 0 0. .0 06 65 58 8 Residual 3 32 21 1. .8 84 45 55 55 58 8 1 12 22 23 3 . .2 26 63 31 16 60 07 71 18 8 R-squared = 0 0. .0 06 66 65 5 Model 2 22 2. .9 93 36 66 65 52 21 1 1 1 2 22 2. .9 93 36 66 65 52 21 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 8 87 7. .1 16 6 Source SS df MS Number of obs = 1 12 22 25 5ln1.35560.0503 (0.0507) (0.0054)wageedu三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例10、最后可建立、最后可建立 do 文件把前面所执行过的命令保存下来。文件把前面所执行过的命令保存下来。在在do文件的编辑窗口中(点击文件的编辑窗口中(点击Stata窗口工具栏右起第窗口工具栏右起第5个个New Do-file Editor键即打开键即打开Stata的的do文件编辑窗口)键入如文件编辑窗口)键入如下命令和注释,并保存为下命令和注释,并保存为“工资方程工资方程1.do”文件。该文件的内文件。该文件的内容为:容为:use “D:讲课资料周蓓的上课资料数据【重要】【计量经济学软件应用课件】10649289stata10工资方程1.dta“, clear/打开数据文件des/数据的简要描述su age edu exp expsq wage lnwage/定量变量的描述性统计reg wage edu/简单线性模型的OLS估计graph twoway lfit wage edu | scatter wage edu/作图reg wage edu if age|t| 95% Conf. Interval Total 4 44 48 81 17 7. .1 18 80 05 5 4 40 07 7 1 11 10 0. .1 11 15 59 92 23 3 Root MSE = 1 10 0. .3 33 32 2 Adj R-squared = 0 0. .0 03 30 06 6 Residual 4 43 33 33 39 9. .9 98 83 38 8 4 40 06 6 1 10 06 6. .7 74 48 87 72 29 9 R-squared = 0 0. .0 03 33 30 0 Model 1 14 47 77 7. .1 19 96 66 67 7 1 1 1 14 47 77 7. .1 19 96 66 67 7 Prob F = 0 0. .0 00 00 02 2 F( 1, 406) = 1 13 3. .8 84 4 Source SS df MS Number of obs = 4 40 08 8. reg math expend三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例u水平水平-对数模型的命令及运行结果如下:对数模型的命令及运行结果如下:reg math lnexpend估计结果:估计结果:即学校生均支出增加即学校生均支出增加1%,使得学生数学平均成绩将提高,使得学生数学平均成绩将提高0.11分;分; _cons 7 7. .7 77 79 97 79 99 9 4 4. .6 66 62 26 66 68 8 1 1. .6 67 7 0 0. .0 09 96 6 - -1 1. .3 38 86 61 18 85 5 1 16 6. .9 94 45 57 78 8 lnexpend 1 11 1. .1 16 64 44 4 3 3. .1 16 69 90 01 11 1 3 3. .5 52 2 0 0. .0 00 00 0 4 4. .9 93 34 46 68 85 5 1 17 7. .3 39 94 41 12 2 math Coef. Std. Err. t P|t| 95% Conf. Interval Total 4 44 48 81 17 7. .1 18 80 05 5 4 40 07 7 1 11 10 0. .1 11 15 59 92 23 3 Root MSE = 1 10 0. .3 35 5 Adj R-squared = 0 0. .0 02 27 73 3 Residual 4 43 34 48 87 7. .7 75 53 34 4 4 40 06 6 1 10 07 7. .1 11 12 26 69 93 3 R-squared = 0 0. .0 02 29 97 7 Model 1 13 32 29 9. .4 42 27 70 07 7 1 1 1 13 32 29 9. .4 42 27 70 07 7 Prob F = 0 0. .0 00 00 05 5 F( 1, 406) = 1 12 2. .4 41 1 Source SS df MS Number of obs = 4 40 08 8. reg math lnexpend7.78 11.16lnmathexpend三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例u对数对数-水平模型的命令及运行结果如下:水平模型的命令及运行结果如下:reg lnmath expend估计结果:估计结果:即学校生均支出增加即学校生均支出增加1千元,使得学生数学平均成绩将提高千元,使得学生数学平均成绩将提高7%; _cons 2 2. .7 76 61 11 16 61 1 . .1 14 40 09 94 44 49 9 1 19 9. .5 59 9 0 0. .0 00 00 0 2 2. .4 48 84 40 08 88 8 3 3. .0 03 38 82 23 33 3 expend . .0 07 71 18 83 34 49 9 . .0 03 31 17 71 11 12 2 2 2. .2 27 7 0 0. .0 02 24 4 . .0 00 09 94 49 96 62 2 . .1 13 34 41 17 73 36 6 lnmath Coef. Std. Err. t P|t| 95% Conf. Interval Total 1 10 01 1. .2 27 71 18 88 84 4 4 40 07 7 . .2 24 48 88 82 25 52 26 67 7 Root MSE = . .4 49 96 63 31 1 Adj R-squared = 0 0. .0 01 10 00 0 Residual 1 10 00 0. .0 00 07 78 86 66 6 4 40 06 6 . .2 24 46 63 32 24 47 79 92 2 R-squared = 0 0. .0 01 12 25 5 Model 1 1. .2 26 64 40 01 18 83 3 1 1 1 1. .2 26 64 40 01 18 83 3 Prob F = 0 0. .0 02 24 40 0 F( 1, 406) = 5 5. .1 13 3 Source SS df MS Number of obs = 4 40 08 8. reg lnmath expendln2.760.07mathexpend三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例u对数对数-对数模型的命令及运行结果如下:对数模型的命令及运行结果如下:reg lnmath lnexpend估计结果:估计结果:即学校生均支出增加即学校生均支出增加1%,使得学生数学平均成绩将提高,使得学生数学平均成绩将提高0.32%; _cons 2 2. .6 61 13 36 66 63 3 . .2 22 23 38 82 21 16 6 1 11 1. .6 68 8 0 0. .0 00 00 0 2 2. .1 17 73 36 66 69 9 3 3. .0 05 53 36 65 57 7 lnexpend . .3 31 15 58 83 38 83 3 . .1 15 52 21 12 21 17 7 2 2. .0 08 8 0 0. .0 03 39 9 . .0 01 16 67 79 93 38 8 . .6 61 14 48 88 82 29 9 lnmath Coef. Std. Err. t P|t| 95% Conf. Interval Total 1 10 01 1. .2 27 71 18 88 84 4 4 40 07 7 . .2 24 48 88 82 25 52 26 67 7 Root MSE = . .4 49 96 68 81 1 Adj R-squared = 0 0. .0 00 08 81 1 Residual 1 10 00 0. .2 20 07 79 92 29 9 4 40 06 6 . .2 24 46 68 81 17 75 55 59 9 R-squared = 0 0. .0 01 10 05 5 Model 1 1. .0 06 63 39 95 55 5 1 1 1 1. .0 06 63 39 95 55 5 Prob F = 0 0. .0 03 38 85 5 F( 1, 406) = 4 4. .3 31 1 Source SS df MS Number of obs = 4 40 08 8. reg lnmath lnexpendln2.61 0.32lnmathexpend四、多元回归分析的四、多元回归分析的Stata基本命令基本命令u对于多元线性回归模型:对于多元线性回归模型:regress y x1 x2xk 以以 y 为被解释变量,为被解释变量, x1, x2,xk 为解释变量进行普通最为解释变量进行普通最小二乘小二乘(OLS)回归。回归。regress命令可简写为命令可简写为reg;regress y x1 x2xk, noconstanty对对x1, x2,xk的回归,不包含截距项,即过原点回归;的回归,不包含截距项,即过原点回归;test x1 x2 x3根据最近的回归进行根据最近的回归进行 F 检验,原假设为:检验,原假设为: test 根据最近的回归进行根据最近的回归进行F检验,原假设为:检验,原假设为:01 122kkyxxxu1230,0,011()x22()x33()x112233,五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例实验实验 1 多元回归分析:工资方程多元回归分析:工资方程 利用数据文件利用数据文件“工资方程工资方程1.dta”建立工资方程考察影响小时建立工资方程考察影响小时工资工资(wage)的因素,重点关注受教育年限的因素,重点关注受教育年限(edu)的系数,即教的系数,即教育收益率育