Stata软件之回归讲解ppt课件.ppt
《Stata软件之回归讲解ppt课件.ppt》由会员分享,可在线阅读,更多相关《Stata软件之回归讲解ppt课件.ppt(39页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计量经济软件应用计量经济软件应用Stata软件实验之一元、软件实验之一元、多元回归分析多元回归分析内容概要内容概要一、实验目的一、实验目的二、简单回归分析的二、简单回归分析的Stata基本命令基本命令三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例四、多元回归分析的四、多元回归分析的Stata基本命令基本命令五、多元回归分析的五、多元回归分析的Stata软件操作实例软件操作实例一、实验目的:一、实验目的: 掌握运用掌握运用Stata软件进行简单回归分析以及软件进行简单回归分析以及多元回归分析的操作方法和步骤,并能看懂多元回归分析的操作方法和步骤,并能看懂Stata软件运行
2、结果。软件运行结果。 二、简单回归分析的二、简单回归分析的Stata基本命令基本命令u简单线性回归模型简单线性回归模型 ( simple linear regression model ) 指指只有一个解释变量的回归模型。如:只有一个解释变量的回归模型。如:其中,其中,y 为被解释变量,为被解释变量,x 为解释变量,为解释变量,u 为随机误差项,为随机误差项,表示除表示除 x 之外影响之外影响 y 的因素;的因素; 称为斜率参数或斜率系称为斜率参数或斜率系数,数, 称为截距参数或截距系数,也称为截距项或常数项。称为截距参数或截距系数,也称为截距项或常数项。简单线性回归模型的一种特殊情况:简单线
3、性回归模型的一种特殊情况:即假定截距系数即假定截距系数 时,该模型被称为过原点回归;过时,该模型被称为过原点回归;过原点回归在实际中有一定的应用,但除非有非常明确的理原点回归在实际中有一定的应用,但除非有非常明确的理论分析表明论分析表明 ,否则不宜轻易使用过原点回归模型。,否则不宜轻易使用过原点回归模型。01yxu101yxu0000二、简单回归分析的二、简单回归分析的Stata基本命令基本命令regress y x 以以 y 为被解释变量,为被解释变量,x 为解释变量进行普通最小二乘为解释变量进行普通最小二乘(OLS)回归。回归。regress命令可简写为横线上方的三个字命令可简写为横线上方
4、的三个字母母reg。regress y x, noconstanty 对对 x 的回归,不包含截距项的回归,不包含截距项 (constant),即过原点回归。,即过原点回归。predict z 根据最近的回归生成一个新变量根据最近的回归生成一个新变量 z,其值等于每一个观测,其值等于每一个观测的拟合值(即的拟合值(即 )。)。predict u, residual根据最近的回归生成一个根据最近的回归生成一个新变量新变量 u,其值等于每一个观测,其值等于每一个观测的残差(即的残差(即 )。)。iyiiieyy三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例实验实验 1 简单
5、回归分析:教育对工资的影响简单回归分析:教育对工资的影响 劳动经济学中经常讨论的一个问题是劳动者工资的决定。不劳动经济学中经常讨论的一个问题是劳动者工资的决定。不难想象,决定工资的因素有很多,例如能力、性别、工作经验、难想象,决定工资的因素有很多,例如能力、性别、工作经验、教育水平、行业、职业等。在这里仅考虑其中一种因素:教育教育水平、行业、职业等。在这里仅考虑其中一种因素:教育水平,建立如下计量模型:水平,建立如下计量模型:其中,其中,wage 为被解释变量,表示小时工资,单位为元;为被解释变量,表示小时工资,单位为元;edu为解释变量,表示受教育年限,即个人接受教育的年数,单为解释变量,表
6、示受教育年限,即个人接受教育的年数,单位为年;位为年;u为随机误差项。假定模型为随机误差项。假定模型(3.1)满足简单回归模型的满足简单回归模型的全部全部5条基本假定,这样条基本假定,这样 的的OLS估计量估计量 将是最佳线性将是最佳线性无偏估计量。请根据无偏估计量。请根据表表S-2中给出的数据采用中给出的数据采用Stata软件完成上软件完成上述模型的估计等工作。述模型的估计等工作。01,(, 3.1)wageedu u01,01,三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例1、打开数据文件。、打开数据文件。直接双击直接双击“工资方程工资方程1.dta”文件;或者点文
7、件;或者点击击Stata窗口工具栏最左侧的窗口工具栏最左侧的Open键,然后选择键,然后选择“工资方程工资方程1.dta”即可;或者先复制即可;或者先复制Excel表表S-2中的数据,再点击中的数据,再点击Stata窗口工具栏右起第窗口工具栏右起第4个个Data Editor键,将数据粘贴到打开的键,将数据粘贴到打开的数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左数据编辑窗口中,然后关闭该数据编辑窗口,点击工具栏左起第二个起第二个Save键保存数据,保存时需要给数据文件命名。键保存数据,保存时需要给数据文件命名。2、给出数据的简要描述。、给出数据的简要描述。使用使用describe命令,
8、简写为:命令,简写为:des 得到以下运行结果;得到以下运行结果;三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例结果显示结果显示“工资方程工资方程1.dta”数据文件包含数据文件包含1225个样本和个样本和11个个变变量;量;11个变量的定义及说明见第个变量的定义及说明见第3列。列。 more w wa ag ge e float %9.0g h ho ou ur rl ly y w wa ag ge em mi ig gr ra an nt t float %9.0g 1 1: :m mi ig gr ra an nt t w wo or rk ke er r; ;
9、0 0: :l lo oc ca al l w wo or rk ke er rh he ea al lt th h float %9.0g 1 1: :b ba ad d; ; 2 2: :g go oo od d; ; 3 3: :v ve er ry y g go oo od de ex xp ps sq q float %9.0g e ex xp p 2 2 a ag ge e- -e ed du u- -6 6e ex xp p float %9.0g y ye ea ar rs s o of f w wo or rk k e ex xp pe er ri ie en nc ce e
10、: :e ed du u float %9.0g y ye ea ar rs s o of f e ed du uc ca at ti io on n 4 4: :c co ol ll le eg ge ee ed du ul le ev ve el l float %9.0g 1 1: :p pr ri im ma ar ry y; ; 2 2: :j ju un ni io or r; ; 3 3: :s se en ni io or r; ;m ma ar rr ri ie ed d float %9.0g 1 1: :m ma ar rr ri ie ed d; ; 0 0: :u u
11、n nm ma ar rr ri ie ed df fe em ma al le e float %9.0g 1 1: :f fe em ma al le e; ; 0 0: :m ma al le ea ag ge e float %9.0g a ag ge e i in n y ye ea ar rs s variable name type format label variable label storage display value size: 5 58 8, ,8 80 00 0 (99.4% of memory free) vars: 1 11 1 2 25 5 A Au ug
12、 g 2 20 00 09 9 0 08 8: :3 38 8 obs: 1 1, ,2 22 25 5 1 10 06 64 49 92 28 89 9 s st ta at ta a1 10 0 1 1. .d dt ta aContains data from D D: : 三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例3、变量的描述性统计分析。、变量的描述性统计分析。对于定量变量,使用对于定量变量,使用summarize命令:命令:su age edu exp expsq wage lnwage,得到以下运行结得到以下运行结果,保存该运行结果;果,保存该运行结果
13、;第第1列:变量名;列:变量名; 第第2列:观测数;列:观测数;第第3列:均值;列:均值; 第第4列:标准差;列:标准差;第第5列:最小值;列:最小值; 第第6列:最大值。列:最大值。 lnwage 1 12 22 25 5 1 1. .8 80 08 83 35 52 2 . .5 53 30 07 73 39 99 9 . .2 22 23 31 14 43 35 5 3 3. .6 62 24 43 34 41 1 wage 1 12 22 25 5 7 7. .1 12 25 55 5 4 4. .7 76 66 68 82 28 8 1 1. .2 25 5 3 37 7. .5 5
14、 expsq 1 12 22 25 5 6 61 13 3. .9 97 77 76 6 5 54 48 8. .3 30 07 72 2 0 0 2 25 50 00 0 exp 1 12 22 25 5 2 21 1. .8 80 04 49 9 1 11 1. .7 77 74 44 43 3 0 0 5 50 0 edu 1 12 22 25 5 8 8. .9 99 92 26 65 53 3 2 2. .7 71 19 90 06 68 8 0 0 1 19 9 age 1 12 22 25 5 3 36 6. .7 79 97 75 55 5 1 10 0. .6 67 76 6
15、3 31 1 1 16 6 6 60 0 Variable Obs Mean Std. Dev. Min Max三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例4、wage对对edu的的OLS回归。回归。使用使用regress命令:命令:reg wage edu,得到以下运行结果,保存该运行结果;得到以下运行结果,保存该运行结果;(1) 表下方区域为基本的回归结果。第表下方区域为基本的回归结果。第1列依次为被解释变量列依次为被解释变量wage,解释,解释变量变量edu,截距项,截距项constant;第;第2列回归系数的列回归系数的OLS估计值;第估计值;第3列回归系列回
16、归系数的标准误;第数的标准误;第4列回归系数的列回归系数的 t 统计量值;统计量值;写出样本回归方程为:写出样本回归方程为:即如果受教育年限增加即如果受教育年限增加1年,平均来说小时工资会增加年,平均来说小时工资会增加0.39元。元。 _cons 3 3. .5 58 84 46 69 95 5 . .4 45 58 89 90 08 88 8 7 7. .8 81 1 0 0. .0 00 00 0 2 2. .6 68 84 43 35 59 9 4 4. .4 48 85 50 03 31 1 edu . .3 39 93 37 74 44 42 2 . .0 04 48 88 84 4
17、9 91 1 8 8. .0 06 6 0 0. .0 00 00 0 . .2 29 97 79 90 06 69 9 . .4 48 89 95 58 81 15 5 wage Coef. Std. Err. t P|t| 95% Conf. Interval Total 2 27 78 81 12 2. .5 51 19 91 1 1 12 22 24 4 2 22 2. .7 72 22 26 64 46 63 3 Root MSE = 4 4. .6 64 46 69 9 Adj R-squared = 0 0. .0 04 49 97 7 Residual 2 26 64 40 0
18、9 9. .5 54 44 45 5 1 12 22 23 3 2 21 1. .5 59 94 40 06 67 75 5 R-squared = 0 0. .0 05 50 04 4 Model 1 14 40 02 2. .9 97 74 46 61 1 1 1 1 14 40 02 2. .9 97 74 46 61 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 6 64 4. .9 97 7 Source SS df MS Number of obs = 1 12 22 25 53.58470.3937 (0.4589) (0.0488)wa
19、geedu三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例(2) 表左上方区域为方差分析表。第表左上方区域为方差分析表。第2列从上到下依次为回归平方和列从上到下依次为回归平方和(SSE)、残差平方和残差平方和(SSR)和总离差平方和和总离差平方和(SST);第;第3列为自由度,分别为列为自由度,分别为k=1,n-k-1=1225-1-1=1223,n-1=1225-1=1224;第第4列为均方和列为均方和(MSS),由各项,由各项平方和除以相应的自由度得到。平方和除以相应的自由度得到。(3) 表右上方区域给出了样本数表右上方区域给出了样本数(Number of obs)、
20、判定系数、判定系数(R-squared)、调整的判定系数调整的判定系数(Adj R-squared)、F统计量的值、回归方程标准误或均方统计量的值、回归方程标准误或均方根误根误(Root MSE, 或或 S.E.) 以及其他一些统计量的信息。以及其他一些统计量的信息。u上述回归分析的菜单操作实现:上述回归分析的菜单操作实现:StatisticsLinear models and relatedLinear regression弹出对话框,在弹出对话框,在Dependent Variable选项框中选择或键选项框中选择或键入入wage,在,在Independent Variables选项框中选择
21、或键入选项框中选择或键入edu点击点击OK即可即可 _cons 3 3. .5 58 84 46 69 95 5 . .4 45 58 89 90 08 88 8 7 7. .8 81 1 0 0. .0 00 00 0 2 2. .6 68 84 43 35 59 9 4 4. .4 48 85 50 03 31 1 edu . .3 39 93 37 74 44 42 2 . .0 04 48 88 84 49 91 1 8 8. .0 06 6 0 0. .0 00 00 0 . .2 29 97 79 90 06 69 9 . .4 48 89 95 58 81 15 5 wage C
22、oef. Std. Err. t P|t| 95% Conf. Interval Total 2 27 78 81 12 2. .5 51 19 91 1 1 12 22 24 4 2 22 2. .7 72 22 26 64 46 63 3 Root MSE = 4 4. .6 64 46 69 9 Adj R-squared = 0 0. .0 04 49 97 7 Residual 2 26 64 40 09 9. .5 54 44 45 5 1 12 22 23 3 2 21 1. .5 59 94 40 06 67 75 5 R-squared = 0 0. .0 05 50 04
23、4 Model 1 14 40 02 2. .9 97 74 46 61 1 1 1 1 14 40 02 2. .9 97 74 46 61 1 Prob F = 0 0. .0 00 00 00 0 F( 1, 1223) = 6 64 4. .9 97 7 Source SS df MS Number of obs = 1 12 22 25 5三、简单回归分析的三、简单回归分析的Stata软件操作实例软件操作实例5、生成新变量、生成新变量 z 为上一个回归的拟合值,生成新变量为上一个回归的拟合值,生成新变量 u 为为上一个回归的残差;上一个回归的残差;然后根据然后根据 u 对数据进行从小
24、到大的排对数据进行从小到大的排序,并列出序,并列出 u 最小的最小的5个观测。个观测。命令如下:命令如下:predict z (生成拟合值生成拟合值)predict u, residual ( 生成残差生成残差 )sort u (根据根据 u 对数据从小到大排序对数据从小到大排序)list wage z u in 1/5 (列出列出 u 最小的最小的5个观测值以及对应的实个观测值以及对应的实际样本观测值和拟合值际样本观测值和拟合值)即对于观测即对于观测 1,小时工资的实际观测值,小时工资的实际观测值(wage)为为2.46,拟合值,拟合值(z)为为9.10,残差,残差(u)为为-6.64。 5
25、. 1 1. .2 25 5 9 9 7 7. .1 12 28 83 39 93 3 - -5 5. .8 87 78 83 39 93 3 4. 2 2. .3 38 80 09 95 52 2 1 12 2 8 8. .3 30 09 96 62 26 6 - -5 5. .9 92 28 86 67 73 3 3. 3 3 1 14 4 9 9. .0 09 97 71 11 15 5 - -6 6. .0 09 97 71 11 14 4 2. 1 1. .7 78 85 57 71 14 4 1 11 1 7 7. .9 91 15 58 88 82 2 - -6 6. .1 13
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Stata 软件 回归 讲解 ppt 课件
限制150内