统计分析与方法回归分析虚拟变量回归分析.pptx
回归分析的类型回归分析的类型因变量与自变量都是定量变量的回归分析因变量与自变量都是定量变量的回归分析即我们常做的回归分析即我们常做的回归分析因变量是定量变量,自变量中有定性变量的回归分析因变量是定量变量,自变量中有定性变量的回归分析即含有虚拟变量的回归分析即含有虚拟变量的回归分析因变量是定性变量的回归分析因变量是定性变量的回归分析Logistic回归分析回归分析第1页/共19页自变量中有定性变量自变量中有定性变量的回归分析的回归分析第2页/共19页自变量中有定性变量的回归自变量中有定性变量的回归在社会经济研究中,由许多定性变量,比如地区、民族、性别、文化程度、在社会经济研究中,由许多定性变量,比如地区、民族、性别、文化程度、职业和居住地等。职业和居住地等。可以应用它们的信息进行线性回归。可以应用它们的信息进行线性回归。但是,必须现将定性变量转换为哑变量(也称虚拟变量),然后再将它们引但是,必须现将定性变量转换为哑变量(也称虚拟变量),然后再将它们引入方程,所得的回归结果才有明确的解释意义。入方程,所得的回归结果才有明确的解释意义。第3页/共19页哑变量的建立哑变量的建立对于具有对于具有k类的定性变量来说,设哑变量时,我们只设类的定性变量来说,设哑变量时,我们只设k-1个哑变量。个哑变量。例例7.4 分析某地区妇女的年龄、文化程度、及居住地状况对其曾生子女数的影响。分析某地区妇女的年龄、文化程度、及居住地状况对其曾生子女数的影响。定量变量定量变量:年龄年龄定性变量定性变量:文化程度、地区文化程度、地区Spss数据:妇女生育子女数数据:妇女生育子女数.SAV第4页/共19页哑变量的建立哑变量的建立原变量编码值原变量编码值 哑变量赋值的操作哑变量赋值的操作文化程度文化程度=1(文盲)(文盲)所有所有EDU=0文化程度文化程度=2(小学)(小学)EDU2=1,其他其他EDU=0文化程度文化程度=3(初中)(初中)EDU3=1,其他其他EDU=0文化程度文化程度=4(高中)(高中)EDU4=1,其他其他EDU=0文化程度文化程度=5(大学)(大学)EDU5=1,其他其他EDU=0 地区地区=1(城市)(城市)AREA=1 地区地区=2(农村)(农村)AREA=0第5页/共19页应用应用SPSS建立回归方程建立回归方程回归结果:第6页/共19页SPSSSPSS输出结果输出结果第7页/共19页SPSSSPSS输出结果输出结果第8页/共19页回归方程的解释回归方程的解释当案例在两个分类变量都等于当案例在两个分类变量都等于0时,即文化程度为文盲,居住地在农村时,此种情况称为参照类(其他情况时,即文化程度为文盲,居住地在农村时,此种情况称为参照类(其他情况将于此进行比较),其回归方程为:将于此进行比较),其回归方程为:表明所有参照类妇女年龄每上升表明所有参照类妇女年龄每上升1岁,其曾生子女数的平均变化量为岁,其曾生子女数的平均变化量为0.068个。个。第9页/共19页回归方程的解释回归方程的解释当文化程度为小学,居住地为农村时:当文化程度为小学,居住地为农村时:表明,对于相同年龄和居住地而言,小学文化程度妇女比文盲妇女曾生子女表明,对于相同年龄和居住地而言,小学文化程度妇女比文盲妇女曾生子女数多出数多出b2个部分,即少生个部分,即少生1.13个子女。个子女。第10页/共19页回归方程的解释回归方程的解释当教育程度为文盲、居住地为城市时,当教育程度为文盲、居住地为城市时,表明,对于相同年龄和文化程度而言,城表明,对于相同年龄和文化程度而言,城市妇女比农村妇女曾生子女数多出市妇女比农村妇女曾生子女数多出b6个部个部分,即少生分,即少生0.49个子女。个子女。第11页/共19页回归方程的解释回归方程的解释总之,该回归方程表示总之,该回归方程表示:参照类参照类妇女曾生子女数对年龄的回归直线的妇女曾生子女数对年龄的回归直线的截据为截据为1.41,年龄每上升,年龄每上升1岁,参岁,参照类妇女的照类妇女的平均曾生子女数上升平均曾生子女数上升0.068个。个。城市妇女城市妇女比农村妇女的平均曾生子女数比农村妇女的平均曾生子女数少少0.49个。个。小学、初中、高中和大学小学、初中、高中和大学文化程度妇女的平均曾生子女数分别比文盲妇女文化程度妇女的平均曾生子女数分别比文盲妇女少少1.13、1.31、1.58、1.57个个(在年龄和居住地相同时)。(在年龄和居住地相同时)。第12页/共19页回归方程的解释回归方程的解释文化程度在实际中是一个序次变量。可以用文化程度在实际中是一个序次变量。可以用 表示序次变量个相邻分类的实际效应,如初中的表示序次变量个相邻分类的实际效应,如初中的边际效应为:边际效应为:w类似,可以计算下面的边际效应:类似,可以计算下面的边际效应:w小学小学=-1.13 初中初中=-0.18w高中高中=-0.27 大学大学=0.01第13页/共19页回归分析回归分析利用同样的方法我们可以对例利用同样的方法我们可以对例7.27.2进行回归分析。进行回归分析。例例7.2的数据中的数据中,还有一个自变量是定性变量还有一个自变量是定性变量“收入收入”,以虚拟变量或哑元以虚拟变量或哑元(dummy variable)的方式出现。的方式出现。第14页/共19页SPSSSPSS输出结果输出结果第15页/共19页SPSSSPSS输出结果输出结果第16页/共19页回归分析回归分析回归方程为:回归方程为:第17页/共19页总统任期对工业指数变化的影响案总统任期对工业指数变化的影响案例例现有道琼斯工业平均指数(DJIA)在8任总统的每一个四年任期之内的变化,利用回归分析来确定政党和总统任期对道琼斯工业平均指数变化的影响。所有的数据在数据文件:回归分析-总统对指数的影响案例.SAV。第18页/共19页感谢您的观看!第19页/共19页