第五章回归模型的函数形式与变量类型课件.pptx
第五章回归模型的函数形式与变量类型第1页,此课件共42页哦回归模型的函数形式与变量类型授课:梁海兵第2页,此课件共42页哦参数线性,变量线性现实问题:许多经济现象,参数线性/变量线性回归模型并不适合!参数线性,变量非线性变量非线性第3页,此课件共42页哦主要讲解内容模型的类型与变换;非线性模型的特殊含义与应用;非线性普通最小二乘法及其应用。第4页,此课件共42页哦一、模型的类型与变换至今为止,我们都假设未知的总体回归线是线性的,拟合优度检验及变量显著性检验也都是对函数形式的线性检验。然而,在实际经济活动中,经济变量的关系是复杂的,直接表现为线性关系的情况并不多见。第5页,此课件共42页哦1.变量置换法适用对象:倒数模型、多项式模型一般地,关于解释变量的非线性问题都可以通过变量置换变成线性问题。第6页,此课件共42页哦2.函数变换法适用对象:幂函数模型、指数函数模型如果是关于参数的非线性问题,变量置换法就无能为力了,函数变换是常用的方法第7页,此课件共42页哦3.复杂函数模型与级数展开法 第8页,此课件共42页哦4.无法线性化的模型一般形式为:非线性函数可线性函数第9页,此课件共42页哦二、非线性模型的特殊含义与应用虽然某些非线性模型对于我们估计来说存在一定的困难,但结合实际经济活动,它们往往有着特殊的含义和重要的应用。第10页,此课件共42页哦1.双对数模型:如何度量弹性弹性模型拓展:多元对数线性回归模型第11页,此课件共42页哦一个重要应用:农业技术进步率的测量第12页,此课件共42页哦第13页,此课件共42页哦比较线性和双对数回归模型:究竟选择哪个模型呢?规律之一:根据数据作图,依图趋势建模。为什么不根据为什么不根据r r2 2选择模型?选择模型?1.要比较两个模型r2值,因变量的形式必须相同;2.根据r2定义,线性模型和双对数模型度量意义不同。XY0LnXLnY0第14页,此课件共42页哦在线性模型和对数线性模型之间选择:MWD检验零假设H0:线性模型:Y是X的线性函数。备择假设H1:对数线性模型:LnY是X或LnX的线性函数。第15页,此课件共42页哦MWD检验步骤如下:(1)估计线性模型,得到 Y的估计值(2)估计线性对数模型,得到 LnY 的估计值(3)求(4)做 Y 对 X 和 Z1i 的回归如果根据 t 检验 Z1i 的系数是统计显著的,则拒绝 H0(5)求(6)做 LnY 对 X 或 LogX 和 Z2i 的回归如果 Z2i 的系数是统计显著的,则拒绝 H1第16页,此课件共42页哦2.半对数模型:如何测度增长率增长率增长率模型第17页,此课件共42页哦3.线性-对数模型增长模型解释变量每百分比变动引起因变量的绝对变化量第18页,此课件共42页哦三、非线性普通最小二乘法一个参数为例第19页,此课件共42页哦非线性最小二乘法:应用举例墨西哥1955-1974生产函数数学SAT分数函数1975-2007美国人口增长率假设:消费收入的指数函数假设:消费收入的倒数函数第20页,此课件共42页哦 到目前为止,在所考虑的线性回归模型中,解释变量都是数值变量或定量变量。但事实上有些时候,解释变量可能是定性变量。虚拟变量(Dummy Variables)第21页,此课件共42页哦主要讲解内容虚拟变量的性质;虚拟变量的设定规则;虚拟变量的引入方式;参数邹检验;被解释变量的类型;线性概率模型初步;极大似然估计法原理。第22页,此课件共42页哦一、虚拟变量的性质常见定量变量:收入、产出、成本、价格、重量、温度等常见定性变量:性别、种族、肤色、宗教、民族、婚姻、政团关系等具备或不具备某种性质定量化01不具备某种性质具备某种性质D基准基准类第23页,此课件共42页哦二、虚拟变量的设定规则 一般原则:如果定性变量有 m 种分类,则需要引入(m-1)个虚拟变量。如果不符合该原则,则会陷入虚拟变量陷阱,即完全共线性或多重共线性。第24页,此课件共42页哦三、虚拟变量的引入方式方式1:加法方式以性别和受教育程度为例第25页,此课件共42页哦方式2:乘法方式交互项主效应交互效应以性别和受教育程度为例第26页,此课件共42页哦YX0XYX0YX0Y0一致回归平行回归并行回归相异回归第27页,此课件共42页哦四、参数邹检验XXioYH0:参数稳定第28页,此课件共42页哦邹氏参数稳定性检验步骤:首先,分别以两个连续的时间序列作为两个样本运用总模型式进行回归,得到相应的残差平方和RSS1和RSS2;然后,将两个序列并为一个大样本后运用总模型式进行回归,得到大样本下的残差平方和RSSR;最后,通过F统计量,在事先给定的显著性水平下进行假设检验。如果F大于相应的临界值,则拒绝原假设,认为发生了结构变化,参数是非稳定的。第29页,此课件共42页哦应用举例与解释第30页,此课件共42页哦交互项主效应交互效应第31页,此课件共42页哦虚拟变量引入交互项的重要应用:双重差分第32页,此课件共42页哦对照组(direct=0):直管组(direct=1):改革前(time=0):改革后(time=1):改革前(time=0):改革后(time=1):一重差分双重差分第33页,此课件共42页哦五、被解释变量类型以研究劳动力市场就业 为例就业时间就业意愿就业种类就业收入第34页,此课件共42页哦当因变量是一个分类变量而不是一个连续变量时,线性回归就不适用。实际上,许多社会科学的观察都只是分类的而不是连续的。如政治学中否选举某候选人、经济学中是否签订一个合同、社会学中犯罪、逃学、迁移、结婚、离婚、生育、患病等都可以按照分类变量来测量。六、线性概率模型初步第35页,此课件共42页哦以农民工是否愿意转移就业为例,构建如下回归方程:其中,Yi 是一个二分类变量,Xi 表示第 i 个农民工年收入。如果第个农民工转移,则 Yi,否则 Yi。因变量为二分类变量的线性回归模型也被称为线性概率模型,LPM第36页,此课件共42页哦 假设有一个理论上存在的连续反应变量 Y*代表事件发生的可能性,其值域为负无穷到正无穷。当该变量的值跨越一个临界值 C(如 C=0),便导致事件发生,则有:当 Y*0时,Yi=1,否则 Yi=0再假设 Y*与 Xi 之间存在如下线性关系:Logistic分布第37页,此课件共42页哦第38页,此课件共42页哦事件发生事件不发生第39页,此课件共42页哦七、最大似然估计在线性回归模型估计未知总体参数时主要采用最小二乘法,这一方法的原理是根据线性回归模型选择参数估计值,使因变量的观测值与模型估计值之间的离差平方值为最小。而最大似然估计法则是统计分析中另一常用模型参数估计方法。在线性回归分析中,最大似然估计法可以得到与最小二乘法相同的结果。与最小二乘法相比,最大似然估计法既可以用于线性模型,也可以用于非线性模型估计。由于Logistic回归是非线性模型,因此最大似然估计法是最常用的模型估计方法。第40页,此课件共42页哦概率函数似然函数第41页,此课件共42页哦如何用最大似然法估计Logistic回归模型的参数假设有由 N 个案例构成的总体,Y1,Y2,YN。从中随机抽取 n 个案例作为样本,观测值标注为 y1,y2,yn。设pi=P(yi=1|xi)为给定 xi 的条件下得到结果 yi=1 的条件概率;而在同样条件下得到结果 yi=0 的条件概率为 P(yi=0|xi)=1-pi。于是,得到一个观测值的概率为 P(yi)=piyi(1-pi)1-yi第42页,此课件共42页哦