《第九章 二元选择模型优秀PPT.ppt》由会员分享,可在线阅读,更多相关《第九章 二元选择模型优秀PPT.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第九章 二元选择模型第一页,本课件共有47页说明说明在经典计量经济学模型中,被解释变量通常被假定在经典计量经济学模型中,被解释变量通常被假定为连续变量。为连续变量。离散被解释变量数据计量经济学模型(离散被解释变量数据计量经济学模型(Models Models with Discrete Dependent Variableswith Discrete Dependent Variables)和离散选)和离散选择模型择模型(DCM,Discrete Choice Model)(DCM,Discrete Choice Model)。二元选择模型二元选择模型(Binary Choice Model)
2、(Binary Choice Model)和多元选择模和多元选择模型型(Multiple Choice Model)(Multiple Choice Model)。本节只介绍二元选择模型。本节只介绍二元选择模型。第二页,本课件共有47页离散选择模型起源于离散选择模型起源于FechnerFechner于于18601860年进行的动物条年进行的动物条件二元反射研究。件二元反射研究。19621962年,年,WarnerWarner首次将它应用于经济研究领域,用首次将它应用于经济研究领域,用以研究公共交通工具和私人交通工具的选择问题。以研究公共交通工具和私人交通工具的选择问题。7070、8080年代,
3、离散选择模型被普遍应用于经济布局、企年代,离散选择模型被普遍应用于经济布局、企业定点、交通问题、就业问题、购买决策等经济决策领业定点、交通问题、就业问题、购买决策等经济决策领域的研究。域的研究。模型的估计方法主要发展于模型的估计方法主要发展于8080年代初期。年代初期。第三页,本课件共有47页一、二元离散选择模型的经济背景一、二元离散选择模型的经济背景第四页,本课件共有47页实际经济生活中的二元选择问题实际经济生活中的二元选择问题研究选择结果与影响因素之间的关系。研究选择结果与影响因素之间的关系。影响因素包括两部分:影响因素包括两部分:决策者的属性决策者的属性和和备选方案的属备选方案的属性性。
4、对于单个方案的取舍。例如,购买者对某种商品的购对于单个方案的取舍。例如,购买者对某种商品的购买决策问题买决策问题 ,求职者对某种职业的选择问题,投票,求职者对某种职业的选择问题,投票人对某候选人的投票决策,银行对某客户的贷款决策。人对某候选人的投票决策,银行对某客户的贷款决策。由由决策者的属性决定。决策者的属性决定。对于两个方案的选择。例如,两种出行方式的选择,两对于两个方案的选择。例如,两种出行方式的选择,两种商品的选择。由种商品的选择。由决策者的属性决策者的属性和和备选方案的属性共备选方案的属性共同决定。同决定。第五页,本课件共有47页二、二元离散选择模型二、二元离散选择模型第六页,本课件
5、共有47页1.1.线性概率线性概率(LPM)(LPM)模型模型假设有以下二元选择模型:(9.1)其中,Xi是包含常数项的k元解释变量,假设在给定Xi的时候,Yi=1 的概率为p,即 ,则在给定Xi的时候,Yi=0 的概率为1-p,即 。第七页,本课件共有47页当(9.1)式满足 时 ,(9.2)另外,因为Yi只取1和0两个值,其条件期望为 (9.3)综合(9.2)式和(9.3)式得:(9.4)第八页,本课件共有47页因此,(9.1)式拟合的是当给定解释变量Xi的值时,某事件发生(即Yi取值为1)的平均概率。在(9.4)式中,这一概率体现为线性的形式 ,因此(9.1)式称为线性概率模型(Line
6、ar Probability Model,LPM)。对于线性概率模型,可以采用普通最小二乘法进行估计,但是会存在一些问题。常见的问题和相应的解决方法如下:第九页,本课件共有47页(1)对(9.1)式的拟合的结果是对某一事件发生的平均概率的预测,即但是,的值并不能保证在0和1之间,完全有可能出现大于1和小于0的情形。实际应用中,当出现的预测值大于1或小于0的情况不是太多时,如果预测值大于1,就把它看作是等于1,如果预测值小于0,就把它看作是等于0.第十页,本课件共有47页(2)由于Y是二元变量,因此扰动项也应该是二元变量,它应该服从二项分布,而不是我们通常假定的正态分布。但是,当样本足够多时,二
7、项分布收敛于正态分布。第十一页,本课件共有47页(3)在LPM中,扰动项的方差为:因此,扰动项是异方差的。为了克服异方差,可以采用处理异方差的方法去估计模型。第十二页,本课件共有47页(4)由于因变量是二元选择的结果,因此按传统线性回归模型所计算的判定系数R2不再有实际的意义。可以定义 当Y的实际预测的值大于0.5时,我们视其预测值为1;当小于0.5时,视其预测值为0。然后比较预测值与实际值是否存在差异,如果不存在差异,则认为是正确的预测。然后将正确的预测的个数与总预测个数比较,得到一个新的拟合优度的指标。第十三页,本课件共有47页(5)边际效应的分析对LPM进行边际效应分析得:因此,当解释变
8、量是非虚拟变量时,表示的是解释变量变动一个单位时对Y取值为1的平均概率的影响。如果解释变量是虚拟变量,则 表示的是虚拟解释变量取值为1和取值为0时,Y的取值为1的概率的差异。因此,LPM的边际效应是一个常数,的边际效应是一个常数,它与解释变量取值的大小无关。第十四页,本课件共有47页在LPM中,假设Yi=1 的概率是线性的,也就是假设中的函数F为恒等函数,即但是,不能保证概率的取值在0和1之间。第十五页,本课件共有47页标准正态分布的概率分布函数标准正态分布的概率分布函数 第十六页,本课件共有47页逻辑分布的概率分布函数逻辑分布的概率分布函数 第十七页,本课件共有47页如果将函数F定义为标准正
9、态分布函数 ,即 会把概率的取值限定在0和1之间,这时的概率模型称为这时的概率模型称为Probit模型。模型。第十八页,本课件共有47页如果将函数F定义为Logistic分布函数 ,则产生的概率模型为则产生的概率模型为Logit模型模型:同样,也将概率的取值限定在0和1之间。第十九页,本课件共有47页2.Probit2.Probit模型模型考察以下模型 (9.6)其中,Yi*是潜变量或隐变量(Latent Variable),它无法获得实际观测值,但是却可以观测到它的性状,如Yi*0或Yi*0。因此,我们实际上观测到的变量是Yi而不是Yi*。(9.6)式称为潜变量反应函数(Latent Res
10、ponse Function)或指示函数(Index Function)。第二十页,本课件共有47页一般假设:A1:;A2:是i.i.d.的正态或Logistic分布;A3:。在A1A3的假定之下,考察(9.6)式中Yi的概率特征:(9.7)第二十一页,本课件共有47页当 为标准正态分布的概率密度函数时,(9.7)式可以写成:(9.8)这样,(9.8)式正是Probit模型。第二十二页,本课件共有47页3.Logit3.Logit模型模型当(9.7)式中的 是Logistic的概率密度函数时,(9.7)式可以进一步表达为 (9.9)(9.9)式正是Logit模型。第二十三页,本课件共有47页边
11、际效应分析对于Probit模型来说,其边际效应为:(9.10)对于Logit模型,其边际效应为:(9.11)其中,。第二十四页,本课件共有47页从(9.10)式和(9.11)式中可以看到,Probit和Logit模型中解释变量对Yi取值为1的概率的边际影响不是常数,它会随着解释变量取值的变化而变化。对于非虚拟的解释变量,一般是用其样本均值代入到(9.10)式和(9.11)式中,估计出平均的边际影响。但是,对于虚拟解释变量而言,则需要先分别计算其取值为1和0时的值,二者的差即为虚拟解释变量的边际影响。第二十五页,本课件共有47页最大似然估计(MLE)Probit和Logit模型都是非线性模型,不
12、能用OLS法估计。对于非线性模型的估计方法之一是最大似然法。对于Probit或Logit模型来说,第二十六页,本课件共有47页所以似然函数为对数似然函数为 (9.12)第二十七页,本课件共有47页最大化logL的一阶条件为 (9.13)由于(9.13)式不存在封闭解,所以要用非线性求解的迭代法求解。常用的迭代方法之一是建立在泰勒级数展开基础上的Newton-Raphson迭代法或二次攀峰算法(Quadratic Hill Climbing)。第二十八页,本课件共有47页似然比检验和拟合优度似然比检验类似于检验模型整体显著性的F检验,原假设为全部解释变量的系数都为0,检验的统计量LR为:(9.1
13、4)其中,lnL为对概率模型进行MLE估计的对数似然函数值,lnL0为估计只有截距项的模型的对数似然函数值。当原假设成立时,LR的渐近分布是自由度为k-1(即除截距项外的解释变量的个数)的 分布。第二十九页,本课件共有47页对于Probit和Logit模型,同样可以计算(9.5)式中 的以反映模型的拟合优度。此外,还可以计算类似于传统R2的McFadden似然比指数(McFaddens Likelihood Ratio Index)来度量拟合优度。似然比指数的定义为(9.15)McFadden R2总是介于0和1之间。当所有的斜率系数都为0时,McFadden R2=0,但是,McFadden
14、 R2不会恰好等于1。McFadden R2越大,表明拟合得越好。第三十页,本课件共有47页例例 贷款决策模型贷款决策模型分析与建模:分析与建模:某商业银行从历史贷款客户中随机抽某商业银行从历史贷款客户中随机抽取取78个样本,根据设计的指标体系分别计算它们的个样本,根据设计的指标体系分别计算它们的“商业信用支持度商业信用支持度”(CC)和)和“市场竞争地位等级市场竞争地位等级”(CM),对它们贷款的结果(),对它们贷款的结果(JG)采用二元离散)采用二元离散变量,变量,1表示贷款成功,表示贷款成功,0表示贷款失败。目的是研究表示贷款失败。目的是研究JG与与CC、CM之间的关系,并为正确贷款决策
15、提供之间的关系,并为正确贷款决策提供支持。支持。第三十一页,本课件共有47页样样本本观观测测值值CC=XYCM=SC第三十二页,本课件共有47页第三十三页,本课件共有47页第三十四页,本课件共有47页该方程表示该方程表示,当,当CC和和CM已知时,代入方程,可以计算贷款成功的已知时,代入方程,可以计算贷款成功的概率概率JGF。例如,将表中第。例如,将表中第19个样本观测值个样本观测值CC=15、CM=1代入方代入方程右边,计算括号内的值为程右边,计算括号内的值为0.1326552;查标准正态分布表,对应于;查标准正态分布表,对应于0.1326552的累积正态分布为的累积正态分布为0.5517;
16、于是,;于是,JG的预测值的预测值JGF=10.5517=0.4483,即对应于该客户,贷款成功的概率为,即对应于该客户,贷款成功的概率为0.4483。输出的估计结果第三十五页,本课件共有47页模拟预测第三十六页,本课件共有47页预测:预测:如果有一个新客户,根据客户资料,计算的如果有一个新客户,根据客户资料,计算的“商业信用支持度商业信用支持度”(XY)和)和“市场竞争地位等级市场竞争地位等级”(SC),代入模型,就可以得到贷款成功的概率,),代入模型,就可以得到贷款成功的概率,以此决定是否给予贷款。以此决定是否给予贷款。第三十七页,本课件共有47页3 3、重复观测值可以得到情况下二元、重复
17、观测值可以得到情况下二元ProbitProbit离散离散选择模型的参数估计选择模型的参数估计 对每个决策者有多个重复(例如对每个决策者有多个重复(例如10次左右)次左右)观测值。观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次的次数比例为数比例为pi,那么可以将,那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“概率单位模型概率单位模型”,采用广义最小二,采用广义最小二乘法估计乘法估计。实际中并不常用。实际中并不常用。第三十八页,本课件共有47页Brsch-SupanBrsch-Supan于于19871987年指出年指出:如果选择
18、是按照效用最大化而进行的,具有极限如果选择是按照效用最大化而进行的,具有极限值的逻辑分布是较好的选择,这种情况下的二元值的逻辑分布是较好的选择,这种情况下的二元选择模型应该采用选择模型应该采用Logit模型。模型。第三十九页,本课件共有47页第四十页,本课件共有47页第四十一页,本课件共有47页第四十二页,本课件共有47页Probit0.9999991.0000000.4472330.000000第四十三页,本课件共有47页3 3、重复观测值可以得到情况下二元、重复观测值可以得到情况下二元logitlogit离散离散选择模型的参数估计选择模型的参数估计对每个决策者有多个重复(例如对每个决策者有
19、多个重复(例如10次左右)观测值。次左右)观测值。对第对第i个决策者重复观测个决策者重复观测ni次,选择次,选择yi=1的次数比例的次数比例为为pi,那么可以将,那么可以将pi作为真实概率作为真实概率Pi的一个估计量。的一个估计量。建立建立“对数成败比例模型对数成败比例模型”,采用广义最小二乘,采用广义最小二乘法估计法估计。实际中并不常用。实际中并不常用。详见教科书。详见教科书。第四十四页,本课件共有47页三、二元离散选择模型的变量显著性检验三、二元离散选择模型的变量显著性检验第四十五页,本课件共有47页1 1、检验假设、检验假设经典模型中采用的变量显著性经典模型中采用的变量显著性t检验仍然是有效的。检验仍然是有效的。如果省略的变量与保留的变量不是正交的,那么对如果省略的变量与保留的变量不是正交的,那么对参数估计量将产生影响,需要进一步检验这种省略参数估计量将产生影响,需要进一步检验这种省略是否恰当。是否恰当。第四十六页,本课件共有47页2 2、统计量、统计量如果X2中的变量省略后对参数估计量没有影响,那么H1和H0情况下的对数最大似然函数值应该相差不大,此时LR统计量的值很小,自然会小于临界值,不拒绝 H0。第四十七页,本课件共有47页
限制150内