第07章离散因变量和受限因变量模型精选PPT.ppt
《第07章离散因变量和受限因变量模型精选PPT.ppt》由会员分享,可在线阅读,更多相关《第07章离散因变量和受限因变量模型精选PPT.ppt(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第07章离散因变量和受限因变量模型1第1页,此课件共69页哦在在实实际际中中,还还会会经经常常遇遇到到因因变变量量受受到到某某种种限限制制的的情情况况,这这种种情情况况下下,取取得得的的样样本本数数据据来来自自总总体体的的一一个个子子集集,可可能能不不能能完完全全反反映映总总体体。这这时时需需要要建建立立的的经经济济计计量量模模型型称称为为受受限限因因变变量量模模型型(limiteddependentvariablemodel)。这这两两类类模模型型经经常常用用于于调查数据的分析中。调查数据的分析中。2第2页,此课件共69页哦7.1二元选择模型二元选择模型二元选择模型二元选择模型 在离散选择模
2、型中,最简单的情形是在两个可供选择的方在离散选择模型中,最简单的情形是在两个可供选择的方案中选择其一,此时被解释变量只取两个值,称为二元选择模案中选择其一,此时被解释变量只取两个值,称为二元选择模型(型(binarychoicemodel)。在实际生活中,我们经常遇到二元选择)。在实际生活中,我们经常遇到二元选择问题。例如,在买车与不买车的选择中,买车记为问题。例如,在买车与不买车的选择中,买车记为1,不买记为,不买记为0。是。是否买车与两类因素有关系:一类是车本身所具有的属性,如价否买车与两类因素有关系:一类是车本身所具有的属性,如价格、型号等;另一类是决策者所具有的属性如收入水平、对车格、
3、型号等;另一类是决策者所具有的属性如收入水平、对车的偏好程度等。如果我们要研究是否买车与收入之间的关系,的偏好程度等。如果我们要研究是否买车与收入之间的关系,即研究具有某一收入水平的个体买车的可能性。因此,二元选即研究具有某一收入水平的个体买车的可能性。因此,二元选择模型的目的是研究具有给定特征的个体作某种而不作另一种择模型的目的是研究具有给定特征的个体作某种而不作另一种选择的概率。选择的概率。3第3页,此课件共69页哦为为了了深深刻刻地地理理解解二二元元选选择择模模型型,首首先先从从最最简简单单的的线线性性概概率率模模型开始讨论。线性概率模型的回归形式为:型开始讨论。线性概率模型的回归形式为
4、:(7.1.1)其其中中:N是是样样本本容容量量;k是是解解释释变变量量个个数数;xj为为第第j个个个个体体特特征征的的取取值值。例例如如,x1表表示示收收入入;x2表表示示汽汽车车的的价价格格;x3表表示示消消费费者者的的偏偏好好等等。设设 yi 表示取值表示取值为为0和和1的离散型随机变量:的离散型随机变量:式(式(7.1.1)中)中ui为相互独立且均值为为相互独立且均值为0的随机扰动项。的随机扰动项。7.1.1 线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式线性概率模型及二元选择模型的形式 4第4页,此课件共69页哦令令pi=P(yi=1
5、),那么那么1-pi=P(yi=0),于是于是(7.1.2)又又因因为为E(ui)=0,所所以以E(yi)=xi,xi=(x1i,x2i,xki),=(1,2,k),从而有下面的等式:从而有下面的等式:(7.1.3)5第5页,此课件共69页哦式式(7.1.3)只只有有当当xi 的的取取值值在在(0,1)之之间间时时才才成成立立,否否则则就就会会产产生生矛矛盾盾,而而在在实实际际应应用用时时很很可可能能超超出出这这个个范范围围。因因此此,线线性性概概率率模模型型常常常常写写成下面的形式:成下面的形式:(7.1.4)此时就可以把因变量看成是一个概率。此时就可以把因变量看成是一个概率。那么扰动项的方
6、差为:那么扰动项的方差为:(7.1.5)或或(7.1.6)6第6页,此课件共69页哦由由此此可可以以看看出出,误误差差项项具具有有异异方方差差性性。异异方方差差性性使使得得参参数数估估计计不不再再是是有有效效的的,修修正正异异方方差差的的一一个个方方法法就就是是使使用用加加权权最最小小二二乘乘估估计计。但但是是加加权权最最小小二二乘乘法法无无法法保保证证预预测测值值在在(0,1)之之内内,这这是是线线性性概概率率模模型型一一个个严严重重的的弱弱点点。由由于于上上述述问问题题,我我们们考考虑虑对线性概率模型进行一些变换,由此得到下面要讨论的模型。对线性概率模型进行一些变换,由此得到下面要讨论的模
7、型。假假设设有有一一个个未未被被观观察察到到的的潜潜在在变变量量yi*,它它与与xi之之间间具具有有线线性性关关系系,即即(7.1.7)其中:其中:ui*是扰动项。是扰动项。yi和和yi*的关系如下:的关系如下:(7.1.8)7第7页,此课件共69页哦 yi*大大于于临临界界值值0时时,yi=1;小小于于等等于于0时时,yi=0。这这里里把把临临界界值值选选为为0,但但事事实实上上只只要要xi包包含含有有常常数数项项,临临界界值值的的选选择择就就是是无无关关的的,所所以不妨设为以不妨设为0。这样。这样(7.1.9)其其中中:F是是ui*的的分分布布函函数数,要要求求它它是是一一个个连连续续函函
8、数数,并并且且是是单单调调递递增的。因此,原始的回归模型可以看成如下的一个回归模型:增的。因此,原始的回归模型可以看成如下的一个回归模型:(7.1.10)即即yi关于它的条件均值的一个回归。关于它的条件均值的一个回归。8第8页,此课件共69页哦 分分布布函函数数的的类类型型决决定定了了二二元元选选择择模模型型的的类类型型,根根据据分分布布函函数数F的的不不同同,二二元元选选择择模模型型可可以以有有不不同同的的类类型型,常常用用的的二二元元选选择择模模型型如如表表7.1所示:所示:表表表表7.1 7.1 常用的二元选择模型常用的二元选择模型常用的二元选择模型常用的二元选择模型 ui*对应的分布对
9、应的分布分布函数分布函数F 相应的二元选择模型相应的二元选择模型标准正态分布标准正态分布Probit 模型模型逻辑分布逻辑分布Logit 模型模型极值分布极值分布Extreme模型模型9第9页,此课件共69页哦二元选择模型一般采用极大似然估计。似然函数为二元选择模型一般采用极大似然估计。似然函数为(7.1.11)即即(7.1.12)对数似然函数为对数似然函数为(7.1.13)7.1.27.1.2二元选择模型的估计问题二元选择模型的估计问题 10第10页,此课件共69页哦对数似然函数的一阶条件为对数似然函数的一阶条件为(7.1.14)其其中中:fi 表表示示概概率率密密度度函函数数。那那么么如如
10、果果已已知知分分布布函函数数和和密密度度函函数数的的表表达达式式及及样样本本值值,求求解解该该方方程程组组,就就可可以以得得到到参参数数的的极极大大似似然然估估计计量量。例例如如,将将上上述述3种种分分布布函函数数和和密密度度函函数数代代入入式式(7.1.14)就就可可以以得得到到3种种模模型型的的参参数数极极大大似似然然估估计计。但但是是式式(7.1.14)通通常常是是非非线线性性的的,需需用用迭迭代法进行求解。代法进行求解。二二元元选选择择模模型型中中估估计计的的系系数数不不能能被被解解释释成成对对因因变变量量的的边边际际影影响响,只只能能从从符符号号上上判判断断。如如果果为为正正,表表明
11、明解解释释变变量量越越大大,因因变变量量取取1的的概概率率越越大大;反反之之,如如果果系系数数为为负负,表表明明相相应应的的概概率率将越小。将越小。11第11页,此课件共69页哦 例例例例7.17.1二元选择模型实例二元选择模型实例二元选择模型实例二元选择模型实例 考考虑虑Greene给给出出的的斯斯佩佩克克特特和和马马泽泽欧欧(1980)的的例例子子,在在例例子子中中分分析析了了某某种种教教学学方方法法对对成成绩绩的的有有效效性性。因因变变量量(GRADE)代代表表在在接接受受新新教教学学方方法法后后成成绩绩是是否否改改善善,如如果果改改善善为为1,未未改改善善为为0。解解释释变变量量(PS
12、I)代代表表是是否否接接受受新新教教学学方方法法,如如果果接接受受为为1,不不接接受受为为0。还还有有对对新新教教学学方方法法量量度度的的其其他他解解释释变变量量:平平均均分分数数(GPA)和和测测验验得得分分(TUCE),来来分分析析新的教学方法的效果。新的教学方法的效果。12第12页,此课件共69页哦 (1 1)模型的估计)模型的估计)模型的估计)模型的估计 估计二元选择模型,从估计二元选择模型,从EquationSpecification对话框中,选择对话框中,选择Binary估计方法。在二元模型的设定中分为两部分。首先,在估计方法。在二元模型的设定中分为两部分。首先,在Equation
13、Specification区域中,键入二元因变量的名字,随后键入区域中,键入二元因变量的名字,随后键入一列回归项。由于二元变量估计只支持列表形式的设定,所以不能一列回归项。由于二元变量估计只支持列表形式的设定,所以不能输入公式。然后,在输入公式。然后,在Binaryestimationmethod中选择中选择Probit,Logit,Extremevalue选择三种估计方法的一种。以例选择三种估计方法的一种。以例7.1为例,对话框如为例,对话框如图图7.2所示。所示。13第13页,此课件共69页哦图图图图7.2 7.2 二元选择模型估计对话框二元选择模型估计对话框二元选择模型估计对话框二元选择
14、模型估计对话框14第14页,此课件共69页哦 例例7.1的估计输出结果如下:的估计输出结果如下:15第15页,此课件共69页哦参参数数估估计计结结果果的的上上半半部部分分包包含含与与一一般般的的回回归归结结果果类类似似的的基基本本信信息息,标标题题包包含含关关于于估估计计方方法法(ML表表示示极极大大似似然然估估计计)和和估估计计中中所所使使用用的的样样本本的的基基本本信信息息,也也包包括括达达到到收收敛敛要要求求的的迭迭代代次次数数。和和计计算算系系数数协协方方差差矩矩阵阵所所使使用用方方法法的的信信息息。在在其其下下面面显显示示的的是是系系数数的的估估计计、渐渐近近的的标准误差、标准误差、
15、z-统计量和相应的概率值及各种有关统计量。统计量和相应的概率值及各种有关统计量。16第16页,此课件共69页哦在回归结果中还提供几种似然函数:在回归结果中还提供几种似然函数:loglikelihood是是对对数数似似然然函函数数的的最最大大值值L(b),b是是未未知知参参数数 的估计值。的估计值。Avg.loglikelihood是是用用观观察察值值的的个个数数N去去除除以以对对数数似似然然函数函数L(b),即对数似然函数的平均值。,即对数似然函数的平均值。Restr.Loglikelihood是是除除了了常常数数以以外外所所有有系系数数被被限限制制为为0时的极大似然函数时的极大似然函数L(b
16、)。LR统统计计量量检检验验除除了了常常数数以以外外所所有有系系数数都都是是0的的假假设设,这这类类似似于于线线性性回回归归模模型型中中的的统统计计量量,测测试试模模型型整整体体的的显显著著性性。圆圆括号中的数字表示自由度,它是该测试下约束变量的个数。括号中的数字表示自由度,它是该测试下约束变量的个数。17第17页,此课件共69页哦 Probability(LRstat)是是LR检检验验统统计计量量的的P值值。在在零零假假设设下下,LR检检验验统统计计量量近近似似服服从从于于自自由由度度等等于于检检验验下下约约束束变变量量的个数的的个数的 2分布。分布。McFaddenR-squared是是计
17、计算算似似然然比比率率指指标标,正正像像它它的的名名字字所所表表示示的的,它它同同线线性性回回归归模模型型中中的的R2是是类类似似的的。它它具具有有总总是是介介于于0和和1之间的性质。之间的性质。18第18页,此课件共69页哦 利利用用式式(7.1.10),分分布布函函数数采采用用标标准准正正态态分分布布,即即Probit模模型型,例例7.1计算结果为计算结果为(7.1.15)z=(-2.93)(2.34)(0.62)(2.39)利利用用式式(7.1.15)的的Probit模模型型的的系系数数,本本例例按按如如下下公公式式给给出出新新教教学学法法对对学习成绩影响的概率,学习成绩影响的概率,当当
18、PSI=0时:时:(7.1.19)当当PSI=1时:时:(7.1.20)式式中中测测验验得得分分TUCE取取均均值值(21.938),平平均均分分数数GPA是是按按从从小小到到大大重重新排序后的序列。新排序后的序列。19第19页,此课件共69页哦图图图图7.1 7.1 新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率新教学法对学习成绩影响的概率20第20页,此课件共69页哦(2 2)估计选项估计选项估计选项估计选项 因因为为我我们们是是用用迭迭代代法法求求极极大大似似然然函函数数的的最最大大值值,所所以以Option选选项项可可以以从从估估计计选选项项中中设
19、设定定估估计计算算法法与与迭迭代代限限制制。单击单击Options按钮,打开对话框如图按钮,打开对话框如图7.3所示。所示。图图图图7.3Options7.3Options对话框对话框对话框对话框21第21页,此课件共69页哦Option对话框有以下几项设置:对话框有以下几项设置:稳稳稳稳健健健健标标标标准准准准差差差差(RobustStandardErrors)对对二二元元因因变变量量模模型型而而言言,EViews允允许许使使用用准准-极极大大似似然然函函数数(Huber/White)或或广广义义的的线线性性模模型型(GLM)方方法法估估计计标标准准误误差差。察察看看RobustCovari
20、ance对对话话框框,并并从从两两种方法中选择一种。种方法中选择一种。初初初初始始始始值值值值EViews的的默默认认值值是是使使用用经经验验运运算算法法则则而而选选择择出出来来的的,适用于二元选择模型的每一种类型。适用于二元选择模型的每一种类型。估估估估计计计计法法法法则则则则在在Optimizationalgorithm一一栏栏中中选选择择估估计计的的运运算算法法则则。默默认认地地,EViews使使用用quadratichill-climbing方方法法得得到到参参数数估估计计。这这种种运运算算法法则则使使用用对对数数似似然然分分析析二二次次导导数数的的矩矩阵阵来来形形成成迭迭代代和和计计
21、算算估估计计的的系系数数协协方方差差矩矩阵阵。还还有有另另外外两两种种不不同同的的估估计计法法则则,Newton-Raphson也也使使用用二二次次导导数数,BHHH使使用用一一次次导导数数,既既确确定定迭代更新,又确定协方差矩阵估计。迭代更新,又确定协方差矩阵估计。22第22页,此课件共69页哦 (3 3)预测)预测)预测)预测从从 方方 程程 工工 具具 栏栏 选选 择择 Procs/Forecast(Fitted Probability/Index),然然 后后 单单 击击 想想 要要 预预 测测 的的 对对 象象。既既 可可 以以 计计 算算 拟拟 合合 概概 率率,也可以计算指标,也
22、可以计算指标的拟合值。的拟合值。像像其其他他方方法法一一样样,可可以以选选择择预预测测样样本本,显显示示预预测测图图。如如果果解解释释变变量量向向量量xt包包括括二二元元因因变变量量yt的的滞滞后后值值,选选择择Dynamic选选项项预预测测,EViews使使用用拟拟合合值值得得到到预预测测值值;而而选选择择Static选项,将使用实际的(滞后的)选项,将使用实际的(滞后的)yt-1得到预测值。得到预测值。对对于于这这种种估估计计方方法法,无无论论预预测测评评价价还还是是预预测测标标准准误误差差通通常常都都无无法法自自动动计计算算。后后者者能能够够通通过过使使用用View/Covariance
23、Matrix显示的系数方差矩阵,或者使用显示的系数方差矩阵,或者使用covariance函数来计算。函数来计算。23第23页,此课件共69页哦可可以以在在各各种种方方式式上上使使用用拟拟合合指指标标,举举个个例例子子,计计算算解解释释变变量量的的边边际际影影响响。计计算算预预测测拟拟合合的的指指标标,并并用用序序列列xb中中保保存存这这个个结结果果。然然后后生生成成序序列列dnorm(-xb)、dlogistic(-xb)、dextreme(-xb),可可以以与与估估计计的的系系数数 j相相乘乘,提提供供一一个个yi的的期期望望值值对对xi的的第第j个分量的导数的估计。个分量的导数的估计。(7
24、.5.1)24第24页,此课件共69页哦(4 4)产生残差序列)产生残差序列)产生残差序列)产生残差序列通通过过Procs/MakeReidualSeries选选项项产产生生下下面面三三种种残残差差类类型型中中的的一一种类型。种类型。表表表表7.6 7.6 残差类型残差类型残差类型残差类型普通残差普通残差(Ordinary)标准化残差标准化残差(Standardized)广义残差广义残差(Generalized)25第25页,此课件共69页哦7.27.2排序选择模型排序选择模型排序选择模型排序选择模型当当因因变变量量不不止止是是两两种种选选择择时时,就就要要用用到到多多元元选选择择模模型型(m
25、ultiplechoicemodel)。多多元元离离散散选选择择问问题题普普遍遍存存在在于于经经济济生生活中。例如:活中。例如:(1)一一个个人人面面临临多多种种职职业业选选择择,将将可可供供选选择择的的职职业业排排队队,用用0,1,2,3表表示示。影影响响选选择择的的因因素素有有不不同同职职业业的的收收入入、发发展展前前景景和个人偏好等;和个人偏好等;(2)同同一一种种商商品品,不不同同的的消消费费者者对对其其偏偏好好不不同同。例例如如,十十分分喜喜欢欢、一一般般喜喜欢欢、无无所所谓谓、一一般般厌厌恶恶和和十十分分厌厌恶恶,分分别别用用0,1,2,3,4表表示示。而而影影响响消消费费者者偏偏
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 07 离散 因变量 受限 模型 精选 PPT
限制150内