选择性样本模型(课堂PPT).ppt
《选择性样本模型(课堂PPT).ppt》由会员分享,可在线阅读,更多相关《选择性样本模型(课堂PPT).ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、4.5 4.5 受限被解释变量数据模型受限被解释变量数据模型选择性样本选择性样本 Model with Limited Dependent Variable Selective Samples Model一、社会经济生活中的选择性样本问题一、社会经济生活中的选择性样本问题 二、二、“截断截断”数据计量经济学模型的最大似然估计数据计量经济学模型的最大似然估计三、三、“截断截断”数据计量经济学模型的数据计量经济学模型的Heckman两步估两步估计计 四、四、“归并归并”数据计量经济学模型的最大似然估计数据计量经济学模型的最大似然估计五、选择性样本的经验判断和检验五、选择性样本的经验判断和检验 1T
2、he Bank of Sweden Prize in Economic Sciences in Memory of Alfred Nobel 2000 for his development of theory and methods for analyzing selective samples”James J Heckman2“Shadow Prices,Market Wages and Labour Supply”,Econometrica 42(4),1974,P679-694 发现并提出发现并提出“选择性样本选择性样本”问题问题。“Sample Selection Bias as a
3、 Specification Error”,Econometrica 47(1),1979,P153-161 证明了偏误的存在并提出了证明了偏误的存在并提出了Heckman两步修正法。两步修正法。3一、社会经济生活中的选择性样本问题一、社会经济生活中的选择性样本问题 41 1、“截断截断”(truncationtruncation)问题)问题 不能从全部截面个体,而只能从一部分个体中随不能从全部截面个体,而只能从一部分个体中随机抽取被解释变量的样本观测值。机抽取被解释变量的样本观测值。分为两种情况分为两种情况:一是,所抽取的部分个体的观测值都大于或者小于某一是,所抽取的部分个体的观测值都大于或
4、者小于某个确定值,即出现个确定值,即出现“掐头掐头”或者或者“去尾去尾”的现象,与的现象,与其它个体的观测值相比较,存在明显的其它个体的观测值相比较,存在明显的“截断点截断点”。二是,所抽取的样本观测值来自于具有某些特征的部二是,所抽取的样本观测值来自于具有某些特征的部分个体,但是样本观测值的大小与其它个体的观测值分个体,但是样本观测值的大小与其它个体的观测值相比较,并不存在明显的相比较,并不存在明显的“截断点截断点”。样本选择受到限制。样本选择受到限制。52 2、“归并归并”(censoring)(censoring)问题问题 将被解释变量的处于某一范围的样本观测值都用将被解释变量的处于某一
5、范围的样本观测值都用一个相同的值代替。一个相同的值代替。经常出现在经常出现在“检查检查”、“调查调查”活动中,因此也称为活动中,因此也称为“检查检查”(censoring)问题。问题。需求函数模型中用实际消费量作为需求量的观测值,需求函数模型中用实际消费量作为需求量的观测值,如果存在供给限制,就出现如果存在供给限制,就出现“归并归并”问题。问题。被解释变量观测值存在最高和最低的限制。例如考试被解释变量观测值存在最高和最低的限制。例如考试成绩,最高成绩,最高100,最低,最低0,出现,出现“归并归并”问题。问题。被解释变量样本观测值受到限制。被解释变量样本观测值受到限制。6二、二、“截断截断”数
6、据计量经济学模型的最数据计量经济学模型的最大似然估计大似然估计 71 1、思路、思路如果一个单方程计量经济学模型,只能从如果一个单方程计量经济学模型,只能从“掐头掐头”或者或者“去尾去尾”的连续区间随机抽取被解释变量的连续区间随机抽取被解释变量的样本观测值,那么很显然,抽取每一个样本观的样本观测值,那么很显然,抽取每一个样本观测值的概率以及抽取一组样本观测值的联合概率,测值的概率以及抽取一组样本观测值的联合概率,与被解释变量的样本观测值不受限制的情况是不与被解释变量的样本观测值不受限制的情况是不同的。同的。如果能够知道在这种情况下抽取一组样本观测值如果能够知道在这种情况下抽取一组样本观测值的联
7、合概率函数,那么就可以通过该函数极大化的联合概率函数,那么就可以通过该函数极大化求得模型的参数估计量。求得模型的参数估计量。82 2、截断分布、截断分布 如果服从均匀分布U(a,b),但是它只能在(c,b)内取得样本观测值,那么取得每一个样本观测值的概率 为随机变量分布范围内的一个常数 9服从正态分布 是标准正态分布条件概率函数 103 3、截断被解释变量数据模型的最大似然估计、截断被解释变量数据模型的最大似然估计 1112求解该求解该1阶极值条件,即可以得到模型的参数估计阶极值条件,即可以得到模型的参数估计量。量。由于这是一个复杂的非线性问题,需要采用迭代由于这是一个复杂的非线性问题,需要采
8、用迭代方法求解,例如牛顿法。方法求解,例如牛顿法。134 4、演示例题、演示例题农村居民消费模型农村居民消费模型根据对农民消费行为的分析,发现农民的消费水根据对农民消费行为的分析,发现农民的消费水平(平(Y)既取决于来自于农业生产经营的持久收入)既取决于来自于农业生产经营的持久收入(X1),也受到来自于从事非农生产的瞬时收入),也受到来自于从事非农生产的瞬时收入(X2)的影响。现有某地区)的影响。现有某地区50户农户的人均消费、户农户的人均消费、人均持久收入和人均瞬时收入的样本观测值,试人均持久收入和人均瞬时收入的样本观测值,试图建立该地区农民消费模型。图建立该地区农民消费模型。说明:后面的估
9、计结果如果与教科书不同,则是教科书中的数据存在错误(第说明:后面的估计结果如果与教科书不同,则是教科书中的数据存在错误(第34、43样本的样本的X2的观测值中的小数点误写为逗号),本课件的结果是正确的。的观测值中的小数点误写为逗号),本课件的结果是正确的。14样样本本观观测测值值15选择截断数据选择截断数据ML估计估计16将样本视为不受限制的随机抽取将样本视为不受限制的随机抽取 17将样本视为人均消费大于将样本视为人均消费大于1500元的范围内随机抽取元的范围内随机抽取 18将样本视为在人均消费大于将样本视为在人均消费大于1500元、小于元、小于6000元的范围元的范围内随机抽取内随机抽取 1
10、9比较比较3种假设下的对数似然函数值可见,随着截断种假设下的对数似然函数值可见,随着截断区间的缩小,抽取同一个样本的概率增大,致使区间的缩小,抽取同一个样本的概率增大,致使对数似然函数值增大。对数似然函数值增大。205 5、为什么截断被解释变量数据模型不能采用、为什么截断被解释变量数据模型不能采用普通最小二乘估计普通最小二乘估计 对于截断被解释变量数据计量经济学模型,如果对于截断被解释变量数据计量经济学模型,如果仍然把它看作为经典的线性模型,采用仍然把它看作为经典的线性模型,采用OLS估计,估计,会产生什么样的结果?会产生什么样的结果?因为因为yi只能在大于只能在大于a的范围内取得观测值,那么
11、的范围内取得观测值,那么yi的条件均值为:的条件均值为:2122由于被解释变量数据的截断问题,使得原模型变由于被解释变量数据的截断问题,使得原模型变换为包含一个非线性项模型。换为包含一个非线性项模型。如果采用如果采用OLS直接估计原模型:直接估计原模型:实际上忽略了一个非线性项;实际上忽略了一个非线性项;忽略了随机误差项实际上的异方差性。忽略了随机误差项实际上的异方差性。这就造成参数估计量的偏误,而且如果不了解解释变这就造成参数估计量的偏误,而且如果不了解解释变量的分布,要估计该偏误的严重性也是很困难的。量的分布,要估计该偏误的严重性也是很困难的。23三、三、“截断截断”数据计量经济学模型的数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 选择性 样本 模型 课堂 PPT
限制150内