倾向值匹配法精选PPT.ppt
《倾向值匹配法精选PPT.ppt》由会员分享,可在线阅读,更多相关《倾向值匹配法精选PPT.ppt(44页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、倾向值匹配法第1页,此课件共44页哦Q:为什么要使用PSM?nA:解决样本选择偏误带来的内生性问题n例:上北大有助于提高收入吗?n样本选择偏误:考上北大的孩子本身就很出色(聪明、有毅力、能力强)n解决方法:样本配对第2页,此课件共44页哦配对方法n同行业(一维配对)n同行业、规模相当(二维配对)n同行业、规模相当、股权结构相当、(多维配对)?nPSM:把多个维度的信息浓缩成一个(降维:多维到一维)第3页,此课件共44页哦配对过程中的两个核心问题(1)nQ1:哪个样本更好一些?A1:Sample2较好:比较容易满足共同支撑假设(common support assumption)第4页,此课件共
2、44页哦配对过程中的两个核心问题(2)nQ2:stu c1,c2,c3三人中,谁是stu PK的最佳配对对象?nA2:stu c3是最佳配对对象,比较容易满足平行假设(balancing assumption)第5页,此课件共44页哦ATT(Average Treatment Effect on the Treated)平均处理效应的衡量n运用得分进行样本匹配并比较,估计出ATT值。nATT=EY(1)-Y(0)|T=1Y(1):Stu PK 上北大后的年薪Y(0):Stu PK 假如不上北大的年薪可观测数据可观测数据不可观测数据,不可观测数据,采用配对者的收采用配对者的收入来代替入来代替AT
3、T=12W-9W=3W第6页,此课件共44页哦实例介绍第7页,此课件共44页哦实例介绍n研究问题:培训对工资的效应n基本思想:分析接受培训行为与不接受培训行为在工资表现上的差异。但是,现实可以观测到的可以观测到的是处理组接受培训的事实,而如果处理组没有接受培训会怎么样是不可观测的不可观测的,这种状态称为反事实。匹配法就是为了解决这种不可观测的事实的方法。第8页,此课件共44页哦实例介绍n分组:在倾向值匹配法中,根据处理指示变量将样本分为两个组。处理组处理组,在本例中就是在NSW(国家支持工作示范项目)实施后接受培训的组;控制组控制组,在本例中就是在NSW实施后不接受培训的组。n研究目的:通过对
4、处理组和对照组的匹配,在其他条件完全相同的情况下,通过接受培训的组(处理组)与不接受培训的组(控制组)在工资表现上的差异来判断接受培训的行为与工资之间的因果关系。第9页,此课件共44页哦变量定义变量变量定义定义treat接受培训(处理组)表示接受培训(处理组)表示1,没有接受培训(控制组)表示,没有接受培训(控制组)表示0age年龄年龄educ受教育年数受教育年数black种族虚拟变量,黑人时,种族虚拟变量,黑人时,black=1hsip民族虚拟变量,西班牙人时,民族虚拟变量,西班牙人时,hsip=1marr婚姻状况虚拟变量,已婚,婚姻状况虚拟变量,已婚,marr=1re741974年实际工资
5、年实际工资re751975年实际工资年实际工资第10页,此课件共44页哦变量定义re781978年实际工资年实际工资u74当在当在1974年失业,年失业,u74=1agesqage*ageeducsqeduc*educre74sqre74*re74re75sqre75*re75u74blcaku74*blcak第11页,此课件共44页哦倾向打分第12页,此课件共44页哦OLS回归结果工资的变化到底是来自个体的异质性工资的变化到底是来自个体的异质性性还是培训?性还是培训?第13页,此课件共44页哦倾向打分n1.设定宏变量(1)设定宏变量breps表示重复抽样200次命令:global breps
6、 200(2)设定宏变量x,表示age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black命令:global x age agesq educ educsq married black hisp re74 re75 re74sq re75sq u74black第14页,此课件共44页哦倾向打分n2.通过logit模型进行倾向打分命令:pscore treat$x,pscore(mypscore)blockid(myblock)comsup numblo(5)level(0.05)logit注:$表示引用宏变
7、量第15页,此课件共44页哦pscore结果第16页,此课件共44页哦倾向值分布第17页,此课件共44页哦倾向值分布第18页,此课件共44页哦block中样本的分布第19页,此课件共44页哦block中的描述性统计第20页,此课件共44页哦运用得分进行样本匹配并比较第21页,此课件共44页哦方法一:最邻近方法方法一:最邻近方法(nearest neighbor matching)n含义:最邻近匹配法是最常用的一种匹配方法,它把控制组中找到的与处理组个体倾向得分差异最小的个体,作为自己的比较对象。n优点:按处理个体找控制个体,所有处理个体都会配对成功,处理组的信息得以充分使用。n缺点:由于不舍弃
8、任何一个处理组,很可能有些配对组的倾向得分差距很大,也将其配对,导致配对质量不高,而处理效应ATT的结果中也会包含这一差距,使得ATT精确度下降。第22页,此课件共44页哦方法一:最邻近方法方法一:最邻近方法(nearest neighbor matching)n命令nset seed 10101(产生随机数种子)nattnd re78 treat$x,comsup boot reps($breps)dots logit第23页,此课件共44页哦方法一:最邻近方法方法一:最邻近方法(nearest neighbor matching)第24页,此课件共44页哦方法二:半径匹配法方法二:半径匹配
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 倾向 匹配 精选 PPT
限制150内