虚拟变量回归.pptx
《虚拟变量回归.pptx》由会员分享,可在线阅读,更多相关《虚拟变量回归.pptx(54页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、很多研究认为,影响商品房价格的因素有多个方面,例如:1.成本费用因素成本费用因素:包括土地、建筑物建造成本、其他费用;2.房地产供求因素房地产供求因素:包括住房需求量、房地产开发量等;3.经济因素经济因素:包括宏观经济状况、物价状况、居民收入状况等;4.人口因素人口因素:包括人口密度、家庭结构等;5.社会因素社会因素:包括社会治安、城市化水平、消费心理等;6.行政行政(政策政策)因素因素:包括土地与住房制度、房地产价格政策等;7.区域因素区域因素:包括所处地段的市政基础设施、交通状况等;8.个别因素个别因素:包括朝向、结构、材料、功能设计、施工质量等;9.房地产投机因素房地产投机因素:投机者在
2、房地产市场中的投机活动;10.自然因素自然因素:包括自然环境、地质、地形、地势及气候等。(资料来源:徐静;武乐杰,房地产价格影响因素的解释结构模型分析,金融经济,2009年 10期)1引子1 影响房地产价格的复杂因素影响房地产价格的复杂因素第1页/共54页2在影响房地产价格的众多因素中,有定量的因素:成本因素、房地产供求因素、经济因素、人口因素等;也有定性的因素:社会因素、行政因素、区位因素、个别因素、投机因 素、自然因素等。在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。能否把定性的因素也引入计量经济模型中呢?怎样才能在模型中有效地表示这些定性因素的
3、作用呢?第2页/共54页引子2 男女大学生的消费真的有差异吗男女大学生的消费真的有差异吗?当代大学生在消费结构呈现出多元化趋势。大学生除了日当代大学生在消费结构呈现出多元化趋势。大学生除了日常生常生活费开支以外,还有人际交往、网络通讯、书报、衣着、活费开支以外,还有人际交往、网络通讯、书报、衣着、化妆化妆品、电脑、旅游、食品、学习用品、各种考证等消费。不品、电脑、旅游、食品、学习用品、各种考证等消费。不同性同性别大学生的消费结构有所不同,专科生、本科生、研究生别大学生的消费结构有所不同,专科生、本科生、研究生的消的消费结构更有差异。不同年级之间,男女同学之间,消费水费结构更有差异。不同年级之间
4、,男女同学之间,消费水平、平、消费结构、消费方式上都存在着差异。消费结构、消费方式上都存在着差异。(注:来源于新华网等:共青团中央、全国学联共同发布的中国大学生消费与生活形态研究报告)为了研究为了研究男女男女大学生、大学生、不同层次不同层次大学生、大学生、不同年级不同年级大学生大学生的消的消费结构是否有差异,需要将这些定性的因素引入计量模型,费结构是否有差异,需要将这些定性的因素引入计量模型,怎怎样才能在模型中有效地表示这类定性因素的作用呢?样才能在模型中有效地表示这类定性因素的作用呢?3第3页/共54页 第一节 虚拟变量 一、什么是虚拟变量 4数量变量与属性变量 可用数量表现的连续变量 只表
5、明属性的不连续变量 属性变量:不能精确计量的说明某种属性或状态的定性变量,如性别、民族、战争、政治事件 本身是定性的二分类变量(非此即彼)本来是连续变量也可转换为定性变量(如上线/不上线)虚拟变量:人工构造的取值为0和1的作为属性变量代表的变量称虚拟变量,一般常用D(dummy)表示 D=0 表示某种属性或状态不出现或不存在 D=1 表示某种属性或状态出现或存在第4页/共54页虚拟变量的作用作为属性因素的代表,如性别作为某些非精确计量的数量因素的代表,如受教育程度(高中及以下、专科、本科及以上)作为某些偶然因素或政策因素的代表,如伊拉克战争、“911事件”、四川汶川大地震时间序列分析中作为季节
6、(月份)的代表分段回归研究斜率、截距的变动比较两个回归模型的差异虚拟被解释变量模型:被解释变量本身是定性变量5第5页/共54页 二、虚拟变量模型 虚拟变量模型:包含有虚拟变量的模型称虚拟变量模型 三种类型:1、解释变量中只包含虚拟变量作用:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异2、解释变量中既含定量变量,又含虚拟变量 作用:研究定量变量和虚拟变量同时对被解释变量的影响 3、虚拟被解释变量模型:被解释变量本身取值为0或1作用:对某社会经济现象进行“是”与“否”判断研究 (离散选择模型)6第6页/共54页 三、虚拟变量的设置规则 1、虚拟变量取值 虚拟变量D取值为0
7、,还是取值为1,要根据研究的目的去决定 D取值为0的类型基础类型,作为比较的基准 D取值为1的类型与基础类型相比较的类型 例如:D=0 如果是女性(基础类型)D=1 如果是男性(比较类型)D=0 为“911事件”以前(基础类型)D=1 为“911事件”以后(比较类型)D=0 不是大学毕业生(基础类型)D=1 是大学毕业生(比较类型)7第7页/共54页8虚拟变量的设置规则 和 取值均为0的类型基础类型:是比较的基准,代表了基准组(西部地区)的截距 或 分别取值为1的类型是与基础类型比较的类型和 为差异截距系数为东部地区为中部地区为其他为其他又如,研究东、中、西部地区收入X与消费支出Y的关系:第8
8、页/共54页虚拟变量的设置原则虚拟变量的设置原则 虚拟变量的个数须按以下原则确定:每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个属性类别,只在模型中引入m-1个虚拟变量。例子:已知冷饮的销售量例子:已知冷饮的销售量Y除受除受k种定量变量种定量变量Xk的影响外,的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入三个虚拟变量即可:只需引入三个虚拟变量即可:第9页/共54页则冷饮销售量的模型为:在上述模型中,若再引入第四个虚拟变量则冷饮销售模型变为则冷饮销售模型变为:其矩阵形式为:其矩阵形式为:第10
9、页/共54页如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则式中的:显然,(X,D)中的第1列可表示成后4列的线性组合,从而(X,D)不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷阱”,应避免。第11页/共54页使用虚拟变量需注意的问题使用虚拟变量需注意的问题虚拟变量陷阱:若定性变量有m个类别,则引入m个虚拟变量将会产生完全多重共线性问题,避免方法:只引入(m-1)个虚拟变量引入m个虚拟变量但去掉截距项哪种方法更好:包含截距项更方便,可以很容易地检验某个组与基准组之间是否存在显著差异以及差异程度。第12页/共54页13(1)在有截距的模型中如果模型中每个定性因素有m个
10、相互排斥的类型,模型中只能引入m-1个虚拟变量,否则会出现完全多重共线性例如:一个定性因素有三种类型,若设三个虚拟变量若 ;若 ,等等。显然此时 ,而截距 对应的变量为1,再次生成了截距项,则导致了完全的多重共线性2、避免落入“虚拟变量陷阱”第13页/共54页14模型为此时虽然有 ,若 ,若 ,且 ,但因为没有截距项,不会出现完全的多重共线性。注意:此时 等参数不再是差异截距系数,而分别是相应类型的截距。(2)若模型中无截距项第14页/共54页 第二节 虚拟解释变量回归 定性变量作为解释变量,可以影响模型的截距,也可以影 响模型的斜率,还可以同时影响截距和斜率 只使截距变动 只使斜率变动 使截
11、距与斜率都变动 一、用虚拟变量表示不同截矩的回归 加法类型 虚拟变量以加法方式引入模型的作用:改变模型中截距,可分为各种情况去设置虚拟变量15第15页/共54页虚拟变量的引入虚拟变量的引入 企业男职工的平均薪金为:企业男职工的平均薪金为:企业职工薪金模型中性别虚拟变量的引入采取了加法方式。企业职工薪金模型中性别虚拟变量的引入采取了加法方式。1 1、加法方式、加法方式企业女职工的平均薪金为:企业女职工的平均薪金为:在该模型中,如果仍假定在该模型中,如果仍假定E(i)=0,则,则第16页/共54页几何意义:假定20,则两个函数有相同的斜率,但有不同的截距。意即,男女职工平均薪金对教龄的变化率是一样
12、的,但两者的平均薪金水平相差2。可以通过传统的回归检验,对2的统计显著性进行检验,以判断企业男女职工的平均薪金水平是否有显著差异。02第17页/共54页 又例:在横截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上 模型可设定如下:模型可设定如下:这时需要引入两个虚拟变量:这时需要引入两个虚拟变量:第18页/共54页 在E(i)=0 的初始假定下,高中以下、高中、大学及其以上教育水平下个人保健支出的函数:高中以下:高中:高中:大学及其以上大学及其以上:假定假定 3 2,其几何意义,其几何意义:第19页/共54页还可将多个虚拟变量引入模
13、型中以考察多种“定性”因素的影响。如在上述职工薪金的例中,再引入代表学历的虚拟变量D2:本科及以上学历本科以下学历职工薪金的回归模型可设计为:职工薪金的回归模型可设计为:第20页/共54页女职工本科以下学历的平均薪金:女职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:女职工本科以上学历的平均薪金:于是,不同性别、不同学历职工的平均薪金分别为于是,不同性别、不同学历职工的平均薪金分别为:男职工本科以下学历的平均薪金:男职工本科以下学历的平均薪金:男职工本科以上学历的平均薪金:男职工本科以上学历的平均薪金:第21页/共54页221.解释变量只有一个分为两种类型的定性变量无定量变量的回归这
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟 变量 回归
限制150内