3 虚拟变量与方差分析1350.pptx
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《3 虚拟变量与方差分析1350.pptx》由会员分享,可在线阅读,更多相关《3 虚拟变量与方差分析1350.pptx(41页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、营销研究方法营销研究方法 -数量分析方法数量分析方法周影辉周影辉 博士博士中山大学管理学院市场学系中山大学管理学院市场学系1问题引入例 6.在表 2-7给出了一些女性曾生子女数的数据,同时也给出了她们的年龄,受教育程度和居住地。如果我们想知道女性的年龄(AGE),文化程度(EDU,5个级别)及居住地(AREA,城市和农村)对其曾生子女数的影响,怎样建模?关键是文化程度和居住地2表 2-7 CEB AGE EDU AREA 1 20 3 1 1 22 4 2 2 24 3 2 1 25 5 1 1 28 5 1 3社会科学研究中,有许多分类变量,如民族,文化程度,性别,公司类型,品牌等它们也可以
2、被包含在线性回归模型中,用以解释因变量的变化在将它们引入回归模型之前,必须先将它们转化为虚拟变量(哑变量)。为什么?4因为分类变量的各类根本没有定量关系,不能像间距变量的情形那样,分析 变化一个单位时,的平均变化如 男(0)-女(1)但我们可以以类为单位,分析各类对 的影响5虚拟变量的建立设是有个分类的分类变量,在数据处理时以不同编码值代表案例所属的类型用个取值为 0 和的虚拟(dummy)变量分别代表各个类的属性当案例属于一个虚拟变量所代表的类时,这个虚拟变量就取,否则取 0分类变量:有问题吗?6这 个虚拟变量线性相关,违背了最小二乘回归的条件。怎样解决?取消一个虚拟变量,即对有 个分类的变
3、量用 个虚拟变量编码。有没有信息损失,为什么?称不设虚拟变量明确表示的类为参照类7例 6.(续)文化程度(EDU)有 5 类,分别为 (1)文盲或半文盲(2)小学 (3)初中 (4)高中 (5)大学5 类需 4 个虚拟变量,取(1)为参照类,则虚拟变量取值规则如下 8地区(AREA)有两类,分别为 (1)城市和(2)农村,只用一个虚拟变量 DU 就可以了。取农村为参照类,编码规则为 根据原变量值建立虚拟变量的工作可以用 SPSS 数据转换功能来完成SPSS Show!9用表 2-7 的数据建立如下回归方程 回归结果如下 方程的 为 0.96,各变量的回归系数均在 0.05 水平显著10虚拟变量
4、回归系数的意义当两个分类变量都属于参照类时,所有虚拟变量都取值 0,回归方程(41)可以简化为上式为参照类女性的曾生子女数对年龄的回归直线,为直线的截距,为直线的斜率(表示?)11当受教育程度为小学,居住地为农村时,方程为(44)是(43)的平行线,但截距增加了 ,因此 是小学文化程度女性比文盲半文盲女性在相同的年龄和居住地条件下曾生子女数多的部分12表示各类别的虚拟变量的回归系数 表示该类别与参照类均值之差,因此它又称为差别截距 回归方程(42)各系数的解释?13如何衡量各个变量(组)作用的大小?用偏确定系数。分别做不含有 (作为一组,代表EDU),AGE 和 DU 的线性回归,然后根据(2
5、3)式,可得 表 2-814表 2-815如果只关心 AGE 和 AREA 对 CEB 的影响,我们可以做 CEB 对 AGE 和 AREA 的回归为什么不建立两个线性回归模型,分别对城乡女性拟合她们曾生子女数与其年龄的回归直线?分别估计和用虚拟变量回归将他们合并一起估计有何差别?16多元回归比简单回归的优越性:只有将各方面的变量放在同一模型中,才能在控制其他自变量的情况下对各自自变量的边际作用进行考察和检验统计控制17与单因素方差分析的关系如果一个回归分析中只有虚拟变量,并且这些虚拟变量都代表某一个原变量的不同类别,那么这一回归的整体检验等价于单因素方差分析(one-way analysis
6、 of variance,1-way ANOVA)如只纳入代表 EDU 的四个虚拟变量的回归 回归方程的显著性检验 F=10.079SPSS Show!方差分析 v.s.回归分析18在只有一方面的虚拟变量的回归方程中,由于没有其他变量,各回归系数的表现十分单纯,回归常数项 就是参照类案例的 平均值本例中 即为两个文盲、半文盲案例的 CEB 值 4 和 5 的平均值其他教育水平类的平均值则通过参照类平均值加上相应差值 来表现,如大学这一方程完美再现了样本按教育程度分类的类平均值19与双因素方差分析的关系如果一个回归分析中只有两个因素形成的虚拟变量,那么这一回归分析等价于双因素方差分析(2-way
7、 ANOVA)如例 6 中将代表教育程度和城乡的所有虚拟变量纳入回归中严格来说,它是只考虑了主效应的双因素方差分析,它没有考虑教育程度和城乡两个因素之间的交互作用(Interaction)如何在回归中纳入交互作用呢?20交互作用用两个因素的各项虚拟变量相乘得到如例 6 中,EDU 与 AREA 的交互作用为SPSS Show-How to get these interaction terms?方差分析 v.s.回归分析?21含交互作用的回归方程为将交互作用包含在内的饱和双因素方差模型,能够完美再现各交互分类的组平均值常数项仍然是参照类的平均值,这时的参照类是交互参照类,即两个因素的所有虚拟变
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 虚拟变量与方差分析1350 虚拟 变量 方差分析 1350
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内