《应用回归分析第9章课后习题参考复习资料.docx》由会员分享,可在线阅读,更多相关《应用回归分析第9章课后习题参考复习资料.docx(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 9 章 含 定 性 变 量 的 回 来 模 型思索 及练 习参 考答 案9.1 一个 学生 运用 含有 季节 定性 自变 量的 回来 模型,对 春夏 秋冬四 个季 节引 入 4 个 0-1 型自 变量,用 软件 计算 的结 果中 总是自动 删除 了其 中的 一个 自变 量,他为 此感 到困 惑不 解。出现 这种状 况的 缘由 是什 么?答:假设这个 含有 季节 定性 自变 量的 回来 模型 为:其中含有 k 个定量变量,记为。对春夏秋冬四个季节引入 4 个0-1 型自变量,记为,只取了 6 个观测值,其中春季及夏季取了两次,秋,冬各取到一次观测值,那么样本设计矩阵为:明显,()中的第 1
2、列可表示成后 4 列的线性组合,从而()不满秩,参数无法唯一求出。这就是所谓的“虚拟变量陷井,应防止。当某自变量对其余 1 个自变量的复判定系数 超过确定界限时,软件将拒绝这个自变量进入回来模型。称 1-为自变量的容忍度,软件的默认容忍度为 0.0 0 0 1。也就是说,当0.9 9 9 9 时,自变量将被自动拒绝在回来方程之外,除非我们修改容忍度的默认值。而在这个模型中出现了完全共线性,所以软件计算的结果中总是自动删除了其中的一个定性自变量。9.2 对自 变量 中含 有定 性变 量的 问题,为 什么 不对 同一 属性 分别建 立回 来模 型,而实 行设 虚拟 变量 的方 法建 立回 来模 型
3、?答:缘由有两个,以例 9.1 说明。一是因为模型假设对每类家庭具有一样的斜率和误差方差,把两类家庭放在一起可以对公共斜率做出最正确估计;二是对于其他统计推断,用一个带有虚拟变量的回来模型来进展也会更加精确,这是均方误差的自由度更多。9.3 探讨 者想 探讨 实行 某项 保险 革新 措施 的速 度 y 对保 险公 司的规 模 x1和保 险公 司类 型的 关系 参 见参 考文 献【3】。因变量 的计 量是 第一 个公 司接 受这 项革 新和 给定 公司 接受 这项 革新在 时间 上先 后间 隔的 月数。第 一个 自变 量公 司的 规模 是数 量型的,用 公司 的总 资产 额 百万 美元 来 计量
4、;第 二个 自变 量公司 是定 性变 量,由两 种类 型构 成,即股 份公 司和 互助 公司。数据 资料 见表 9.8,试 建立 y 对公 司规 模和 公司 类型 的回 来。i y x1公司类型1 1 7 1 5 1 互助2 2 6 9 2 互助3 2 1 1 7 5 互助4 3 0 3 1 互助5 2 2 1 0 4 互助6 0 2 7 7 互助7 1 2 2 1 0 互助8 1 9 1 2 0 互助9 4 2 9 0 互助1 0 1 6 2 3 8 互助1 1 2 8 1 6 4 股份1 2 1 5 2 7 2 股份1 3 1 1 2 9 5 股份1 4 3 8 6 8 股份1 5 3 1
5、 8 5 股份1 6 2 1 2 2 4 股份1 7 2 0 1 6 6 股份1 8 1 3 3 0 5 股份1 9 3 0 1 2 4 股份2 0 1 4 2 4 6 股份解:对定型变量“公司类型进展数量化处理:引入虚拟变量 x2:公司类型为“互助时,x2=1,为“股份时,x2=0。那么表 9.5 中数据转换成以下数据:i y x1公司类型1 1 7 1 5 1 12 2 6 9 2 13 2 1 1 7 5 14 3 0 3 1 15 2 2 1 0 4 16 0 2 7 7 17 1 2 2 1 0 18 1 9 1 2 0 19 4 2 9 0 11 0 1 6 2 3 8 11 1
6、2 8 1 6 4 01 2 1 5 2 7 2 01 3 1 1 2 9 5 01 4 3 8 6 8 01 5 3 1 8 5 01 6 2 1 2 2 4 01 7 2 0 1 6 6 01 8 1 3 3 0 5 01 9 3 0 1 2 4 02 0 1 4 2 4 6 0建立回来方程 y b0 1x1 2x2+用软件作线性回来,得到输出结果如下:R 检验:拟合优度 R2=0.8 8 3,接近 1,说明回来拟合的效果较好。F 检验:F 值=7 2.4 9 7,.值为 0,说明回来方程通过 F 检验。T 检验:回来系数通过 t 检验,回来方程为:4 1.9 3 0 0.1 0 2 x1
7、 8.0 5 5 x2说明:假设引入虚拟变量 x2,当公司类型为“互助时,x2=0,为“股份时,x2=1。那么回来方程为:1 2结果 分析:1 股份制公司实行保险革新措施的主动性比互助型公司高,缘由可能在于股份制公司建立在共同承当风险上,所以更情愿革新;2 公司规模越大,实行保险革新措施的倾向越大:大规模公司的保险制度的更新对公司的影响程度比小规模公司大,因此大规模公司更倾向于比拟更新措施和现有政策带来的效益,最终表现在接受革新措施的时间间隔较短。铁路 里程 数据,依 据散 点图 视察 在某 时间 点有 折点,用 折线回来 拟合 这个 数据。解:由散点图 9(见下列图)可看出在 1 9 9 5
8、 年1 6 有折点,考虑由两段构成的分段线性回来,这可以通过引入一个 0-1 型虚拟自变量实现。由散点图可知该折点为 1 6,那么引入虚拟自变量,由输出的调整后的确定系数,说明拟合优度较好。由输出的系数表可以得出回来方程为:由输出方程分析表可知,F 值为 5 9 4.5 2 4,且 P 值约为零,说明回来方程特殊显著;系数表中回来参数对应的 t 检验 P 值都约等于零,说明回来参数均通过了显著性检验。因此,折线方程成立。散点 图方差分析表系数表9.5 某省 统计 局 1 9 9 0 年 9 月在 全省 范围 内进 展了 一次 公众 平安感问 卷调 查,参考 文献【1 0】选 取了 调查 表中
9、的一 个问 题进 展分析。此 题对 其中 的数 据做 了适 当的 合并。对 1 3 9 1 人填 写的 问卷设 计:“一人 在家 是否 害怕 生人 来。因 变量 1 表示 害怕,2 表示 不害 怕。2 个自 变量:x 1 是年 龄,x 2 是文 化程度。各变 量的 取值 含义 如表 9.1 0 所示。是否害怕 y 年龄 x 1 文化程度x 2害怕 1不害怕 01 6 2 8 岁 2 22 9 4 5 岁 3 74 6 6 0 岁 5 36 1 岁以上 6 8文盲0小学1中学2中专以上3现在的问题是:公民一人在家害怕 生人来这个事务,及公民的年龄 x 1,文化程度 x 2 有没有关系呢?调查数据
10、见表9.1 1。序号x1x21 0122 22 20131 1039834567891 01 11 21 31 41 51 62 22 23 73 73 73 75 3 535 35 36 86 86 86 8230123012301233 8 98 342 74 8 71 0 3961 8 84 721 01 841 4 62 631 81 9 62 7437 31 803702 4 35 7192 9 17 6531 1 52 9271 14其中,是依据9.4 4 式计算的。(1)把公 民的 年龄 x 1,文化 程度 x 2 作为 数值 型变 量,建 立y 对 x 1,x 2 的回 来。(
11、2)把公 民的 年龄 x 1,文化 程度 x 2 作为 定性 型变 量,用 0-1 变量 将其 数量 化,建立 y 对公 民的 年龄 和文 化程 度的 回来。(3)你对 回来 的效 果是 否满 意,你认 为主 要的 问题 是什 么?解:(1)先对 进展 逻辑 变换,令,那 么干脆 用进 展 y 及 x 1,x 2 的回 来,输出 结果 如下:由输 出系 数表 结果 得到 回来 方程:E M B E D E q u a t i o n.3那么 复原 后回 来方 程为:=由方 差分 析表 知 F 值=0.3 8 6,P 值=0.6 8 7,大 于 5%,说 明回 来方程 不显 著;由系 数表 知回
12、 来参 数的 t 检验 均没 有通 过,因为 P 值都 大 于5%,说 明回 来参 数未 通过 显著 性检 验。由于 回来 模型 存在 异方 差,所以 接受 加权 最小 二乘 法重 新拟合,权重:输出 结果 如下:由输 出结 果得 到回 来方 程:=复原 后的 回来 方程:=由方 差分 析表 结果 知值=4.3 0 4,P 值=0.0 3 7,小 于 5%,说 明回来方 程显 著;由系 数表 知 对应 的回 来系 数相 应的 P 值=0.6 9 7,大 于 5%,说明 对应 的回 来系 数没 有通 过检 验,不显 著;对应 的回 来系 数相 应的 P 值=0.0 1 3,小 于 5%,说 明
13、对应 的回来 系数 通过 检显 著性 验,且该 回来 系数 为-0.3 3 1,说明 文化程 度越 高越 不害 怕。(2)把公 民的 年龄 x 1,文化 程度 x 2 作为 定性 型变 量,引入 6个 0-1 变量 表示 年龄1)干 脆 进 展 y 及 6 个 虚 拟 变 量 的 未 加 权 的 回 来,输 出 结 果 如下:由 方 差 分 析 表 知 2.4 7 2,P 值=0.1 0 6,大 于 5%,说 明 回 来方 程 不 显 著;且 除 了 外,其 它 自 变 量 对 应 的 回 来 系 数 都 没 通过检 验。下面 通过 后退 法选 择变 量对 上述 模型 改良。输出 结果 如下 表:后退 法的 过程 中剔 除了,留 下了,但 是 对应 的回 来系数 未通 过检 验,将其 剔除,最 终留 下了;而 且回 来方 程显著,2)加 权 回 来:用 后 退 法 选 择 变 量,由 输 出 结 果 如 下 可 知 最终只 留下 了。从上表可以看出,最终只保存了变量,回来方程为:从模型概要表中可以看出模型四的回来方程的拟合优度不佳。3 对 回来 的效 果不 满意。变 量 在不 同的 回来 方法 下显 著性不同,对 该变 量的 显著 性判 定还 有待 改良。假 如能 获得 年龄 的精确 值做 回来 的极 大似 然估 计,可能 会改 良回 来效 果。
限制150内