多元线性回归的统计检验ppt课件.ppt
“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。多元线性回归模型的统计检验1、拟合优度检验2、方程总体线性的显著性检验(F检验)3、变量的显著性检验(t检验)“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。1.拟合优度检验可决系数与调整可决系数 总离差平方和TSS,回归平方和ESS,残差平方和 RSS2iTSSYY2iESSYY2iiRSSYYTSSRSSESS“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。可决系数回归平方和占总离差的比重即是衡量样本回归线对样本观测值得拟合程度。 越接近1,模型的拟合程度越高21ESSRSSRTSSTSS 2R“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。可决系数的问题在实际应用中发现,如果模型中每增加一个解释变量, 往往随之增大。原因:残差平方和往往随着解释变量个数的增加和减少,至少不会增加。因此,在多元回归模型之家比较拟合优度,不是一个合适的指标。2R2R“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。可调整的可决系数思路:在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以要将残差平方和与总离差平方和分别除以各自的自由度,剔除变量个数对拟合优度的影响。公式如下:2(n1)1(1)RSSkRTSSn “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。可决系数与调整可决系数的关系经过计算转化后可决系数与调整后的可决系数之间的关系:2211 (1)1nRRnk “雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。2.方程总体线性的显著性检验(F检验)方程显著性F检验的模型:检验参数 是否显著为零。 按照假设检验的原理和程序,原假设与备择假设: i011i22k.uikiiYXXXk0:121=0=0=0:(1,2,., )kjHHjk:,.,不全为零“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。F检验在原假设 成立的条件下,统计量:服从自由度(k,n-k-1)的F分布。给定显著性水平,比较 与F值大小:0:H(1)ESSkFRSSnkF00( ,1)( ,1)FF k nkFF k nk拒绝原假设H接受原假设H“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。拟合优度与F检验关系1不同点1.拟合优度:从已经估计的模型出发,检验它对样本观测值得拟合程度2.F检验:从样本观测值出发检验模型总体的线性关系的显著性。联系模型对样本的观测值拟合程度高,模型总体线性关系的显著性就强“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。拟合优度与F检验关系2两个统计量之间的关系式:或者2111nRnkkF 22(1)(1)RkFRnk“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。变量的显著性检验( 检验)多元线性回归模型,方程的总体线性关系式显著的,并不能说明每个解释变量对被解释变量的影响都是显著的。因此必须对每个解释变量进行显著性检验,以决定是否作为解释变量被保留在模型中。t“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 统计量参数估计量的方差: 表示矩阵 主对角线上的第j个元素。 是随机干扰项的方差,实际计算中用 代替。 服从正态分布如下:21( )()CovX X2j()cjjVarcjj1()XX22j2j(,)jjjNc (1)1jjjjjjjtt nkSe ecnkt“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。 检验在变量显著性检验中,针对 设计的原假设和备择假设为:给定一个显著性水平,得到临界值根据: tjX01:00jjHH:2t0202(1)(1)ttnkHttnkH拒绝原假设接受原假设“雪亮工程是以区(县)、乡(镇)、村(社区)三级综治中心为指挥平台、以综治信息化为支撑、以网格化管理为基础、以公共安全视频监控联网应用为重点的“群众性治安防控工程”。注意没有绝对的显著性水平。关键仍然是考察经济变量在经济关系上是否对解释变量有影响,显著性检验起到验证的作用。同时还要看显著性水平不太高的变量在模型中及模型应用中的作用,不要简单剔除变量!