[数学]电力负荷预测第七章-回归分析预测法.ppt
-
资源ID:74921965
资源大小:2.60MB
全文页数:99页
- 资源格式: PPT
下载积分:30金币
快捷下载
会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
[数学]电力负荷预测第七章-回归分析预测法.ppt
第七章 回归分析预测法 一.概述 二.一元线性回归模型预测 三.多元线性回归模型预测 四.虚拟变量回归模型预测 五.非线性回归模型预测 六.自回归模型预测教 学 要 求清楚回归分析预测法的适用对象;清楚回归分析与相关分析的区别;掌握一元线性回归模型的参数估计与检验;了解多元线性回归模型的参数估计与检验;了解带虚拟变量的回归模型的应用条件;清楚非线性回归模型的建模方法;教学重点 相关分析与回归分析的基本概念;一元线性回归模型的建立与参数检验;教学难点 相关系数的含义 参数检验的作用一.概述回归分析预测法 从各种现象的相互关系出发,通过对与预测对象有联系的现象的变动趋势分析,推算预测对象未来状态数量表现的一种方法。xj负荷y影响因素时间x1负荷的变化空间示意图y=f(t)时间序列模型y=f(x)关联序列模型 几个基本问题 1.回归的含义2.相关关系的概念3.相关分析与回归分析的区别与联系4.相关分析与回归分析的作用5.回归分析模型的种类1.回归的含义回归研究自变量与因变量之间关系形式的分析方法。GDP电量需求气象因素系统负荷长期预测短期预测自变量因变量2.相关关系的概念 函数关系:严格的依存关系,有数学表达式。相关关系:非严格的,不确定的依存关系。确定性问题确定性问题(函数关系)不确定性问题不确定性问题(相关关系)相关关系的特点现象之间确定存在数量上的客观内在关系。表现在:一个现象发生数量上的变化,要影响另一现象也相应 地发生数量上的变化。现象之间的依存关系不是确定的,具有一定的随机性。表现在:给定自变量的一个数值,因变量晖有若干数值和它对 应,且因变量总是遵循一定规律围绕着这些数值的平 均数上下波动。3.相关分析与回归分析的区别与联系相同点:研究及测度2个及以上变量之间的关系。不同点:相关分析 2个随机变量及以上紧密程度。直线相关相关系数 曲线相关相关指数 多元相关复相关系数 不分自变量与因变量。回归分析 几个随机变量与其它几个普通变量之间的数量变动关系。需区分自变量与因变量。相互联系先相关分析,后回归分析。相相关关分分析析回回归归分分析析可建模推算预测判断关联关系相关分析是回归分析的基础;序列相关并不一定能建立回归模型;初级高级4.相关分析与回归分析的作用对数量关系的研究分析,深入认识现象之间的相互依存关系。通过对回归模型,进行预测和预报。用于补充缺少的资料。5.回归分析模型的种类自变量多少:一元与多元模型线性性:线性与非线性含虚拟变量:普通回归与虚拟变量回归 (自变量为数量变量和品质变量)含滞后量:无自回归、自回归二.一元线性回归预测模型定义:对两个具有线性关系的变量,配合线性回归模型,根据自变量的变动来预测因变量的平均发展趋势的方法,为一元线性回归预测法。主 要 内 容 1.模型描述 2.参数估计 3.相关系数 4.显著性检验 5.预测及预测区间的确定 6.算例1.模型描述xi:影响因素(可以控制或预先给定);:各种随机因素对y的影响的总和,服从正态分布,即 N(0,2);yi:预测目标,由于受随机因素的影响,是一个以回归直 线上对应值为中心的正态随机变量,即yN(a+bx,2);自变量因变量一元线性回归模型一元线性回归模型总体方差为一组观察值(xi,yi)的 散点状态的估计式;估计式;2.OLS参数估计(Ordinary Least Square)基本思想:通过数学模型,配合一条较为理想的趋势线,使得原序列的观察值与估计值的离差平方和为最小;推导3.相关系数选择主要因素作模型的自变量的依据离差平方和的分解 离差在一元线性回归模型中,观察值yi的取值是上下波动的,这种波动现象,。原因自变量变动的影响,即x取值的不同;其它因素的影响(包括观察和实践中产生的误差等);对1个观察值,离差为 对n个观察值,离差为 为0,证明(略)离差项的物理含义:Q1由客观和实验中产生误差以及其它未加控制因素 引起的(未解释部分)。即:由那些未被考虑的 随机因素的影响产生的,且无法因回归方程的 建立而消失。Q2由于选择自变量x并建立线性回归方程而产生的,可用回归模型的建立加以说明(已解释部分)可决系数R2R2在总的离差中,由自变量x变动所引起的百分比。它是评价两个变量之间线性相关关系强弱的一个 重要指标。0R21 相关系数R:R为可决系数的平方根,是一元线性方程中衡量两个 变量之间相关程度的重要指标。可不需要先求出回归模型中的剩余离差来求,直接从样本数据中计算得到,实际工作中带 来方便。若代入平均数,则R的计算变为积差法计算公式R的讨论(-1R1)R=0 说明回归离差为0,即自变量x的变动对总离差毫无影响。零相关;R=1 说明回归离差等于总离差,即总离差的变化完全由自变量变化所引起的。完全相关(退化成函数关系)0 R 0.7或 R2 0.49 说明自变量对x的变动对总离差的影响占一半以上。高度相关;R0.3或 R2 0.09 说明自变量对x的变动对总离差的影响低于9%。低度相关;0.3 R0.7 说明自变量对x的变动对总离差的影响在9%50%之间。中度相关;4.显著性检验目的 检查所建立的一元线性方程,是否符合变量之间的客观规律性,两变量之间是否具有显著的线性相关关系?方法 相关系数检验法(适用于一元线性回归方程)问题描述 相关系数的绝对值大到什么程度程度时?才能认为两变量之间的相关关系是显著的,回归模型用来预测是有意义的。检测标准 与观测值的个数有关;(n)与不同树枝的显著性水平有关;()步骤step1:计算R;Step2:由回归模型的自由度(n-2)和给定的显著性水平 ,从相关系数表中查出临界值R(n-2);Step3:判断。若R R(n-2),说明两变量之间线性相关 关系显著,检验通过,回归模型可用于预测;若 R 1,R2非负,但 可能为负,当 为负时,取 (2)F检验检验一组自变量x1xm与y之间回归效果的显著性。若检验通过,表明1,2=,m0。其中:(m-1)为回归离差 的自由度 (n-m)为剩余离差 的自由度检验方法:若:FF(m-1),(n-m),说明x1xm与y回归显著;FF(m-1),(n-m),说明回归效果不显著;不显著的原因:说明回归影响y的因素,除了一组自变量x1xm变之外,还有其它不可忽略的因素;y与一组自变量x1xm之间的关系,不是线性的;y与一组自变量x1xm之间无关;对策另选自变量或改变预测模型;F与R2,R之间的关系(3).t检验与R检验和F检验不同,前者是将所有的自变量作为一个整体来检验它们与y的相关程度以及回归效果;t检验则是对所求回归模型的每一个系数逐一进行检验。其中:第j个自变量xj的回归系数;:的样本标准差;t检验步骤:Step1:计算估计标准差;S的简洁计算公式n=3n=4Step2:计算样本标准差 (Cjj为(xx)-1主对角线上第j个元素)Step3:计算t统计量 tj t/2(n-m),(j=1m)xj对y有显著影响。tj t/2(n-m),xj对y无影响,应删除。(4).DW检验检验序列相关对模型的影响;什么是序列相关?指数列前后期相关。可以是与前一期相关,也可 以是与以前若干期都相关;常见的为时差为一期 的序列相关,称之为一阶自相关。对于序列相关,若采用最小平方法估计参数,将会产生严重的后果:1)估计标准差S可能严重低估 的真实值;2)样本方差 可能严重低估D(j)的真实值;3)估计回归系数 可能歪曲j的真实值;4)通常的F检验和t检验将不再有效;5)根据最小平方法估计量所作的预测将无效。方差DW检验(Durbin-Waston准则)一阶自相关展开式大样本时(n30)DW检验步骤Step1:利用最小平方法求回归模型及残差eiStep2:计算DW的值;Step3:根据给定的检验水平及自变量的个数m,从Dw检 验表中差的相应的临界值DL、DU,从根据表得出 检验结论。DW检验判别表与样本的容量n和自变量的个数m有关n一定时,m愈大,无结论区愈大;m一定时,n愈大,无结论区愈小;注意:若DW的统计量落入无结论区,则不能做出 回归模型是否存在自相关现象的结论。DW检验判别域?当落入无结论区的解决办法:增加样本;调整样本;采用其它方法进行自相关检验;?产生自相关的原因 忽略某些重要的影响因素;错误的选用了回归模型的数学形式;随机误差项的确是相关的(如后效性);?产生自相关时的补救办法把略去的重要影响因素一入到模型中;重新选择合适的回归模型形式;增大样本容量,改变数据的准确性;3.预测区间(1)估计标准误差 (2)预测值 预测误差 样本方差(3)预测区间 (n30)(n 30)4.例题 1)配合适当的模型并进行各种检验;2)取=0.05,求x2=67,x3=58时的预测值与预测区间;197819791980198119821983198419851986198719881989y9.09.510.010.612.416.217.720.121.825.331.336.0 x212.112.913.814.816.420.924.228.130.135.848.554.8x348.248.949.5450.2551.0251.8452.7653.6954.5555.3556.1656.98时间序列变化关系曲线解:(1)设变量,并假定y与x2,x3之间存在着线性关系;(2)建立二元线性回归模型(3)计算回归系数(4)R检验说明相关关系显著(5)F检验(6)T检验通过t检验,说明x2,x3均对y有显著影响。(7)DW检验说明回归模型不存在着自相关。DW检验表 n最小为15综合计算结果为(8)预测作业7-1.(1)根据以下数据,建立多元线性回归模型;(2)对模型进行检验(=0.05)(3)设x2较上年增长15%,x3增长17%时,作下一年 度y的预测且确定预测区间;197719781979198019811982198319841985198619871988y8.28.38.69.09.49.412.213.715.518.323.327.3x276.477.980.283.085.288.2116.2129.0147.5183.2210.3248.5x39.07.85.55.010.83.56.210.818.415.732.545.5Excel可用的函数有:MMULT(乘),MINVERSE(逆),TRANSPOSE(转置)5.采用excel的多元回归预测影响变量中有品质变量如:性别:男、女地震:有、无季节:春、夏、秋、冬地势:丘陵、山区、平原政策:改变前、改变后第四节第四节 虚拟变量回归预测法虚拟变量回归预测法一、虚拟变量 1-0二、带虚拟变量的回归模型发生重大变异的跳跃,间断式模型:yi:因变量,xi2:自变量,Di虚拟变量设i0为观察值出现重大变异的年份Di=0 ii0 1 i i0续上续上则yi=B1+B2Xi2+i iR(n-1)2、多元回归:(最小二乘法,R、F、t、DW验证)小结小结3、虚拟变量回归4、非线性回归 线性化 直接换元 间接换元 转化为非线性高斯牛顿迭代法