基于mrmr的orelm的短期风速预测-王琦.pdf
《基于mrmr的orelm的短期风速预测-王琦.pdf》由会员分享,可在线阅读,更多相关《基于mrmr的orelm的短期风速预测-王琦.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、收稿日期: 2017-06-29。基金项目:国家高技术研究发展计划“863”资助项目(SS2014AA052502);国家自然科学基金资助项目(51507027)。作者简介:王琦(1983-),男,硕士,工程师,研究方向为新能源技术。 E-mail:通讯作者:秦本双(1989-),女,硕士研究生,研究方向为新能源发电。 E-mail:85基于 MRMR 的 ORELM 的短期风速预测王 琦1, 关添升2, 秦本双3(1.中国电力工程顾问集团东北电力设计院有限公司,吉林长春130021; 2.国网吉林省电力有限公司培训中心,吉林长春130021; 3.东北电力大学电气工程学院,吉林吉林13201
2、2)摘 要:由于风速具有间歇性、随机性及波动性等特点,导致大规模风电并网对电力系统的安全、稳定运行带来严重影响。文章提出一种基于最大相关最小冗余(Maximum Correlation Minimum Redundancy, MRMR)的离群鲁棒极限学习机(OutlierRobustExtreme LearningMachine, ORELM)的短期风速预测新方法。首先分析影响风速的属性特征,采用MRMR算法来衡量不同风速属性特征与风速的相关性,进而确定风速属性特征的输入维度;然后对极限学习机(ExtremeLearningMachine, ELM)进行优化,构建ORELM风速预测模型。最后以
3、美国某大型风电场实测数据为依据进行风速预测,仿真结果表明该方法具有较高的预测精度。关键词:风速;短期预测; MRMR; ORELM中图分类号: TK81 文献标志码: A 文章编号: 1671-5292(2018)01-0085-06可再生能源Renewable Energy Resources第36卷 第1期2018年1月Vol.36 No.1Jan. 20180 引言随着世界化石能源的日益枯竭和环保压力的日趋严重,风能作为一种替代石油、煤炭等化石能源的可再生、环保、洁净的绿色能源,受到越来越多国家的高度重视,世界各国纷纷把风力发电作为重点发展的可再生能源发电技术1,2。由于风电具有随机性、
4、间歇性和波动性等特点,导致大规模风电并网给电力系统的稳定性带来严重影响,如增加电力系统的运行成本和旋转备用等3。准确的风速或风功率预测对提高电力系统稳定运行的经济效益具有重要意义,也提高了风电场参与市场竞争的能力,成为解决上述问题的关键。在时间尺度上,风速预测可分为短期、中期和长期预测4,在工程上,均有其不同的意义。中长期风速预测是评估风电场资源的重要依据,短期预测是含风电的电力系统经济调度的重要依据,对提高供电能质量和维持电网的可靠性具有重要意义。风速预测模型分为物理模型和统计模型5。物理模型以气象数据以及地理数据为依据,建立物理预测模型;统计模型通过分析各时间点风速序列内风速数据间的相关性
5、,利用历史数据构建风速预测统计模型。常用的风速预测方法有持续法、灰色系统法、卡尔曼滤波法、支持向量机及神经网络法等68。与其他人工神经网络相比,ELM具有结构简单、泛化能力强、学习时间短等优点,能够取得较好的预测效果9。然而,ELM训练时易受到离群样本点干扰,影响模型的预测精度10。与传统单隐层前馈神经网络相比,文献11指出ELM网络需要更多的隐层节点参数,易导致过拟合。文献12采用正则化对ELM网络进行优化,避免了过拟合,但是隐含层节点数大大增加。针对上述问题,本文提出一种基于MRMR的ORELM风速短期预测新方法。首先确定风速时间序列输入维度,再构建ORELM风速预测模型,最后结合美国某风
6、电场实测数据进行仿真,对本文方法进行验证。1 特征选择影响风速预测的因素有很多,如温度、湿度、风向及气压等,且风速在时间尺度上是连续的,相近时刻的风速具有一定的关联性。本文选取风速、风向、温度、湿度、气压、降雨量、风速标准差及风速极值8个指标进行风速预测,根据文献13选取与每个指标相关性最大的前4个时刻的值作为参数,共计32维风速属性,然而在风速预测模型中考虑过多的因素会增加预测模型的复杂度,降低预测模型的精度,因此,本文基于最大相关最小冗余算法对32维风速样本属性进行筛选,选择出万方数据与风速相关的最佳风速属性样本。V=v1,vi,vmT(1)式中:V为风速属性特征信息库;vi为第i个风速属
7、性矩阵;m为风速属性个数,m=32。1.1 数据预处理由于风速数据中存在量测带来的误差,以及不利于问题分析的数据,故需要对其进行预处理。本文采用持续法和平均插值法对缺失数据和异常数据进行预处理,以便更好的进行风速预测。对原始数据进行规范化和归一化处理,将所有属性数据映射到0,1之间,得到初始风速数据集:xi=xi-minxjmaxxj-minxj,j=1,2,N (2)式中:xi为第i时刻的原始风速数据;xi为归一后的风速数据;N为时间序列长度。1.2 互信息互信息14表示一随机变量包含另一随机变量信息量的度量。根据风速属性特征信息库计算不同属性特征序列相对于风速序列的互信息值,设vo为风速时
8、间序列,则其互信息为vi=vi1,vik,vin;vo=vo1,vok,von (3)I(vi,vo)=vikVvokvop(vik,vok)logp(vik,vok)p(vik)p(vok),k=1,2,n (4)式中:n为训练样本维度;vik为第i个属性在第k时刻的值;p(vik),p(vok)分别为边际分布;p(vik,vok)为概率密度函数;I(vi,vo)为属性特征vi与风速时间序列vo之间的互信息。互信息也指在给定另一随机变量的条件下,原随机变量不确定度的缩减量。I(vi;vo)=H(vik)-H(vik|vok) (5)H(vi)=-vikVp(vik)logp(vik)H(vi
9、|vo)=vikVp(vik)H(vi|vo=vok) (6)式中:H(vi)为离散随机变量vi对应的信息熵;H(vi|vo)为变量vi在变量vo下的条件熵。1.3 基于MRMR的特征选择MRMR算法是基于互信息值来衡量不同属性特征之间的相关性和冗余性,进而搜索出最佳的特征子集15。maxD(V,vok),D=1mxiVI(vi,vo),minR(V),R=1m2vi,voVI(vi,vo) (7)式中:D为V中每一个风速属性序列和该对应风速序列之间互信息的均值,用于衡量不同风速属性和风速之间的相关程度;R为V集中两个不同风速属性之间的互信息,表示属性之间的冗余程度。MRMR准则是所选风速属性
10、序列与风速序列相关性最大,不同风速属性序列之间的冗余性最小。max(D,R),=D-R (8)2 构建风速预测模型设ELM16网络的的激活函数为g(x),则风速预测模型为hL(x)=Li = 1ig(ix+bi) (9)式中:i为第i个输出层神经元与隐含层神经元之间的连接权值矩阵;i为第i个隐含层神经元与输入层神经元之间的连接权值矩阵;x为ELM网络训练的输入集;bi为第i个隐含层神经元的偏置;L为隐含层的神经元个数。一般情况下,离群样本占训练样本比重比较小,可用稀疏性进行描述,而与l2范数相比,l0范数描述稀疏性的效果更好。结合统计学理论,将求解最小化结构风险和经验风险的问题转化为求解最小化
11、l2范数输出权值的问题,使得训练误差e是稀疏的。minCe0+2subject to y-H=e (10)然而,式(10)为非凸优化问题,为了解决这一问题,可将其转化成一个易于处理的具有稀疏特性的凸松弛问题。结合相关理论,可采用l1范数代替式(10)中的l0范数,不仅可保证e的稀疏性,而且整体最小化是凸的。mine1+1C2subject to y-H=e (11)式(11)是一个凸优化约束问题,可用增广拉格朗日乘子法(ALM)进行求解,相应地,增广拉格朗日函数为86可再生能源 2018,36(1)万方数据L(e,)=e1+1C22+T(y-H-e)+2y-H-e22(12)式中:为增广拉格朗
12、日乘子向量;为惩罚参数,根据文献17,取=2N/y1。ALM算法通过迭代求解増广拉格朗日函数得到最优解(e,)和拉格朗日乘子,ALM的迭代方式为(ek+1,k+1)=argmine,L(e,),k+1=k+(y-Hk+1-ek+1) (13)在ALM迭代的第一阶段,可通过连续更新e和两个未知数实现其最小化,具体迭代步骤为k+1=argminL(ek,k)ek+1=argmineL(e,k+1,k)k+1=k+(y-Hk+1-ek+1)扇墒梢梢梢梢梢梢缮梢梢梢梢梢梢(14)可解出ek+1,k+1,如式(15)和(16)所示:k+1=(HTH+2/CI)-1HT(y-ek+k/) (15)ek+1
13、=shrink(y-Hk+1+k/,1/)=max|y-Hk+1+k/|-1/,0osign(y-Hk+1+k/) (16)式中:“o”表示对应元素间相乘18。将式(15)代入式(9)即可求得风速:hL(x)=Li=1ig(ix+bi)=Li=1(HTH+2/CI)-1HT(y-ei+i/)g(ix+bi) (17)基于以上分析,在确定训练样本(xi,yi)、激活函数g(x)、隐含节点数L、正则化系数C和最大迭代次数MaxIter之后,ORELM算法的基本步骤如下:随机生成隐含层参数(wi,bi),i=1,2,L;计算隐含层输出矩阵H(w1,wL;x1,xN;b1,bL);参数初始化设置:=2
14、N/y1,P=(HTH+2/CI)-1HT,e1=0,1=0;for k=1,MaxIter;k+1=P(y-ek+k/);ek+1=shrink(y-Hk+1+k/,1/);k+1=k+(y-Hk+1-ek+1);kk+1。基于MRMR法特征选择的结果,采用ORELM网络结合上述步骤,当预测网络的输入、输出确定后,就能构建风速短期预测模型。将风速预测值进行反归一化处理,采用平均绝对百分比误差(eMAPE)和均方根误差(eRMSE)评估预测模型的准确性和有效性。zi=zimaxi=1,2,nxi- mini=1,2,nxi蓸 蔀+ mini=1,2,nxi (18)eMAPE=1nni=1si
15、-zisi,eRMSE=1nni=1(si-zi)2姨(19)式中:zi为第i个时刻的预测数据;zi为第i个时刻反归一化后的预测数据;si为实际风速值;n为预测样本个数。3 仿真分析结合美国风电场数据采集系统的量测风速以及气象属性数据开展研究。采用单步预测方式,实测数据的时间间隔为30 min,对应预测模型每次输出一个风速值。本文首先对缺失数据和异常数据进行补充和修正;然后以2008年的风速属性数据为训练样本,构建风速短期预测模型;最后以2009年的风速属性数据进行风速预测,检验模型的预测效果。采用MRMR法对32维风速属性特征进行筛选,各属性特征的MRMR指标结果如图1所示。为筛选出最优风速
16、属性特征集合,根据图1结果将各指标绝对值由大到小顺序累加,并计算其eMAPE,结果如图2所示。从图2可知,随着风速属性特征数目的增加,eMAPE先减小后增大,当特征集取9时误差最小。基于上述特征选择结果,在同一数据集下,分别采用传统ELM网络、ORELM网络和MRMR+ORELM网络进行风速预测,选取该风电场2009年3个典型日的实测数据进行对比,结果如图3所示。王 琦,等 基于MRMR的ORELM的短期风速预测图1 MRMR特征选择判据Fig.1 MRMRfeature selection criterion0-0.5-1-1.5-2风速属性个数0 5 10 15 20 25 30 3587
17、万方数据从图3可知:在预测时间段内,三种方法均可预测出风速的变化趋势,但是,在风速变化剧烈的时间段,ELM网络模型的预测效果最差;ORELM网络法则取得了良好的预测效果;MRMR+ORELM模型的预测效果更为显著,预测结果更接近真实风速。三种预测方法的对比结果如表1所示。从表1的误差结果对比可知:与ELM网络风速预测模型相比,ORELM模型预测误差较小,效果较好;ORELM网络在传统ELM模型的基础上考虑了训练样本的稀疏性,采用l0范数对风速预测模型进行优化,预测结果表明,对传统ELM进行优化可提高风速预测模型的精度;在ORELM模型的基础上,本文采用MRMR算法对风速属性特征进行筛选,提高了
18、预测准确性。4 结论本文结合实测数据提出一种基于MRMR法特征选择的ORELM风速预测新方法,得出以下结论。采用MRMR算法对风速属性特征进行约简,简化了风速预测模型的输入集,节约了计算时间,同时模型的精度得到了提高。在ELM网络的基础上,对其进行优化,构建了ORELM风速预测模型,提高模型的泛化能力和预测的准确度,仿真结果验证了本文方法的准确性。参考文献:1 Troncoso A,Salcedo-Sanz S,Casanova-Mateo C,et al.Local models-based regression trees for very short-termwind speed pre
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 mrmr orelm 短期 风速 预测 王琦
限制150内