基于数据挖掘的楼宇短期负荷预测方法研究-林顺富.pdf
《基于数据挖掘的楼宇短期负荷预测方法研究-林顺富.pdf》由会员分享,可在线阅读,更多相关《基于数据挖掘的楼宇短期负荷预测方法研究-林顺富.pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第44卷 第7期 电力系统保护与控制 Vol.44 No.7 2016年4月1日 Power System Protection and Control Apr. 1, 2016 DOI: 10.7667/PSPC151318 基于数据挖掘的楼宇短期负荷预测方法研究 林顺富1,2,郝 朝1,汤晓栋3,李东东1,2,符 杨1 (1.上海电力学院电气工程学院,上海 200090;2. 上海高校高效电能应用工程研究中心,上海 200090; 3.上海电器科学研究所,上海 200063) 摘要:楼宇短期负荷预测是楼宇能效管理系统中对用能子系统进行评估诊断、优化控制以及调度规划的重要基础。针对智能楼宇参
2、与需求响应所需高精度、实时负荷信息的要求,提出一种基于数据挖掘支持向量机的楼宇短期负荷预测方法。选择与待预测时点相似相近的样本数据集,采用K-means算法对样本数据集中的温度、湿度、气压等气象数据进行聚类,根据聚类结果提取训练样本,最后采用支持向量机(SVM)算法建立负荷预测模型。实际应用结果表明,该方法预测结果平均相对误差为1.34%,相对误差在1%以内的概率达到67.5%,优于现有的时间序列法、同结构SVM法、不考虑气象因素的DMSVM法等方法。 关键词:楼宇能效管理;负荷预测;数据挖掘;支持向量机;聚类分析 Study of short-term load forecasting me
3、thod based on data mining for buildings LIN Shunfu1, 2, HAO Chao1, TANG Xiaodong3, LI Dongdong1, 2, FU Yang1 (1. College of Electrical Engineering, Shanghai University of Electric Power, Shanghai 200090, China; 2. Shanghai Higher Institution Engineering Research Center of High Efficiency Electricity
4、 Application, Shanghai 200090, China; 3. Shanghai Electrical Apparatus Research Institute, Shanghai 200063, China) Abstract: The load forecasting is the important basis of the energy management systems for the evaluation and diagnosis, optimized control, and scheduling of the energy subsystems in bu
5、ildings. In order to obtain real-time and high accuracy load information, this paper proposes a short-term load forecasting method based on data mining for buildings. It firstly finds the sample datasets that are similar to the forecasted time points from the historical data, and then performs the K
6、-means cluster analysis on the meteorological data, such as temperature, humidity, barometric pressure, etc., and finally adopts the support vector machine (SVM) for short term forecasting. The practical application results prove that the eMAPEof the proposed method is 1.34%, and the probability of
7、the relative error less than 1% is 67.5%, which are obviously better than that of the ARIMA, SVM and DMSVM without meteorological data. This work is supported by National Natural Science Foundation of China (No. 51207088). Key words: energy management of buildings; load forecasting; data mining; sup
8、port vector machine; cluster analysis 0 引言 楼宇建筑能耗约占全球总能源消耗的40%,是温室气体排放的重要来源之一。我国楼宇耗电量约占全国城镇总耗电量的27%,95%以上建筑属于高耗能建筑,单位建筑能耗是发达国家的1.52倍1。随着我国经济发展和产业结构调整,楼宇建筑能耗比重将继续上升。为了应对能源危机和环境恶化, 基金项目:上海市科委科创项目(14DZ1201602) ;国家自然科学基金项目(51207088) ;上海绿色能源并网工程技术研究中心 (13DZ2251900);国网公司科技项目(SGRI- DL-71-14-004) 楼宇建筑的节能工作及
9、能效管理受到政府以及学界的重要关注2。楼宇负荷预测是楼宇能效管理系统对建筑内的各个用能子系统评估诊断、优化控制用电以及调度规划的重要基础。结合精确的负荷预测,可以分析用户曲线高峰以及可控负荷的节能潜力,并为制定基于需求响应的柔性负荷控制机制提供支撑。 目前常用的负荷预测方法有时间序列法、灰色预测法、BP神经网络以及组合预测法等。时间序列法、灰色预测法等方法在面对办公楼宇非线性、周期性的负荷特点时预测难度较大3。此外,楼宇负荷受诸多随机因素尤其是气象因素的直接干扰,要排除这些干扰因素或者将其考虑到负荷预测模型中- 84 - 电力系统保护与控制 是提高负荷预测精度的常用方法4-8。人工智能预测法可
10、以胜任考虑多因素的预测工作,但是训练这些大量的非线性影响因素数据,不仅导致训练速度降低,非有效样本的输入会大大降低训练的精度。数据挖掘可以提取海量数据中相似相近样本,将智能预测法与数据挖掘技术联合,可以极大地降低非有效训练样本的输入,提高训练速度和精度9-12。 文献 13提出了一种提高负荷预测精度的方法,通过对历史数据的预处理方式进行改进,得到较高的预测精度。文献 14联合聚类分析和神经网络预测法并应用到商业办公区的负荷预测,比时间序列法( ARIMA)预测精度提高50%。文献15将自回归小波神经网络负荷预测方法应用于微网的楼宇建筑中,考虑了微电网负荷时间序列的波动性和不光滑的特点,并且通过
11、增加日期类型影响因素来提高负荷预测精度。文献16采用混沌时间序列法对微网中居民小区负荷进行预测,但混沌理论不适于周期性负荷预测中。 本文针对智能楼宇负荷特点结合实时气象数据提出一种DMSVM负荷预测方法,首先选择待预测整时点的相似相近历史数据;然后采用数据挖掘中K-means聚类算法对待预测整时点的气象因素聚类,根据聚类结果提取与待预测整时点同类的历史负荷数据;最后选择支持向量机建立负荷预测模型。将本方法应用到上海某办公楼宇证明本文DMSVM方法预测精度更高。 1 DMSVM负荷预测流程 采用联合聚类分析和支持向量机的负荷预测方法,通过提取历史数据集中相关负荷数据,并考虑气象因素进行负荷预测,
12、可以充分发挥聚类分析和支持向量机各自的优势,实现高精度快速度负荷预测17-19。在进行负荷预测前首先要进行数据预处理,针对待预测时点,收集相关预测影响因素的数据,如气温、气压、湿度等,组成如下的历史数据集记录: 整点时刻 负荷 气温 气压 湿度 基于数据挖掘的负荷预测方法流程如图1所示,主要分为以下几个步骤: 1) 对预处理后的数据记录,按照预测的相似相近原则,选择与待预测点相关的历史负荷数据,组成待预测点的聚类输入样本集; 2) 对上述得到的数据集中的气象因素(气温、气压、湿度)进行聚类分析,根据聚类结果选择与待预测点的气象因素同类的历史数据集作为训练样本数据集; 图1 负荷预测流程图 Fi
13、g. 1 Flowchart of load forecasting 3) 对上述得到的数据集运用SVM算法进行训练并预测。 2 关键技术 2.1 聚类分析 K-means算法是一种基于原型的、划分的动态聚类技术,通过计算两个对象间欧氏距离来评价相似度,即距离越近其相似度越高20。本文对历史数据集中整时点的温度、湿度、气压等气象因素进行聚类,其目标是:类内的气象数据相互之间是相似相近的,而不同类间的气象数据是差异较大的。同类内的相似性越大,类间的差别越大,聚类效果就越好21-23。具体步骤如下: 1) 对于给定的一个包含n个d维数据点的数据集X=x1, x2, , xi, , xn,其中xiR
14、d,选择数据集中K个点作为初始聚类中心,每个对象代表一个类别的中心k (k=1, 2, , K)。 2) 计算各点到中心k的欧氏距离,按距离最近的准则分别将它们分配给与其最相似的聚类中心代表的类,形成K个簇C=ck, k=1, 2, , K。每个簇 ck代表一个类。计算该类各点到聚类中心k的距离平方和J(ck): 2()ikk ikxCJc x = (1) 林顺富,等 基于数据挖掘的楼宇短期负荷预测方法研究 - 85 - 3) 计算各类样本到其所在类别聚类中心k总的距离平方和J(C),直至最小。 211211( ) ( )=ikKKk ikk k xCKnki i kkiJC Jc xdx=
15、= = = = (2) 式中:若xi ci,dki=1;若xici,dki=0。 最后计算类内所有对象的均值作为该类的新聚类中心。 4) 判断聚类中心和J(C)值是否发生改变,若发生改变则转步骤2),若不再改变则聚类结束。 2.2 支持向量机 针对楼宇负荷的非线性、日周期性等特点以及预测过程考虑气象等因素,本文选取支持向量机算法建立负荷预测模型。支持向量机在20世纪90年代提出,其实现结构风险最小化训练样本,克服了神经网络经验风险最小化的局限。支持向量机的训练等价于解一个线性约束的二次规划问题,因此存在唯一解。通过数据挖掘提取有效训练样本可提高训练速度和精度,支持向量机被认为是替代神经网络方法
16、的较好选择24-27。支持向量机原理模型如下:假定一组样本数据集: 1, ni iiG xy= 式中:xi是输入向量;yi是相应输出;n为数据总数。支持向量机非线性回归的核心思想是样本映射到高维特征空间,然后在此高维特征空间进行线性回归,回归函数为 () ()fx w x b= + (3) 其函数逼近问题通过最小化下式来实现: 21( ) ( / ) , ( ) / 2nii iiRc c n L x y f x w= +(4) ( )0, (), ()() , ()y fxL xy f xy fx y fx =(5) 式中:2/2w表示平滑程度;L(x, y-f(x)为Vapnik的不敏感损
17、失函数,对SVM结构风险进行度量。 为了寻找系数w、b,引入两个松弛变量,*,上式可以写成如下形式: 2*1*( , , ) /2 ( )s.t.() ,() ,0, 0, 1, 2, ,nii ii ii ii iiiRw w cwx b dd wx bn =+ + + =(6) c(c0)是惩罚参数,表示对误分训练实例的惩罚。引入拉格朗日乘子,*,可以得到支持向量机回归函数: *1(, , ) ( ) (, )nii iif x Kxx b =+(7) 其中 *1*1( ) ( , ) , (0, )( ) ( , ) , (0, )nj i i ij jinj i i ij jiy Kx
18、 x cby Kx x c = += 通过控制c和两个参数以及核函数可以实现支持向量机非线性回归预测。式中K(x, xi)称为核函数,需要满足Mercer条件,本文选取高斯核函数: 22( , ) exp( / 2 )iiKxx x x = (8) 3 案例分析 3.1 数据处理 本文历史负荷数据来自于上海某办公楼宇2014年7月26至2014年8月31日的整时点负荷数据,只考虑工作日共得到25天的历史数据L(取每小时1个点,每日24点,共600点),如图2。历史数据中还包括温度、湿度、气压等整点气象因素数据,分别如图3图5所示。 图2 历史负荷数据集 Fig. 2 Historical da
19、ta set of load 图3 历史温度数据集 Fig. 3 Historical data set of temperature - 86 - 电力系统保护与控制 图4 历史湿度数据集 Fig. 4 Historical data set of humidity 图5 历史气压数据集 Fig. 5 Historical data set of barometric pressure 对接下来的一周2014年9月1日至2014年9月5日内各个整时点负荷进行预测。首先选取待预测时点t的前3个小时的历史数据L(t-i)和前25天中与待预测时点同一时刻的历史数据L(t-24j) 作为聚类分析的样
20、本数据集,其中i=1,2,3;j=1,2,3, 25。对得到的样本数据集中的气象因素数据进行聚类分析,根据聚类结果选择与待预测时点属于同类气象因素的历史负荷作为负荷预测的训练样本数据集。 3.2 预测结果 提出的DMSVM预测方法,与时间序列法ARIMA(1,1,1)、同结构SVM(考虑气象因素但未经过聚类分析)、不考虑气象因素DMSVM方法(聚类过程考虑气象因素,在SVM训练时不考虑气象因素)程序均在Matlab平台上成功运行,将其结果进行对比,图6是2014年9月3日的预测结果。 表1是2014年9月3日不考虑气象因素的DMSVM方法和本文提出的DMSVM预测结果统计表,并计算其平均相对误
21、差: 图6 2014年9月3日的负荷预测结果 Fig. 6 Forecasting results in Sep.3, 2014 MAPE11 () ()100%()niLi Fien Li= (9) 表1 2014年9月3日的负荷预测结果 Table 1 Forecasting results in Sep.3, 2014 时刻 实际负荷/ kW 不考虑气象DMSVM 改进DMSVM 预测 负荷/kW 相对 误差 预测 负荷/kW 相对 误差 0:00 180 179.29 0.39% 179.47 0.29% 1:00 220 221.21 -0.55% 218.06 0.88% 2:00
22、 160 165.88 -3.68% 161.91 -1.20% 3:00 180 184.08 -2.27% 180.31 -0.18% 4:00 280 280.04 -0.02% 280.02 -0.01% 5:00 600 594.49 0.92% 611.67 -1.95% 6:00 620 619.21 0.13% 620.30 -0.05% 7:00 700 702.00 -0.29% 697.31 0.38% 8:00 800 796.76 0.40% 794.88 0.64% 9:00 900 891.06 0.99% 885.71 1.59% 10:00 940 913.7
23、5 2.79% 920.79 2.04% 11:00 880 874.42 0.63% 880.07 -0.01% 12:00 860 855.46 0.53% 863.21 -0.37% 13:00 900 891.06 0.99% 903.11 -0.35% 14:00 900 890.55 1.05% 913.44 -1.49% 15:00 900 887.48 1.39% 888.67 1.26% 16:00 920 906.53 1.46% 929.84 -1.07% 17:00 540 539.95 0.01% 550.52 -1.95% 18:00 320 316.59 1.06
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数据 挖掘 楼宇 短期 负荷 预测 方法 研究 林顺富
限制150内