基于PSO参数辨识SVM的中长期径流预测研究.pdf
《基于PSO参数辨识SVM的中长期径流预测研究.pdf》由会员分享,可在线阅读,更多相关《基于PSO参数辨识SVM的中长期径流预测研究.pdf(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第5 1 卷 第1 期 2 0 1 1年 1月 大 连 理工大 学学 报 J o u r n a l o f Da l i a n Uni v e r s i t y o f Te c h n o l o g y Vo 1 5 1,No 1 J a n 2 0 1 1 文 章 编 号:1 0 0 0 8 6 0 8(2 0 1 1)01 0 1 1 5 0 6 基于 P S O 参数辨识 S VM 的中长期径流预测研究 叶 碎高,彭 勇 ,周惠 成(1 大连理工大学 水利工程学院,辽宁 大连1 1 6 0 2 4;2 浙 江 省 水 利 河 口研 究 院,浙 江 杭 州 3 1 0 0 2 0
2、)摘 要:以径向基函数作为核函数,利用微粒群(P S O)算法的全局寻优特性进行支持向量机 (S VM)的参数辨识 在微粒群搜 索参数前,先对参数进 行指数变换,使 O,1 和 1,c x。有着相 同的搜 索概 率 微粒群算法的适应值 函数是 以支持 向量机模 型的推广 能力为标 准的,讨论 了 测试样 本的最小误差和 留一法对支持 向量机学 习方法推广 能力 的两种估计 最后 以长江 宜昌 站 的月径流 资料为例,分 别采 用 AR MA模 型、季节性 AR I MA模 型、B P神经 网络模型 以及所 建 立的支持 向量机模型进行模拟预测,结果 显示了该模 型的有效 性 关键 词:径 流
3、中长期预 报;参 数辨识;微 粒群 算法;支持 向量机 中图分类 号:T V1 2 4 文 献标志 码:A O 引 言 中长期水 文 预报 具 有 较 长 的预 见 期,能够 使 人们 在解决 防洪 与抗 旱、蓄水 与 弃水 及 各 部 门 用 水 之 间矛盾 时及 早采 取 措 施进 行 统 筹 安排,以获 取最 大的效益 中长 期水 文预报 模 型很 多,已在水 文 水资 源研究 中得 到 了广 泛 的应 用,对 水 文水 资 源科学 问题 的解 决起 到 了非常重 要 的作 用 其 中,机 器学 习是水 文预 报 的 一个 重 要 方 向,其 实 现 方 法大 致 可以分为 3种:(1)
4、经典 的统计 估 计方 法,如 AR MA模 型 这 类方法有一定 的局 限性:需要 已知样本 的分 布函 数,这样花费 的代 价 很大;传 统 的统 计方法 是 样 本 趋于无穷时 的渐近理论,而实际的样本有 限 (2)经验 非线性 方法,如 ANN 1 这种 方法 是 利 用 已知 样本 建立 多 维 非 线性 模 型,克 服 了传 统 参 数估计 的瓶颈 但 这种模 型是 黑箱子 模型,缺乏 统 一的数学 理论 (3)支 持 向量 机 方 法 卜 统 计 学 习 理 论(S L T)是 一种专 门研究 小样 本情况 下机 器学 习 规 律的理论,其统计推理规则不仅考虑了渐近性的 要求,而
5、且力求在有 限信息中得到最优结果 支持 向量机 是 建 立在 S L T 的 VC维 理论 和结 构 风 险 最小原理基础上的,根据有限的样本在模型的复 杂性和学习能力之间寻求最佳折中,来获得最佳 的推 广 能力 由于 S L T理论 和 支持 向量 机(S VM)方 法还 处于发展阶段,很多方面还很不完善,比如:许 多理 论 目前 还 不 能在 实 际算 法 中实现;VC维 的分 析 尚没 有通用 的方 法;S VM 方法 中如何 选 择 适 当 的核 函数 没有 理 论 基础;参数 C、e 和 核 函数相 关参 数难 于辨识 本文 主要 针对 问题,通 过 一 定 的 指 数 变 换 将
6、微 粒 群(P S O)算 法 用 于 S VM 的参 数 辨识 问题,并将 优 化后 的模型用 于 径 流 中长期 预报 中 1 基 于微 粒 群 的 支 持 向量 机 参 数辨 识 1 1 回归支持向量机原理 已知一 个训 练集 X一 (X 1,1),(2,2),(f,Y z)R”R (1)用非线性映射 把数据 映射到高维特 征空 间,并在 高维 特征空 间 中进 行线 性 回归:厂()一(,()+b;W,X R”,b R(2)收稿 日期:2 0 0 8 1 2 1 5;修 回日期:2 0 1 0 1 1 一 O 1 基金项 目:国家 自然科学基金资助项 目(5 0 9 0 9 0 1 2
7、);水文水资源与水利工程科学 国家重点实验室开放基金资助项 目(2 0 0 9 4 9 0 2 1 1)作者简介:叶碎高(1 9 6 3 一),男,博士,教授级高工;彭勇(1 9 7 9 一),男,博士,E ma il:p y o n g c u i d i 1 6 3 c o m 大连理工大学学报 第5 1 卷 最优 的回归 函数 是通 过在一定 的约束 条 件下 最 小化规 则化风 险泛 函 1 一l 专 十 C 丁 1 L (,f(x )一;1 其 中第 1项称为 规则 化 项;第 2项则 为经 验 风 险 泛 函,可 由不 同的损失 函数确定,常数 C 0控制 对 超 出误 差 e 的
8、样 本 的惩 罚程 度 采 用 F 不敏 感 损 失 函数 L (,f(x )一 ma x 0,f(x )l e)(3)对于 L (,f(x i),如果估计输 出 f(x )与 期望输出 Y 的偏差的绝对值小于 e,则等于 0;否 则,它等于偏差的绝对值减去 e,通过引入非负松 弛变量、8,最小 化规则 化风 险泛 函可重新 描述 为 1 ra i n 1 Il lI。+c E(+毫)i 1 f Y 一(,(置)一b e+8 s t +bY f +(4)【8,0 这 是一个 二次优化 问题,其对 偶 问题 为 W(oli Cg=一 号 l l 一 a,)置,x i)一 e(a +a )十 Y
9、(a a,)s t (口 一 口,)一0,0 口 C (5)解 这个二 次优化,可 以得到 a的值,w的表 达 式为 f 一(口 a )(置)(6)f l f 厂():(口 一口 )+b(7)i 一 1 支持 向量机 理论 只考 虑高 维特征 空 间的点积 运算 K(x ,),即,称 K(x ,)为核 函数 常用 核 函数 有 线 性 核 函数(,;多 项 式 核 函 数(+c)本文选 用径 向基核 函数 1 2 微粒群算法原理 微粒群算法在搜索过程 中,每个微粒在解空 间中 同时 向 2 个 点逼 近,第 1 个 点 是所 有 微 粒在 历代 搜索 过程 中所 达 到 的最 优解 g ;另
10、一个 点 是每个微粒在历代搜索过程中自身所达到的最优 解 P 每个 微粒 表示 为在 n 维 空 间中的一个 点,用 x 一(X )表示 第 i 个 微粒(搜 索 S VM 参数时 鼍 一(C e ),第 i 个微粒的个 体 最优 解 表 示 为 p 一(p P P ),全 局最 优解 表示 为 g 一(g。g g ),而 鼍 的第k次修正量表示为 ,一(硝 吨),其计 算公 式为=+C 1 r a n dl (一z )+C 2r a n d 2(g 一 z )(8)z 一 z +(9)式 中:i 一 1,2,m,d一 1,2,n,m 为微粒 群 微粒 个数,n为解 向量 维数;c 和 c。是
11、 学 习 因子,Ke n n e d y等 建议 取 C 1 一 C 2 2;r a n dl 和 r a n d 2 为两个独立的介 于 O,1 的随机数;为动量项 系数,随 算法 迭代 而 线性 减小;一,“,“决定微粒在解空间第d维的搜索精度 1 3 参数辨识步骤 径 向基 函数 S VM 有 3个参 数需 要 确定:C、和 寻求 S VM 模型的最佳参数是一个参数辨识 问题 本文利用微粒群全局快速优化 的特点对参 数进 行搜索,可 以减少试 算 的盲 目性 和复杂性,来 提高模型预测精度 由于参数 C、和 在 0,1 内 的可能性比较大,如果直接进行搜索,0,1 被选 中的概率将较低,
12、所 以本文在搜索前对参数进行 了指数变换,使 O,1 和 1,。有着相同的搜索概 率(如图 1所示)基 于 P S O辨 识 S VM 参数 的 步骤 如下:微粒群 搜索空间 s 参嗷 空间 图 1 S VM 参 数辨识 P S O 算法 Fi g1 SVM p a r a me t e r i de nt i f i c a t i on b y PSO a l go r i t h m(1)对 S VM 进 行初 始化 设 置,包 括 设置 迭代 次数、微粒最大允许速度“、群体规模、随机生 成初始微粒 z?和微粒初始速度 7 其 中微粒向 量的元 素对应 相应 的 S VM 参 数 C、e
13、 和 口 第1 期 叶碎 高 等:基于 P S O 参数 辨识 S VM 的中长 期径 流预测研 究 1 1 7 (2)一 个 微 粒 向 量 代 表 一 个 支 持 向 量 机 模 型,计算 每个微粒 的适 应 值,以反 映 S VM 模 型 的 推广能力 适应值 函数 有如 下 3 种 形 式:以训 练样 本 的实 际 值 与 预 报 值 误 差 最小 为 目标 函数,这种 形式 不好 因为 Ke e r t h i 等 7 的 研 究表 明对一足 够大 的 C,当 一。时径 向基 函 数 S V M 能 以非 常高 的精 度模 拟训 练样 本,但 对测 试 样本不 具有任 何泛 化能 力
14、;当 一 0 时径 向基 函 数 S VM 会把所 有训 练样本 都模 拟 为一个 数 以预测 样 本 的 实 际 值 与 预 报 值 误 差 最 小 为 目标 函数。,这种 形 式下,只保 证 了预 测 样 本 有较 高的推 广能力,但不 能 保 证 模 型 有较 高 的推 广能力 表达 式为 1 F(x。)一 :l E y f(z )y。I(1 0),三 式 中:m 为 预测样本 个 数,z 为 支 持 向 量机 的第 i 个 输人 值,Y 为第 i 个 预测 样 本 实测 值,f(z )为 第 i 个 预测样 本预测 值 以模 型的推 广能力 最 大 为 目标 函数 采 用 留一法对 支
15、 持 向量 机 学 习 方 法 推 广 能 力 进 行 估 计 1 进 行 留一 法 估 计 时,首 先 从 训 练 集 中 留 出 一个待 检验样 本,然 后用 其 他 训 练样 本 训 练 预 报 模 型,最后对 训练集 中的待检验 样本 进行 预测 令 广表示 留出第 i 个样本后从剩余训练样本 上得 到的预测 模型,厂 (z )表 示使 用该 模型对 第 i 个 样本进 行预 测,Y f i(z )表 示 留一 法 的预 报 误 差 则 留一法对 该学 习方法 推广 能力 的估计 为 1 F(x。)一 l 一厂(z )I(1 1)K 1 式 中:k为训练 样 本 个 数 为 支 持 向
16、量 机 的 第 i 个输 入值,Y 为第 i 个 训练 样本 实测 值,广(z )为 第 i 个训 练样本 预测值 (3)按 照式(1 0)或(1 1)计 算 的适 应 函数 值 F(x )与 自身 的最 优 值 F(p )进 行 比较,如 果 F(x )F(p ),贝 0 F(p )=F(x ),p =(4)将每 个 微 粒 的最好 适 应值 F(p )与 所 有微 粒 的最好适 应值 F(g 。)进行 比较如 果 F(p )F(g 。),贝 0 F(g b e ):F(p b ),g k 一 p e S (5)判 断是 否达到最 大 迭代 次 数,如 果 否,再 进 行新一 轮 的计 算,
17、按 式(8)、(9)将 微 粒进 行 移 动,从 而产生新 的微 粒,返 回步骤(2)如 果是,计 算 结束 2 实 际 应 用 2 1工程 概况 收集 了 长 江 宜 昌 水 文 站 5 2 a(1 8 9 0 0 1 1 9 4 1 1 2)的月 平 均 径 流 资料 由前 4 9 a(1 8 9 0 0 1 1 9 3 8 1 2)数 据作 为 训练 数据,后 3 a(1 9 3 9 0 1 1 9 4 1-1 2)资料进行预测检验,见图 2 为检验支持 向量机 模 型的预 测效果,本 文还分 别 采用 AR MA 模 型、季 节性 A R I MA 模 型 以及 B P神经 网络 模
18、型 对原始 月径流序列 进行 了模拟预测,并 选择各 自相 对误差 绝对值 的平 均值作为评价指标 对于季 节性 A R I MA模型,首 先按周期 一1 2作差 分得 到平 稳 序列,然后再 对所 得 到 的平稳 序列 建立 A R MA模 型 对 于 B P神 经 网络模 型,输 入节点 数为 1 2;取 一 个隐层,采用“试错 法”确定隐层节点数 图 2 宜 昌站(1 8 9 0 0 1 1 9 4 1 1 2)月 径流资 料 Fi g 2 M o n t h l y d i s c h a r g e o f t h e Yi c h a n g S t a t i o n (1 8
19、9 0 0 1 t o 1 9 4 1-1 2)2 2 参 数范 围确 定 月 平 均 径 流 过 程 构 成 了非 线 性 时 间 序 列 X 一 -,z,),对 这 个 非线 性 径 流 序 列 进行 预 测,就 是要 寻 找在+P 时 刻 的流 量值 和前 P(由 于月 平均 流量 过程 的 自相 关 系数 在 滞 时 为 1 2个 月时 最大,所 以取 P一 1 2)个时 刻 的流量 值 斗。,汁 2,z 升 P 一 1的关 系,即 z 叶 p f(x 升 1,斗 2,汁 ),f为 一个 非 线性 函数,表示 径 流时 间序 列 之 间 的非线 性关 系,可 以通 过支 持 向量 机
20、对 N P组 流 量 序 列 样 本 进 行 学 习,模 型 用 厂(z)一(a 一a )K(,)+b表示,其 中的参数 a 、l=1 a 、b 用 微粒 群搜 索到 的 C、e求得 支 持 向量机 训练算 法采 用序 列极 小化 训练算 法 C、t7、e 区间 的确定 基 于以下 的考虑 g :首 先 确 定 的 取 值 范 围 从 核 函 数 e x p(一 I l 一。)可 以看 出 的 大 小 完 全 是 针对 l l X一置 f I 而言的 因此在实际应用 中,只 大连理工大学学报 第5 1 卷 要 19 的取值 比训 练 样 本 之 间 的最 小 距离 小 得 多,就 能达到 一
21、0的效果;同样,当 比训练 样本 之 间的最大 间 隔大 得 多 时 就可 以达 到 一。的效 果 基于这一考虑,实验 中确 定 的搜索空 间为 mi n(I j 一 f I J。)2 0,ma x(I】II)2 0 对于宜昌站训练数据,rai n(I I 一 lI)=5 8 9 5 1 0,ma x(1 l 一 置 l l。)=3 9 3 4,所 以 2 9 4 71 0 _“,7 8 6 8 0 3,最后取 1 o 一,1 0 。然后确 定 C的取 值 范 围 在 构 造分类 面 方 程 时惩 罚 因子 C的作用 是对拉 格 朗 日因子 a的取 值 加以限制,见式(5)当 C超过一定值时就
22、丧失了 其对 a取值 的约束作用,此时经验风险和推广能 力几乎 不再 发生 变 化 为 此采 取 了如下 的启 发式 思维确定 c取值的上限:首先给定一个小的 C值,取名为 G,用其训练 S VM 求解出一组 a ,i=1,2,k,其 中 k为 训 练 样 本 总 数,令 C 一 ma x(a )如 果 C C ,则 以 C 作 为 C 的取 值上 限;否则 换一个 更 大 的 C 训 练 S VM,直至 得 到 的 C 远小于 C 这样 就可得到 C的搜 索空间 O,C 对于宜昌站训练数据求得 C =1 0 0 0 0,所以 c 0,1 o 由于在搜索前对参数进行 了指数 变换,而 0的指数
23、变换为 c x。,根据经验选取 C E l O 一,1 0 最后 确定 e的取 值 范 围 因为 在训 练模 型 之 前,对 S VM 的 输 入 进 行 了 规 格 化处 理 使 其 处 于 O,1 ,所 以 e的取值范 围也在 0,1 ,即 E E o,1 支持 向量机模型参数取值范围为 C E E l O 一,1 0 、E E l 0,1 0 和E E 0,1 3;相应的微粒群 搜索范围为 c 一5,4 3、一4,2 和 E 0,1 微粒群训练支持 向量机模型时,初始参数参 考文献 1 2 进行设置:学习因子C-=C 2=2,最大 速度“=“=0 1,最大迭代次数 T一 5 0,微粒个数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 PSO 参数 辨识 SVM 中长期 径流 预测 研究
限制150内