基于概率后缀树的股票时间序列预测方法研究.doc
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《基于概率后缀树的股票时间序列预测方法研究.doc》由会员分享,可在线阅读,更多相关《基于概率后缀树的股票时间序列预测方法研究.doc(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 年 月 第 卷 第 期 四川大学学报 ( 自然科学版 ( ) ) : 基 于 概 率 后 缀 树 的 股 票 时 间 序列 预 测 方 法 研 究 程小林,郑 ( 兴,李旭伟 , ) 四川大学计算机学院 成都 摘 要 : 在时 间序 列符 号化 基础 上 , 本 文 引入 概 率 后 缀树 模 型 , 构 建基 于 时 间 序 列 符号 化和 概率 后缀 树相 结合 的股票 预测 模型 本 文选 择在 沪深 的 支股 票数 据上 将预 测模型 与传 统的 马尔 科夫 模型 和 自回归 移动 平 均 模型 进 行对 比 , 结 果 显 示本 文 提 出的 有效 性 关键 词 : 股票 数据 挖
2、掘 ; 时间 序列符 号化 ; 高斯 混合 模型 聚类 ; 概 率后 缀树 : , ( ) , ( ) ( ) , : ; ; ; ( , )和 加 权 引 言 支持 向 量 机 ( , 近年 来,随 着人 工 智 能 的 飞 速发 展 ,学科 交 叉 的日 益深 入,一 些在 其他 它领 域应 用的技 术不 断地 )相 结 合 来 预 测 股 票 拐 点 年 提 出 了 一 个 基 于 核 ( 等 在 , 中图 分类 号 : 文献 标识 码 : 文章 编号 : ( ) , , ( , , , ) ; 运用 在股 票预测 中 ,如随 机 过 程 、混 淆 理 论 以 及小 波分 析等 这些 新
3、方 法的 引入 为股 票预测 研究 注入 了强 大的 动力,目 前,人 工 神经 网 络 和 支 持 向量 机 等计 算机 技术 已 经 成 为 研 究人 员 和 投 资 者 研究 股 市的 重要 方法 陈 曦 在 年 利 用 分 段 线 性 表 示 方 法 基金项目 :国家自然科学基金() : ( ), , , , 测准 确率 模型 等 人 对 股 票 时 间 序 列 进 行 聚类 从而 产生 股票 交易 决策 提 出了 进 化 针对 股票 交易 决策 信 号 问 题 构 建了 动 态 阈 值 模 型 来预 测未 来的 交易 信号 : 作者简介 程小林 男 重庆人 硕士生 研究方向为金融时间
4、序列 通讯作者 :李旭伟 : : )方法 提取 关键 特征 来提 高股 票 预 ; 四川大学学报 ( 自然科学版 ) 第 卷 在现 有研究 的基 础上 ,本 文构 建了一 个基 于高 )的股 票 预 测 模 型,实 现 对 股票 下一 周期 趋势进 行预 测本文 主要 的研究 工 作 包含 以下 几点 : ()获取 原始 交易 数据 ,计 算相 关 股票 技 术指 标,构 造模 型的 特征 向量 ; 数据 符号 化,将 同一 支股 票的 特征 向量进 行多 次聚 类,获 得多 组聚 类 结果 ,为 每次 聚 类 获 得 的 多个 簇 分配 不同 的字符 ,获 得多 个 符 号 序 列,实 现
5、股 票交 易数 据符 号化; ()使用 符号 序列 构建 概率 后 缀树 ,通 过 选择 验证 集上 最佳收 益 率 方 法 解决 高 斯 混 合 模 型聚 类 算法 的不 稳定性 ; ()通过 实 验 验 证 本 文 构 建 的 基 于概 率 后 缀 树的 股票 预测模 型能 有效 提高 收益 率 股票序列符号化与预测 数据 预处 理 与传 统的时 间序 列数 据相 比,股票交 易数 据时 间序 列有 自身的 一些 特性 ,针 对股 票交易 数据 的特 征,本 文设 计 了 以 下 方 法 对 股 票 交 易 序 列 进 行 处 理,股 票交 易数 据序 列符 号化 流的具 体流 程步 骤如
6、 下 ()采集 股票 日 交 易 数 据;()对 获 取 的 数据 为了 能在不 同角 度反 映股 票趋 势变 化,研 究人 员在 原始 交易数 据 的 基 础 上提 出 了 技 术 指 标这 一 概念 来反 映股票 市场 的变 化,不同 的技术 指标 都是 对股 票价 格趋势 的定 量分 析,以帮 助投资 者进 行投 示天 数),投资者 通 常 使 用 不同 参 数 的 技 术 指 标相 结合 的方 式对股 票进 行分 析,不同 的参数 的指 标之 间的 差异 非常重 要,不仅 可以 从多 个角度 来反 映股 票的 走势 ,而 且 其 相 交 点 往 往 是 股 票 走 势 的 关 键 点例
7、如 指标 在参 数 取 和 参数 取 的 差 值 上就 有着 明显 的意 义 ,当其 值 小 于 时,表 明 目 前 人们 买入 的愿 望 更强 烈 ,其值 越 小 ,则 买 入 愿 望 越 强,反之 亦 然因 此,本 文 在选 择 输 入特 征 变 量时 , 不仅 使用 了技 术指 标本 身的 值,还 考虑 了同 一技 术 指标 在不 同参 数值 下的 差异 和趋势 ,差 异和 趋势 用 本文 选 择 投资 者 常 用的 、 、 三 个 间序 列如 下所 示 , , , 基 于高斯 混合 模型 聚类 的符 号化 聚类 算法 主要 分 为 四 类:层 次 聚 类 算 法、划 分 式聚 类算 法
8、、基于网 格和 密度 的聚 类算 法以 及其 他 聚类 算法 ,其 中高 斯混合 模型 聚类 算法 被广 泛 使 用,本文 选择了 高斯 混合 模型 聚类 算法 对子 序列 进 行聚 类处 理 高斯 混合 模型 聚 类 方法 中 的 值 是 需 要 预 先 设定 的 参 数,表 示 最 终 输出 簇 的 数 量, 的 取 值 直 接关 系到 聚类 结果 ,需要 更具 实际 情况 做相 应的 选 择本文 通过遗 传算 法多 次 实验 得 到当 取 值 为 时,聚类 效果较 为 理 想,各 簇 数 据之 间 得 到 了 很 好 的区 分 聚类 完成 后,每 个 数 据 点 都 会 被 归 入 相
9、应 的 簇,接下 来需要 做 的 工 作是 为 每 个 点 赋 予字 符 符 号化 的大 致思 想是 为 同 一 簇 中 的数 据 赋 予 相 同 的 字符 ,每 个簇对 应 同 一 个字 符 ,然后 按 照 时 间 先 后 顺序 将每 个符 号 组合 起 来 ,即 为 符 号 化 序 列本 文 通过 高斯 混合 模型 聚类 将数 据划分 到 个 簇中,按 照每 个簇 的数 据对 应一 个符 号的原 则 ,最终 的符 号 斯混 合模 型聚类 符号 化和 概率 后缀 树 ( ( ) , ;( ) ;( ) ;( ) ;( ) ;( ) , 资决 策 本 文选 择 了 部 分 技 术 指 标 ,如
10、 : ( )相 对 强 弱 指 数、 ( )威廉 指 数、 ( )移 、 、 ( ) ( 第 期 程小林 , 等 : 基于概率后缀树的股票时间序列预测方法研究 化序 列将 由 个 字符 组成 ,该 序列 即为概 率后 缀树 使得 当前 匹配 的阶 数发 生改 变,体 现了 概率 后缀 树 的输 入信 息 该 过程 的数 学表 达如 下: 变阶 的思 想 , , , , 输入 时 间 序 列 , 设定 一个 待匹 配序 列 规 定 ( )( )表示 序列 的 后缀 ,可得 出 , , )( , ,), 个 符号 组 成 的符 最长 后缀 ( ) , , , , ,最 短 号集 合 , , , ,
11、 , ( , 后缀 为 ( ) ,使 用 阶 概率 后 缀 树 匹 , , ),输 出 的 符 号 化 时 间 序 列 为 , , , , , 配序 列 的过 程如 下 由 中 的 元 素 构 成 且元 素 个 ()选 择序 列 阶 概 率 后 缀 树 能 够 匹 配 到 数与 相同 的最 长后 缀 ),从 根 节 点 开 始 倒 序 搜 在使用概率 后缀 树预 测时 ,输 出信息 为下 一个 索概 率后 缀树 匹配 ( ) 可能 出现 的符号 以 及 概 率 本 文 的 模 型中 ,不 同的 ()若 无 法 匹 配 ( ),则 去 掉 离 符号 代表 不同的 交易 信号 , ,每 一个 字符
12、有 其特 定的 ,此 时 需 要 匹 配 的序 列 从 含义 因此 在分 配字 符前 需要 确定不 同簇 内的 数据 , ( )变 为 ( ),若 匹 配 成 功 ,则 代表 的含 义 对 于 投 资者 而 言 需 要 获 取 的 交 易信 , ( ) 号通 常有 三种 ,第 一 种是 买 入 信 号 ,即 下 一 个 周期 结束 对序 列 的搜 索 若 也 无 法 匹 股价 会出 现上涨 ;第 二种 是 持 有 信 号,表 示 下 一个 配,则 去 掉 ( ), , ,此 时 匹 配 的 目 标 序 列 为 周期 的股 价不 会有 大 的 变 化,只 有 小 范 围的 波 动 ; 以此 类
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 概率 后缀 股票 时间 序列 预测 方法 研究
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内