《基于支持向量机的基的基金收益率预测分析.pdf》由会员分享,可在线阅读,更多相关《基于支持向量机的基的基金收益率预测分析.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 3 届中国金融学年会中国上海 2006.10 1基于支持向量机的基金收益率预测分析基于支持向量机的基金收益率预测分析 曹丽娟,女,1972.10.21 生,汉族,江苏省,博士学位,金融学副教授,复旦大学金融研究院,上海市邯郸路 220 号 傅东升,男,1978.11.27 生,汉族,山东省,金融学博士研究生,复旦大学金融研究院,上海市邯郸路 220 号 摘要摘要:运用支持向量机(Support Vector Machine,SVM)来预测基金收益率时间序列,并将 Back-propagation(BP)神经网络作为基准方法,实验选取沪深交易所上市的 6 只样本基金,根据选用的性能评价尺度:
2、正则均方误差(NMSE),平均绝对误差(MAE)以及方向对称(DS)指标,仿真结果表明在预测基金收益率问题上,SVM 比 BP 有更好的预测精度。文章最后给出了相关解释。关键词关键词:支持向量机(SVM),BP 神经网络,基金收益率预测 Application of Support Vector Machine for Forecasting Fund Return Cao Lijuan,Fu Dongsheng Abstract Support Vector Machine(SVM)is applied to forecast the time series of the return of
3、 funds,with the back-propagation(BP)neural network used as a benchmark.6 closed-end funds chosen from Shanghai and Shenzhen stock exchanges are used as the sample data.According to the criteria of NMSE(Normalized Mean Square Error),MAE(Mean Average Error)and DS(Direction Symmetry),the simulation res
4、ults show that SVM has an advantage over the BP neural network on the forecasting of fund return.An analysis of the results is provided in the paper.Key words:Support Vector Machine(SVM);BP neural network;Fund Return Forecasting 1 引言 1 引言 在以证券投资基金为代表的机构投资者逐渐占据市场主流的今天,基金已经成为市场上不容忽视的重要投资品种和理财方式。基金收益特征
5、明显不同于股票和股票市场指数,怎样采用科学方法,合理预测基金收益成为广大投资者和研究者关注的焦点之一。在有关基金预测的文献当中,预测方法主要分为两类:(1)统计方法1 2 3,(2)人工智能方法4。统计方法有自回归 Auto Regression(AR),移动平均 Moving Average(MA),自回归条件异方差 Autoregressive Conditional Heteroskedasticity(ARCH)。传统方法是一种参数方法,首先要定义模型的具体形式,根据历史数据找出最优参数,所以,模型精度容易遭到模型定义错误的影响,导致模型不匹配问题。人工智能方法主要是神经网络方法。和传
6、统的统计模型不同,神经网络是数据驱动的非参数模型,它们让“数据自己说话”。因此,和大多数参数模型相比,神经网络较少遇到模型误配问题。而且,神经网络具有较强的噪声容忍能力,能够用不完整甚至是缺失的数据来学习复杂系统。它们还具有柔性,能够用新的数据重新训练网络来学习动态系统。因此,和传统的统计模型相比,神经网络在描述基金的动态性第 3 届中国金融学年会中国上海 2006.10 2方面具有更大的潜力。Chiang et al.3比较了神经网络和传统的线性回归方法来预测基金的年末净值(NAV)方面的表现,发现神经网络有着更好的预测精度。Carhart and Karaali 4也用同样的方法来预测基金
7、业绩上的效果,得到近似的结论。Indro et al.5也发现在预测股票共同基金业绩方面,神经网络比传统计量方法有更好的预测精度。但是,神经网络也有很多缺点,首先,它容易陷入过度学习(“Overfitting”),原因在于神经网络贯彻了“经验风险最小原理(The Empirical Risk Minimization,ERM)”。过度学习问题会降低神经网络的预测精度,影响模型的预测。同时,神经网络的解可能是局部最优的,而不是全局最优,这也会影响模型的预测精度。神经网络的参数很多,很难发现一套有效的方法来找到神经网络的最优参数。并且,神经网络是黑匣子,其解难以让人理解。最近,一种名叫支持向量机(
8、Support Vector Machine,SVM)的新型学习机正在众多的领域引起人们越来越多的兴趣,由于 SVM 具有以下特征:良好的预测性能不存在局部最小值解的稀疏特征。它已被从原来在模式识别中的应用6拓展到回归估计中7。SVM 是由 Vapnik 和他的合作者于 1995 年开发的一种新颖学习算法,它基于结构风险最小化原理(Structural Risk Minimization,SRM)最小化由训练误差和一个置信区间组成的广义误差的上界,这种归纳原理不同于通常所用最小化训练误差的经验风险最小化(ERM)原则。基于这种独特的原理,在解决许多机器学习问题方面,SVM 通常可以获得比基于
9、ERM 原理的传统神经网络具有更高的预测性能。而且,训练 SVM 等价于求解一个带约束条件的二次线性规划问题,所以 SVM 的解总是唯一而且也是全局最优的,而不像其他网络训练那样需要求解非线性优化,从而有可能陷入局部极小值。SVM 的解只依赖于训练数据集合的子集,即支持向量。只用支持向量,SVM 便可获得与用全部训练数据点相同的解。本文将 SVM 运用于预测基金收益率,并将多层反向传播(BP)神经网络作为基准方法,以检验在基金收益率预测方面引入 SVM 的合理性。利用上海和深圳两家证券交易所的上市基金数据,根据所选用的性能评价尺度,实验证明了 SVM 比神经网络在基金收益率预测方面具有更好的精
10、度,这说明 SVM 在预测基金收益率的问题上是很有发展前景的。2 模型和参数 2 模型和参数 2.1 回归估计中的支持向量机 2.1 回归估计中的支持向量机 和其它神经网络相比,在估计回归函数时 SVM 具有以下三个独特的特征。首先,SVM用高维特征空间中的一组线性函数来进行回归。其次,SVM 用风险最小化原理来进行回归估计,风险根据 Vapnik 的非敏感损失函数来衡量。第三,SVM 贯彻了 SRM 原理,即最小化由经验误差和调整项组成的风险函数。给定一组由一未知函数随机独立产生的数据点集1122(,),(,),.,(,)llXYXYXY(niXXR,iYYR,l是训练样本总数),SVM 用
11、以下的形式来逼近函数:()()f XwXb=+(1)其中()X代表从输入空间x非线性映射的高维特征空间。系数w 和 b是通过最小化调整风险函数(2)来估计的。最小化:2111(,()2liiiwCL Yf Xl=+(2)第 3 届中国金融学年会中国上海 2006.10 3 ()()(,()0iiiiiiYf XYf XL Y f Xotherwise=(3)2w为调整项,最小化2w使得函数尽可能平坦,以控制函数的复杂性。11(,()liiiL Yf Xl=是由非敏感损失函数(3)测量的经验误差,(3)可以使 SVM 用稀少数据点来代表原函数(1)。C是调整常数,叫做管道尺度,由实验来决定取值。
12、引入正的松弛变量(*)i()标明有无的变量),方程(2)转变为原始目标函数(4)。最小化=+liiiCw1*2)(21 (4)约束条件*(*)()()0iiiiiiiYwXbwXbY+,li,.,1=.最后,引入拉格朗日乘子,使用最优化约束,决策函数(1)便有如下的显式解8:*1()()(,)liiiif XaaK XXb=+(5)函数(5)中,(*)ia是所谓的拉格朗日乘子,满足等式0*=iiaa,0ia 以及0*ia 其中 li,.,1=。它们是通过最大化函数(4)得到的,其双重函数为:(*)*11111()()()()()(,)2lllliiiiiiiijjijiiijW aY aaaa
13、aaaaK XX=+(6)约束条件如下:0)(1*=liiiaa,Cai(*)0,li,.,1=.(,)ijK XX为核函数,等于特征空间()iX 和()jX中的两个矢量iX 和jX的内积,(,)()()ijijK XXXX=。核函数可以不需计算映射()X便可处理任意维特征空间的计算。满 足 Mercer 条 件 8 的 任 意 函 数 均 可 用 作 核 函 数。一 般 采 用 多 项 式 核(,)(1)dijijK X XXX=+以及高斯核函数221(,)exp()ijijK X XXX=,其中d 和2是核参数。基于 Karush-Kuhn-Tucker(KKT)条件9,(5)中只有一些系
14、数)(*iiaa 收敛为非零值,且相应的训练数据点有等于或大于的近似误差,它们称为支持向量。根据函数(5),很明显只有支持向量被用来决定决策函数,因为其它数据点的)(*iiaa 值等于 0,因为支持第 3 届中国金融学年会中国上海 2006.10 4向量通常只是训练数据点的子集,这一特征被称为解的稀疏性。从执行角度来说,训练 SVM 等价于求解一个变量个数为训练数据点两倍的二次线性约束规划问题(6)。Scholkopf 和 Smola 拓展的顺序最小优化算法(SMO)10在训练 SVM 方面是非常有效的。3 基于 SVM 的基金收益率序列的预测 3 基于 SVM 的基金收益率序列的预测 3.1
15、 样本选取 3.1 样本选取 实验选取上海和深圳证券交易所上市的 6 只封闭式基金,数据来源于 Wind 资讯的基金数据库后复权日收盘价。表 3.1 给出了样本基金的名称及研究采样时间段。样本时间窗口统一为 2000 年 6 月 21 日到 2006 年 6 月 21 日,共有 1444 个交易日的数据作为样本点。在该样本期内,我国股票市场经历了完整的上涨和下跌行情周期,使得我们能够在足够长的时间段内展开研究,得到的结果更有说服力。表表 3.1 样本基金名称及样本期间样本基金名称及样本期间 序号 基金简称 基金代码 研究样本期 1 基金开元 184688 2000.6.212006.6.21
16、2 基金普惠 184689 2000.6.212006.6.21 3 基金同益 184690 2000.6.212006.6.21 4 基金金泰 500001 2000.6.212006.6.21 5 基金泰和 500002 2000.6.212006.6.21 6 基金安信 500003 2000.6.212006.6.21 3.2 输入变量的选取和数据预处理 3.2 输入变量的选取和数据预处理 在实验中,1 天作为预测时间段。选取对数收益率为预测对象,计算公式如表 3.2 所示。输入变量由四个基于 1 天期的滞后收益率(RDP-1,RDP-2,RDP-3 and RDP-4)和一个转变后的
17、收盘价(EMA100)组成。EMA100 由当天收盘价减去前 100 天的价格移动平均值得到。减去均值是为了消除价格中的趋势项,因为所有 5 种数据集里最大值和最小值的比率大概为2:1。能否找到滑动窗口的最优长度并不重要,但它不能长于 1 天的预测时间带11。EMA100用来尽可能多的保存原始收盘价中所包含的信息,因为从原始收盘价转换成收益率的过程中可能会丢失一些有用的信息。图图 3.1 基金开元的收益率柱状图基金开元的收益率柱状图 第 3 届中国金融学年会中国上海 2006.10 5图 3.1 给出了基金开元的收益率柱状图,可以看出数据集中左侧存在异常点。由于 Z 分数正则化方法最适用于正则
18、化包含异常点的时间序列,我们采用此法处理每一个数据集。然后将每一个完整的数据集分为按照时间序列分为训练-测试-校验集。训练集有 1000 个数据样本,测试集和校验集各有 222 个数据样本。训练集用来训练 SVM 和神经网络,校验集用来选择 SVM 的最优参数以及防止神经网络出现过拟合问题,测试集用来评估性能。表表 3.2 输入输出变量输入输出变量 变量名 计算公式 EMA100 RDP-1 RDP-2 RDP-3 RDP-4 100()()p iEMAi 1ln(/)ttP P 12ln(/)ttPP 23ln(/)ttPP 34ln(/)ttPP RDP+1 1ln(/)ttPP+注:()
19、nEMA i表示第 i 天的 n 阶指数移动平均值,iP表示第 i 天的收盘价 3.3 性能评价尺度 表3.3 性能评价尺度 表 3.3 性能测量尺度及计算性能测量尺度及计算 测量尺度 计算公式 NMSE=niiiyyn122)(1=niiyyn122)(11=niiyy1 MAE=niiiyyn11 DS=niidn1100=otherwiseyyyydiiiii00)(111 注:n表示数据类型数目,y,y代表输出变量的真实值和预测值 第 3 届中国金融学年会中国上海 2006.10 6预测性能是通过以下统计指标来衡量:如正则均方误差(NMSE),平均绝对误差(MAE)以及方向对称(DS)
20、。表 3 中描述了这些准则的定义。NMSE 和 MAE 是真实值和预测值之间偏差的测度。NMSE 和 MAE 越小,预测的时间序列值和实际值也接近(值越小,预测越好),DS 提供了一个判断以百分比形式表示的 1 天收益率预测方向是否正确的指标(值越大,预测结果越好)。3.4 实验结果 3.4 实验结果 将 SVM 用到基金收益率预测中时,首先要考虑的事情是应该选择什么样的核函数。由于基金的动态性是非线性的12,直觉上认为用非线性的核函数可获得比线性核函数更好的性能。本研究采用高斯函数作为 SVM 的核函数,因为在一般的平滑性假设下,高斯核有很好的性能。因此,如果没有关于数据的额外信息存在,高斯
21、核非常有用8,这也可以从实验中比较高斯核以及多项式核结果看出。多项式核得到的结果较差,并且在训练 SVM 时需要更长的时间。需要考虑的第二件事是核函数的参数(2,C 和)的取值问题。由于没有结构化的方法来选择 SVM 的最优参数,在校验集中得到最好结果的参数值被用作 SVM 的参数。由于不同种类的基金具有不同的特征,这些参数值随基金而变化。本实验采用 SMO 来训练 SVM 方法,用 VC+语言开发程序。实验选取标准的 3 层 BP 神经网络作为基准方法,输入层有 5 个节点,即输入变量个数。输出节点数为 1。而隐含层节点数目由校验集来决定。步骤很简单,隐含层节点从小的值(比如 3)取到合理的
22、大值(比如 30)。对每一个选定的隐层节点数,训练 BP 神经网络,估计校验集的平均误差。对于每一个隐层节点数重复以上步骤后,选取使得校验集平均误差最小的隐层节点数。选取的节点数可能随基金的不同而变化。学习速率同样基于校验集选定。隐层采用 S 型转换函数,输出节点采用线性转换函数。采用随机梯度下降算法训练 BP 神经网络,这是因为对于大型非平稳数据来说,它比批处理训练法性能更好。在随机梯度下降训练中,一个训练样本出现后 BP 神经网络的权值及偏差会立即更新。采用的 BP 神经网络软件直接来自 Matlab 7.0 内建的神经网络工具箱。在 BP 神经网络训练中,提前停止法被用来克服过度学习的问
23、题。也就是说,我们首先让神经网络学习 200 轮数,然后每增加 10 轮学习轮数时,我们都计算校验集上的 NMSE,如果 NMSE 开始递增,我们就停止 BP 学习过程。表 3.4 给出了 SVM 和 BP 两种方法在训练集上的结果。从表中可以看出,对所有样本基金,神经网络都有着更小的 NMSE、MAE 值。而就 DS 而言,SVM 比 BP 具有更大的数值。表表 3.4 训练集结果训练集结果 SVM BP 基金代码 NMSE MAE DS(%)NMSE MAE DS(%)184688 0.9864 0.5798 67.67 0.8573 0.5748 55.16 184689 0.9905
24、0.6086 64.36 0.7033 0.5713 50.85 184690 0.9774 0.6136 68.67 0.7406 0.5789 52.25 500001 0.9326 0.5645 67.27 0.7079 0.5308 50.85 500002 0.9989 0.6535 67.67 0.7339 0.5993 55.26 表 3.5 给出了校验集的结果。正如我们所预料的那样,校验集的 NMSE 比训练集要差。所有 NMSE 值都接近或大于 1.0,表明金融数据集具有很强的噪声性。两种方法的结果对比之下,SVM 有较小的 NMSE 和 MAE,但较大的 DS,说明 SVM
25、 表现出更好的预测效果。第 3 届中国金融学年会中国上海 2006.10 7表表 3.5 校验集结果校验集结果 SVM BP 基金代码 NMSE MAE DS(%)NMSE MAE DS(%)184688 0.9959 0.6195 53.42 1.2884 0.7209 46.58 184689 1.0003 0.6327 62.56 1.2341 0.7122 59.36 184690 0.9920 0.6696 53.88 1.2874 0.7567 49.77 500001 0.9751 0.6049 52.51 1.2966 0.6812 51.60 500002 0.9988 0.
26、6678 60.27 1.1707 0.7580 52.51 500003 0.9897 0.6516 63.01 1.6289 0.8003 52.51 表 3.6 给出了测试集的结果。与在校验集上的结果类似,在所有的 6 只基金中,SVM比 BP 有较小的 NMSE 和 MAE,并在大多数基金中,SVM 比 BP 有较大的 DS 值。通过比较训练集,校验集以及测试集的结果,可知 BP 神经网络存在明显的过学习现象,导致预测效果显著降低,相形之下,SVM 得到的预测结果总体上要稳健得多。基于测试集 NMSE,成对 t 检验1314用来确定这三种方法是否存在显著差异。t 值表明对于单尾检验在
27、0.05 的显著性水平下 SVM 优于 BP 神经网络。表表 3.6 测试集结果测试集结果 SVM BP 基金代码 NMSE MAE DS(%)NMSE MAE DS(%)184688 1.0149 0.8950 48.42 1.2767 1.0160 51.13 184689 1.0119 0.9292 58.37 1.6284 1.1104 48.87 184690 1.0160 0.9038 53.85 1.3549 1.0423 49.77 500001 1.0071 0.9185 58.82 1.6153 1.0851 48.87 500002 1.0234 0.8382 61.54
28、 1.1404 0.9001 52.49 500003 1.0280 0.8127 59.73 1.5900 0.9483 50.23 t-test 4.09 t0.05,5=2.57 4 结论 4 结论 本文研究 SVM 在基金收益率预测方面的应用。通过对 6 只样本基金进行实验分析,我们发现,SVM都能提供比BP更小的NMSE和MAE值,同时给出较大的DS值。这表明 SVM比 BP 神经网络能更精确地预测基金收益率,并能够准确预测收益率的变化方向。SVM 提供了一种替代 BP 神经网络的有效工具,其预测能力明显优于 BP 网络。原因可以分解为:(1)SVM 贯彻了最小化广义误差上界原则(S
29、RM),而不是最小化训练误差原则(ERM),最终导致比采用 ERM 原则的 BP 神经网络更好的预测性能。(2)BP 神经网络不能收敛到全局最优解。梯度最陡下降算法沿着误差表面最陡的斜坡来最小化误差的平方之和以优化权值,有可能使 BP 神经网络陷入局部极小值。而 SVM 中,训练 SVM 等价与求解一个二次线性约束规划问题,解总是唯一和全局最优的。(3)用校验集来停止 BP 神经网络的训练需要很多技巧和耐心。过早停止训练将会导致网络未能充分学习预测所要求的复杂性。过晚的停止训练会使网络过多的学习复杂性,导第 3 届中国金融学年会中国上海 2006.10 8致训练样本的过度拟合问题。虽然我们采用
30、“提前停止训练”的步骤来避免过拟合问题,但仍难以保证 BP 神经网络不出现过度拟合问题。鉴于 SVM 优越的性能,未来工作将进一步完善支持向量机方法,从而改善其预测精度。参考文献参考文献 1 James D.et al.Explaining the future performance of domestic bond mutual funds.The Journal of fixed income 10(1):97-103,2000.2 Parvez Ahmed.Forecasting correlation among equity mutual funds.Journal of Bank
31、ing&Finance 25:1187-1208,2001.3 Chiang et al.A neural network approach to mutual fund net asset value forecasting.The International Journal of Management Science 24(2):205-215,1996.4 Carhart,M.and 0.Karaali.Neural Network Forecasting of Mutual Fund Returns.Sixteenth annual lntemational Symposium on
32、Forecasting Proceedings,1996.5 Indro et al.Predicting mutual fund performance using artificial neural networks.The International Journal of Management Science 27:373-380,1999.6 B.Scholkopf,C.Burges and V.Vapnik,“Extracting support data for a given task,”Proceedings of First International Conference
33、on Knowledge Discovery&Data Mining,AAAI press,Menlo Park,CA,1995.7 R.Muller,J.A.Smola and B.Scholkopf,“Prediction time series with support vector Machine,”In Proceedings of International Conference on Artificial Neural Networks,pp.999,1997.8 V.N.Vapnik,The Nature of Statistical Learning Theory.New Y
34、ork,Springer-Verlag,1995.9 H.W.Kuhn and A.W.Tucker.“Nonlinear programming”,In Proceedings 2th Berkeley Symposium on Mathematical Statistics and Probabilistics,Berkeley,University of California Press,pp.481-492,1951.10 A.J.Smola and B.Scholkopf,A tutorial on support vector regression,NeuroCOLT Techni
35、cal Report TR,Royal Holloway College,London,UK,1998.11 M.Thomason,“The practitioner methods and tool,”Journal of Computational Intelligence in Finance,Vol.7,No.3,pp.36-45,1999.12 M.Ql and G.S.Maddala,“Economic factors and the stock market:a new perspective”,Journal of Forecasting,18,151-166,1999.13 D.C.Montgomery and G.C.Runger,Applied Statistics and Probability for Engineers.Wiley&Sons,New York,1999.14 B.Yoshua and C.Nicolas,“Extensions to Metric-Based Model Selection,”to appear in the Journal of Machine Learning Research.
限制150内