机器学习系列报告之五:锦上添花机器学习算法助力组合优化.docx





《机器学习系列报告之五:锦上添花机器学习算法助力组合优化.docx》由会员分享,可在线阅读,更多相关《机器学习系列报告之五:锦上添花机器学习算法助力组合优化.docx(25页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1、主流组合优化方法51.1 、线性优化:个股集中度高51.2 、二次规划6121、“因子一收益”线性假设下的二次规划组合 71.2.2、 风格因子数据估计协方差矩阵的二次规划组合82、配置型组合优化102.1 借鉴资产配置模型的开展方向 102.2 、运用机器学习算法来克服难点 11221、坐标下降算法12222、交替方向乘子算法133、配置型优化下指数增强效果133.1 、中证500指数增强143.2 沪深300指数增强164、总结185、风险提示19附录20A.风格因子构造方式20B.风险预算优化问题转换 21C.标准差风险测度下ADMM算法:x更新与y更新的具体方法 22大类资产配置上
2、没什么问题,但股票组合的资产数量成百上千,优 化效率急剧下降。2.不像在大类资产配置,优化问题中基本没什么约束条件,当我们进 行组合优化时,普遍会有个股权重约束、风格约束、行业约束等各 类约束条件。这些更为苛刻的约束条件,使得优化问题更为复杂化。2.2、运用机器学习算法来克服难点在上述讨论中,我们知道如果想对股票组合直接套用风险预算模型并不现 实。该小节将介绍一些机器学习算法,并阐述如何借用它们来克服上述难点。首先我们定义问题,不失一般性,我们的风险预算股票组合要满足以下数 学表达:#(11)Risk(w) lTw = 1 w e c其中,。为所有约束条件的集合。实际上,如果上述问题在没有约束
3、。时的解w 那么式(11)所描述 的问题是无解的。因此在有约束时,我们的目标应该改为风险贡献占比尽可 能地接近预设的风险预算。此时,式(10)的描述仍然成立,只是有了更多 的约束条件。nMinimizew Risk(w) 2 RBt * In wi i=l5. t. w E fl#(12)或者等价地,写为:nMinimizew (w;A) = Risk(w) 4* In牝 + 1q(w)#(13)i=l#(14)其中,lc(w)是指示函数:lc(w)=在式(13)中,对于任意大于o的参数九 优化问题都有对应的解w(a)。 我们对于;i选取,那么选择使得wQ)的和为1的a值。该值我们可以通过二分
4、法 求得其数值解,只需确保两个;i初始值分别使得w(a)的和大于1与小于1。 具体算法如下:1 .确认两个初始值4加力 Xmax,使得W(2m出) 1;2 .取2=那么学吧,并求解w(Q= arga讥w(w;Q;3 .假设w(A) 1,那么tUqx用4更新;.重复循环步骤2与3,直至w(2)的和与1之间的差距小于事先定下 的收敛误差标准;4 .以最后一次循环的;I值与w(a)值作为优化问题的结果。这里一个关键性的问题是,上述算法步骤2中,w(A) = argminw (w; A) 的求解。如果求解速度很慢,那么势必会大大影响整个算法的效率。下面我 们介绍一些适合该问题求解的机器学习算法。2.2
5、.1、 坐标下降算法梯度下降(Gradiant Descent)是机器学习(尤其是神经网络模型)中 最常用的算法之一,它每次计算出目标函数在当前点的梯度方向,并沿其反 方向偏移从而获得更新值。而坐标下降(Coordinate Descent)是梯度下降 的一个衍生变种,它每一次更新并不计算完整的梯度,而是仅在其中一个坐 标方向上进行微分计算,并保持其它坐标值不变,仅沿着该坐标偏移一小步。 其算法步骤如下:对于无约束优化问题Minimize f(w),其中w =W2,,wQ1 .获得初始值w= w();2 .选择一个方向计算在这个方向上的梯度%/(w);3 . W 更新为 W =(W1,,Wi-
6、T*Wi+1,,W/1),其中为学习速率。即除了坐标i有更新以外,其它坐标保持不变;4 .重复循环步骤2与3,直至收敛;5 .以最后一次循环的w值作为优化问题的结果。上述算法中,步骤2涉及挑选一个方向。主流的挑选方式有两种,一种 是随机挑选(Random Coordinate Descent), 一种是固定顺序的循环挑选(Cyclical Coordinate Descent)。这两种方式并没有明显的优劣之分,从 简便性角度出发,我们这里使用循环坐标下降算法(后简称CCD) o由于我们是有约束的优化问题,因此在运用CC D的过程会额外多一步: 将无约束下的更新值w,投影到约束空间。上,以投影w
7、 = Rc(w)作为该轮循 环的更新值,算法步骤入下:对于优化问题 Minimize /(w), s.t.weC,其中w = (wlw%,皿)1 .获得初始值w= w();2 .选择一个方向ie12,词,计算在这个方向上的梯度Z/(w);3 . W更新为W =(W1,,Wt, Wi-T*Wi+l,,wQ,其中为学习速率。即除了坐标i有更新以外,其它坐标保持不变;4 .将更新后的点投影到。上,w = Rc(w);5 .重复循环步骤2、3与4,直至收敛;6 .以最后一次循环的w值作为优化问题的结果。但是这个方式能否收敛到正确的最优解,取决于约束条件与变量如何排 序(Roncalli, 2019)。
8、因此在股票组合优化中,仅运用CCD算法并缺乏以 保证获得优化后的权重。所以我们还需要配合另一个算法:交替方向乘子。、交替方向乘子算法交替方向乘子(Alternating direction method of multipliers,后简称 ADMM)是Gabay与Mercier在1976年引入,是一种算子拆分技巧,用以 解决如下问题:Minimize /(%)+g(y)s. t. Ax + By = c#(15)其中,a 脓px- b e 衣pxce rp o 函数 /: nr T股u+8, g:脓小7眩11+8都是闭凸函数。该问题的的优化算法如下(Boyd, 2010):1 .获得X()与
9、y()的初始值,初始化凉)= 0,并确定参数8;2 .对于每一轮循环k,依次:2更新 x(k)= argmin /(%) + |A- + By( J) c + uk x222a) 更新 y(*)= argmin g(y) + 出 + By c +y 22C) 更新 a(“)= u(kT) + (A%(k) + By 一 c)3 .在步骤2不断循环,直至收敛;4 .以最后一次循环的x, y作为优化问题的结果。对于我们组合的优化问题,式(13)可以改写成:nMinimize Risk(x) 一 2 RBt * In + lc(y) i=l5 . t. x y = 0#(16)其中 f(x) = R
10、isk(x) - 入EWRBt * In瑞,g(y) = lc(y)。如果我们进一步取标准差风险测度Risk(x) =+ c * yfxTXx,那么算法步骤2中,x更新局部的优化问题便成为一个无约束风险预算问题,可 以通过上一小节的CCD算法求解。而y更新局部那么成为一个投影算子 y=Pq(x)+这一局部的求解在有多个约束条件构成凸约束空间。时,涉及到运用邻近算子(Proximal Operator)与Dykstra算法。x更新 及y更新的具体优化求解过程放在文末附录。3、配置型优化下指数增强效果上一章介绍了用以优化配置型组合优化的优化算法。这一章节将实证该优 化方式在指数增强组合上的效果。我
11、们分别选取目前市场上最主流的增强指数: 中证500与沪深300。比拟配置型优化下指数增强的效果与线性优化的差异。在我们之前的研报沪深300指数增强模型构建与测试多因子系列报 告之二十三中,我们得出了对个股权重(尤其是权重股权重)的约束控制是 沪深300增强表现的关键之一。因此该章节的优化测试中参考该结论,也将设 置个股相对基准权重的约束条件。具体的基本假设与约束条件如下: 采用综合质量因子EBQC对指数内成分股打分,成分股内选股; 个股权重满足:大于0%,小于100%,权重和为1; 约束行业相对偏离度不超过10%; 约束市值因子暴露度不超过5%; 个股权重相对基准绝对偏离度不超过1%; 月度调
12、仓,费率假设为单边0.3%; 样本区间为 2009-01-01 至 2019-12-31。其中,“个股权重相对基准绝对偏离度不超过1%”的约束与我们第一章 线性优化测试中“个股权重必须处于0,2%范围内”的约束有所差异。参与比拟的具体优化方式如下:1 .线性优化:Minimize wTa;2 .有约束风险平价:为 一Minimize wTa + c * VwTXw 工 In % + 1 (y)(x,y)-i 。n i=l3 .有约束风险预算: 0,月R么。3.1、 中证500指数增强我们首先测试不同优化方式在中证500指数增强上的效果。组合线性优 化下年化超额收益7.0%,信息比率1.54,相
13、对最大回撤7.7%,平均双边换 手56.5%o这个表现相比于第一章节中的线性优化结果(信息比率1.38,相 对最大回撤9.1%,平均双边换手48.5%)已经有了不小提升。可见对个股 权重相对与基准偏差的约束在中证500增强里也能有效提升组合表现。风险平价优化组合的表现与其它优化组合差异较大,它的相对年化波动 3.0%,明显小于其它组合;且换手率很低,平均双边仅21.2%,同时逐年稳 定性很强,每年表现基本一致。但它在收益端明显弱于其它组合,仅3.0% 的年化超额。信息比仅0.98。风险预算优化组合收益表现与线性优化组合相当,年化超额收益7.0%, 但风险端优势明显,相对年化波动3.8%,信息比
14、率1.80,显著高于线性优 化组合;相对最大回撤6.4%,好于线性优化组合的7.7%O其双边换手率平 均41.0%,略低于线性优化组合的48.4%。表4: EBQC因子500增强组合统计数据线性优化风险平价风险预算年化收益 年化波动 夏普比率15.2%28.5%0.6411.3%29.0%0.5215.8%28.8%0.65图4:不同优化下EBQC因子500增强净值比拟最大回撤-52.2%-61.3%-52.5%年化超额收益7.0%3.0%7.0%相对年化波动4.4%3.0%3.8%信息比率1.540.981.80相对最大回撤-7.7%-6.5%-6.4%图4:不同优化下EBQC因子500增强
15、净值比拟资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至20191231图5:不同优化下EBQC因子500增强相对净值比拟资料来源:光大证券研究所,Wind;注:基准为中证500指数 测试区间为 2009-02-01 至 2019-12-31资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至20191231从分散化的角度,线性优化组合平均每期持仓93只股票,风险平价组 合平均每期持仓395只股票,风险预算组合平均每期持仓240只股票。风险 平价组合的持股最为分散,这也是其收益较低的一个重要原因。风险预算组 合的持股集中度较为适中。除了持股集中度,我
16、慢也可以通过分散比率这个 统计量比拟不同组合的分散化程度,立.该值越大说明组合风 wTXw险越分散。从下列图可以看出,风险预算优化组合的分散比率始终高于线性优 化组合,其分散比率均值为1.68,而线性优化组合分散比率均值为1.64。结 合其它收益及风险统计数据。我们最为推荐风险预算组合优化方式。图6:不同优化方式下500增强组合分散比率序列资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至2019-12-31风险预算优化中证500增强组合除了 2009年小幅跑输基准以外,从 2010年至今每年都跑赢中证500指数。2015年组合相对基准波动较大,除 此之外,每年相对波动基
17、本保持在3%以内。相对最大回撤近4年未超过2%o表5:风险预算优化EBQC因子中证500增强分年度表现统计年化收益年化波动夏普比率最大回撤年化超额收益 相对年化波动信息比率相对最大回撤200974.7%34.2%2.1818.1%-1.6%3.2%-0.515.0%201021.0%28.1%0.7524.9%7.5%2.9%2.621.6%2011-32.5%23.9%-1.3636.2%5.3%2.3%2.321.3%20127.4%23.6%0.3125.4%4.3%2.4%1.751.6%201324.1%22.2%1.0915.7%5.8%2.8%2.101.8%201435.2%1
18、9.4%1.8210.6%1.1%2.7%0.413.9%201559.8%50.2%1.1952.5%14.9%8.6%1.736.4%2016-6.9%31.0%-0.2226.2%7.9%2.9%2.711.5%201712.5%14.9%0.8412.1%11.7%2.8%4.211.4%2018-28.7%24.1%-1.1933.2%8.5%3.1%2.751.7%201932.4%21.7%1.4917.3%6.8%2.9%2.351.9%Summary15.8%28.8%0.6552.5%7.0%3.8%1.806.4%资料来源:光大证券研究所,Wind; 注:基准为中证500
19、指数,测试区间为20090201至2019-12-313.2、 沪深300指数增强我们也测试了不同优化方式在沪深300指数增强上的效果。组合线性优 化下年化超额收益4.6%,信息比率1.49,相对最大回撤4.4%,平均双边换 手 37.4%。与上一节的测试类似,风险平价优化组合的表现与其它优化组合差异依 然很大,它在超额收益更小,年化2.7%o信息比1.04。它的优势局部中, 相对年化波动2.6%,换手率平均双边仅16.9%。风险预算优化组合年化超额收益4.4%,稍低于线性优化组合。相对年 化波动2.7%,信息比率1.61,相对最大回撤3.6%,均优于线性优化组合的 表现。其双边换手率平均33
20、.0%,略低于线性优化组合的37.4%。表6: EBQC因子300增强组合统计数据资料来源:光大证券研究所,Wind;注:测试区间为2009-02-01至2019-12-31线性优化风险平价风险预算年化收益11.3%9.7%11.6%年化波动24.2%24.5%24.3%夏普比率0.560.500.57最大回撤-43.1%-47.1%-43.7%年化超额收益4.6%2.7%4.4%相对年化波动3.1%2.6%2.7%信息比率1.491.041.61相对最大回撤-4.4%-3.9%-3.6%图7:不同优化下EBQC因子300增强净值比拟资料来源:光大证券研究所,Wind;注:测试区间为2009-
21、02-01至 2019-12-31图8:不同优化下EBQC因子300增强相对净值比拟资料来源:光大证券研究所,Wind;注:基准为沪深300指数 测试区间为20090201至2019-12-31线性优化组合平均每期持仓84只股票,风险平价组合平均每期持仓288 只股票,风险预算组合每期持仓77只股票。从持股集中度的角度来说,风 险预算优化300增强组合与线性优化组合差异不大,风险预算组合持股反而 更集中一些。但如果观察分散比率序列,可以看出风险预算组合的风险分散 程度仍始终高于线性优化组合,其分散比率均值为1.68,而线性优化组合分 散比率均值为1.650图9:不同优化方式下300增强组合分散
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 机器 学习 系列 报告 锦上添花 算法 助力 组合 优化

限制150内