基于已实现协方差矩阵的高维金融资产投资组合应用-宋鹏.pdf
《基于已实现协方差矩阵的高维金融资产投资组合应用-宋鹏.pdf》由会员分享,可在线阅读,更多相关《基于已实现协方差矩阵的高维金融资产投资组合应用-宋鹏.pdf(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第32卷第8期VoL 32 No8统计与信息论坛StatisticsInformation Forum2017年8月Aug,2017【统计应用研究】基于已实现协方差矩阵的高维金融资产投资组合应用宋鹏,胡永宏(中央财经大学统计与数学学院,北京100081)摘要:随着金融市场的发展,可配置金融资产种类不断增加,高维资产的投资组合应用引起了广泛的关注,因此高维协方差矩阵的建模及预测更加重要。基于已实现协方差矩阵,创新地将Elastic Net(弹性网)方法与向量自回归模型结合,对高维已实现协方差矩阵进行建模和预测。实证分析中模型取得了理想的预测精度,待估参数的数目显著下降;由于弹性网方法具备充分的变
2、量选择功能和群组效应,得到的模型更加完善,因此资产之间动态相关结构也更加明晰;分析发现行业之间协方差变化比自身方差变化更加复杂,将VAR-LASSo、VAREN、D(:C-MVGARCH、删A四种模型预测的协方差矩阵应用到投资组合中,结果表明VAREN优势明显。关键词:高维资产;已实现协方差矩阵;向量自回归;Elastic Net方法中图分类号:F2240 文献标志码:A 文章编号:10073116(2017)08一0063一08一、引言随着现代金融市场的高速发展,高维金融资产的投资组合配置越发常见,而现代投资组合理论对资产协方差矩阵的建模预测有着很强的依赖,因此对高维金融资产协方差矩阵的建模
3、及预测变得十分重要。高维金融资产投资组合维数的增加势必会加大参数估计的难度,也会影响资产协方差矩阵的度量精度,导致投资组合绩效下降。在实际应用中,应用普通的多变量ARCH类模型无法得到可靠的高维协方差矩阵估计,针对高维协方差矩阵的建模及预测,一些学者进行了相应的研究:Cai和Liu将稀疏矩阵理论引入到高维协方差矩阵的估计中,在保证信息相对完备的情况下,用矩阵稀疏来解决维数灾难问题1;Fan等人利用非参数和半参数方法估计了纵向数据的协方差矩阵和相关性矩阵2,这些方法将协方差矩阵看作统计意义上的总体,而用样本去估计总体并没有将矩阵时变产生的相关历史信息考虑在内;Bollerslev等人发现协方差矩
4、阵以很强的自相关结构随着时间变化,也就是历史信息对于预测未来有帮助33;Bauer和Vorkink提出了一种多变量的异构自回归模型(HAR)4,这种方法基于对数矩阵识别,不过此模型只能应用在低维数据协方差矩阵的建模过程中;Chiriac和Voev考虑了多变量ARFIMA模型5,但是没有探究模型在高维协方差矩阵中的应用;Golosnoy等人提出了条件自回归Wishart模型6|,作者同样在文中仅仅考虑了5种不同的资产,应用到高维协方差矩阵还存在很大的未知;刘丽萍等人提出CCDGARCH模型(poetCCC),将主成分正交补门限估计应用到CCC-GARCH模型中,对高维协方差矩阵进行条件稀疏化,拟
5、在克服维数灾难的同时考虑协方差矩阵的“条件性”7,但是此方法仅仅降低了协方差矩阵的冗余噪声,待估参数数目没有下降,导致无法很好地探究协方差矩阵内在的动态驱动结构。Callot等人提出的VAR-LASS0模型L8,为高维协方差矩阵的建模提供了另外一种思路,其方法收稿日期:20161223;修复日期:2017一06一05基金项目:国家自然科学基金面上项目稳健投资组合选择的并行最优化算法研究与实现(61272193);中央财经大学研究生科研创新基金项目高维协方差阵建模及投资组合应用(201607)作者简介:宋鹏,男,山东济南人,博士生,研究方向:金融统计;胡永宏,男,陕西韩城人,管理学博士,教授,博
6、士生导师,研究方向:金融统计,统计综合评价。63万方数据统计与信息论坛首先将协方差矩阵拉直为向量,然后用向量自回归模型(VAR)刻画动态结构,同时应用LASSO算法进行参数向量的稀疏化,以此对协方差矩阵进行建模和预测。这种方法对待估参数向量进行了降维,而且由于VAR模型的特性,可以明确各个变量之间的动态变化结构。遗憾的是,LASSo算法有自身的局限性,当变量数目大于观测数量时估计精度会下降,而且没有考虑到变量之间的群组效应,即重要且高度相关的变量应同时选人模型(反之亦然)。在算法领域,针对LASSO局限性的问题,Zou和Hastie提出了弹性网算法(Elastic Net,EN)L9J,弹性网
7、(EN)的惩罚项实际上为LASS0惩罚和岭回归惩罚的凸组合,因此兼备了二者的优点,并具备变量选择功能,在变量个数大于观测数目时精度也得到了改善,同时还考虑到了群组效应,在实证分析中表现更好。因此,本文拟将弹性网方法与VAR结合,提出VAR_EN模型,对高维金融资产协方差矩阵进行建模和预测。在实际应用过程中有两点需要说明:其一,由于协方差矩阵是不可观测的,需要对其进行估计。Anderson和Bollerslev首先提出了基于高频数据的已实现协方差矩阵构建方法1 0I,这种方法应用过程中不需要参数估计,且基于高频数据,包含信息更多,精确度更高;其二,与传统多变量ARCH类模型相比,VAR方法并没有
8、从模型设定结构上保证协方差矩阵的非负定性,需要额外的方法进行弥补改善。Bauer和Vorkink提出了矩阵对数变换法,以此保证最后得到的协方差矩阵的非负定性。综上所述,本文所做工作如下:第一,创新地将弹性网方法与VAR模型结合,并给出模型预测误差上界,将其用于高维金融资产已实现协方差矩阵的建模和预测,同时通过矩阵对数变换法保证预测协方差矩阵的非负定性;第二,对协方差矩阵进行预测后,与VARLASSO、DCC_MVGARCH和EWMA方法进行对比;第三,利用VAR模型的特性,探究金融资产之间的动态驱动结构(如不同资产波动的动态驱动来源是否一致);第四,将预测后的高维协方差矩阵应用到投资组合中,综
9、合评价投资组合绩效。二、相关方法介绍(一)已实现协方差矩阵构建方法Anderson和Bollerslev提出的已实现协方差矩阵(RCOV),是应用范围最广的基于高频数据的64协方差矩阵构造方法。在给定高频数据获取的频率下,假定日内获取的样本数量为m,资产i与资产歹之间在第天的已实现协方差如下:竺RCoV护一(户缺一夕纠)(知一纵一1)一1(1)在得到两个资产之间已实现协方差后,可以构建全部n维资产的已实现协方差矩阵:rRCOVll。 RCOVl。RCOV:一l ; ; (2)LRCOV。l。 RCOV二:_|在没有噪声影响的情况下,已实现协方差矩阵是积分扩散阵的一致估计,而且在获取数据频率足够
10、高时,不会存在测量误差。(二)VAR模型构造说明假定资产数目为船且固定不变,令。表示丁时刻九咒维的已实现协方差矩阵。BOllerslev等发现协方差矩阵具有自回归结构(条件性),如果滞后户期,则。一厂(,l,哪)。用VAR模型刻画自回归结构来间接地对协方差元素向量进行建模,定义vech()为拉直算子,将矩阵中不同元素拉直为向量。令弘一vech(。),则:三t=(i)+七圣;一七|f=1(一1,2,T) (3)其中鲜为咒(咒+1)2维方阵,是滞后变量的系数矩阵;为咒维常数项向量,s。为零均值误差向量。为了方便估计,将模型变换,考虑执中每个元素自身的自回归结构。设是一(理+1)理2,互一(1,y7
11、,1,“,y7,。)7为(坳+1)维的解释变量向量,则Z一(ZT,Z-)7为丁(坳+1)的矩阵。令yi一(y,y卜,y),i一1,2,志为第i个元素的T维观测向量,ei一(丁T-1川,1f)为相应的误差向量,令一(西,p一:)7为第i个方程(助+1)维参数向量,对于第i个方程模型为:yi=勿,+ei(i一1,2,是) (4)对于每个元素i单独建模,一共走个方程,每个方程有(幼+1)个参数。(三)弹性网(E1astic Net)方法介绍Tibshirani提出了LASSo估计方法11,设数据集(zi,y。),i一1,2,n,其中zi一(zil,zi2,z咖),z为夕维解释变量,y为被解释变量,咒
12、为观测样本数量,假定解释变量已进行标准化,令声一(声,怠,岛),则LAsso估计(占,声)由下式给出:万方数据宋鹏,胡永宏:基于已实现协方差矩阵的高维金融资产投资组合应用(占,声)一arg min(Ma一岛z)2+i=1 Aj岛I) (5)模型可以改写为:(五,口)一arg min(挑一a一p,zg)2)z=1 Jst J屈l (6)LASSO方法使得系数收缩与变量选择可以同时进行,然而也有局限:其一,当变量个数夕大于样本数量咒时,LASSO算法最多只能选出n个变量;其二,如果在全部变量中有一些变量相关性很高,LASSo倾向于只选择其中的一个,忽视群组中的其他变量。针对以上问题,Zou和Has
13、tie提出了弹性网的正则化方法。假定有靠个观测值与p维变量,令Y一(y。,y。,y。)T表示被解释变量的,z次观测,X=(X,Xz“,Xp)为p维解释变量观测矩阵,其中墨一(z”zz”,)丁在被解释变量中心化和解释变量标准化后,给定非负的(A。,A。),则:L(A。,天2,p一y一邵2+Az j9 2+Al p l(7)其中 I卢I 2=劈I p I。一|卢lJ一1 J一1可以得到氖:蜘)一arg mi砷L(A1,A2,p (8)上述为朴素弹性网(naIve elastic net)估计,可见其变量惩罚项为LAsSO与岭回归的凸组合。zou和Hastie指出,朴素弹性网方法兼顾了LASSO和岭
14、回归的优势,即使当变量个数夕大于样本数量规时,此方法也不局限于只选择咒个变量,此外还具备群组效应。朴素弹性网实际进行了两步收缩,需要进行参数修正。给定预处理后的数据集(X,y)和参数(A-,A。),定义修正后的弹性网估计方法为:舀(elastic net)一g咖伊(紫)|192脚“f屈)(9)实际上声(elastic net)一(1+A2)p(naiVe elastic net)(10)(四)VAR_EN模型的误差上界在Callot和KOck的基础上,基于弹性网与LASSO的关系,本文给出VAR_EN模型的误差上界。对于任意方阵A,记11 A ll。为矩阵中绝对值最大的元素;对于任意实数口和6
15、,盘V易=max(口,6),口6一min(口,6);件,为向前一期估计的协方差矩阵;A,、A2分别为L。、Lz惩罚项系数;记优i和叩;,分别为y印的均值和方差,旌为零均值扰动项。的方差;定义m。=maxl:Q mi|,琅一maXl硌(孕,V孕,),令;一max(sl,s2,&)表示每个VAR方程中最大非零系数,则VAR-EN模型所估计的向前一期协方差矩阵的误差上界表示为: Il全件一一I厄(努;忐+1)(11)其中x。、灭F瓦j一8In(1+z)2(1+尼)2(1+乡)2ln(尼2户)K;办 K一塑型塑掣谚去霞。:拯堕土丛墼掣卫蚴谚A言(O户的情况;第二次取后44个数据设为数据集2(Set一2
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 实现 协方差 矩阵 金融资产 投资 组合 应用 宋鹏
限制150内