基于金融高频数据的ETF套利分析.pdf
1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/第17卷 第2期2009年 4月中国管理科学Chinese Journal of Management ScienceVol.17,No.2Apr.,2009文章编号:1003-207(2009)02-0001-07基于金融高频数据的ETF套利分析刘 伟,陈 敏,梁 斌(中国科学院数学与系统科学研究院,北京 100080)摘 要:目前对ETF的研究大多基于日数据,无法定量研究ETF瞬时套利问题。本文基于华夏上证50ETF和华安上证180ETF二级市场交易的高频数据,分析了ETF跟踪标的指数的日内误差,研究了两只ETF实现无风险套利的市场冲击成本和时间成本。最后利用金融久期分析了ETF二级市场的日内效应及其对套利交易的影响,并建立ACD模型,提供了定量预测实现套利交易时间成本的统计方法。关键词:交易所交易基金;高频数据;套利成本中图分类号:F224 文献标识码:A 收稿日期:2008-04-08;修订日期:2009-03-15基金项目:国家基础研究计划973项目(2007CB814902);自然科学基金委海外、港澳青年学者合作研究基金(10628104);国家自然科学基金委创新研究群体科学基金(10721011)作者简介:刘伟(1982-),男(汉族),山东人,中科院数学与经科院研究院,博士研究生,研究方向:金融统计与风险管理11 引言ETF(Exchange2Traded Fund,即交易所交易基金)在国内也被称为交易型开放式指数基金,是一个投资组合集合实物后加以证券化,并在交易所上市交易的有价证券。ETF的一揽子证券组合通常是由市场上某种指数的成分股构成,目的在于实现指数投资的证券化,保证投资者能够以较低的成本对指数进行投资操作。ETF的市场分为一级市场和二级市场,投资者于一级市场支付指定的投资组合,申购创造出新的ETF凭证,也可采用赎回的方法缴回ETF凭证,换取指定的投资组合;二级市场上ETF份额在证券交易所的交易与股票无异。ETF作为一种重要的指数化投资工具,一经推出便在全球受到广泛重视,并迅速发展。自1993年美国的SPRD交易所交易基金发行以来,ETF的推出对市场的影响、ETF的套利机会和套利策略成为学术研究中的一个热门领域。Park等(1995)1对日数据应用GARCH(1,1)模型,研究了TIPS推出后市场交易量情况的改变;Switzer等(2000)2应用每小时的日内数据研究了SPDRs交易所交易基金和相应的指数期货之间的关系,指出相对于ETF指数期货有显著的正价格误差,同时也说明ETF上市后期货定价效率有所改善;Engle(2002)3第一次使用ETF二级市场每笔交易的高频数据和其参考净值研究了美国市场上ETF的溢价/折价的问题,发现以美国国内指数为标的的基金跟踪误差很小,而以国外指数为标的在美国发行的ETF具有较大的跟踪误差。我国从2004年11月第一个ETF基金华夏上证50ETF发行前后,也出现了一些相关的研究文章。汤弦(2005)4对我国ETF产品的设计原理和运作机制进行了剖析,在此基础上提出了在我国现有法律制度和技术环境下,充分发挥现有技术系统特点,实现该产品内在功能,特别是其瞬时套利要求的解决方案;陈绍胜(2005)5通过实证研究说明了指数基金跟踪误差的一些影响因素,并进一步探讨了指数基金如何从设计开始就能降低指数基金的跟踪误差的方法;陈远志(2007)6基于上证50ETF日交易数据集从实证角度计量其对目标指数的跟踪误差变化及波动特征,并深入探讨跟踪误差变化及波动的成因;张敏、徐坚(2007)7利用每日收盘价格探讨了利用ETF构建沪深300指数期货的现货组合的可能性,对几种ETF组合与沪深300指数的相关性以及他们跟踪沪深300指数的跟踪误差进行了分析。已有研究主要集中在ETF与股指期货的套利策略和ETF对标的指数的跟踪误差两个方面。且由于数据和研究理论的限制,绝大部分都是对于日数据或者小时数据的分析。另外,能够在较小的时间内,以较小的价格成本买入或者卖出足量证券,是 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/实现套利的基本前提,而现有讨论ETF的套利的文献多是从价格的角度出发,没有考虑时间成本和交易量的限制。本 文 利 用 华 夏 上 证50ETF和 华 安 上 证180ETF二级市场交易的高频数据,分析了ETF对标的指数跟踪的日内误差。已有研究多是直接通过ETF的溢价/折价的大小来判断ETF套利机会是否存在,对市场冲击成本仅仅是给出理论的推测,没有严格的统计证据。我们用规范的实证结果,研究了两只ETF实现无风险套利的市场冲击成本和时间成本。进一步利用高频数据的金融久期分析了ETF二级市场的日内效应和对套利交易的影响,分别为交易量久期和价格久期建立ACD模型,提供了定量预测实现套利交易时间成本的统计方法。研究发现ETF交易量和价格变化具有周期性特征,开盘阶段价格变化较快,市场流动性好,套利机会较多、实现成本较小。2 中国市场ETF的套利机会套利策略是目前ETF研究的一个重要的方面。在国外市场上最为常见套利,为指数现货和期货的套利,当股指期货实际价格高于理论价格时,卖期货、买现货并持有到期,期货到期日时以手中现货部位交割,称为正向套利;反之,买期货并放空现货,期货到期日时,拿现货回补放空部位,成为反向套利。ETF的另外一种套利策略为ETF的二级市场价格和基金净值之间的套利。当ETF市场价格高于基金净值(溢价)时,可采用申购策略,在市场上买入一篮子股票,一级市场上实物申购ETF,并在二级市场卖出ETF;当市场价格低于基金净值(折价)时,可采用赎回策略,在二级市场上买入ETF,并在一级市场赎回一揽子股票,并在股票市场上卖出。该策略要求能够实现瞬间套利,即在用一篮子股票申购ETF的同时能够在二级市场同步实现大批量卖出ETF份额,或者在二级市场能够大批量买进ETF的同时在股票市场上卖出一篮子股票。套利的同时,还要保证买卖的同步性。由于国内市场相应的指数期货尚未推出,本文主要考虑这种套利方式。一般来讲ETF二级市场的价格应该等于基金净值。但是二级市场的价格往往受到供需、及基金净值难以实时计算等因素的影响,二者往往会发生偏离。以MV(t)记t时刻ET F的市场价格,N AV(t)记t时刻ET F的净值。在考虑市场交易成本后,合理的价格关系式如下:NAV(t)-C2MV(t)NAV(t)+C1(1)其中C1,C2为交易成本,包括印花税、交易手续费、申购(赎回)手续费及市场的冲击成本。其中市场的冲击成本是指套利交易时许在现货市场买进卖出一定规模的资产,所引起的市场价格变化。此外,执行交易也可能面临不同步的问题,这主要是指完成一定交易所要付出的时间成本,而导致成交价格与理想的不一致,产生交易风险。我们称印花税、交易手续费、申购(赎回)手续费为固定成本,市场冲击成本和时间成本为可变成本。Engle(2002)3研究表明美国市场上交易的ETF大多数情况下溢价和折价的时间都很短、价格偏离净值大部分时间内小于买卖价差。从公式(1)可以看出当MV不在由净值和市场成本所确定的范围内时就存在套利空间。MV大于N AV加上交易成本时,可买入ETF成分股,然后申购ETF,并在二级市场卖出ETF。MV小于N AV扣除交易成本时,买入ETF,然后向基金公司申请赎回,获得一篮子股票,同时在市场上卖出。为了可以更清楚地理解,我们用表1刻画出两种套利方向,并介绍了完成套利各步骤地成本。其中国内ETF申购、赎回的手续费为015%到1%,交易费用和印花税总计在015%以下。因此粗略估计当溢价/折价大于等于1%时,才可能有套利空间。而买卖ETF的市场冲击成本在不同的交易时间和市态下会有所不同,将在下面一节详细讨论。表1ETF基金的套利策略MVNAV+C1MV0,i0,i=1,p且j0j=1,q。保证序列xt平稳的一个充分条件是pi=1i+qj=1j1。通常实际应用中ACD(1,1)即可满足要求。ACD(p,q)模型的参数估计可以采用极大似然法。一般地我们可以假设exp(1),当给定(xt,t),1tv其中vmax(p,q)1xv+1,xn的条件密度函数可看成:(nt=v+11t)exp(-nt=v+1xtt)(4)根据(3)式,由差分方程我们可以解得t()=1-qj=1j+pi=1ixt-i+pi=1ik=1qj1=1qjk=1j1 jkxt-i-j1-jk其中=(,1,p,1,q),因此我们可以得到ACD(p,q)模型参数的极大似然估计:mle=argminni=1(xtt+logt)(5)在实际应用中,我们不可能观察到无穷远的xt,因此只可能得到t()的截断值。同样新息序列可能不满足exp(1)。可以证明在一定的正则条件下,t()用其截断代替,极小化(5)所得的参数估计仍然是相合的,称之为伪极大似然估计(QM2L E)。本文所研究的模型的参数,就是伪极大似然估计(QMLE)得到的。在计算久期时,华夏上证50ETF取交易量久期的阈值为10000份,价格久期的阈值为0101元,华安上证180ETF取交易量久期的阈值为5000份,价格久期的阈值为0101元。阈值的大小对结果无实质性的影响。然后为不同的久期建立ACD(p,q)模型,结果表明ACD(1,1)模型即可很好的拟合数据。这儿我们只列出两种久期ACD(1,1)模型参数估计的结果(见表4)。分析ACD(1,1)模型的估计结果,华夏上证50ETF和华安上证180ETF的交易量久期,模型各参数都十分显著,且估计值的大小十分接近,说明交易量久期的动态特征相近。+的值与1十分接近,说明交易量比较集中,具有较强的“聚类效应”。对于价格久期虽然各参数仍然显著,但标准差较大。5第2期 刘 伟等:基于金融高频数据的ETF套利分析 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/价格久期ACD模型的常数项加大,说明相同长度的时间段内ETF价格变化剧烈程度较小,因此套利付出的价格冲击成本相对比较稳定。表4ACD模型的参数估计结果华夏上证50ETF交易量久期价格久期ACD(1,1)模型估计值标准差估计值标准差011394601035034013067801121801119430101982401090816010252340170625010477990156493011589华安上证180ETF交易量久期价格久期ACD(1,1)模型估计值标准差估计值标准差0102678801005481801217780117406011839601028659010765630104613017990801023726016859501218645ETF与股指期货之间的套利目前,ETF现货对应的指数期货尚未推出,所以二者之间的套利机制本文中较少涉猎。随着金融市场的发展,我国即将推出对应沪深300指数的股指期货。股指期货推出后,特别是刚推出的时间段里,由于市场参与者的预期不一致,可能会有较多的套利机会。根据持有成本理论,期货的理论价格为:Ft=(St-Dt)er(T-t)其中,Ft为期货价格,St为现货指数的价格,Dt为现货分红,T为股指期货到期日。在实际的买卖中,考虑到交易费用,冲击成本等因素,实际的理论价格为一个区间,也就是(St-Dt)er(T-t)-C1-C2,(St-Dt)er(T-t)+C1+C2)其中,C1表示交易成本,C2表示市场冲击成本。我国市场尚不存在以沪深300为标的的ETF,我们就可以选择上海和深圳市场上的ETF基金按照一定比例作为现货。这种组合的构建一般是根据最小跟踪误差的方法,也就是,minTE=st=1(rpt-rit)2其中:rpt=ni=1wiri,t,ni=1wi=1,wi0,i。其中n代表ETF的个数,rpt表示追踪投资组合在时刻t的报酬率。rit表示目标指数在时刻t的报酬率。这样就可以计算出现货组合里ETF的权重,同样,在这里会产生一个现货的跟踪误差成本C3。所以,无套利定价区间变为(St-Dt)er(T-t)-C1-C2-C3,(St-Dt)er(T-t)+C1+C2+C3)对于无套利区间很好的估计是股指期货套利中的重要前提。运用高频数据可以很好的估计不同品种、不同合约的以及不同时间的冲击成本。在现货组合的构建中,可以根据冲击成本以及交易量来选择一个更好的ETF构建现货组合也是股指期货套利研究的重要方面。相信随着我国金融市场的逐步发展和各种指数衍生产品的推出,ETF和未来股指期货交易的高频数据研究,将会对市场价格发现和套利交易提供有力的支持。6 结语受金融危机的影响,一段时间以来股票市场波动变大,ETF跟踪标的指数的难度进一步加大,市场上可能会有更多的套利机会出现。套利机会的实现必须考虑二级市场上交易足够基金份额的市场冲击成本和时间成本,而这些问题在已有的文献中很少涉猎。本文利用华夏上证50ETF和华安上证180ETF一段时间内交易的高频数据,分析了ETF对标的指数跟踪的日内误差。研究了两只ETF实现无风险套利的市场冲击成本和时间成本。进一步利用高频数据的金融久期分析了ETF二级市场的日内效应和对套利交易的影响,研究发现ETF交易量和价格变化具有周期性特征,开盘阶段价格变化较快,市场流动性好,套利机会较多、实现成本较小。当然,本文的结论仅是基于一段时间的数据得出的,市场交易瞬息万变,不同时间、不同市态交易量和交易价格的动态结构可能会有变化,不同时间的套利机会需要根据实际情况综合判断。另外,国内外关于高频数据的研究受到理论方法和数据准确性的限制,距离充分利用金融高频数据指导市场还6中国管理科学 2009年 1994-2010 China Academic Journal Electronic Publishing House.All rights reserved.http:/有很大的差距。金融久期的研究也是刚刚展开,还有很多问题需要继续深入考虑。比如在计算金融久期时,阈值的选取可能会影响结果,但目前还没有系统的、统一的规则设定阈值。相信随着金融市场和信息技术的日益发展,高频数据的研究将会更加广泛和深入。参考文献:1 Park,T.H.and Switzer,L.N.Index Participation U2nits and Performance of Index Futures Market:Evidencefrom the Toronto 35 Index Participation Units MarketJ.Journal of Futures Market,1995,15(2):187-200.2 Switzer,L.N.,Varson,P.L.and Zghidi,S.Stand2ard and Poors Depository Receipts and Performance ofS&P 500 Index Futures Market J.Journal of FuturesMarket,2000,20:705-716,.3 RobertEngle.Pricing Exchange2Traded Fund R.Working Paper,2002.4汤弦.交易型开放式指数基金(ETF)产品设计问题研究J.金融研究,2005,(2):94-105.5陈绍胜.指数型基金跟踪误差的实证分析J.当代经济科学,2005,27(4):59-64.6陈远志.上证50ETF的跟踪误差实证研究J.技术经济与管理研究,2007,(6):6-9.7张敏,徐坚.ETF在股指期货期现套利的现货组合中的应用J.技术经济与管理研究,2007,(3):31-32.Analysis of ETFs Arbitrage with High Frequency DataLIU Wei,CHEN Min,LIANG Bin(Academy of Mathematics and Systems Science,Chinese Academy of Sciences,Beijing 100080,China)Abstract:Most of the recent works on ETF are based on daily data,thus the strategy of instantaneous ar2bitrage could not be carefully studied.In this paper,two ETF funds in Chinese stock market are examinedbased on high frequency data.We investigate the extent and properties of the premiums and discounts ofETF from their market value.The cost of arbitrage is carefully studied.In the last part of our work,theAutoregressive Conditional Duration(ACD)is used to study the dynamic structure of ETF transactions;we introduce a statistical method to forecast the time cost to realize the arbitrage chance.Key words:exchange2traded fund;high frequency data;cost of arbitrage7第2期 刘 伟等:基于金融高频数据的ETF套利分析