我国股指期货跨品种套利量化模型研究—基于行业因子视角毕业设计.doc
毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日注 意 事 项1.设计(论文)的内容包括:1)封面(按教务处制定的标准封面格式制作)2)原创性声明3)中文摘要(300字左右)、关键词4)外文摘要、关键词 5)目次页(附件不统一编入)6)论文主体部分:引言(或绪论)、正文、结论7)参考文献8)致谢9)附录(对论文支持必要时)2.论文字数要求:理工类设计(论文)正文字数不少于1万字(不包括图纸、程序清单等),文科类论文正文字数不少于1.2万字。3.附件包括:任务书、开题报告、外文译文、译文原文(复印件)。4.文字、图表要求:1)文字通顺,语言流畅,书写字迹工整,打印字体及大小符合要求,无错别字,不准请他人代写2)工程设计类题目的图纸,要求部分用尺规绘制,部分用计算机绘制,所有图纸应符合国家技术标准规范。图表整洁,布局合理,文字注释必须使用工程字书写,不准用徒手画3)毕业论文须用A4单面打印,论文50页以上的双面打印4)图表应绘制于无格子的页面上5)软件工程类课题应有程序清单,并提供电子文档5.装订顺序1)设计(论文)2)附件:按照任务书、开题报告、外文译文、译文原文(复印件)次序装订指导教师评阅书指导教师评价:一、撰写(设计)过程1、学生在论文(设计)过程中的治学态度、工作精神 优 良 中 及格 不及格2、学生掌握专业知识、技能的扎实程度 优 良 中 及格 不及格3、学生综合运用所学知识和专业技能分析和解决问题的能力 优 良 中 及格 不及格4、研究方法的科学性;技术线路的可行性;设计方案的合理性 优 良 中 及格 不及格5、完成毕业论文(设计)期间的出勤情况 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)指导教师: (签名) 单位: (盖章)年 月 日评阅教师评阅书评阅教师评价:一、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格二、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)评阅教师: (签名) 单位: (盖章)年 月 日教研室(或答辩小组)及教学系意见教研室(或答辩小组)评价:一、答辩过程1、毕业论文(设计)的基本要点和见解的叙述情况 优 良 中 及格 不及格2、对答辩问题的反应、理解、表达情况 优 良 中 及格 不及格3、学生答辩过程中的精神状态 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格评定成绩: 优 良 中 及格 不及格教研室主任(或答辩小组组长): (签名)年 月 日教学系意见:系主任: (签名)年 月 日摘 要伴随着我国金融市场的不断发展,各种新型金融工具不断涌现,2015年4月16日,上证50指数期货和中证500指数期货在中国金融期货交易所上市交易,实现了我国金融指数期货品种的多样化,使得股指期货跨品种套利成为可能。本文首先回顾了期货跨品种套利主流的方法:基于均值回复的套利策略和基于趋势的套利策略,从经典策略中获得了有益启示,而后从估值、市值和行业分布角度,比较了沪深300指数期货、上证50指数期货和中证500指数期货的异同,发现中证500指数期货在这三个角度上与沪深300指数期货和上证50指数期货存在显著的不同。为了确定股指期货跨品种套利的可行性。分析了沪深300指数、上证50指数和中证500指数的相关性,发现上证50指数和中证500指数的相关性最小,走势差异最大,具有最大的套利空间,所以本文的套利对象选择为上证50指数期货和中证500指数期货。而后进行了单个行业因子与指数相对强弱的相关性的检验,发现当日行业因子与次日指数相对强弱的相关系数较小,难以用单一行业因子较好预测次日指数的相对强弱。为了克服单个行业因子预测的不足,本文尝试使用行业因子组合的形式来预测次日指数的相对强弱,通过logistic回归,将行业因子组合起来预测次日上证50指数期货和中证500指数期货的相对强弱情况。在综合考虑了品种的可交易性、交易成本和冲击成本等的情况下,构建了基于行业因子的股指期货跨品种套利量化模型,在单利计算下,实现超过50%的年化收益率,超过1的夏普比率,与同期沪深300指数相比有着明显的优势,证明了基于行业因子的股指期货跨品种套利的可行性。此后为了更全面考察基于行业因子的股指期货跨品种套利量化模型,本文根据跨品种套利的两种经典策略,设计了其在我国股指期货上的运用。由于我国股指期货不具备进行统计套利的基本条件,所以主要比较在基于趋势的股指期货跨品种套利策略和基于行业因子股指期货跨品种套利模型间展开,经过比较,进一步证明了基于行业因子股指期货跨品种套利量化模型的可行性和优越性。关键字: 跨品种套利;行业因子;股指期货;量化投资AbstractWith the continuous development of China's financial market, a variety of new financial instruments continue to emerge, April 16, 2015, SSE 50 Index Futures and the CSI 500 index futures traded on the China Financial Futures Exchange, the realization of the diversification of China's financial index futures, the stock index futures cross species arbitrage become possible.This paper reviews the domestic and foreign scholars related research on investment arbitrage and quantization, puts forward the stock index futures cross-species arbitrage quantitative model based on industry factor. This paper first reviews the methods of classic futures arbitrage strategy: based on the mean reversion and based on the trend .Then from the valuation, the market capitalization and industry distribution point of view, compares the similarities and differences of the CSI 300 index futures, the SSE 50 Index Futures and the CSI 500 index futures, found in the card 500 index futures on the three angles is significantly different from the CSI 300 index futures and the SSE 50 index futures.Then analysis the correlation of the CSI 300 index, SSE 50 index and the CSI 500 index, found the SSE 50 index and the CSI 500 index minimum correlation. Their trend differences are largest and they have most arbitrage space, so the SSE 50 Index Futures and the CSI 500 stock index futures are selected to be the arbitrage object. Then, making correlation test of single industry factor and relative strength of index, day of the industry factor and the next index relative strength of index correlation coefficient is relatively small. It is difficult to use factor of a single industry to predict the next day relative strength index.In order to overcome the disadvantage of single industry forecast factor, we decided to use the combination of industry factor to predict relative strength of index. By logistic regression, the industry factor combined prediction of the SSE 50 Futures (index) and CSI 500 Futures (relative strength index). In considering the variety of transaction and transaction costs and the impact of the cost of the case, to build the stock index futures cross-species arbitrage quantitative model. In back test, the model achieves more than 50% of the annual yield, Sharpe ratio of more than 1, with the same period in the CSI 300 index compared with obvious advantages. It is proved that the feasibility of the stock index futures cross-species arbitrage quantitative model based on industry factor. Then in order to observe the model, according to the two classic cross-species arbitrage strategy, design and its application in China's stock index futures. Due to lack of the basic conditions for statistical arbitrage of stock index futures in China, so the main comparison between cross-species based on the trend of the stock index futures arbitrage strategies and the stock index futures cross-species arbitrage quantitative model based on industry factor, through comparison and further analysis show that the stock index futures cross-species arbitrage quantitative model based on industry factor is feasibility and superiority.Key Words: Cross-species Arbitrage, Industry Factor, Stock Index Futures, Quantitative Investment目录1.绪论11.1研究背景11.2国内外研究现状21.3论文思路与主要内容72.套利交易92.1套利交易的基本概念92.2套利交易的主要类型92.3本章小结113.股指期货风格分析133.1股指期货合约概述133.2股指期货风格分析143.3本章小结184.基于行业因子的股指期货跨品种套利可行性分析194.1沪深300指数、上证50指数和中证500指数走势相关性分析194.2上证50指数和中证500指数价差分析214.3行业因子和指数相对强弱的相关性分析234.4本章小结255基于行业因子的股指期货跨品种套利量化模型的实证研究265.1数据选择265.2数据标准化265.3logistic回归概述275.4模型构建295.5模型结果与分析315.6本章小结366.基于行业因子的股指期货跨品种套利量化模型与跨品种套利经典策略的比较376.1基于均值回复的股指期货跨品种套利策略376.2基于趋势的股指期货跨品种套利策略386.3基于行业因子的股指期货跨品种套利模型与跨品种套利经典策略的比较396.4本章小结417.结论427.1本文的主要研究成果427.2本文的创新之处437.3下一步的工作方向43参考文献45攻读学位期间本人出版或公开发表的论著、论文47附录48致谢49491.绪论1.1研究背景随着中国经济的不断发展,我国金融市场不断发展完善。成熟市场上的各类衍生金融工具陆续出现在我国资本市场上。2010年4月沪深300指数期货(IF)在中国金融期货交易所上市,为广大投资者提供了基础性的风险管理工具。为了应对市场不断的变化发展,同时更好反映市场特征,2015年4月中证50指数期货(IH)与中证500指数期货(IC)在中国金融期货交易所上市,使投资者能根据自身需求,更好管理风险,降低投资风险。伴随着我国股指期货市场不断发展壮大,基于其的投资策略研究不断涌现。由于股指期货具有双向交易、T+0交易和保证金制度等特点,天然适合量化投资策略。量化投资主要使用数量化模型来研究金融市场,构建投资模型,力图从中发现能够带来超额收益的策略。与传统的投资策略相比,因为其具有系统性、及时性和准确性等特点,量化投资策略吸引了众多投资者的关注。针对股指期货的量化投资策略研究主要集中于两个方向:投机交易和套利交易。投机交易利用股指期货可以做多也可做空的特点,利用数理模型判断股指期货涨跌方向,根据结果单边做多或做空;套利交易利用股指期货现货之间的价差(期现套利)、不同月份合约之间(跨期套利)、不同市场之间(跨市场套利)和不同品种合约之间(跨品种套利),利用数理模型预测价差收敛或扩展方向,做多模型认为低估的品种,做空模型认为高估的品种。在2015年4月前,由于上市的股指期货品种只有跟踪沪深300指数的沪深300指数期货,套利交易主要集中在跨期套利和期限套利上,而随着中证500指数期货和中证50指数期货的上市,跨品种套利也将蓬勃发展起来。我国已上市的股指期货存在着显著的差别,上证50指数和沪深300指数主要由低估值、大市值的蓝筹股组成;而中证500指数则主要由高估值、小市值的成长股组成,同时这三大股指期货品种处于相同的宏观经济环境、市场环境中,受到诸多的共同因素影响。在近几年的市场行情中,蓝筹股行情与成长股行情交替出现,这都说明股指期货跨品种套利具有现实基础。另一方面,指数之间的风格切换往往由市场行业轮动驱动。由于上证50指数和沪深300指数更多的由传统的银行、非银金融和房地产等行业股票组成,中证500指数更多由新兴产业如医药生物、计算机、电子等行业股票组成,不同行业之间的轮动成为了指数风格切换的重要动因。在新兴行业表现较好的时候,往往中证500指数表现较佳;而当传统行业价值重估时,上证50指数和沪深300指数往往表现更好,风格切换将带来股指期货跨品种套利的机会。基于此,本文利用多因子模型中的行业因子,通过logistic回归构建股指期货跨品种量化模型,取得了较好的效果,具有一定的实战意义。相较于传统的基于均值回复套利策略和基于趋势套利策略,本文为股指期货跨品种套利提供了一个新的视角,可供投资者参考。1.2国内外研究现状(1)期货套利期货套利交易的概念最初来源于Working(1949)的关于期货仓储理论的经典论述,他认为期货交易者可以从同种期货不同交割期限的合约之间价格差异的决定因素出发,考察合理价差的范围,从不合理的价差中获利。Kanamura,Rachev和 Fabozzi( 2010)认为期货套利交易本质上是一种Pairs Trade( 配对交易) ,在买入一种期货合约的同时卖出另一种期货合约,从两者价格相对波动中获利,而不是单个品种的绝对价格波动中获利。期货套利主要分为期现套利、跨期套利、跨市场套利和跨品种套利。随着我国期货市场的发展,国内出现了不少关于这四种套利的研究。关于期现套利,期现套利的研究主要集中在股指期货与其现货股票或ETF(交易所交易基金Exchange Traded Funds)上。陈晓静和陈钟(2007)选择ETF组合作为沪深300指数现货的替代,根据日均跟踪误差最小化原则确定各ETF比重。利用中金所仿真交易数据,考虑了交易成本、指数期货保证金水平以及跟踪误差等因素后,给出了沪深300指数期货无套利区间。袁象(2008) 分析了国内指数型基金产品的发展现状,分析了其作为期现套利标的的可行性,并对模拟复制指数的股票现货组合构建方法和模型进行探讨,对不同标准构建的指数复制现货组合进行实证分析,发现采用的分层抽样复制方法对沪深300 指数进行复制,基本能够满足期现套利的需求。李成武和陈蕾(2014) 依据持有成本法和高频数据研究发现,沪深300股指期货上市后,期现货价格偏差度和期货定价偏离度越来越小,正向套利机会和反向套利机会从初期频繁出现演变为偶然出现。单次套利平均收益越来越小,套利持续时间也越来越短,沪深300股指期货逐渐进入成熟期。关于跨期套利,国内跨期套利的研究主要集中在成本模型和协整模型上。景楠,王彤(2012)从跨期套利的实物交割及持仓成本的角度出发,运用无套利原理,给出了正向市场和反向市场中买近期合约抛远期合约和买远期抛近期合约的无套利条件,并运用该无套利条件对SHFE上交易量最大的铜期货数据进行实证分析,发现跨期套利具有一定的季节性因素,跟其基本面有较大关系。吕巧云(2012) 主要研究沪深股指期货的跨期套利,选取沪深股指期货日内每五分钟收盘价这一高频数据作为研究对象,选择两种目前领域内最为热门的两种模型持有成本模型和协整模型建立模型进行实证分析。在持有成本模型方面,根据国内市场的特点对一些参数进行了设定,在对数据进行跨期套利时得到了比较好的结果,发现了一些正向和反向的套利机会。在协整模型方面,除了对两组期货合约的价格指数进行协整分析外,还对均衡误差项即为价差建立了显著的ARMA模型,使用这一模型的静态预测功能能够在很大程度上预测出下一时间点价差的走势。利用ARMA模型的预测功能能够从协整模型发现的大量套利机会找到较为稳定的套利机会。关于跨市场套利,国内对跨市场套利研究在四类套利相对较少,主要集中国内和国外同质期货合约之间。邹强(2012)分析了新华A50指数、沪深300指数与 H 股指数的编制,发现它们存在着相当大的相关性。对这三个指数之间的关联性与互动性,利用Johansen协整检验对三个指数之间的长期均衡关系进行分析,并通过建立 VECM(误差修正模型) 对这三个指数之间的关联性与互动性进行具体的实证研究。证实了这种指数间的关联性可以转化为跨市场套利的投资机会,并通过协整检验,误差修正模型等计量方法对跨市套利的头寸组合,以及跨市套利成功的概率做出了定量研究。关于跨品种套利,跨品种套利的研究集中在商品期货上。殷晓梅(2009)对我国19个商品期货交易品种的活跃性及品种间的相关程度进行了分析,发现大连商品期货交易所的大豆和豆粕期货、上海商品期货交易所的铜和铝期货能够进行跨品种套利,并以大豆和豆粕的实际数据为例,介绍传统的跨品种套利方法:价差套利和比价套利。分析这两种方法的原理、操作方法、操作步骤、套利效果,及其优缺点。李亚芹,于逍遥和黄毅敏(2010)对大豆和豆粕期货进行实证研究,建立误差修正模型,通过误差项反映两者的长期均衡关系,从中发现机会进行套利。采用ADF和Johanson检验两种方法,检验大豆和豆粕之间是否具有协整关系。采用E-G两步法,进一步建立误差修正模型,对误差项的进行分析,发现了套利机会。(2)量化投资量化投资是借助现代统计学和数学的方法,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种“大概率”事件以制定策略,用数量模型验证及固化这些规律和策略,然后严格执行已固化的策略来指导投资,以求获得可持续的、稳定且高于平均的超额回报的一种投资方式。目前比较认可的量化投资的开端,始于马科维茨关于资产组合最优化的相关论述。马科维茨(1952)开创性的引入了均值和方差这两个统计学上的概念,用定量方法描述投资者在投资组合上获得的收益和承担的风险。基于投资组合中资产的收益情况和相互之间的协方差矩阵,采用最优化的方法,就可以得到投资组合的最优化配比方式,从而帮助投资者在风险一定的情况下获得最大收益,或者在收益固定的情况下面临的风险最小。整个过程通过清晰的数量化模型进行了表述,为以后量化投资的发展奠定了基础。此后在马科维茨的工作基础上,夏普等人(1964)在马科维茨的工作基础上,发展出了资本资产定价模型(CAMP)。该模型将股票在无风险收益之上的超额收益分为两个部分,即市场收益和残差,而股票的风险也相应的分为两个部分,对应起来分别是系统性风险和非系统性风险。模型证明了在资本市场完全有效等前提下,残差的期望值为零,也就是说,非系统性风险是没有风险补偿的,股票的超额收益仅与其承担的系统风险大小有关。同样的,罗斯(1976)从资本收益可用因子模型表示出发,得出了与资本资产定价模型在一定程度上具有相似性的套利定价理论(APT)。该理论同样认为股票的超额预期收益仅有其所承担的风险有关,只不过除了最主要的市场系统性风险,理论模型还能够包含其他一些存在风险因子,这一定程度上引导了日后风靡的多因子模型的出现。Fama和 French (1993)提出的三因子模型可以看做是CAPM模型的一个拓展,也可以看做是对APT模型的应用。他们对美国股票市场决定不同股票回报率差异的因素的研究发现,股票的市场的beta值不能解释不同股票回报率的差异,而上市公司的市值、账面市值比、市盈率可以解释股票回报率的差异。Fama and French认为,上述超额收益是对CAPM 中未能反映的风险因素的补偿。在这些基本理论的基础上,国外学者也做了大量的实践性研究。Ang, Hodrick, Xing, Zhang(2006)发现Fama-French三因素模型计算得到的异常波动率(idiosyncratic volatility)对资产进行了排序和收益率上的检验,揭示了一个非常稳定的结果:高异常波动率的股票有着非常低的平均收益。这一发现无法由规模、账面/市值比、杠杆、流动性、成交量、换手率、买卖价差、协偏度和分析师的一致预期这些风险因子来解释。而且,它在各种类型的市场和周期上均保持稳定。尽管其中的经济学原理依然是一个未解之谜,但美国市场的实证结果表明,利用这一因子确实能够获得统计意义上十分显著的alpha收益。Arena, Matteo , Stephen Haggard(2008)等检测了价格动量和特质波动率即IVol 的相关性。发现高IVol的股票比低IVol 的有更强的动量效应,这种相关性是显著性的正的,且对于公司规模、交易费用、周转率、价格延迟、财务困境风险、不同的取样时期、不同的构建时期、持有时期,和IVol 的不同的计算是稳健的。进一步的,这种相关性是主要被高IVol的过去表现不佳的股票驱动的。Xiong, Ibbotson(2014)研究了股票价格的加速上涨对其未来表现的影响。作者使用了:NYSE和AMEX中从1960年1月至2011年12月间所有股票组成,包括了股票的日收益率、成交量、流通股数等数据。研究发现,当期股价的加速上涨会导致下期股价大概率表现不佳甚至出现反转,从而得出了股价的加速上涨是不可持续并且可能引发下跌的结论。Alexander , Giblin ,Weddington(2002)利用资产价格的协整关系而非资产收益率的相关性构建投资组合,通过资产组合价格的历史走势,建立统计模型,并预测资产组合未来的价格走势。相比于传统的市场中性策略,协整模型的引入有效降低了资产配置中的参数敏感性,以相对较少的资产数量、平稳的低跟踪误差与较低的换手率获取稳健的超额收益。在多因子模型中,证券暴露于多种风险之中,此时来自于各风险因子的周期性波动会有聚集效应,从而导致证券收益率出现更强的周期性。因此,即使每个风险因子只蕴含着轻微的周期性特点,当证券面对足够多的不同风险时,其收益率也会呈现出巨大的周期效应。Keloharju, Linnainmaa, Nyberg(2014)研究了市场上存在的15 种异象交易策略的收益率变化。证明他们有可能存在周期性特点,某些月份的收益率会显著更高的策略,投资者即可在每个月买入其对应的收益率最高并卖出在对应收益率在该月最低的策略。检验了这种极端策略的收益情况,结果取得了1.88%的月均收益率,t检验值为6.43,效果十分显著。而不根据这些策略历史月均收益率时,月平均收益率甚至是负的。这证明这些异象策略也呈现出周期性的特点。由于起步较晚,国内对量化投资的研究仍处于起步阶段。方兆本和镇磊(2011)提出了一种基于自回归条件持续期(ACD) 来选择交易时机的模型。杨科和陈浪南(2012)提出了基于幂转换以及不设定扰动项的具体相关结构和分布形式,构建了半参数的短期预测模型来预测中国股市的波动率,通过实证发现在各种损失函数下,半参数短期预测模型是预测中国股市波动率精度最高的模型。宋增基和杨俊等(2004)根据 Edward、M. Miller对 Sharpe 的资产资本定价模型(CAPM) 所作的修正,对我国股市1995到2000年的股票的总风险水平、系统性风险水平和预期收益率进行了测算,发现中国证券市场系统性风险占总风险比例较大的特征并没有从根本上发生改变,但是投资者对股票市场的预期收益率在降低,即我国的投资者不断地趋于理性。近年来一些国内学者也进行了具体量化交易策略的研究。张戈等(2011)提出了利用 Copula 函数的程序化交易策略,并用中国期货市场的白糖和棉花期货合约进行了实证,发现交易策略具有较高的收益并能够较好的完成风险控制,策略具有较强的稳定性和实操性。周星月(2014)对量化交易研究成果以及布林线理论进行梳理,用数学方法证明布林线理论对于预测未来的合理性,并基于我国股指期货市场的真实数据,利用布林线理论设计了量化交易模型。朱臻(2014)以创业板指数为研究对象,结合多年来指数基金的实盘操作经验,提出“多品种、多周期、多模型、多参数”的全方位模型整合思路,通过构建专门的交易模组来指导交易,结果表明:在数据统计分析和实盘操作中,指数量化交易系统均取得了优良的业绩。总结国内外学者的研究成果,从期货套利来看,国内外学者对于期货套利研究集中在期现套利和跨期套利上,对于期货跨品种套利研究较少。少数跨品种套利的研究也集中在商品期货上,主流方法仍是统计套利的方法,对于金融期货的跨品种套利研究很少。从量化投资来看,国内外学者的研究重点集中在多因子模型因子的寻找和有效性检验以及技术指标在期货运用上,对于量化套利研究不多。本文利用行业因子,构建股指期货跨品种套利量化模型具有一定的创新性。1.3论文思路与主要内容本文从中国金融期货交易所上市的三种股指期货品种出发,分析它们的价值、规模和行业分布情况,说明它们风格存在显著差异,因此走势也必然存在差异。而后对分析了上证50指数和中证500指数的日收益率价差分布,然后研究了股指期货对应现货指数的走势相关性和单个行业因子与当日和次日的上证50指数和中证500指数的相对强弱关系的相关性,为后文的股指期货跨品种套利模型做了基础性的研究。此后在前文的基础上,通过logistic回归模型,建立股指期货跨品种套利量化模型,并对模型结果进行了分析,并与经典跨品种套利策略进行了比较,具体章节安排如下:第一章绪论,简单介绍了基于行业因子的股指期货跨品种套利量化模型的研究背景,从期货套利和量化投资两个角度,分析了国内外学者的研究成果,从中汲取经验。 第二章套利交易,概述套利交易的定义和特点,根据套利交易的分类,详细介绍了期现套利、跨期套利、跨市场套利和跨品种套利的概念和基本方法,着重介绍了市场上主流的跨品种套利策略:基于均值回复的套利策略和基于趋势的套利策略,为后文的股指期货跨品种套利模型做了理论铺垫。第三章股指期货风格分析,由于股指期货的风格主要由现货指数决定,所以这里风格分析在它们对应的现货指数上展开。首先介绍了股票市场价值和规模评价的基本指标,并通过这些指标分析了沪深300指数、上证50指数和中证500指数的特点。而后本文选择了申银一级行业分类作为本文的行业分类标准,利用申万一级行业分类标准分析了沪深