将偏股型公募基金仓位细分至行业层面的方法探索.pdf
《将偏股型公募基金仓位细分至行业层面的方法探索.pdf》由会员分享,可在线阅读,更多相关《将偏股型公募基金仓位细分至行业层面的方法探索.pdf(15页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 对于偏股型基金仓位测算模型的改进对于偏股型基金仓位测算模型的改进 将偏股型公募基金仓位细分至行业层面的方法探索 好买基金研究中心:孙志远好买基金研究中心:孙志远 一、一、研究目的研究目的 在去年 3 月的一篇研究报告1二、二、现有模型原理简介现有模型原理简介 中,我们对市场上主流的仓位测算模型进行了对比,并在相关机构研究基础上开发了好买公募基金仓位测算模型。在近一年时间内,模型较好的跟踪了公募偏股型基金持股水平,使研究员和投资者及时的了解机构投资者的操作。但在模型运作过程中也逐渐暴露出一些问题,譬如跟踪广度不够、仓位估计值不稳定等等。这些问题影响了模型结论的衍生研究,本文的研究目的即在于优化
2、现有模型,规避或减轻所存在的各种问题,使其更加准确的测度基金仓位的真实变动,并提高其对衍生研究的支持力度。好买当前所采用的仓位估算模型主要基于优化后的一元回归分析,以下是主要的运作原理:(一)根据大、中、小盘指数构造复合指数 以中证 100、中证 200 和中证 500 指数作为大、中、小盘股票收益的代理变量,将个基收益率序列对同期 3 个指数收益率序列进行拟合,在 3 个指数中寻找一个最优权重,使根据复合后的综合指数与个基收益的相关性最大。该最优权重即作为基金股票仓位在大、中、小盘股之间的分配比例。(二)建立总股票仓位估计的一元回归模型 将个基收益率序列作为应变量,所构造的复合指数作为自变量
3、,对每只基金建立一元回归模型,使用 OLS 估计截距项、回归系数和回归残差。回归系数作为初步估计的股票仓位,截距项解释为其他投资品种的收益和可持续的择股收益的加总,残差项为不可持续收益。(三)仓位值的规范性调整 收益率数据是一个随机变量,初步估计的仓位数据可能会因为样本的随机性而暂时偏离该基金在基金合同中所约定的股票投资范围,所以需要对初步估计值进行规范性调整,并以调整后的仓位值作为该基金的股票投资比例的最终估计值。三、三、现有模型所存在的问题现有模型所存在的问题 尽管该模型的原理广为各研究机构所用,但在实际运行中我们还是发现其存在一些问题,具体如下:1 偏股型基金仓位测算方法初试,2010
4、年 3 月 26 日。好买基金研究中心好买基金研究中心 专专 题题 2011 年 03 月 23 日 2 Confidential and Proprietary (一)复合指数权重不稳定 在多元回归模型中,如果自变量之间相关程度过高,将引发回归模型的多重共线性问题。虽然此时回归系数估计值仍一致无偏有效,但如果将自变量时间序列按固定窗口进行平移,将使得前后两期回归系数出现大幅波动。构造复合指数的方法虽然能在在第二步中避免使用多元回归模型,从而在该步骤中无需考虑多重共线性问题,但值得注意的是,第一步构造复合指数时仍面临进行多个变量的高度相关性,这也会引发复合指数中各子类指数分配比例在移动窗口下的
5、不稳定。以国泰金赢增长在 2011 年 2 月 22 日至 3 月 22 日和 2 月 23 日至 3 月 23 日两个时间窗口为例,原模型将根据大、中、小盘 3 个指数来测度最优权重。由于两个计算窗口仅相差一天,在未发生极端事件的前提下仓位变动幅度理应不大,但第一步测算结果显示,该基金大中小盘股票配比发生了巨大变化:中盘股比例从前一窗口的 0%直接上升至后一窗口的 25.36%,而大盘股比例则从 71.97%下降为 51.52%。原模型下大中小盘基金测算结果 数据来源:好买基金研究中心 此外,由于模型采用 15 个交易日的时间窗口,在第二步一元回归模型中,自由度仅为 13,不满足自由度大于1
6、5 的回归自由度经验准则,这也将增大第二步中回归系数值的估计误差。(二)计算时间窗口无法覆盖全月 根据之前对原模型的检验结果,基于 2006 年 1 季度到 2009 年 3 季度的数据,采用 15 个交易日作为计算时间窗口所计算的估计值和真实值的误差平方和最小,因此现有模型以 15 个交易日进行持续运作。但考虑目前好买基金是按月向投资者提供仓位测算数据,而 15 个交易日并没有覆盖全月,存在无法覆盖的“盲点”。(三)无法进行行业配置分析 目前基金投资研究和绩效归因逐步趋向于精细化,从之前简单的“大类资产配置+个股选择”研究向“大类资产配置+行业配置+个股选择”转变,而公募基金目前仅按季公布行
7、业配置水平,数据频率过低,同时其披露信息按证监会的行业划分口径,与当前主流的申万行业、中证行业分类法存在一些差别,因此以行业配置为基础的仓位测算对衍生研究具有更强的指导意义。现有模型限于自由度、多重共线性等约束,无法支持以行业指数为基础的仓位测算,对衍生研究的支持力度不足。28.03%0.00%71.97%23.12%25.36%51.52%0.00%10.00%20.00%30.00%40.00%50.00%60.00%70.00%80.00%大盘股配置比例中盘股配置比例小盘股配置比例时间窗口1:2-22至3-22时间窗口2:2-23至3-23 3 Confidential and Prop
8、rietary 四、四、新方案简介新方案简介 为了对规避或减轻上述问题对估计结果的影响,本文对原测算方案进行了优化,主要改进点如下:(一)以 21 个交易日作为计算时间窗口 考虑到目前模型计算时间窗口过短所带来的回归自由度不足以及无法覆盖全月等问题,新方案将计算时间窗口扩展至 21 个交易日,由此计算出来的仓位数据代表从计算时间点向后约 1 个月内基金的平均股票仓位。(二)引入行业指数,抽取主成分 考虑到市场认同度以及研究的习惯性,新的模型选择 23 个申万 1 级行业作为仓位基础模拟指标。从数据上看,尽管申万 1 级行业分类相对较细,但其收益之间的相关性仍然较强。以下是使用 2010 年 1
9、2 月 17 日到 2011 年 1 月17 日的 21 个连续交易日收益序列计算的 Pearson 相关系数,结果显示仅有食品饮料与采掘和房地产两个行业的相关性未通过 5%的显著性检验。申万一级行业 Pearson 相关系数矩阵 相关 系数 农林 牧渔 采掘 化工 黑色 金属 有色 金属 建筑 建材 机械 设备 电子 元器件 交运 设备 信息 设备 家用 电器 食品 饮料 农林 牧渔 1.00 0.66 0.86 0.80 0.81 0.90 0.92 0.91 0.89 0.88 0.92 0.49 采掘 0.66 1.00 0.87 0.80 0.80 0.83 0.80 0.73 0.
10、73 0.69 0.66 0.38 化工 0.86 0.87 1.00 0.92 0.84 0.95 0.94 0.93 0.91 0.92 0.90 0.59 黑色 金属 0.80 0.80 0.92 1.00 0.78 0.87 0.82 0.83 0.89 0.85 0.81 0.45 有色 金属 0.81 0.80 0.84 0.78 1.00 0.89 0.86 0.87 0.75 0.84 0.83 0.51 建筑 建材 0.90 0.83 0.95 0.87 0.89 1.00 0.97 0.94 0.91 0.93 0.89 0.52 机械 设备 0.92 0.80 0.94
11、0.82 0.86 0.97 1.00 0.97 0.92 0.95 0.93 0.54 电子 元器件 0.91 0.73 0.93 0.83 0.87 0.94 0.97 1.00 0.89 0.97 0.95 0.63 交运 设备 0.89 0.73 0.91 0.89 0.75 0.91 0.92 0.89 1.00 0.88 0.86 0.54 信息 设备 0.88 0.69 0.92 0.85 0.84 0.93 0.95 0.97 0.88 1.00 0.95 0.63 家用 电器 0.92 0.66 0.90 0.81 0.83 0.89 0.93 0.95 0.86 0.95
12、1.00 0.60 食品 饮料 0.49 0.38 0.59 0.45 0.51 0.52 0.54 0.63 0.54 0.63 0.60 1.00 纺织 服装 0.83 0.80 0.95 0.88 0.84 0.93 0.94 0.94 0.94 0.92 0.88 0.63 轻工 制造 0.85 0.78 0.96 0.91 0.82 0.93 0.93 0.94 0.93 0.94 0.92 0.65 医药 生物 0.77 0.63 0.86 0.68 0.75 0.82 0.89 0.93 0.83 0.89 0.87 0.80 公用 事业 0.83 0.86 0.98 0.94
13、0.83 0.94 0.92 0.90 0.93 0.91 0.88 0.55 交通 运输 0.75 0.83 0.95 0.94 0.82 0.88 0.86 0.87 0.87 0.88 0.85 0.61 房地产 0.62 0.81 0.79 0.89 0.63 0.74 0.67 0.63 0.75 0.63 0.64 0.22 金融 服务 0.59 0.70 0.74 0.81 0.66 0.66 0.61 0.65 0.64 0.69 0.64 0.44 商业 贸易 0.90 0.71 0.93 0.85 0.85 0.91 0.94 0.96 0.91 0.95 0.96 0.6
14、1 餐饮 0.85 0.66 0.90 0.88 0.80 0.88 0.89 0.95 0.89 0.95 0.90 0.72 4 Confidential and Proprietary 旅游 信息 服务 0.92 0.76 0.95 0.88 0.83 0.92 0.95 0.96 0.93 0.95 0.96 0.62 综合 0.89 0.79 0.95 0.93 0.82 0.93 0.94 0.93 0.94 0.94 0.90 0.59 续前表 纺织 服装 轻工 制造 医药 生物 公用 事业 交通 运输 房地产 金融 服务 商业 贸易 餐饮 旅游 信息 服务 综合 农林 牧渔 0
15、.83 0.85 0.77 0.83 0.75 0.62 0.59 0.90 0.85 0.92 0.89 采掘 0.80 0.78 0.63 0.86 0.83 0.81 0.70 0.71 0.66 0.76 0.79 化工 0.95 0.96 0.86 0.98 0.95 0.79 0.74 0.93 0.90 0.95 0.95 黑色 金属 0.88 0.91 0.68 0.94 0.94 0.89 0.81 0.85 0.88 0.88 0.93 有色 金属 0.84 0.82 0.75 0.83 0.82 0.63 0.66 0.85 0.80 0.83 0.82 建筑 建材 0.
16、93 0.93 0.82 0.94 0.88 0.74 0.66 0.91 0.88 0.92 0.93 机械 设备 0.94 0.93 0.89 0.92 0.86 0.67 0.61 0.94 0.89 0.95 0.94 电子 元器件 0.94 0.94 0.93 0.90 0.87 0.63 0.65 0.96 0.95 0.96 0.93 交运 设备 0.94 0.93 0.83 0.93 0.87 0.75 0.64 0.91 0.89 0.93 0.94 信息 设备 0.92 0.94 0.89 0.91 0.88 0.63 0.69 0.95 0.95 0.95 0.94 家用
17、 电器 0.88 0.92 0.87 0.88 0.85 0.64 0.64 0.96 0.90 0.96 0.90 食品 饮料 0.63 0.65 0.80 0.55 0.61 0.22 0.44 0.61 0.72 0.62 0.59 纺织 服装 1.00 0.97 0.91 0.96 0.93 0.74 0.70 0.95 0.92 0.94 0.95 轻工 制造 0.97 1.00 0.90 0.96 0.96 0.75 0.70 0.94 0.93 0.97 0.95 医药 生物 0.91 0.90 1.00 0.82 0.81 0.45 0.51 0.89 0.89 0.89 0.
18、83 公用 事业 0.96 0.96 0.82 1.00 0.95 0.85 0.77 0.93 0.89 0.93 0.96 交通 运输 0.93 0.96 0.81 0.95 1.00 0.81 0.82 0.89 0.90 0.91 0.92 房地产 0.74 0.75 0.45 0.85 0.81 1.00 0.79 0.70 0.64 0.72 0.78 金融 服务 0.70 0.70 0.51 0.77 0.82 0.79 1.00 0.71 0.70 0.69 0.77 商业 贸易 0.95 0.94 0.89 0.93 0.89 0.70 0.71 1.00 0.92 0.96
19、 0.94 餐饮 旅游 0.92 0.93 0.89 0.89 0.90 0.64 0.70 0.92 1.00 0.92 0.93 信息 服务 0.94 0.97 0.89 0.93 0.91 0.72 0.69 0.96 0.92 1.00 0.96 综合 0.95 0.95 0.83 0.96 0.92 0.78 0.77 0.94 0.93 0.96 1.00 数据来源:好买基金研究中心 因此,如果直接使用行业指数进行回归,即使使用较长的收益率序列,回归系数仍然会受到多重共线性的扰动。鉴于此,我们引入主成分分析法,该方法通过对高度相关变量间协方差矩阵的转换,从较多的变量中抽取少数几个不
20、相关的主成分,使其尽可能的反映出原有变量族所涵盖的信息,降低数据空间的维度。引入该方法后,可将原有23 个行业指数简化为少数几个相关程度极低的主因子,而这些因子可解释原有行业指数族的绝大部分信息,在保存大量信息的前提下极大的降低了自变量间的相关性。5 Confidential and Proprietary 仍以 2010 年 12 月 17 日到 2011 年 1 月 17 日的 21 个连续交易日申万一级行业指数收益为例,在抽取 3 个主成分时,其信息抽取量占原有信息总量的 93.11%;除了有色金属行业略低外,3 个主成分从各行业中抽取的信息量均超过 80%;3 个主成分之间相关性也极低
21、,多重共线性得以有效改善。主成分特征值及累计方差 数据来源:好买基金研究中心 Total Variance ExplainedTotal Variance Explained19.38084.26284.26219.38084.26284.2621.3295.77990.0411.3295.77990.041.7063.06893.109.7063.06893.109.4321.87694.985.3461.50596.490.169.73597.225.152.65997.884.125.54598.429.112.48898.917.075.32699.242.055.23899.480.
22、037.16399.643.034.14999.792.024.10399.894.015.06599.959.005.02199.980.003.01399.993.001.00499.997.001.003100.000.000.000100.0005.61E-0162.44E-015100.0002.61E-0161.14E-015100.0002.82E-0171.22E-016100.000Component1234567891011121314151617181920212223Total%of VarianceCumulative%Total%of VarianceCumulat
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 将偏股型公募 基金 仓位 细分 行业 层面 方法 探索
限制150内