【广发金工】那些年一起追过的财经小编选股策略——互联网大数据挖掘系列专题之(四).pdf
-
资源ID:91823481
资源大小:2.45MB
全文页数:26页
- 资源格式: PDF
下载积分:9.9金币
快捷下载

会员登录下载
微信登录下载
三方登录下载:
微信扫一扫登录
友情提示
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
|
【广发金工】那些年一起追过的财经小编选股策略——互联网大数据挖掘系列专题之(四).pdf
识别风险,发现价值 请务必阅读末页的免责声明 1 1/2626 金融工程|专题报告 2014 年 8 月 21 日 证券研究报告 阿点 那些年那些年,一起追过的财经小编策略一起追过的财经小编策略 基于基于互联网财经频道互联网财经频道文本文本挖掘挖掘选股选股 报告摘要报告摘要:互联网大数据与互联网金融时代互联网大数据与互联网金融时代 最近几年来,随着互联网大数据以及互联网金融时代的发展,人们获取信息的渠道越来越丰富多样。伴随着行为金融的发展,人们越来越关注非结构化的金融“数据”给投资决策带来的影响。在非结构化的信息中,热门财经网站的财经信息是其中的一部分。热门财经网站发布的财经新闻往往能够对个股的股价产生影响,然而由于财经新闻往往为文本类信息,导致我们很少能够对此类财经信息所带来的投资机会进行量化,并运用于实际的投资实践中。本专题报告的目的为通过对热门财经网站的财经荐股栏目的文本信息进行挖掘,将文本类信息转换为能够进行实际操作的类“数据”信息,通过该信息建立量化策略,试图探讨文本类信息带来的投资价值。财经小编事件选股策略构建财经小编事件选股策略构建 基于文本挖掘技术,我们将大量的热门财经网站相关的荐股栏目的信息转换为类“数据”信息,然后基于这些类“数据”信息构建策略,我们主要考虑一下几个方面的信息:单个财经频道选股策略:单个财经频道选股策略:基于单个财经频道荐股栏目的荐股信息,考虑在全样本内,单个财经网站不区分行业、不考虑个股当日表现下的荐股能力;在创业板股票的荐股能力;在沪深 300 指数成分股中的荐股能力以及在申万一级行业指数的荐股能力。多财经频道智能选股策略多财经频道智能选股策略:基于单个财经频道的前期一段时间内的单个策略表现,利用前期表现优异网站的荐股信息构成超配组合,考虑多个财经网站下的超配组合的策略表现。与单策略类似,考虑全样本内,不区分行业、个股当日表现的动态多策略;区分申万一级行业的动态策略。实证结果实证结果 历史回测结果显示,在单个财经频道事件选股策略下在单个财经频道事件选股策略下,策略存在明显的短期效应,以持有期 2 个交易日最为明显。在不区分行业以及当日表现等因素的影响下,持有期为 2 个交易日的策略在回测期内的表现最为优异,其中新浪财经的荐股表现在历史回测期内表现最好,年化超额收益率为 64.35%;在创业板的选股能力上,新浪财经以及华讯财经网上相对上证指数超额收益明显;在多财经频道选股策略下在多财经频道选股策略下,策略同样存在明显的短期效应,其中在不区分行业的情况下,考虑各个网站前 5 个交易日表现,选择前 50%网站推荐个股形成超配组合策略表现优异,年化超额收益率为 43.66%。而在考虑区分申万一级行业的情况下,考虑各个网站前 30 个交易日表现,选择前 50%网站推荐个股形成超配组合策略表现优异,年化超额收益率为 21.82%。图图 1 动态多策略表现动态多策略表现 表表 1 策略分年度表现策略分年度表现 指标 最大 回撤 最大月内回撤 超额累积收益率 2009-19.77%-19.77%78.36%2010-17.01%-17.01%27.77%2011-24.04%-14.76%-9.86%2012-12.53%-10.74%27.87%2013-12.32%-12.32%42.96%2014至今-10.60%-7.71%11.55%表表 2 策略整体表现策略整体表现 胜率 超额累积收益率 年化超额收益率 46.57%397.37%15.38%分析师:分析师:史庆盛史庆盛 S0260513070004 020-87555888-8618 相关研究:相关研究:捕捉羊群效应下的行业轮动机会行为金融投资策略专题之(一)2014-04-14 基于网络新闻热度的择时策 略互联网大数据挖掘系 列专题之(一)2014-06-25 公告披露背后隐藏的投资 机会互联网大数据挖掘系 列专题之(二)2014-06-26 倾听股吧之声-互联网大数据挖掘系列专题之(三)2014-06-27 识别风险,发现价值 请务必阅读末页的免责声明 2 2/2626 金融工程|专题报告 目录索引目录索引 一、前言.5 二、互联网财经荐股体系介绍.5 2.1 互联网财经频道选股策略框架.5 2.2 数据抓取平台组件框架.6 2.3 数据来源.7 2.4 数据处理过程.7 三、财经小编量化策略构建.10 3.1 热门财经网站荐股信息统计-全样本统计.10 3.2 热门财经网站荐股信息统计-创业板、沪深 300 指数成分统计.11 3.3 热门财经网站荐股信息统计-申万一级行业指数成分统计.12 四、策略构建及实证.13 4.1 单个财经频道选股策略.13 4.2 单个财经频道选股策略实证结果.13 4.3 多财经频道智能选股策略.19 4.4 多财经频道智能选股策略实证结果.20 五、总结.23 5.1 总结.23 5.2 工具推荐.24 风险提示.25 识别风险,发现价值 请务必阅读末页的免责声明 3 3/2626 金融工程|专题报告 图表图表目录目录 图 1 动态多策略表现.1 图 2 互联网财经频道选股策略框架.5 图 3 数据抓取平台组件框架.6 图 4 爬取热门财经网站荐股栏目实例.7 图 5 热门财经网站荐股栏目实例.8 图 6 热门财经网站荐股栏目对应网页源代码.8 图 7 荐股信息存储一览.8 图 8 热门财经网站对应爬取字段.9 图 9 热门财经网站对应爬取字段源代码.9 图 10 个股推荐信息提取一览.9 图 11 各大财经网站每日荐股均值一览.10 图 12 各大热门财经网站每日推荐创业板与沪深 300 指数成分一览.11 图 13 凤凰网申万一级行业荐股均值一览.12 图 14 新浪网申万一级行业荐股均值一览.12 图 15 搜狐证券_个股风云申万一级行业荐股均值一览.12 图 16 同花顺申万一级行业荐股均值一览.12 图 17 南方财富网申万一级行业荐股均值一览.12 图 18 中国证券网申万一级行业荐股均值一览.12 图 19 搜狐证券_个股风云策略表现一览.14 图 20 华讯财经_机构荐股栏目策略表现一览.14 图 21 南方财富网_个股推荐策略表现一览.15 图 22 凤凰网_黑马集中营策略表现一览.16 图 23 新浪网荐股栏目策略表现一览.16 图 24 同花顺_个股投资荐股策略表现一览.17 图 25 中国证券网_热点研究个股荐股策略表现一览.17 图 26 凤凰网_黑马集中营荐股栏目申万一级行业策略表现(持有期 2 个交易日).18 图 27 新浪网_个股研究荐股栏目申万一级行业策略表现(持有期 2 个交易日).19 图 28 考虑各个网站前 5 个交易日表现选择前 50%网站推荐个股形成超配组合策略.20 图 29 考虑各个网站前 30 个交易日表现,选择前 50%网站推荐个股形成超配组合策略.21 图 30 考虑对应申万一级行业策略前5个交易日表现选择前50%网站策略持有期2个交易日表现.22 图 31 考虑对应申万一级行业策略前 30 个交易日表现选择前 50%网站持有期 2 个交易日表现.23 图 32 广发证券金融工程:财经频道量化选股系统.24 表 1 策略分年度表现.1 表 2 策略整体表现.1 识别风险,发现价值 请务必阅读末页的免责声明 4 4/2626 金融工程|专题报告 表 3 各大热门财经网站每日荐股信息统计.10 表 4 各大热门财经网站推荐沪深 300 指数成分股以及创业板股票信息一览.11 表 5 各大热门财经网站荐股信息不同持有期下表现一览.13 表 6 搜狐证券_个股风云策略指标一览.14 表 7 华讯财经_机构荐股策略表现指标一览.14 表 8 南方财富网_个股推荐策略表现指标一览.15 表 9 考虑各大热门财经网站推荐沪深300指数成分股策略指标一览(持有期 2个交易日).15 表 10考虑各大热门财经网站推荐沪深300指数成分股策略指标一览(持有期5个交易日).16 表 11 考虑各大热门财经网站推荐创业板股票策略指标一览(持有期 2 个交易日)16 表 12 考虑各大热门财经网站推荐创业板股票策略指标一览(持有期 5 个交易日).17 表 13 各大财经网站申万一级行业荐股优异行业一览.18 表 14 凤凰网_黑马集中营申万一级行业部分策略表现指标.18 表 15 新浪网_个股研究申万一级行业部分策略表现指标.19 表 16 考虑单个网站前 5 个交易日表现下的动态策略表现一览.20 表 17 考虑各网站前 5 个交易日表现,选择前 50%网站形成超配组合,持有期 2个交易日策略表现.20 表 18 考虑单个网站前 30 个交易日表现下的动态策略表现一览.21 表 19 考虑各网站前 30 个交易日表现,选择前 50%网站形成超配组合持有期 2 个交易日策略表现.21 表 20 考虑对应申万一级行业策略前5个交易日表现选择前50%网站策略持有期2个交易日表现.22 表 21 考虑对应申万一级行业策略前5个交易日表现选择前50%网站策略持有期2个交易日表现.22 表 22 考虑对应申万一级行业策略前 30 个交易日表现选择前 50%网站持有期 2 个交易日策略表现.23 表 23 考虑对应申万一级行业策略前 30 个交易日表现选择前 50%网站持有期 2 个交易日策略表现.23 识别风险,发现价值 请务必阅读末页的免责声明 5 5/2626 金融工程|专题报告 一、前言一、前言 当前,是互联网信息时代。互联网在过去10年里,经历了快速发展阶段,信息的爆炸性增长也使得人们获取的信息量迅速地增加。人们获取信息的途径也越来越丰富。而在互联网大数据时代下,信息的提供者与使用者之间的界限已经越来越模糊,金融信息的来源渠道也越来越丰富多样。投资者有更多的渠道来获取相关的金融信息,过去上百年的金融研究,往往局限于对以数字形式存在的数据的研究,而忽略了对非结构化的金融“数据”的研究,在当前互联网时代下,分析师的研究报告、股吧论坛帖子的信息、新闻媒体的新闻以及微博和维信等非结构化文本信息往往能够反应当前市场上投资者对股市的投资情绪,而这些信息往往又对投资者的投资决策起到潜移默化的作用。据相关报道,2011年8月24日,巨人网络董事长兼首席执行官史玉柱通过微博透露中国人寿“虎视眈眈”欲控股民生银行,随后民生银行股价在两个交易日大涨,史玉柱旗下公司所持该行股份浮盈2.56亿元,他的这条微博也因此被称为“史上最贵微博”;2012年12月6日,“SOHO中国”在某热门财经网站上发布中标消息称:“在刚刚结束的光华路SOHO2项目地上钢结构定标会上,浙江杭萧钢构股份有限公司成功中标!”,随后,SOHO中国董事长潘石屹转发并评论。下午开盘后,杭萧钢构股价应声而上,最高上涨逾6%。可见,媒体的传播已经对个股的涨跌产生了重要的影响。之前我们分别通过股吧帖子论坛、上市公司公告内容、个股新闻热度等三个角度对互联网的文本信息对股市的影响进行了统计分析以及实证,得到了较好的就结果。本专题报告从另一个角度考虑互联网财经相关的文本信息对股市的影响进行研究,我们考虑热门财经网站上推荐股票栏目上的荐股信息对股市的影响,利用大量的热门财经网站上海量的荐股文本信息,从中寻找对个股、行业存在显著影响的信息,并基于此构建量化策略。二、二、互联网财经荐股互联网财经荐股体系介绍体系介绍 2.1 互联网互联网财经频道选股策略框架财经频道选股策略框架 图图 2 互联网财经频道选股策略框架互联网财经频道选股策略框架 数据来源:广发证券发展研究中心 互联网财经频道新浪财经、搜狐网个股推荐、同花顺个股推荐、腾讯财经、华讯财经、凤凰网、南方财富网、中国证券网、搜狐证券金罗盘Matlab,Vba爬取文本存储(字段:推荐日期、标题、文章内容、网站区别标志、推荐个股先后顺序)txt文本形式存储或数据库存储动态考虑多个网站选股策略动态考虑多个网站各行业选股策略文本预处理文本信息提取个股推荐时间顺序网站区分标签个股推荐计数考虑各网站综合选股能力考虑各网站各行业选股能力考虑各网站沪深300、创业板股票选股能力单个网站策略多个网站动态策略 识别风险,发现价值 请务必阅读末页的免责声明 6 6/2626 金融工程|专题报告 财经频道选股策略整个框架分为三大部分:数据获取数据获取、数据处理数据处理以及策略构建策略构建。数据获取阶段数据获取阶段首先收集热门网站的个股推荐栏目,然后对各个网站的个股推荐栏目网页源代码进行解析,分析出需要提取的内容所对应的网页源代码格式,对于返回内容直接为网页所见内容的,直接采用字符串匹配或者HTMLDOM的结构进行解析,推荐使用HTMLDOM结构提取代码,这样爬取下来的内容,“噪音”几乎没有。有些网站信息是经过浏览器再解析后呈现出来的,此时直接对返回的网页源代码进行解析后,得不到需要提取的内容,此时可以考虑是通过JS解析的方式重新获取特定的内容,将需要爬取的特定信息爬取下来后以数据库或者文本文件的形式按一定规律存储于本地磁盘中。数据处理分为预处理以及后期处理两块数据处理分为预处理以及后期处理两块,预处理这一块主要是对由于访问错误或者链接已经失效内容的清洗,后期处理主要是针对预处理后的文本信息根据特定的算法提取每个推荐的个股信息(这里的难点是尽量提高个股信息提取的准确度),可以考虑先对各个网站的文本结构进行分析,找出噪音的规律以及有用信息的规律。策略构建策略构建是本专题研究的重点,主要考虑各个网站的荐股能力,分为整体荐股能力、相对申万一级行业荐股能力、相对沪深300、创业板荐股能力;同时考虑多个网站在单策略结果下的动态选股策略,分为考虑整体的选股能力以及区分行业的选股能力。2.2 数据抓取平台组件框架数据抓取平台组件框架 图图 3 数据抓取平台组件框架数据抓取平台组件框架 数据来源:广发证券发展研究中心 上图刻画了在大规模的互联网数据爬取过程中的整体框架,对于爬取大量财经网站的荐股文本信息,可以分为以下几个主要步骤:1)首先对需要批量爬取信息的网页结构进行研究,主要是研究需要提取的特定信息的网页格式进行研究,这步骤可以借助在IE浏览器下打开需要提取信息的网页,然后调用出开发人员工具,找到需要批量提取的特定信息的网页代码规则,监控系统监控系统监控异常、调整反监控规则获取反监控规则、异常规则、设置代理IP反监控反监控管理管理反监控规则异常规则恢复策略可视化配置智能化配置网页规则网页规则识别识别获取网页抓取规则抓取任务调抓取任务调度分发器度分发器常规抓取临时抓取带优先级抓取消息通用可扩展集群抓取线程池连接池批量存储批量存储 识别风险,发现价值 请务必阅读末页的免责声明 7 7/2626 金融工程|专题报告 或者利用Firefox浏览器下的XPATH工具以及View Source Chart工具以及Firebug、以及Httpfox工具;2)找到各个财经网站上需要爬取的财经信息栏目url的规律,然后直接遍历所有需要爬取的财经网站的荐股栏目信息,获取到各个网站历史荐股信息;3)对于大规模的互联网信息抓取而言,单线程的数据获取是一项非常局限的事情,因此多线程、分布式的信息抓取平台是必须搭建的。因此数据的抓取平台的搭建是一项基础性的工作。由于需要爬取的财经小编的网站数量多,并且需要爬取所有的个股推荐信息,因此爬取的效率是非常关键的一步,多线程、分布式爬取是解决效率问题的好办法。对特定网站需要爬取内容的,需要注意的是网站代码格式不一致问题,因此需要动态地调整爬取程序(正常爬取代码格式+特殊的格式爬取),爬取完成后信息的规范化存储也是一个比较重要的问题,这个可以方便后面的数据清洗、处理。推荐采用数据库存储格式或者本地磁盘的文本形式存储。同时出于对网站安全的考虑,需要实时监控程序的运行,防止网络访问限制问题,设置适当的断线重连机制,IP切换机制等;4)对于抓取到的信息统一批量存储到指定的数据库或者本地磁盘中,构成后续分析的底层的数据库。2.3 数据来源数据来源 经过手工搜索热门财经网站,我们确定了10个热门财经网站的荐股栏目,分别为:中国证券网中国证券网_热点研究个股推荐热点研究个股推荐、南方财富网南方财富网_个股推荐个股推荐、同花顺同花顺_个股投资个股投资、搜狐网站搜狐网站_金罗盘金罗盘、新浪财经新浪财经_个股研究个股研究、华讯财经华讯财经_机构荐股机构荐股、华讯财经华讯财经_个股点评个股点评、华讯财经华讯财经_内参内参、搜狐证券搜狐证券_个股风云个股风云、凤凰网凤凰网_黑马集中营黑马集中营。这样我们就选定了爬取的财经网站池。图图 4 爬取热门财经网站荐股栏目实例爬取热门财经网站荐股栏目实例 数据来源:广发证券发展研究中心 2.4 数据处理过程数据处理过程 选定需要爬取的热门财经网站池后,接下来的过程就是爬取网站池中对应的荐股栏目的历史荐股信息,首先根据需要爬取内容对应到网站的源代码中,找到需 识别风险,发现价值 请务必阅读末页的免责声明 8 8/2626 金融工程|专题报告 要爬取内容的网页源代码代码结构,这里需要注意的问题是,对应的链接失效以及网站对应需要爬取位置格式前后不一的问题,这时候就需要在程序中写入容错机制,判断链接是否失效以及格式前后是否一致的问题。图图 5 热门财经网站荐股栏目实例热门财经网站荐股栏目实例 图图 6 热门财经网站荐股栏目对应网页源代码热门财经网站荐股栏目对应网页源代码 数据来源:广发证券发展研究中心 数据来源:广发证券发展研究中心 图图 7 荐股信息存储一览荐股信息存储一览 数据来源:广发证券发展研究中心 数据爬取完后接下来的一步就是将文本类型的数据处理成有用的信息,因为本专题报告挖掘的是每个热门财经网站荐股栏目上推荐的个股信息,因此需要将爬取下来的文本信息中关于推荐的个股提取出来,从大量的文本信息中提取推荐个股信息的难点是如何获取到特定的个股推荐信息以及最大限度地降低噪音信息对提取个股推荐信息的影响,本专题采用的方法是通过存储各大财经网站的“噪音”信息库,形成“噪音”信息库。如果在提取各大财经网站上包含的个股推荐信息时,匹配到了某只个股的信息,但是同时也匹配到了该个股在“噪音信息”中,则该匹配到的个股推荐信息将不被提取。这里的关键是建立“噪音”信息库,我们人工先对 识别风险,发现价值 请务必阅读末页的免责声明 9 9/2626 金融工程|专题报告 爬取后的干扰信息进行大量提取,建立“噪音”信息库。图图 8 热门财经网站对应爬取字段热门财经网站对应爬取字段 图图 9 热门财经网站对应爬取字段源代码热门财经网站对应爬取字段源代码 数据来源:广发证券发展研究中心 数据来源:广发证券发展研究中心 图图 10 个股推荐信息提取一览个股推荐信息提取一览 数据来源:广发证券发展研究中心 对爬取下来的文本信息进行提取建立各大热门财经网站每日荐股的个股信息后,本专题从两个方面考虑各大热门网站每日的荐股信息,第一为考虑单个热门财经网站每日的荐股信息下的量化策略,第二为考虑各大热门财经网站每日的荐股信息下的动态量化策略。干扰信息干扰信息干扰信息 识别风险,发现价值 请务必阅读末页的免责声明 1010/2626 金融工程|专题报告 三三、财经小编量化策略构建财经小编量化策略构建 在上一节的内容中,我们已经详细地介绍了本专题量化策略构建的整体的框架以及在构建财经小编量化策略过程中需要注意的一些问题点。接下来我们将重点介绍本专题中所构建的量化策略。首先基于本专题所跟踪的热门财经网站的荐股栏目历史荐股信息,考虑单个财经网站上荐股栏目的选股能力,主要考虑四个方向的策略:考虑全样本内个股的推荐能力、考虑全样本内沪深300个股的推荐能力、考虑全样本内创业板个股的推荐能力以及考虑全样本内申万一级行业指数成分股的推荐能力;其次基于单个财经网站上荐股栏目的选股能力的量化策略,考虑网站之间的荐股能力,择优选择前期表现较好的热门财经网站,然后基于这些热门网站的荐股信息构建量化策略。我们首先看一下各大热门财经网站每日荐股信息的统计指标。3.1 热门财经网站荐股信息统计热门财经网站荐股信息统计-全样本统计全样本统计 我们首先从简单的统计指标上,看一下各大热门财经网站上每日荐股数量的相关信息。从全样本不区分行业上看从全样本不区分行业上看,从图10中可以看到,各大热门财经网站上荐股栏目每日推荐的个股数量均匀,其中搜狐网的每日荐股数目最少,平均下来只有每日5只个股,而华讯财经的机构荐股栏目,平均意义上讲,荐股数量最多344只。从标准差角度看,华讯财经的机构荐股栏目每日荐股的数量的波动也是最大的,而搜狐网的金罗盘荐股栏目中每日荐股的数量的波动是最小的。各大热门财经网站荐股数量存在较大差异,也有可能是因为各大热门财经网站样本的时间长度不一造成的。图图 11 各大财经网站每日荐股均值一览各大财经网站每日荐股均值一览 数据来源:广发证券发展研究中心 表表 3 各大热门财经网站每日荐股信息统计各大热门财经网站每日荐股信息统计 网站网站 均值均值 最大值最大值 最小值最小值 标准差标准差 凤凰网凤凰网_ _黑马集中营黑马集中营 73 427 0 58 搜狐证券搜狐证券_ _个股风云个股风云 125 913 0 101 华讯财经华讯财经_ _内参内参 98 385 0 68 华讯财经华讯财经_ _个股点评个股点评 32 199 0 28 华讯财经华讯财经_ _机构荐股机构荐股 344 1899 0 184 新浪财经新浪财经_ _个股研究个股研究 61 564 0 55 050100150200250300350400凤凰网_黑马集中营搜狐证券_个股风云华讯财经_内参华讯财经_个股点评华讯财经_机构荐股新浪财经_个股研究搜狐网_金罗盘同花顺_个股投资南方财富网_个股推荐中国证券网_热点研究个股 识别风险,发现价值 请务必阅读末页的免责声明 1111/2626 金融工程|专题报告 搜狐网搜狐网_ _金罗盘金罗盘 5 64 0 6 同花顺同花顺_ _个股投资个股投资 84 288 0 61 南方财富网南方财富网_ _个股推荐个股推荐 108 276 7 49 中国证券网中国证券网_ _热点研究个股热点研究个股 136 226 28 38 数据来源:广发证券发展研究中心 3.2 热门财经网站荐股信息统计热门财经网站荐股信息统计-创业板、沪深创业板、沪深 300 指数成分统计指数成分统计 从区分各大网站每日推荐的板块角度上看,就创业板而言,各大财经网站每日平均推荐的创业板股票占总推荐股票比例在15%左右,其中,南方财富网的个股推荐栏目每日平均推荐的创业板股票占其每日平均推荐股票的比例最高,为20%.而中国证券网的热点研究个股栏目每日平均推荐的创业板股票占其每日平均推荐股票的比例最低,为8%;从沪深300指数成分推荐而言,各大热门财经网站每日推荐的沪深300指数成分股数量占其推荐股票数量均大于20%,其中同花顺的个股投资栏目推荐比例最少,为21%,而搜狐网的金罗盘栏目推荐比例最多,为43%。图图 12 各大热门财经网站每日推荐创业板与沪深各大热门财经网站每日推荐创业板与沪深300指数成分一览指数成分一览 数据来源:广发证券发展研究中心 表表 4 各大热门财经网站推荐沪深各大热门财经网站推荐沪深300指数成分股以及创业板股票信息一览指数成分股以及创业板股票信息一览 网站网站(创业板(创业板)均值均值 占推占推荐股票占比荐股票占比 (沪深(沪深 300300 指数指数成分)均值成分)均值 占推荐股票占比占推荐股票占比 凤凰网凤凰网_ _黑马集中营黑马集中营 10 14%21 28%搜狐证券搜狐证券_ _个股风云个股风云 24 19%33 26%华讯财经华讯财经_ _内参内参 13 13%34 35%华讯财经华讯财经_ _个股点评个股点评 4 12%10 32%华讯财经华讯财经_ _机构荐股机构荐股 47 14%95 28%新浪财经新浪财经_ _个股研究个股研究 8 13%18 30%搜狐网搜狐网_ _金罗盘金罗盘 1 15%2 43%同花顺同花顺_ _个股投资个股投资 15 18%18 21%南方财富网南方财富网_ _个股推荐个股推荐 21 20%31 28%中国证券网中国证券网_ _热点研究个股热点研究个股 10 8%41 30%数据来源:广发证券发展研究中心 0%5%10%15%20%25%30%35%40%45%凤凰网_黑马集中营搜狐证券_个股风云华讯财经_内参华讯财经_个股点评华讯财经_机构荐股新浪财经_个股研究搜狐网_金罗盘同花顺_个股投资南方财富网_个股推荐中国证券网_热点研究个股各网站日均创业板荐股比例各网站日均沪深300指数成分荐股比例 识别风险,发现价值 请务必阅读末页的免责声明 1212/2626 金融工程|专题报告 3.3 热门财经网站荐股信息统计热门财经网站荐股信息统计-申万一级行业指数成分统计申万一级行业指数成分统计 平均意义上讲,从各大热门财经网站每日推荐的申万一级行业指数成分数量上看,各大热门财经网站在 28 个申万一级行业指数成分中推荐的个股数量不均匀,各大热门财经网站之间在 28 个申万一级行业指数成分中推荐的个股数量也不均匀,每个网站侧重推荐不同的申万行业。图图 13 凤凰网申万一级行业荐股均值一览凤凰网申万一级行业荐股均值一览 图图 14 新浪网申万一级行业荐股均值一览新浪网申万一级行业荐股均值一览 数据来源:广发证券发展研究中心 数据来源:广发证券发展研究中心 图图 15 搜狐证券搜狐证券_个股风云申万一级行业荐股均值一览个股风云申万一级行业荐股均值一览 图图 16 同花顺申万一级行业荐股均值一览同花顺申万一级行业荐股均值一览 数据来源:广发证券发展研究中心 数据来源:广发证券发展研究中心 图图 17 南方财富网申万一级行业荐股均值一览南方财富网申万一级行业荐股均值一览 图图 18 中国证券网申万一级行业荐股均值一览中国证券网申万一级行业荐股均值一览 数据来源:广发证券发展研究中心 数据来源:广发证券发展研究中心 01234560123456012345678910012345678901234567891002468101214 识别风险,发现价值 请务必阅读末页的免责声明 1313/2626 金融工程|专题报告 四四、策略构建及实证策略构建及实证 4.1 单个财经频道选股策略单个财经频道选股策略 策略原理:策略原理:在各个热门财经网站历史回测期间内,考虑回测期间内,各大财经网站的每日的荐股信息。在每个交易日,考虑各大财经网站在该个交易日的荐股信息,对于在该个交易日所推荐的个股,在推荐后的第一个交易日以开盘价买进该个股,如果买入股票停牌,则该只个股不进行买入操作,持有一段时间,在持有期末以收盘价卖出该个股,如果个股在持有期末停牌则延迟卖出,直至可以卖出。交易费用:交易费用:千分之二,在卖出个股时计算。初始资金:初始资金:1。资金投资权重:资金投资权重:等权投资于个股。4.2 单个财经频道选股策略实证结果单个财经频道选股策略实证结果 首先在全样本内,不区分行业、不考虑个股前一日表现,考察各个热门财经网站的策略表现。表表 5 各大热门财经网站荐股信息不同持有期下表现一览各大热门财经网站荐股信息不同持有期下表现一览 年化超额收益率年化超额收益率 持有期持有期 2 2 个交个交易日易日 持有期持有期 5 5 个交易个交易日日 持有期持有期 1010 个交易个交易日日 持有期持有期 3030 个交易个交易日日 凤凰网凤凰网_ _黑马集中营黑马集中营 16%17%16%15%搜搜狐证券狐证券_ _个股风云个股风云 38.64%31.33%34.52%35.47%华讯财经华讯财经_ _内参内参 33.11%10.45%16.31%11.37%华讯财经华讯财经_ _个股点评个股点评 25.23%5.43%6.16%16.17%华讯财经华讯财经_ _机构荐股机构荐股 29.60%21.31%18.85%17.54%新浪财经新浪财经_ _个股研究个股研究 64.35%32.26%24.55%20.89%搜狐网搜狐网_ _金罗盘金罗盘 22.32%31.17%21.09%15.62%同花顺同花顺_ _个股投资个股投资 75.32%49.21%35.35%16.05%南方财富网南方财富网_ _个股推荐个股推荐 22.06%26.79%29.82%32.45%中国证券网中国证券网_ _热点研究个股热点研究个股 42.53%35.59%30.35%31.01%数据来源:广发证券发展研究中心 从表3中可以看出,基于各大热门财经网站的荐股信息构建的量化策略,在短期内都能获得超额收益,短期效应明显。在大部分财经网站上,持有期为2个交易日或者5个交易日能够获得较高的年化超额收益,特别是持有期为2个交易日的尤为明显。识别风险,发现价值 请务必阅读末页的免责声明 1414/2626 金融工程|专题报告 图图 19 搜狐证券搜狐证券_个股风云策略表现一览个股风云策略表现一览 数据来源:广发证券发展研究中心 表表 6 搜狐证券搜狐证券_个股风云策略指标一览个股风云策略指标一览 指标指标 持有期持有期 2 2 个交易日个交易日 持有期持有期 5 5 个交易个交易日日 持有期持有期 1010 个交易个交易日日 持有期持有期 3030 个交易个交易日日 胜率胜率 47.11%44.99%44.44%47.50%最大回撤最大回撤 -12.00%-14.17%-14.43%-15.26%最大月内回撤最大月内回撤 -12.00%-14.17%-14.43%-15.26%超额累积超额累积收益率收益率 42.08%32.87%36.87%38.07%年化超额收益率年化超额收益率 38.64%31.33%34.52%35.47%数据来源:广发证券发展研究中心 图图 20 华讯财经华讯财经_机构荐股栏目策略表现一览机构荐股栏目策略表现一览 数据来源:广发证券发展研究中心 表表 7 华讯财经华讯财经_机构荐股策略表现指标一览机构荐股策略表现指标一览 指标指标 持有期持有期 2 2 个交易日个交易日 持有期持有期 5 5 个交易个交易日日 持有期持有期 1010 个交易个交易日日 持有期持有期 3030 个交易个交易日日 胜率胜率 46.41%43.21%40.58%36.00%最最大回撤大回撤 -24.69%-26.16%-28.90%-31.56%最大月内回撤最大月内回撤 -15.45%-16.55%-17.41%-18.24%超额累积超额累积收益率收益率 118.98%68.74%55.60%48.94%年化超额收益率年化超额收益率 29.60%21.31%18.85%17.54%数据来源:广发证券发展研究中心 1700180019002000210022002300240000.20.40.60.811.21.41.61.82013-04-232013-05-232013-06-232013-07-232013-08-232013-09-232013-10-232013-11-232013-12-232014-01-232014-02-232014-03-232014-04-232014-05-232014-06-23持有期2个交易日持有期5个交易日持有期10个交易日持有期30个交易日上证指数(右轴)050010001500200025003000350000.511.522.52010-08-312010-10-312010-12-312011-03-032011-05-032011-07-032011-09-032011-11-032012-01-032012-03-032012-05-032012-07-032012-09-032012-11-032013-01-032013-03-032013-05-032013-07-032013-09-032013-11-032014-01-032014-03-032014-05-032014-07-03持有期2个交易日持有期5个交易日持有期10个交易日持有期30个交易日上证指数(右轴)识别风险,发现价值 请务必阅读末页的免责声明 1515/2626 金融工程|专题报告 图图 21 南方财富网南方财富网_个股推荐策略表现一览个股推荐策略表现一览 数据来源:广发证券发展研究中心 表表 8 南方财富网南方财富网_个股推荐策略表现指标一览个股推荐策略表现指标一览 指标指标 持有期持有期 2 2 个交易日个交易日 持有期持有期 5 5 个交易个交易日日 持有期持有期 1010 个交易个交易日日 持有期持有期 3030 个交易个交易日日 胜率胜率 46.62%45.42%44.26%41.66%最大回撤最大回撤 -14.84%-12.82%-12.75%-12.77%最大月内回撤最大月内回撤 -10.86%-10.50%-10.26%-9.93%超额累积超额累积收益率收益率 17.23%22.36%25.66%28.52%年化超额收益率年化超额收益率 22.06%26.79%29.82%32.45%数据来源:广发证券发展研究中心 在不区分行业以及当日表现等因素的影响下,财经小编选股策略在短期内的效在短期内的效应明显应明显,持有期为持有期为2个交易日的策略在回测期内的表现最为优异个交易日的策略在回测期内的表现最为优异,其中新浪财经的荐新浪财经的荐股表现在历史回测期内表现最好股表现在历史回测期内表现最好。接下来我们考虑在全样本内,各大热门财经网站上沪深300指数成分股上的荐股能力,策略的原理与之前的一致,不过我们只考虑各大财经网站上推荐的沪深300指数的成分股。表表 9 考虑各大热门财经网站推荐沪深考虑各大热门财经网站推荐沪深300指数成分股策略指标一览指数成分股策略指标一览(持有期持有期2个交易日个交易日)指标指标 胜率胜率 最大回撤最大回撤 最大月内回撤最大月内回撤 超额累积超额累积收收益率益率 年化超额年化超额收益率收益率 凤凰网凤凰网_ _黑马集中营黑马集中营 46.51%-42.02%-21.40%73.81%8.57%搜狐证券搜狐证券_ _个股风云个股风云 46.22%-15.17%-15.17%18.52%24.87%华讯财经华讯财经_ _内参内参 47.24%-20.86%-18.87%37.62%19.25%华讯财经华讯财经_ _个股点评个股点评 46.48%-31.22%-15.50%-9.14%6.56%华讯财经华讯财经_ _机构荐股机构荐股 45.26%-18.60%-14.25%42.10%33.01%新浪财经新浪财经_ _个股研究个股研究 48.17%-47.40%-24.19%3259.18%44.59%搜狐网搜狐网_ _金罗盘金罗盘 46.26%-42.51%-26.72%-25.11%2.17%同花顺同花顺_ _个股投资个股投资 42.91%-25.52%-16.74%-10.68%6.62%南方财富网南方财富网_ _个股推荐个股推荐 43.48%-14.98%-10.77%3.35%12.05%中国证券网中国证券网_ _热点研究个股热点研究个股 45.69%-10.72%-10.51%8.12%16.75%数据来源:广发证券发展研究中心 17501800185019001950200020502100215022002250230000.20.40.60.811.21.42013-06-072013-06-212013-07-052013-07-192013-08-022013-08-162013-08-302013-09-132013-09-272013-10-112013-10-252013-11-082013-11-222013-12-062013-12-202014-01-032014-01-172014-01-312014-02-142014-02-282014-03-142014-03-282014-04-112014-04-252014-05-092014-05-232014-06-062014-06-202014