证券行业大数据应用解决方案(智慧证券-证券大数据-智慧金融-金融大数据).docx
《证券行业大数据应用解决方案(智慧证券-证券大数据-智慧金融-金融大数据).docx》由会员分享,可在线阅读,更多相关《证券行业大数据应用解决方案(智慧证券-证券大数据-智慧金融-金融大数据).docx(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、证券大数据解决方案(智慧证券)XXXX 技术有限公司1XXXX 证券大数据中心建设方案目录第6页1 云数据中心项目概述71.1 建设背景71.2 金融业大数据应用投资分布71.2.1 证券大数据应用81.3 面临的风险和挑战101.4 建设目标111.5 建设原则111.6 云计算大数据中心优势132 云数据中心需求分析152.1 现状分析152.2 总体建设需求153 云数据中心总体规划设计173.1 整体建设思想173.2 整体系统结构173.3 计算资源和存储资源配置估算194 云数据中心资源层规划设计204.1 云计算平台基础架构体系204.1.1 设计原则204.1.2 系统总体架构
2、214.1.3 虚拟化拓扑的结构244.2 云计算中心虚拟化组件254.2.1 迁移254.2.2 高可靠性(HA)254.2.3 容错264.2.4 动态资源分配264.2.5 分布式电源管理274.3 分布式集群存储平台294.3.1 方案拓扑图294.3.2 方案描述294.3.3 系统软件304.3.3.1 云平台系统管理支撑系统304.3.3.1.1 产品定位314.3.3.1.2 XX 证券云应用314.3.3.1.3 客户收益314.3.3.1.4 产品架构324.3.3.1.5 产品体系334.3.3.1.6 产品功能344.3.3.2 集群存储系统354.3.3.2.1 集群
3、存储系统的特点354.3.3.2.2 集群存储硬件介绍384.3.3.2.3 系统功能及特点384.3.3.2.3.1 国产硬件自主可控384.3.3.2.3.2 海量数据高效管理384.3.3.2.3.3 数据读写性能394.3.3.2.3.4 数据全局共享394.3.3.2.3.5 数据安全性404.3.3.2.3.6 系统可扩展性414.3.3.2.3.7 与现有环境无缝兼容424.3.3.2.3.8 系统的整体拥有成本424.3.3.2.3.9 使用分布式提高投资回报率424.3.3.2.3.10 降低管理及运行成本简易存储434.3.3.2.3.11 提高用户应用的生产力444.3.
4、3.3 基于大数据的证券数据管理与分析系统444.3.3.3.1.1 大数据平台介绍454.3.3.3.1.1.1 平台功能框架454.3.3.3.1.1.2 分布式存储功能454.3.3.3.1.1.3 分布式计算功能464.3.3.3.1.1.4 NoSQL 功能474.3.3.3.1.1.5 数据仓库功能474.3.3.3.1.1.6 分布式协调功能474.3.3.3.1.1.7 工作流管理功能484.3.3.3.1.1.8 维护管理功能484.3.3.3.1.2 证券数据分析系统架构494.3.3.3.1.2.1 非格式数据的分类存储494.3.3.3.1.2.2 对格式化数据的全文检
5、索合多线索加权检索494.3.3.3.1.2.3 完善的业务分析报表系统504.3.3.3.1.2.3.1 国内经济形势分析图504.3.3.3.1.2.3.2 按照国家名称分析各国经济形势图504.3.3.3.1.2.3.3 按照全球各大交易所数据技术分析各类产品的价格趋向图;504.3.3.3.1.2.3.4 用户可以定制所关心的数据统计图504.3.3.3.1.2.4 数据分类存储与自动化数据引擎504.3.3.3.1.3 交易数据存储管理分析系统架构514.3.3.3.1.3.1 交易数据按照产品分类存储514.3.3.3.1.3.2 交易数据按照产品分类趋势分析图514.3.3.3.
6、1.3.3 交易数据按照客户分类盈利分析图524.3.3.3.1.3.4 交易数据按照佣金盈利分析图524.3.3.3.1.3.5 交易数据按照客户操作手法分析图524.3.3.3.1.3.6 交易数据按照可户盈利排名分析图524.3.3.3.1.3.7 交易数据可以提示用户适合那种产品交易524.3.3.3.1.3.8 用户分布情况报表分析524.3.3.3.1.3.9 提供精准化客户服务指南524.3.3.3.2 XX 大数据统一平台524.3.3.3.2.1 数据采集544.3.3.3.2.2 数据接入544.3.3.3.2.3 规则过滤554.3.3.3.2.4 数据存储554.3.3
7、.3.2.5 计算引擎564.3.3.3.2.5.1 功能564.3.3.3.2.5.2 组成574.3.3.3.2.5.3 基本算子集574.3.3.3.2.6 业务处理594.3.3.3.2.7 业务管理604.3.3.3.2.8 用户权限管理604.3.3.3.2.9 业务管理604.3.3.4 云计算中心安全层规划设计634.3.3.4.1 云平台安全建设需求634.3.3.4.2 云平台安全建设思路644.3.3.4.3 云数据中心安全系统总体设计664.3.3.4.4 云平台安全防护详细设计664.3.3.4.4.1 平云终端接入安全设计664.3.3.4.4.2 主机层安全684
8、.3.3.4.4.3 服务器负载均衡684.3.3.4.4.4 虚拟机 VM 之间访问安全694.3.3.4.5 平台层安全714.3.3.4.6 数据层安全764.3.3.5 云计算数据中心备份设计774.3.3.5.1 逻辑架构774.3.3.5.2 方案实现设计774.3.3.6 云计算数据中心整体方案拓扑784.3.3.6.1.1 网络拓扑78XXXX 证券大数据中心建设方案1 云数据中心项目概述1.1 建设背景数据显示,中国大数据 IT 应用投资规模以五大行业最高,其中以互联网行业占比最高, 占大数据IT 应用投资规模的 28.9%,其次是电信领域(19.9%),第三为金融领域(17
9、.5%), 政府和医疗分别为第四和第五根据国际知名咨询公司麦肯锡的报告显示:在大数据应用综合价值潜力方面,信息技术、金融保险、政府及批发贸易四大行业潜力最高高。具体到行业内每家公司的数据量来看,信息、金融保险、计算机及电子设备、公用事业四类的数据量最大。1.2 金融业大数据应用投资分布从投资结构上来看,证券将会成为金融类企业中的重要部分,证券和保险分列第二和第三位。接下来,我们将分别介绍证券、保险和证券行业的大数据应用情况。第7页XXXX 证券大数据中心建设方案1.2.1 证券大数据应用大数据时代,券商们已意识到大数据的重要性,券商对于大数据的研究与应用正在处于起步阶段,相对于银行和保险业,证
10、券行业的大数据应用起步相对较晚。目前国内外证券行业的大数据应用大致有以下三个方向:第一方面:股价预测2017 年 5 月英国对冲基金 Derwent Capital Markets 建立了规模为 4000 万美金的对冲基金,该基金是首家基于社交网络的对冲基金,该基金通过分析Twitter 的数据内容来感知市场情绪,从而指导进行投资。利用 Twitter 的对冲基金 Derwent Capital Markets 在首月的交易中确实盈利了,其以 1.85%的收益率,让平均数只有 0.76%的其他对冲基金相形见绌。麻省理工学院的学者,根据情绪词将 twitter 内容标定为正面或负面情绪。结果发现
11、,无论是如“希望”的正面情绪,或是“害怕”、“担心”的负面情绪,其占总 twitter 内容数的比例,都预示着道琼斯指数、标准普尔 500 指数、纳斯达克指数的下跌;美国佩斯大学的一位博士则采用了另外一种思路,他追踪了星巴克、可口可乐和耐克三家公司在社交媒体上的受欢迎程度,同时比较它们的股价。他们发现,Facebook 上的粉丝数、Twitter 上的听众数和 Youtude 上的观看人数都第8页XXXX 证券大数据中心建设方案和股价密切相关。另外,品牌的受欢迎程度,还能预测股价在 10 天、30 天之后的上涨情况。但是,Twitter 情绪指标,仍然不可能预测出会冲击金融市场的突发事件。例如
12、,在 2016 年 10 月 13 号,美国联邦储备委员会突然启动一项银行纾困计划, 令道琼斯指数反弹,而3 天前的 Twitter 相关情绪指数毫无征兆。而且,研究者自己也意识到,Twitter 用户与股市投资者并不完全重合,这样的样本代表性有待商榷,但仍无法阻止投资者对于新兴的社交网络倾注更多的热情。第二,客户关系管理(1) 客户细分。通过分析客户的账户状态(类型、生命周期、投资时间) 、账户价值(资产峰值、资产均值、交易量、佣金贡献和成本等)、交易习惯( 周转率、市场关注度、仓位、平均持股市值、平均持股时间、单笔交易均值和日均成交量等)、投资偏好(偏好品种、下单渠道和是否申购)以及投资收
13、益( 本期相对和绝对收益、今年相对和绝对收益和投资能力等),来进行客户聚类和细分,从而发现客户交易模式类型,找出最有价值和盈利潜力的客户群 , 以及他们最需要的服务, 更好地配置资源和政策, 改进服务,抓住最有价值的客户。(2) 流失客户预测。券商可根据客户历史交易行为和流失情况来建模从而预测客户流失的概率。如 2017 年海通证券自主开发的“给予数据挖掘算法的证券客户行为特征分析技术”主要应用在客户深度画像以及基于画像的用户流失概率预测。通过对海通 100 多万样本客户、半年交易记录的海量信息分析, 建立了客户分类、客户偏好、客户流失概率的模型。该项技术最大初衷是希望通过客户行为的量化分析,
14、来测算客户将来可能流失的概率。第三,投资景气指数。2017 年,国泰君安推出了“个人投资者投资景气指数”(简称 3I 指数), 通过一个独特的视角传递个人投资者对市场的预期、当期的风险偏好等信息。第9页XXXX 证券大数据中心建设方案国泰君安研究所对海量个人投资者样本进行持续性跟踪监测,对账本投资收益率、持仓率、资金流动情况等一系列指标进行统计、加权汇总后得到的综合性投资景气指数。3I 指数通过对海量个人投资者真实投资交易信息的深入挖掘分析,了解交易个人投资者交易行为的变化、投资信心的状态与发展趋势、对市场的预期以及当前的风险偏好等信息。在样本选择上,选择资金 100 万元以下、投资年限5 年
15、以上的中小投资者,样本规模高达 10 万,覆盖全国不同地区,所以,这个指数较为有代表性。在参数方面,主要根据中小投资者持仓率的高低、是否追加资金、是否盈利这几个指标,来看投资者对市场是乐观还是悲观。“3I 指数” 每月发布一次,以 100 为中间值,100120 属于正常区间,120 以上表示趋热, 100 以下则是趋冷。从实验数据看,从 2007 年至今,“3I 指数”的涨跌波动与上证指数走势拟下图是 2016 年 1 月到 2018 年 2 月的 3I 指数(虚线) 和上证综指运行(实线)走势图,注:3I 指标在 80 以下表明个人投资者的投资景气度“低迷”,100 以下表明“趋冷”。合度
16、相当高。1.3 面临的风险和挑战(1)XX 证券面临着同行业务和对客户招揽的竞争;第10页XXXX 证券大数据中心建设方案(2)客户也需要XX 证券为客户提供更加精准的产品、技术的指导;(3)XX 证券为了提高公司经营的竞争力也需要对客户的交易数据进行分析、了解不同客户适合在哪种类型产品上交易更高更好的盈利;(4)通过大数据,也可以把中国乃至全球的经济、政治、文化、军事等情报对证券业乃至整个金融业的影响趋势,让公司也有较强的规避风险的能力;1.4 建设目标依托云计算技术,对XX 证券内部业务平台、数据、交易数据管理、交易数据分析、国内、国外经济、军事、政治情报的分析系统实行统一规划和建设。所有
17、资源整合后在逻辑 上以单一整体的形式呈现,并可按需进行动态扩展和配置。按照分阶段可升级的标准要求, 为多级单位提供应用支撑基础平台服务和数据存储、备份、交换等服务,实现基础软硬件 资源的统一管理、按需分配、综合利用,增强数据中心的可管理性,提高应用的兼容性和 可用性,加速业务系统的部署,提升硬件资源的利用率;1.5 建设原则结合本项目的实际应用和发展要求,在进行云计算、大数据平台方案设计过程中,应始终坚持以下原则:1) 可扩展性原则为了保护已有的投资以及不断增长的业务需求,系统必须具有灵活的结构并留有合理 的扩充余地,以便根据需要进行适当的变动和扩充;主要业务平台系统应采用开放的结构, 符合国
18、际标准、工业标准和行业标准,适应技术的发展和变化。由于本次市局信息系统整 体东迁,相当于系统重新规划和建设,所以我们把主要精力放在满足现有业务需求和对未 来的系统扩展的支持性上,也就是需要设计成一个便于扩展的系统架构,系统应具备良好 的扩展能力并能够便捷地进行扩展。2) 合理性原则在一定的资金条件下,以适当的投入,建立性能价格比高的、先进的、完善的业务系统。所有软硬件的选型和配置要坚持性能价格比最优原则,同时兼顾与市局已有设备和系第12页统的互联互通能力,以及与目前操作系统和应用系统的兼容性。在满足系统性能、功能以及考虑到在可预见的未来不失去先进性的条件下,尽量取得整个系统的投入合理性,以构成
19、一个性能价格比优化的应用系统。系统架构的设计应尽可能地运用虚拟化、云计算等新技术,以符合未来的技术发展方向。这种设计方法可以最大化地利用投资,并在利用率、管理、能源等各方面提高用户投资的效率,降低总体拥有成本,减少浪费的发生。结合新技术的运用,也可以让各应用系统更好地融入未来整体IT 建设规划中,避免发生推到重建的现象,从而更好地保护市局在信息系统上的投入。3) 可靠性原则系统要具有高可靠性及强大的容错能力。该系统必须保证 724 全天候不间断地工作, 核心设备比如数据库服务器和存储设备具有全容错结构,并具有热插拔功能,可带电修复 有关故障而不影响整个系统的工作,设计应保持一定数量的冗余以保证
20、整体系统的高可靠 性和高可用性。即便是在系统建设初期也要着重考虑系统可用性、可靠性问题,防止出现 系统停顿等问题造成信息系统的中断服务。通过结合云计算等新技术,可以更好地提高系 统的可靠性和可用性。4) 可管理性原则选择基于开放的技术,采用标准化、规范化设计;同时采用先进的设备,易于日后扩展,便于向更新技术的升级与衔接,实现系统较长的生命力;保证后期在系统上进行有效的开发和使用,并为今后的发展提供一个良好的环境;在设计、组建中心机房系统时,采用先进的、标准的设备;在选购服务器、存储和连 接设备时,确保系统部件间的严密配合和无缝联接,并获得良好的售后服务和技术支持; 整个系统建成后按照整理一套完
21、整的文档资料,以便提高整个系统的可管理性与可维护性。5) 安全性原则严格按照 XX 关于信息安全的规定和要求,规划和部署中心机房的业务系统和备份系统;采用安全服务器、备份还原系统、来防止内外部的网络安全威协和数据丢失窃取威胁等;所有软硬件采用国产、自主研发的产品,从根本上保障系统的安全性。XXXX 证券大数据中心建设方案1.6 云计算大数据中心优势通过建立云计算大数据中心,通过服务的方式交付对物理硬件的需求,代替传统硬件设备跟随着应有系统的增加而增加的模式,对现有应用系统进行整合,实现 IT 服务的快速交付,节能响应国家号召,提升业务系统安全。1) 国产硬件自主可控数据存储硬件采用我国完全自主
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 证券 行业 数据 应用 解决方案 智慧 金融
限制150内