大数据分析一体机概述课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《大数据分析一体机概述课件.ppt》由会员分享,可在线阅读,更多相关《大数据分析一体机概述课件.ppt(30页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、目录1大数据概述大数据概述2一体机概述一体机概述3研发思路研发思路4应用分析应用分析1大数据的4V特征“4V”是“大数据”的显著特征,或者说,只有具备这些特点的数据,才是大数据。大数据大数据将有新型的展现方式:大型控制中心和移动终端,实现数据的实时处理和快速决策。将有新型的展现方式:大型控制中心和移动终端,实现数据的实时处理和快速决策。体量Volume多样性Variety价值密度Value速度Velocity非结构化数据的超大规模和增长总数据量的8090%比结构化数据增长快10倍到50倍是传统数据仓库的10倍到50倍大数据的异构和多样性很多不同形式(文本、图像、视频、机器数据)无模式或者模式不
2、明显不连贯的语法或句义大量的不相关信息对未来趋势与模式的可预测分析深度复杂分析(机器学习、人工智能Vs传统商务智能(咨询、报告等)实时分析而非批量式分析数据输入、处理与丢弃立竿见影而非事后见效大数据的特征大数据技术将被设计用于在成本可承受(economically)的条件下,通过非常快速(velocity)的采集、发现和分析,从大量化(volumes)、多类别(variety)的数据中提取价值(value),属于IT 领域新一代的技术与架构 用以分析的数据越全面,分析的结果就越接近于真实。大数据分析意味着企业能够从这些新的数据中获取新的洞察力,并将其与已知业务的各个细节相融合数据分析的价值分析
3、技术:数据处理:自然语言处理技术统计和分析:A/B test;top N排行榜;地域占比;文本情感分析数据挖掘:关联规则分析;分类;聚类模型预测:预测模型;机器学习;建模仿真大数据技术:数据采集:ETL工具数据存取:关系数据库;NoSQL;SQL等基础架构支持:云存储;分布式文件系统等计算结果展现:云计算;标签云;关系图等存储结构化数据:p海量数据的查询、统计、更新等操作效率低非结构化数据p图片、视频、word、pdf、ppt等文件存储p不利于检索、查询和存储半结构化数据p转换为结构化存储p按照非结构化存储解决方案:Hadoop(MapReduce技术)流计算(twitter的storm和ya
4、hoo的S4)一些相关技术1、对现有数据库管理技术的挑战传统的数据库部署不能处理数TB 级别的数据,也不能很好的支持高级别的数据分析。急速膨胀的数据体量即将超越传统数据库的管理能力。2、经典数据库技术并没有考虑数据的多类别(variety)SQL(结构化数据查询语言),在设计的一开始是没有考虑非结构化数据的。3、实时性的技术挑战:一般而言,像数据仓库系统、BI应用,对处理时间的要求并不高。因此这类应用往往运行1、2天获得结果依然可行的。但实时处理的要求,是区别大数据应用和传统数据仓库技术、BI技术的关键差别之一。网络架构、数据中心、运维的挑战:技术架构的挑战:人们每天创建的数据量正呈爆炸式增长
5、,但就数据保存来说,目前的技术改进不大,而数据丢失的可能性却不断增加。如此庞大的数据量首先在存储上就会是一个非常严重的问题,硬件的更新速度将是大数据发展的基石。领域共性问题大数据大数据处处理理技技术手段手段String ConvertCountFilterString TruncateSortIndexingJoinSequenceExtractAggregateSocial MediaMachine&Sensor DataMediaWeb ClickstreamMobile AppsCall LogSplunkBI/ReportingCustomizedSolutionsDatabase/D
6、ata Warehouse较常常见的的解决方案解决方案大数据大数据储储存存大数据大数据处处理理数据分享数据分享数据数据检检索索数据分析数据分析数据展数据展现现分布式软件架构并行计算框架分布式存储横向扩容(Scale-out)架构存储与运算合一Big Data 运算与存储,单一架构解决8传统并行计算架构并行计算+分布式存储运算存储传统存储架构计算与存储一体,计算向数据靠拢,高效专用存储模式为程序员屏蔽通性、并发、同步与一致性等问题任务之间无依赖(share-nothing),具有高系统延展性(scale-out)利用利用Hadoop 的特性的特性目录1大数据概述大数据概述2一体机概述一体机概述3
7、研发思路研发思路4应用分析应用分析9一体机概念和分类一体机是软件与硬件相结合的集成系统产品,其一般集数据处理、数据传输、数据存储三方面于一体。一体机通过预先集成、测试、优化,能够实现快速部署、简化IT基础架构,节省资源,提升系统高可用性和可扩展性。服务器服务器软件软件存储存储网络网络管理管理10从IT基础设施发展角度看,复杂的系统集成模式已经成为业务创新的“绊脚石”简化(预集成)、优化的基础设施才能为业务应用“云化”提供更好的保障大型机一体化、预集成系统集成一体化预集成专有技术标准运行专有软件运维成本极高分层(服务器、网络、存储)现场集成通用平台,缺乏对平台软件优化开放的技术标准集成及运维成本
8、高简化,将平台软件需要的基础设施预集成优化,针对平台软件非功能需求进行优化沿用开放的技术标准运维成本低平台即服务软件即服务数据即服务云云Gartner Data Center Conference presentationGartner数据中心大会专题讲座Will Fabric Computing Change the Concept of the Traditional Server?”,December 2011光纤运算是否会颠覆传统服务器的概念光纤运算是否会颠覆传统服务器的概念 2011年年12月月“By 2015,35%of total server shipped value wil
9、l be as integrated systems.”“到2015年,35%的服务器都将以集成系统方式交付”Unified Computing System(UCS)2012.42012.9FusionCubeExadata数据库一体机数据库一体机Exalogic中间件一体机中间件一体机Exalytics内存分析机内存分析机Big Data 大数据机大数据机从2008年开始,基于开放的技术标准,国内外厂商纷纷开始研制一体机。Oracle率先推出数据库、中间件、数据分析以及大数据等多款一体机产品一体机架构负载均衡中间件数据库服务器存储单机,集群单实例,多实例横向、纵向扩展能力CPU/内存比高I
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 分析 一体机 概述 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内