《大数据解决方案》PPT课件.pptx
微软大数据微软大数据&自助式分析解决方案自助式分析解决方案议程大数据解决方案大数据的一些疑问大数据分析大数据处理自助式分析方案Gartner Magic Quadrant for Business Intelligence Platforms,2011全球权威评估机构全球权威评估机构GARTNER连续几年把微软评为连续几年把微软评为BI方案实施能力第一厂商方案实施能力第一厂商 Gartner Magic Quadrant for Business Intelligence Platforms,2013Gartner Magic Quadrant for Business Intelligence Platforms,2010大数据解决方案-大数据的一些疑问怎么从大数据得到价值?你想从大数据里得到什么?多大的数据才是大数据?大数据企业品牌腾飞的大数据企业品牌腾飞的“肾上腺素肾上腺素”5.5 Billion Subscribers WW(70+%of population)设备爆炸2 Billion Connected People 社交网络Web Traffic up from130 Exabyte(10 E18)in 2010 to 1.6 ZettaByte(10 E21)in 2015无处不在的连接10 Billion Connected Sensors传感器网络数据复杂度:多元性和速度TerabytesGigabytesMegabytesPetabytesBig DataWeb 2.0Web 2.0ERP/CRM付款薪资货存联系人订单跟踪销售管道Web 日志数字市场搜索市场网上推荐广告移动协作电子商务网页点击流Wikis/博客传感器/RFID/设备社交网络音频/视频日志文件空间&GPS 坐标数据数据集市电子政务气候文本/图像Web 日志数字市场搜索市场网上推荐协作电子商务数据的获取主要趋势,你想从大数据里得到什么?一系列新问题社交网络和互联网分析我的品牌或产品情绪实时数据源如何优化我的车队运行(基于天气和交通趋势)高级分析功能如何更好预测未来结果?端到端的大数据生命周期增强可视化10101HQLColdStreamHDFSHotStreamE=MC2HQLLearnedLimitsSQL战略/趋势分析存储&管理洞察价值操作/实时分析微软大数据平台总体架构微软大数据平台总体架构Fast LoadSource SystemsHistorical Data(Beyond Active Window)Summarize&LoadBig Data Sources(Raw,Unstructured)Alerts,NotificationsData&Compute Intensive AppERPCRMLOBAPPSIntegrate/EnrichSQL Server StreamInsightETL with SSIS,DQS,MDSHDInsight on Windows AzureHDInsight on Windows ServerSQL Server FTDW Data MartsSQL Server Reporting ServicesSQL Server Analysis ServerBusiness InsightsInteractive ReportsPerformance ScorecardsCrawlersBotsDevicesSensorsSQL Server Parallel Data Warehouse$What We Sell$Azure Market PlaceSummarize&Load via PDW Hadoop ConnectorHortonworks or Cloudera Hadoop微软大数据产品洞察力 INSIGHTS数据管理 DATA MANAGEMENT丰富数据 DATA ENRICHMENTPowerPivotPower ViewHadoop on WindowsHadoop=Big Data?HADOOP 集成企业级安全,高可靠性,管理与微软商业智能工具无缝集成SQL Server 数据平台的一部分在Windows Azure上几分钟内完成部署SQL SERVER 2012 PARALLEL DATA WAREHOUSE软硬件整合优化的并行数据仓库 从TB到PB 的高可扩展性平台使用MPP架构实现卓越的可扩展性硬件厂商的选择通过使用遵循行业标准的硬件降低成本与Microsoft 商业智能工具的深度集成充分利用最新软件技术 Windows Server 2012 Storage SpacesWindows Server 2012 Hyper-VSQL Server 2012 xVelocity 列存储SQL SERVER 2012 PARALLEL DATA WAREHOUSE 开放和灵活与Apache Hadoop 100%兼容工具由丰富的合作伙伴生态系统提供与社区的紧密合作Accelerating the delivery of Hadoop for WindowsHadoop for Windows JavaScript librariesHive ODBC driversThe Apache Software Foundation当前大数据分析的挑战:大量新技术需要学习掌握、周期长、见效缓慢数据仓库学习MapReduce需要IT人员提前手动将数据从HDFS导入数据仓库或集市,才可进行分析HDFS(Hadoop)HDFS(Hadoop)DatabaseHDFS(Hadoop)SQL Server 2012 PDW Powered by PolyBasePOLYBASEPOLYBASE:数据处理的突破性技术SQL 统一查询,结构化和非结构化数据查询关联Hadoop表和关系型数据库表采用标准SQL语言Select,From Where沿用现有SQL 技能无需IT人员介入节省时间和成本分析多样 的数据类型企业数据及商业智能平台的进化-当前结构化数据源结构化数据源结构化数据源ODS数据集市多维度存储分析应用其他存储使用DW企业数据及商业智能平台的进化-未来大数据存储结构化数据源非结构化数据源数据流数据仓库数据集市多维度存储数据服务分析应用其他存储服务使用高度可视化-数据民主化的基础敏捷、精准的业务决策面向中高层领导面向中高层领导-管理驾驶舱管理驾驶舱面向一线经营分析面向一线经营分析-大数据自助平台大数据自助平台提供面向不同层面用户的解决方案分析的基础是数据可视化分析的基础是数据可视化数据可视化是数据可视化是一门艺术一门艺术向导向导 提高分析效率提高分析效率图表图表,KPIs,波形图波形图,仪表与仪表与数据地图可视化数据地图可视化 面向业务人员的面向业务人员的运营报表与自定制报表工具运营报表与自定制报表工具发布、权限管理;发布、权限管理;数据驱动的数据驱动的KPI报警报警与报表内容订阅与报表内容订阅组件库,团队成员分享自组件库,团队成员分享自定制报定制报(图图)表与可重用数据表与可重用数据集合集合丰富多样的图表类型,连接所有类型数据源丰富多样的图表类型,连接所有类型数据源1.1.面向中高层领导面向中高层领导-管理驾驶舱管理驾驶舱 领导驾驶舱是一个为高层管理层提供的“一站式”(One-Stop)决策支持的管理信息中心系统。它以驾驶舱的形式,通过各种常见的图表(速度表、音量柱、预警雷达、雷达球)形象标示企业运行的关键指标(KPI),直观的监测企业运营情况,并可以对异常关键指标预警,和挖掘分析。它能将企业管理决策提升到一个新的高度。最大化地发挥高层经理了解、领导和控制公司业务的管理室(即驾驶舱)用户定义的报表导航途径用户定义的报表导航途径What-If What-If 分析分析地理数据图层地理数据图层动画数据呈现动画数据呈现易于开发交互式易于开发交互式,上下文关联的报表,内存数据引擎高速处理上亿上下文关联的报表,内存数据引擎高速处理上亿ExcelExcel表单记录表单记录关联其它关联其它ExcelExcel表单数据表单数据数据分解数据分解2 2.面向普通员工面向普通员工-大数据自助式分析平台大数据自助式分析平台DEMO1-EXCEL BI分析增强能力透视表、透视图、切片器、跨维度钻取DEMO2-EXCEL 新增能力POWER VIEW自助分析联动、动态展现、0代码GIS、业务人员与IT人员新沟通方式DEMO3-EXCEL 新增能力POWERMAP 3D GIS自助分析DEMO4-微软POWERBI现实应用案例(微博与电影票房)DEMO5-微软POWERBI现实应用案例(星巴克机场选址开店)自助式自助式BI案例案例-XX移动、移动、XX联通成功案例联通成功案例背景:背景:u客户原有BI系统基于Cognos,后台数据库Oracle,但是业务人员学习困难,使用不易,推广工作困难重重。领导使用界面不够友好,导致决策迟缓。当有新需求时,重新部署需要很长周期。现在:现在:u经过启动新一轮BI前端工具选型,通过对各个BI厂商的POC成果对比,微软成功赢标。u新平台改造:Oracle+Sqlserver2012SP1+Excel 2013+SharePoint2013uBI实施周期从原来3-10天反应时间,提升到现在2-3小时,分析决策效率大大提高u高峰同时在线100多个用户。总结微软大数据解决方案:业务能力:访问任意数据源(关系型数据库、Hadoop、非结构化数据)的数据整合平台低成本的数据价值洞察平台技术能力:结构化、半结构化、非结构化数据的处理能力