大数据治理解决方案ppt课件.pptx
《大数据治理解决方案ppt课件.pptx》由会员分享,可在线阅读,更多相关《大数据治理解决方案ppt课件.pptx(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1大数据治理体系与数据治理体系的联系与区别大数据治理是一项系统工程,大到大数据技术平台的搭建、组织的变革、政策的制定、流程的重组,小到元数据的管理、主数据的整合、各种类型大数据的个性化治理和大数据的行业应用。组织必须治理全部大数据,将大数据治理定义如下: 大数据治理是广义数据治理计划的一部分,即制定与大数据有关的数据优化、隐私保护与数据变现的政策。 将上述大数据治理的定义分解为以下部分: 1大数据是大数据是广义广义数据数据治理治理计划计划的的一部分一部分数据治理机构必须采取以下措施,以将大数据整合到既有的数据治理框架中: 扩展数据治理宪章的外延,将大数据治理纳入其中; 拓宽数据治理委员会成员的
2、范围,将数据科学家等大数据的超级用户吸纳进来; 任命处理社交媒体等特定大数据的主管; 将大数据与元数据、隐私、数据质量和主数据等数据治理准则结合。 大数据治理关大数据治理关乎政策乎政策制定制定政策包括人们在特定情形下如何作为的成文和非成文的宣告。譬如,大数据治理政策可能申明,未经顾客知情并同意,组织不得将顾客的Facebook资料整合到其主数据记录中。大数据必须大数据必须优优化化考虑一下组织是如何将现实世界的准则应用到大数据治理中的。公司设计了精致的企业资产管理计划,对机器、飞机、交通工具和其他资产进行妥善管理。与对实物资产进行登记类似,组织必须对大数据进行如下优化: 元数据建立大数据类别信息
3、;数据质量管理像公司对实物资产进行定期检修一样,定期净化大数据;信息生命周期管理对大数据进行存档,并在没必要继续保存某些数据时,将其删除。 大数据隐私至大数据隐私至关重要关重要组织同样必须建立旨在防止大数据误用的适当政策。组织在处理社交媒体、地理定位、生物计量学和其他形式的个人可识别信息(PII)时,必须考虑涉及的声誉、规制和法律风险。 大数据必须变大数据必须变现现所谓变现,就是将数据等资产转化为现金的过程,变现的方式可以是将数据卖给第三方,也可以是利用数据开发新的服务。在当下,公司意识到,必须将大数据视为具有财务价值的企业资产。例如,运营部门可以通过传感器数据,根据定期检修计划,提高设备正常
4、运行时间。呼叫中心可以分析客户代表的记录,通过了解顾客呼叫的原因,降低呼叫量。此外,零售商可以使用主数据激活Facebook的应用程序,提升顾客忠诚度。 2.1大数据治理框架大数据治理框架由三大部分组成:大数据类型、大数据治理领域、行业与功能2产业和功能场景保险业电信业零售业公共事业医疗保健业组织元数据隐私数据质量大数据类型web和社交媒体数据机器对机器的数据生物计量学数据大体量交易数据人工生成的数据信息治理大数据治理需要高度聚焦于数据本身。传统的数据治理领域同样适用于大数据大数据分析受用例驱动,用例的具体情况因产业和功能而异。客户服务IT业务流程整合情绪分析情绪分析FacebookFaceb
5、ook忠诚度计划忠诚度计划客户流失客户流失分析分析索赔调查索赔调查IT IT日志日志分析分析车载通车载通信技术信技术位置服务位置服务索赔欺诈索赔欺诈分析分析智能仪表智能仪表患者监测患者监测索赔分析索赔分析客户流失客户流失分析分析通话质量通话质量保证保证基因测试基因测试人脸识别人脸识别承保承保电子病历电子病历RFIRFI日志日志3.1大数据治理成熟度模型实施大数据治理的第一步,是评估大数据治理成熟度的当前状态和期望的未来状态。现将某信息治理委员会的成熟度模型用于成熟度评估。该模型设立了4个领域的11个大数据治理成熟度指标。3支持准则支持准则数据架构数据标准审计信息日志和报告核心核心准则准则数据质
6、量管理信息生命周期管理信息安全与隐私支持要素支持要素管理人员数据风险管理政策目标目标业务成果要求支持增强组织机构和认识元数据3.1.1大数据治理成熟度模型介绍及问题示例4目标目标 目标指信息治理计划的预期结果。目标倾向于关注降低风险与提升价值,这反过来又受降低成本和提高收入的驱动。 业务成果:代表信息治理计划的目标和目的。业务成果:A是否已经确定了大数据治理计划的关键业务关联方?B是否对大数据治理可带来的财务收益进行了量化?支持要素支持要素核心准则核心准则支持支持准则准则 组织结构和认识:指业务部门和IT部门间的相互责任,以及对治理不同管理层次中数据的信托责任的认识。 管理人员:旨在保证数据监
7、护,实现资产增值、风险消解和组织控制的质量控制准则。 数据风险管理:据以识别、保留、量化、规避、接受、消解和转嫁风险的方法论。 政策:期望得到落实的组织行为的书面表达。 数据结构和认识:如关键角色的职位说明中,是否包含大数据治理,如配备首席数据官和信息治理官? 管理人员:是否已经建立了责任分配(RACI)矩阵,以定义针对大数据关键属性的角色和责任? 数据风险管理:是否在大数据治理与风险治理之间建立了联系? 政策:是否已经归档了一组大数据治理政策? 数据质量管理:指测量、提高和保证产品数据、测试数据和归档数据的质量和集成性的方法。 信息生命周期管理:有关信息采集、使用、保留和删除的系统化的、基于
8、策略的方法。 信息安全与隐私:组织用于消解风险和保护数据资产的策略、实践和控制手段。 数据质量管理:对于与大数据相关的质量问题(数据价值不高或不显著),是否达成了一致意见? 信息生命周期管理:是否制定了流程,根据法律和业务要求合法处理不再需要的大数据? 信息安全和隐私:首席信息安全官是否是大数据治理计划的关键支持者? 数据架构:结构化和非结构化数据系统及应用的架构式设计,用于实现数据的可用性,并将数据分配给合适的用户。 元数据:指用于创建常见的语义定义、IT术语、数据模型和数据库的方法和工具。 审计信息日志和报告:指监测和测量数据价值、风险和信息治理有效性的组织流程。 数据架构:Hadoop、
9、NoSQL以及与当前架构相关的其他新兴大数据技术的共存战略是怎样的? 分类和元数据:业务词库是否包含与大数据相关的关键业务术语(如针对点击流数据的“独立访客”)? 审计信息日志和报告:企业如何检测特权用户对医保索赔和通话详单等敏感大数据的访问?问题示例问题示例模型介绍模型介绍案例5.2 某大型金融机构资金管理部的大数据治理路线图5创建Hadoop基础设施大数据治理的演进关键活动每日头寸快照社交媒体和非结构化内容治理大数据某大型金融机构的资金管理部,为大中型企业提供现金管理和流动性管理的综合服务。该部门处于部署大数据计划的早期阶段,其最初的大数据治理路线图如右图所示:第1-6个月构建技术基础设施
10、,获得Linux服务器和Apache Hadoop发行版。由于大数据是一个新事物,在切入业务前,必须设计一个可行的用例,并进行财务可行性论证。此外,组织要认真审视数据管理的传统方面:怎样将数据导入并导出Hadoop?Hadoop中的数据质量如何?大数据的元数据是怎样的?如何将大数据整合到未来12个月将要部署的主数据管理数据库中?大数据已经成为主流媒体的热门词汇,高管层至少很有可能同意支持一个大数据试点项目。因此,数据治理团队需要及时更新路线图,将与大数据有关的人员、流程和技术计划纳入其中。第6-12个月引入详细的交易记录,以分析每日头寸快照。受传统基础设施成本高昂的影响,以往的金融机构从未进行
11、这样细致入微的分析。第12-24个月将社交媒体数据和其他非结构化内容引入Hadoop环境。由于金融机构的大多数客户是大企业,对交易对手的10-K和10-Q归档等非结构化内容,进行探索性分析。第24-36个月资金管理部已经有了现成的聚焦于大企业客户的主数据的信息治理计划。大数据处理框架的组成6大数据治理需要高度聚焦于数据本身。我们将大数据分为五种:web和社交媒体数据、机器对机器的数据、大体量交易数据、生物计量学数据和人工生成的数据。大数据类型大数据类型信息治理准则信息治理准则产业与功能产业与功能传统的信息治理准则,同样适用于大数据,相关准则包括组织、元数据、隐私、数据质量、业务流程整合、主数据
12、整合和信息生命周期管理。大数据分析是受例驱动的,用例的具体情况因产能和功能而异。限于篇幅,我们只列出了部分的产业和功能。大数据的类型大数据大体可分为五种类型7Web和社交媒体数据二的点击流数据Twitter FeedsFacebook帖子网络内容Web和社交媒体数据二的点击流数据Twitter FeedsFacebook帖子网络内容机器对机器的数据二的公用事业智能仪表读数RFID读数石油钻探设备传感器读数网络内容Web和社交媒体数据二的点击流数据Twitter FeedsFacebook帖子网络内容Web和社交媒体数据二的点击流数据Twitter FeedsFacebook帖子网络内容类型6.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 治理 解决方案 ppt 课件
限制150内