欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt

    • 资源ID:85124276       资源大小:4.94MB        全文页数:26页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt

    大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨厦门大学计算机科学系 2020版林子雨林子雨厦门大学计算机科学系厦门大学计算机科学系E-mail:主页:主页:http:/ 大数据技术概述大数据技术概述(PPT版本号:版本号:2020年年12月版本)月版本)大数据基础编程、实验和案例教程(第大数据基础编程、实验和案例教程(第2版)版)教材官网:http:/ 大数据时代大数据时代1.2 大数据关键技术大数据关键技术1.3 大数据软件大数据软件1.4 内容安排内容安排百度搜索厦门大学数据库实验室网站访问平台大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.1大数据时代大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.2大数据关键技术表1-1 大数据技术的不同层面及其功能技技术层术层面面功能功能数据采集利用ETL工具将分布的、异构数据源中的数据如关系数据、平面数据文件等,抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础;或者也可以把实时采集的数据作为流计算系统的输入,进行实时处理分析数据存储和管理利用分布式文件系统、数据仓库、关系数据库、NoSQL数据库、云数据库等,实现对结构化、半结构化和非结构化海量数据的存储和管理数据处理与分析利用分布式并行编程模型和计算框架,结合机器学习和数据挖掘算法,实现对海量数据的处理和分析;对分析结果进行可视化呈现,帮助人们更好地理解数据、分析数据数据隐私和安全在从大数据中挖掘潜在的巨大商业价值和学术价值的同时,构建隐私数据保护体系和数据安全体系,有效保护个人隐私和数据安全大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.2大数据关键技术分布式存储分布式处理GFSHDFSBigTableHBaseNoSQL(键值、列族、图形、文档数据库)NewSQL(如:SQLAzure)MapReduce大数据两大核心技术大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.2大数据关键技术大数据计算模式大数据计算模式解决问题解决问题代表产品代表产品批处理计算针对大规模数据的批量处理MapReduce、Spark等流计算针对流数据的实时计算Flink、Storm、S4、Flume、Streams、Puma、DStream、Super Mario、银河流数据处理平台等图计算针对大规模图结构数据的处理Pregel、GraphX、Giraph、PowerGraph、Hama、GoldenOrb等查询分析计算大规模数据的存储管理和查询分析Dremel、Hive、Cassandra、Impala等表1-2大数据计算模式及其代表产品大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3大数据软件大数据技大数据技术术大数据大数据软软件件数据采集Kafka数据存储与管理HDFS、HBase、Redis、MongoDB数据处理与分析MapReduce、Spark、Hive、Flink数据可视化D3、ECharts表1-3 本教程所涉及的大数据软件大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3.1Hadoop大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3.2Spark图1-2BDAS架构大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.3.4NoSQL数据库NoSQL数据库是一种不同于关系数据库的数据库管理系统,是对一大类非关系型数据库的统称,它所采用的数据模型并非传统关系数据库的关系模型,而是类似键/值、列族、文档等非关系模型。NoSQL数据库没有固定的表结构,通常也不存在连接操作,也没有严格遵守ACID约束,因此,与关系数据库相比,NoSQL具有灵活的水平可扩展性,可以支持海量数据存储。此外,NoSQL数据库支持MapReduce风格的编程,可以较好地应用于大数据时代的各种数据管理。NoSQL数据库的出现,一方面弥补了关系数据库在当前商业应用中存在的各种缺陷,另一方面也撼动了关系数据库的传统垄断地位。NoSQL数据库虽然数量众多,但是,归结起来,典型的NoSQL数据库通常包括键值数据库、列族数据库、文档数据库和图数据库。本教程将介绍两种流行的NoSQL数据库产品的安装和使用方法,即键值数据库Redis和文档数据库MongoDB。大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.4内容安排图1-3本教程中涉及的相关大数据软件大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.4内容安排图1-4本教程中大数据软件之间的相互关系大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨1.5本章小结大数据技术是一个庞杂的知识体系,包含了大量相关技术和软件。在具体学习相关技术及其软件之前,非常有必要建立对大数据技术体系的整体性认识。因此,本章首先从总体上介绍了大数据关键技术和各类大数据软件。鉴于不同的大数据学习者有着不同的学习需求,为了方便读者迅速找到对应的学习章节,本章给出了本教程的整体内容安排。此外,与教程配套的相关资源的建设,是帮助读者更加有效、高效学习本教程的重要方面,因此,本章最后详细列出了与本教程配套的各种丰富的在线资源,全部可以通过网络自由免费访问。大数据基础编程、实验和案例教程(第2版)厦门大学计算机科学系林子雨附录A:主讲教师林子雨简介单位:厦门大学计算机科学系E-mail:个人网页:http:/ of Computer Science,Xiamen University,2020

    注意事项

    本文(数据基础编程、实验和案例教程-第1章-大数据技术概述(2020.ppt)为本站会员(创****公)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开