大数据技术原理与应用(第2版教材)-第1章-大数据概述(2018.ppt
《大数据技术原理与应用(第2版教材)-第1章-大数据概述(2018.ppt》由会员分享,可在线阅读,更多相关《大数据技术原理与应用(第2版教材)-第1章-大数据概述(2018.ppt(47页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、,厦门大学计算机科学系 2018年2月版本,林子雨厦门大学计算机科学系E-mail: 主页:http:/ 大数据概述(PPT版本号:2018年2月版本),http:/ 大数据概述在线视频观看地址,提纲,1.1 大数据时代1.2 大数据概念1.3 大数据的影响1.4 大数据的应用1.5 大数据关键技术1.6 大数据计算模式1.7 大数据产业1.8 大数据与云计算、物联网的关系,欢迎访问大数据技术原理与应用教材官方网站:http:/ (2017年2月第2版)ISBN:978-7-115-44330-4厦门大学 林子雨 编著,人民邮电出版社,1.1大数据时代,1.1.1第三次信息化浪潮,根据IBM前
2、首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革,表1-1 三次信息化浪潮,1.1.2信息科技为大数据时代提供技术支撑,图1-1 存储价格随时间变化情况,1. 存储设备容量不断增加,1.2信息科技为大数据时代提供技术支撑,来自斯威本科技大学(Swinburne University of Technology)的研究团队,在2013年6月29日刊出的自然通讯(Nature Communications)杂志的文章中,描述了一种全新的数据存储方式,可将1PB(1024TB)的数据存储到一张仅DVD大小的聚合物碟片上。,1.1.2信息科技为大数据时代提供技术支撑,图1-3 CPU晶体
3、管数目随时间变化情况,2. CPU处理能力大幅提升,1.1.2信息科技为大数据时代提供技术支撑,图1-4 网络带宽随时间变化情况,3. 网络带宽不断增加,1.1.3数据产生方式的变革促成大数据时代的来临,图1-5 数据产生方式的变革,1.1.4 大数据的发展历程,表1-2 大数据发展的三个阶段,1.2大数据概念,1.2.1数据量大,根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩尔定律)人类在最近两年产生的数据量相当于之前产生的全部数据量预计到2020年,全球将总共拥有35ZB的数据量,相较于2010年,数据量将增长近30倍,1.2.2 数据类型繁多
4、,大数据是由结构化和非结构化数据组成的10%的结构化数据,存储在数据库中90%的非结构化数据,它们与人类信息密切相关,科学研究基因组LHC 加速器地球与空间探测企业应用Email、文档、文件应用日志交易记录Web 1.0数据文本图像视频Web 2.0数据查询日志/点击流Twitter/ Blog / SNSWiki,1.2.3处理速度快,从数据的生成到消耗,时间窗口非常小,可用于生成决策的时间非常少1秒定律:这一点也是和传统的数据挖掘技术有着本质的不同,1.2.4价值密度低,价值密度低,商业价值高以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒,但是具有很高的商业价值,继续装ing
5、,1.3大数据的影响,图灵奖获得者、著名数据库专家Jim Gray 博士观察并总结人类自古以来,在科学研究上,先后历经了实验、理论、计算和数据四种范式,实验,理论,计算,数据,1.3大数据的影响,在思维方式方面,大数据完全颠覆了传统的思维方式:全样而非抽样效率而非精确相关而非因果,1.3大数据的影响,在社会发展方面,大数据决策逐渐成为一种新的决策方式,大数据应用有力促进了信息技术与各行业的深度融合,大数据开发大大推动了新技术和新应用的不断涌现在就业市场方面,大数据的兴起使得数据科学家成为热门职业在人才培养方面,大数据的兴起,将在很大程度上改变中国高校信息技术相关专业的现有教学和科研体制,1.4
6、大数据的应用,大数据无处不在,包括金融、汽车、零售、餐饮、电信、能源、政务、医疗、体育、娱乐等在内的社会各行各业都已经融入了大数据的印迹,典型的大数据应用实例,Kevin Spacey,David Fincher,英国同名小说纸牌屋,风靡全球的美剧纸牌屋,大数据分析,典型的大数据应用实例,从谷歌流感趋势看大数据的应用价值 “谷歌流感趋势”,通过跟踪搜索词相关数据来判断全美地区的流感情况,1.5大数据关键技术,表1-5 大数据技术的不同层面及其功能,1.5大数据关键技术,分布式存储,分布式处理,GFSHDFSBigTableHBaseNoSQL(键值、列族、图形、文档数据库)NewSQL(如:S
7、QL Azure),MapReduce,大数据,两大核心技术,1.6大数据计算模式,表1-3 大数据计算模式及其代表产品,1.7大数据产业,大数据产业是指一切与支撑大数据组织管理和价值发现相关的企业经济活动的集合,1.8大数据与云计算、物联网的关系,云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者相辅相成,既有联系又有区别,1.8.1云计算,云计算实现了通过网络提供可伸缩的、廉价的分布式计算能力,用户只需要在具备网络接入条件的地方,就可以随时随地获得所需的各种IT资源,图1-7 云计算的服务模式和类型,1. 云计算概念,1.8.1云计算,Infrastructure as a Se
8、rvice,Platform as a Service,Software as a Service,SaaS,PaaS,IaaS,Google Apps, Microsoft “Software+Services”,IBM IT factory, Google App Engine, F,Amazon EC2, IBM Blue Cloud, Sun Grid,Server,Storage,Server,Storage,Visualization,Infrastructure,Platform,Application,从一个集中的系统部署软件,使之在一台本地计算机上(或从云中远程地)运行的一个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 技术 原理 应用 利用 运用 教材 概述
限制150内