知识点5-网络与新媒体数据环境—大数据.pdf
《知识点5-网络与新媒体数据环境—大数据.pdf》由会员分享,可在线阅读,更多相关《知识点5-网络与新媒体数据环境—大数据.pdf(14页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1 Chapter 5 第五节 网络与新媒体应用的 数据环境大数据 2 目前,信息海洋已经将我们团团围住,单一数 据集容量超过几十TB 甚至数PB 已不罕见,其规模 大到无法在容许的时间内用常规软件工具对其内容 进行抓取、管理和处理,人类已经从小数据时代进 入大数据时代。 3 一、大数据概述 所谓大数据是指那些大小已经超出传统意义上 的尺度,已有的一般软件难以捕捉、存储、管理和 分析的数据。 一般意义上,大数据是指无法在可容忍的时间 内用传统IT技术和软硬件工具对其进行感知、获取、 管理、处理和服务的数据集合。但不同的研究机构 和学者对大数据的定义不尽相同。 4 归纳起来,大数据的概念和内涵可
2、以从广义和 狭义两个方面进行诠释: 广义的大数据概念,除了大数据技术及其应用 之外,还包括大数据工程和大数据科学。 狭义的大数据概念,主要是指大数据技术及其 应用,是指从各种各样类型的数据中,快速获得有 价值信息的能力。 5 大数据的特点可以总结为4个“V”,即体量浩 大(Volume)、模态繁多(Variety)、生成快速 (Velocity)、价值巨大(Value)。 6 大数据主要来自于:人们在互联网活动中,以 及使用移动互联网过程中,所产生的各类数据, 包括文字、图片视频等信息,各类计算机信息系 统产生的数据,以及各类数字设备所采集的数据, 如摄像头产生的数字信号、医疗物联网中产生的
3、人的各项特征值、天文望远镜所产生的大量数据 等。 7 二、大数据的关键技术 大数据的处理技术主要包括数据的采集、管理、 分析与展示技术。具体来说,大数据的关键技术主 要包括两个方面:非关系数据管理技术和云计算技 术。 一方面,关系数据库技术(RDBMS)经过了 将近40 年的发展,成为一门成熟的、同时仍在不断 演进的主流数据管理和分析技术。 8 但是,关系数据管理技术在大数据时代丧失了互 联网搜索这个机会,其主要原因是关系数据管理系统 (并行据库)的扩展性遇到了前所未有的障碍,不能 胜任大数据分析的要求。在这种情况下,非关系数 据管理技术应运而生。 代表性的技术主要包括“映射归约”(Map R
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 宋词元曲经典的解读与传播
限制150内