2016年中国数据驱动型互联网企业大数据产品研究报告.pdf
《2016年中国数据驱动型互联网企业大数据产品研究报告.pdf》由会员分享,可在线阅读,更多相关《2016年中国数据驱动型互联网企业大数据产品研究报告.pdf(92页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 中国数据驱动型互联网企业大数 据产品研究报告 2016年 2 内容综述 聚焦网络媒体大数据,研究其体系架构及相关产品 发展阶段:从信息驱动向数据智能驱动 进阶; 产业结构:由数据源、技术服务及应用 类型共同构成; 数据来源:企业自有数据是主流数据源, 数据的流通和共享将成趋势; 数据管理:数据挖掘与可视化成行业热 点,数据管理向垂直行业分化; 分析处理:文本、图像、语音分析相对 成熟,视频分析存在探索空间; 应用类型:从独立数据产品向完整行业 解决方案发展,定制化将成趋势。 优势体现:互联网基因有利于大数据的 获取与处理; 现状分析:互联网行业是大数据应用的 领跑者。1)已上市互联网企业中,
2、以 BAT为首的数据驱动型媒体整体表现较 好;2)未上市互联网企业中,数据驱动 型企业成为领跑者; 机遇:1)手机网民持续增长,可采集群 体更加广泛;2)移动端使用时长占比超 77%,信息采集更加丰富连贯;3)场景 化特征为大数据发展带来新契机; 挑战:屏幕变小、行为碎片化对大数据 的应用提出更高要求。 海外发展:1)企业技术探索先行, 政策推动产业发展进程;2)将自 主研发与投资收购相结合,技术推 动企业发展; 优势体现:具有强媒体属性的网络 服务的发展策略相对成熟; 现状分析:中国网络媒体的数据生 态系统雏形已成,多维度输出大数 据能力; 发展策略:大媒体以流量+广告服 务为起点,推进产业
3、生态形成。 本报告将聚焦于中国网络媒体,研 究其大数据体系架构及相关产品, 探讨大数据发展趋势。 大数据 Data 来源:艾瑞咨询研究院自主研究及绘制。 2016.12 iResearch Inc 互联网大数据 Internet 网络媒体大数据 Media 3 中国大数据产业现状分析 1 中国网络媒体大数据产业分析 2 中国网络媒体大数据企业分析 3 中国网络媒体大数据的机遇与挑战 4 4 大数据定义与特征 4V:数据规模大,数据流转快,数据类型多,价值密度低 抽样数据 全量数据 精确数据 混杂数据 因果关系 相关关系 数据类型多 除了以文本为主的结构化数据、 以网页数据为代表的半结构数据,
4、 也存在大量网络日志、音频、视 频、图片、地理位置信息等非结 构化数据。 Variety 数据流转快 1秒定律:要在秒级时间范围内 给出分析结果,超出这个时间, 数据就失去价值了。 Velocity 大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。为了适应数据量的爆发式增长, 数据处理方式正逐步向全量性、混沌性及相关性发展。为了避免信息损失,越来越多的场景倾向于对全量数据进行挖掘与 分析,其中,只有一小部分数据是结构化的,而非结构化数据中同样蕴含着大量信息,因此,能够处理各式各样的混杂数 据的大数据技术得到了广泛应用和迅速发展。其中,占据着重要地位的大数据预测分
5、析,也从主要基于因果关系进行分析 发展成了建立在相关关系的基础上的分析模式。 Volume 数据规模大 IDC预计,到2020年,全球新建 和复制的信息量将达到44ZB, 中国数据量将超过8ZB。 Value 价值密度低 海量数据中,如何通过强大的机 器算法,更迅速有效地完成数据 的价值“提纯”,已成为目前大 数据背景下亟待解决的难题。 来源:艾瑞咨询研究院自主研究及绘制。 2016.12 iResearch Inc 5 大数据集成与存储 数据仓库基于企业整体建立,是大数据集成和存储的基础 作为大数据集成与挖掘的基础,数据仓库是在企业范围内共享准确一致的集成数据、针对分析需求进行数据重组的工
6、具, 基于整个企业的数据模型建立。而数据集市基于单个部门或业务主题建立,为部门业务运行提供数据服务,可以根据仓库 建设也可以独立建设,形成从属数据集市和独立数据集市。所有的从属数据集市都从属于同一个数据仓库,各子系统的数 据均能保持一致。而每个独立数据集市都从各源应用环境中单独提取数据,独立拥有硬件平台、软件平台、数据和应用程 序,彼此没有任何约束,无法保证数据的一致性,从长远来看,既不稳定也不可行。 数据仓库能够对海量数据进行集成,满足大数据发展对数据存储的需求,为企业提供局部解决方案和全面解决方案。 注释: ETL是指从源系统中提取数据,清洗、转换数据为一个标准的格式,并加载数据到目标数据
7、存储区(通常是数据仓库)的工具。 来源:艾瑞咨询研究院自主研究及绘制。 2016.12 iResearch Inc 按照某一特定部门的 决策支持需求而组织 起来的、针对一组主 题的应用系统。 面向主题、集成、不可 更新且随时间不断变化 的数据集合,用来支持 管理人员的决策。 源应用环境 从属数据集市 独立数据集市 Data Warehouse 数据仓库 数据集市 Data Mart 数据源 ETL 数据 仓库 数据 集市 终端 用户 大数据处理的数据价值流转过程 数据仓库与数据集市工作原理示意 6 大数据产业生态 产业结构由数据源、技术服务及应用类型共同构成 如:精准化营销 搜索引擎精准营销
8、 RTB实时竞价广告 重定向精准营销 如:互联网金融 高频交易 社交情绪分析 信贷风险分析 大数据 Big Data 数据源 Data Source 官方数据 行业数据 企业数据 第三方数据 技术服务 Technical Services 应用类型 Application Types 数据准备 存储管理 计算处理 分析技术 可视化 解决方案 智慧城市 智慧政务 智慧社区 智慧旅游 工具/产品化服务 精准营销 个性化推荐 舆情监测 网站/App分析工具 行业应用 电信行业 金融行业 医疗行业 电商行业 如:智慧农场 生长监测 产量预测 农业预警 数据挖掘 来源:艾瑞咨询研究院自主研究及绘制。 2
9、016.12 iResearch Inc 大数据产业结构示意图 7 行业应用 按类型 数 据 交 易 大数据产业图谱 工具/产品化服务 解决方案 舆情监测 网站/App分析工具 精准营销 征信 电信 医疗 娱乐 (城管) (社区) (农业) 智慧政务 智慧公安 智慧城市 行业联盟 官方数据 地理、水利、卫星、气象等 第三方数据服务 基础数据 信息类 关系类 注释:此大数据产业链地图为示意图,未将所有企业标出,举例企业顺序不涉及排名,按企业中文名称首字母排列。如有分类不当,请联系:。 企业数据 数 据 应 用 数 据 来 源 金融 房地产 物流 天气 地图服务 农业 体育 教育 人力资源 能源
10、 旅游 交通 数 据 安 全 图像分析 语音分析 文本分析 视频分析 计算处理 可视化 全技术支持 数 据 管 理 数 据 分 析 数据挖掘 BI 按数据类型 AI 按应用类型 数据集成 云存储 数据存取 交易类 按行业 金融 医疗 交通 物流 旅游 体育 娱乐 能源 建筑 农业 个性化推荐 贵阳、上 海、东湖 等大数据 交易中心 8 大数据产业图谱 大数据应用广泛,价值升级来源于数据流通及共享 数 据 应 用 数 据 分 析 数 据 管 理 数 据 来 源 应 用 类 型 分 析 技 术 基 础 架 构 数 据 源 应 用 存 储 、 分 析 、 挖 掘 、 可 视 化 收 集 / 采 集
11、目前数据来源已较为多元,维度也越加丰富,尤其是互联网行业,在数据深度与广度方面具有天然优势,而物 联网、车联网等的出现丰富了数据的采集方式与采集范围。 应用情况:目前企业内部的数据打通已成行业趋势,未来将进一步实现行业内外的数据流通乃至共享。 价值体现:1)大数据能够对人群进行细化管理,并提高对特定人群的覆盖率;2)数据价值的实现与其鲜 活度相关;3)大数据的核心价值不在于数据量大,而在于通过数据的沉淀与应用产生价值,其价值升级来 源于数据的流通和共享。 大数据基础架构包括多种数据库及相关分析计算技术,能够支持数据的采集、清洗、集成、存取、分析、挖掘 等环节,从功能角度来看,除传统的数据处理过
12、程外,可视化分析等分析服务也是基础架构的一环。 应用情况:企业(含互联网企业)的数据相关部门(如数据中心/数据分析平台/数据商业部等),主要通 过对数据的管理、分析及整合,服务于自有业务,同时不断拓展应用类型和范围。 价值体现:大数据处理过程中流转的数据形态可划分为静态数据和动态数据,主要通过计算过程实现其价 值,其中,模型算法为数据深度挖掘的核心,能够实现预测等功能。 大数据应用已渗透电信、金融、医疗、人力资源、物流、天气等多个行业,从产品角度来看,除传统的工具/ 产品化服务、行业应用及解决方案外,大数据应用也包括商业智能等分析服务。 应用情况:目前大数据应用的主要输出形式是可视化报表,未来
13、将在功能方面进一步融合提升。 典型大数据行业应用: 物流:优化整体运输流程,实现实时查询把控。 营销:应用形式成熟落地,既提高了用户对目标商品的获取效率,又改善了商家的投放效果。 产品 功能 流程 来源:艾瑞咨询研究院自主研究及绘制。 2016.12 iResearch Inc 数据应用 数据管理与分析 数据来源 概述:本报告的大数据产业图谱以大数据产品的角度出发,对产业链角色进行划分。其中,数据管理与数据 分析部分包括了大数据基础架构及相关分析技术,能够实现大数据的存储、分析、挖掘、可视化等环节。而 在数据源与数据应用方面,从功能和流程角度来看具有高度的关联性及一致性,涉及行业极其广泛。
14、9 产业链:数据来源 企业自有数据是主流数据源,数据的流通和共享将成趋势 注释:企业数据的数据类型主要可以分为四类,分别是基础类(LBS/设备等),信息类(搜索/浏览数据),交易类(网购/O2O),关系类(社交等)。 来源:艾瑞咨询研究院自主研究及绘制。 2016.12 iResearch Inc 数据来源 Data Sources 近年来,官方数据开放程度提高,行业联盟兴起,第三方数据服务蓬勃发展,各大企业(以互联网核心 企业为主)也开始逐步开放群体画像数据,单一数据的跨界融合放大了其价值。但目前大数据应用的数 据源仍以企业自有数据为主。整体来看,数据产生量爆炸式增长,可分析的数据维度越来
15、越丰富。 尚未形成完善统一的监管政策与行业规则,企业之间的数据孤岛情况仍然存在。数据交易方面,数据交 易模式与数据资产定价标准有待建立,发展程度尚不成熟。 艾瑞分析认为,大数据行业的发展将在政策法规和行业自律的约束下,从探索期步入高速发展的成熟期; 在市场客观需求的驱动下,数据的流通和共享将成为趋势。 1)发展现状 2)主要困局 3)前瞻视点 伴随着数据资源价值逐步得到认可,数据流通的需求不断上升,除企业直接合作外,数据交易市场开始出现,建立数据需求方与供给 方之间成规模化的联系。而数据的开放需要多方助力,数据的流通与分享能够为大数据的价值提升赋能,尤其在经济价值和社会价值 方面会有较大提升。
16、 行业数据 第三方数据 企业自有数据 数据交易 官方数据,包括国家统计局、工信部等及国家地 理、水利、卫星、气象等部门发布的公开数据 行业联盟数据等 运营商数据 第三方机构数据 包括CRM、ERP数据等企 业内部数据,以及投资并 购企业的相关数据 外部企业数据 主要通过企业合作、数据 交易等方式获取,形式多 样,来源广泛 10 产业链:数据管理(1/2) 数据管理囊括从数据收集到应用的全过程,且外延仍在拓展 包括数据采集、清洗、转换、 集成等环节,从业务过程中提 取多数据类型的数据信息,转 化为便于计算和存储的形式。 数据准备 存储管理 计算处理 数据挖掘 可视化 数据安全 包括数据存取、云存
17、储等方面。 数据量爆发式增长,数据存储由 集中式向分布式发展,提高存取 效率,同时易于扩展。 以可读形式展现数据结果,在人与大数据系统间传递、交换信息。 交互形式越发丰富,降低了大数据的使用门槛。 包括大数据查询分析计算、批 处理计算、流式计算等多种计 算需求。此外,云计算极大提 升了对大数据的处理能力。 伴随着数据量的增加,数据 安全的重要性越发凸显,既 包括外来黑客攻击防护,也 包括用户个人信息管理。 来源:艾瑞咨询研究院自主研究及绘制。 2016.12 iResearch Inc 基于不同的数据类型和格式提出的数据挖掘算法能够更科学地呈现 数据本身的特点,实现预测等更深入的分析需求。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2016 年中 数据 驱动 互联网 企业 产品 研究 报告
限制150内