融媒环境下大数据平台的建设及应用.docx
《融媒环境下大数据平台的建设及应用.docx》由会员分享,可在线阅读,更多相关《融媒环境下大数据平台的建设及应用.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、融媒环境下大数据平台的建设及应用宋雪姣【摘要】融媒环境下,利用成熟的大数据技术实现传统媒体与新 兴媒体的融合,完成传统媒体向智慧媒体的转型是传统广电媒体的必 经之路。本文从广播电视大数据平台现状及平台建设模块入手,讨论 大数据技术在媒体融合下的应用,并对未来做出展望。【关键词】大数据;广电大数据平台;媒体融合随着全国广播电视系统媒体融合工作的推进,整合现有网络传播 渠道和行业资源,结合自身优势加强内容制作和融媒体渠道传播,已 逐渐成为各级融媒体中心建设的规定动作。媒体机构开展融媒离不开 数据的支撑,各级广播电视(以下简称“广电”)媒体拥有自己的大 数据平台是开展融媒的必要步骤。随着大数据在地方
2、融媒体工程中的 应用越来越成熟,多家地方传统媒体和新兴的媒体机构都利用大数据 实现了自己的个性化转型1。一、媒体环境下大数据平台的开展现状2022年,我国出台的关于加快推进媒体深度融合开展的意见 指出,要以互联网思维优化资源配置,做大做强网络平台,占领新兴 传播阵地2。融媒大数据平台是推动媒体融合开展的重要板块,也 是建设智能媒体的必要条件之一。媒体机构的成功转型离不开数据,特别是内部与外部数据之间的 交互尤为重要。大数据的价值表达在数据的量上,数据越多价值也越 高。数据是实时更新的,这增加了数据的用途。随着技术的开展,媒 体的传播方式进入数字化和智能化的时代。在融媒体转型过程中,各 级媒体机
3、构认识到大数据平台的重要性。2022年12月,“南方+”首个用户画像正式出炉,通过大数据 分析对“南方+”客户端所有用户进行定量分析研究后,推出第一份 数据报告中国移动端新闻资讯头部用户内容消费洞察报告。通过 这个调查报告,可以了解“南方+”用户的内容偏好、消费偏好、用 户时间分配等信息,把握该群体用户的行为特征,从而有针对性地调 整产品内容、推广策略和服务方式,提高数据运营决策分析水平。江 苏有线视界观APP通过大数据系统支撑前端APP业务运营。采用用户 数据采集、用户分析、用户触达等大数据技术辅助用户运营,对前端 用户增长带来持久动力。截至2022年10月,江苏有线视界观APP用 户到达百
4、万级,日均活跃用户数位列江苏省级APP第一位。黄河云视 APP充分利用大数据用户运营平台及工具,构建起从用户数据采集、 用户属性分析、智能内容推荐的全流程内容推荐和用户运营体系,自 2022年10月投入试运行以来,黄河云视APP的日活用户实现高速增 长。同时央视频也通过多样化的用户分析工具对活动前、活动中、活 动后的运营活动进行分析,使用户运营业务得到快速增长和提升。 2022年10月,央视频“人民方队,阅兵有我”的H5主题筹划上线, 这是央视频的首次亮相。来自全球150多个国家和地区、国内390多 个城市的超3000万人参加这次活动,在线直播人数峰值300万+。2022 年8月,东京奥运会期
5、间,央视频赛事视频观看量累计达25. 8亿人 次,单日视频观看突破3亿人次,播放量达39亿次。由此可见,大数据平台在融媒开展中发挥着重要的作用。如何应 用相关技术,利用互联网思维优化资源配置,是传统广电融媒开展需 要思考的问题。二、广电大数据平台的建设融媒体持续建设和深入开展与大数据密不可分,业务数据化、数 据业务化是其与传统广播电视传播最主要的区别。大数据平台的数据 来源主要由用户数据、业务数据和互联网数据等三个主要来源构成; 结合实际应用,广电大数据平台应该包括以下局部:数据采集、数据 清洗、智能分析,通过这些模块实现数据的收集与分析。(一)数据接入及采集数据接入功能具备从不同数据源(结构
6、化数据、非结构化数据) 将所需要的数据按照要求进行收集与提取,同时也可以在一定程度上 完成数据的转换。现有的融媒数据采集和接入分为离线数据接入和把 不同来源、格式的数据通过ETL (数据仓库技术)过程在物理上整合 后进行集中性存放,形成规范的数据存储。离线数据接入的主要目的 是将一些不经常更新的数据,按照要求或规那么,定时地将数据同步到 后台,同时进行数据处理和清洗;对来源数据和清洗后的数据进行检 查,保证加载后的数据的一致性和正确性;将清洗后的数据加载到数 据仓库中。实时数据接入提供基于消息中间件的实时数据接入服务, 通过可视化的配置消息队列的参数可以支持外部代码写入,并提供任 务监控功能帮
7、助用户了解目前实时数据生产和消费情况。实时数据计 入主要包括以下功能:快速高效使用、实时数据报警、多源多目的地。(二)数据存储与查询支持已建设融媒体平台用户数据和运营数据的导入和数据存储, 支持对已发布运营活动的运营数据的批量计算与实时查询,为用户运 营活动的实时调整和更新提供数据依据和保证。大数据平台的存储数 据为结构化数据、半结构化数据、非结构化数据,存储方式是基于 Hadoop (分布式系统基础架构)的分布式存储方案。结构化数据存储 于Hive (数据仓库工具)建立大数据仓库,半结构化数据基于列存 储HBase(开源数据库)实现,非结构化数据根据实际需要可提供HDFS(云存储)存储。HD
8、FS (云存储)是一种分布式文件存储系统,与传统的文件系统 相同,用户可以在其中创立目录和文件,也可以对目录和文件进行删 除和移动。Hive (数据仓库工具)把存储在HDFS (云存储)之上的 结构化数据抽象成关系型数据表,并提供SQL (结构化查询语言)接 口对数据表做查询操作。因此,用户能够以传统关系型数据库的方式 来查询大数据存储系统,可以通过Hive (数据仓库工具)来实现SQL (结构化查询语言)查询分析。(三)数据分析与用户标签大数据平台需具备数据分析的功能,该功能通过特定的SQL (结 构化查询语言)语句查询,实现用户数据的多样可视化展现。此外, 需要具备多种数据分析模型,包括但
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 环境 数据 平台 建设 应用
限制150内