GY∕T 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求(广播电影电视).pdf





《GY∕T 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求(广播电影电视).pdf》由会员分享,可在线阅读,更多相关《GY∕T 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求(广播电影电视).pdf(26页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 GY 中华人民共和国广播电视和网络视听行业标准 GY/T 339.22020 有线电视网络大数据技术规范 第 2 部分:平台要求 Technical specification for CATVs big data Part 2:Platforms requirements 2020-12-22 发布 2020-12-22 实施 国家广播电视总局 发 布 GY/T 339.22020 I 目 次 前言.II 引言.III 1 范围.1 2 规范性引用文件.1 3 术语和定义.1 4 缩略语.2 5 概述.3 6 数据核心子系统技术要求.4 6.1 数据采集接入.4 6.2 数据存储.5 6.
2、3 数据处理.7 6.4 数据分析.9 6.5 数据展示.13 6.6 数据开放.14 6.7 资源管理.14 7 基础资源子系统技术要求.15 8 安全运行子系统技术要求.15 9 运行维护子系统技术要求.15 9.1 概述.15 9.2 运维能力和支撑保障.16 9.3 运维操作.16 9.4 运维过程管理.16 附录 A(资料性)大数据参考体系架构.18 参考文献.20 GY/T 339.22020 II 前 言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。本文件为GY/T 339有线电视网络大数据技术规范的第2部分。GY/T 339
3、已经发布了以下部分:第 1 部分:通用要求;第 2 部分:平台要求;第 3 部分:数据规则。请注意本文件的某些内容可能涉及专利。本文件发布机构不承担识别这些专利的责任。本文件由全国广播电影电视标准化技术委员会(SAC/TC 239)归口。本文件起草单位:国家广播电视总局广播电视规划院、中国电子技术标准化研究院、广州市诚毅科技软件开发有限公司、浩鲸云计算科技股份有限公司、北京东方国信科技股份有限公司、华数数字电视传媒集团有限公司、国家广播电视总局广播电视科学研究院、重庆有线电视网络股份有限公司、中国广播电视网络有限公司、北京歌华有线电视网络股份有限公司、广东省广播电视网络股份有限公司、湖北省广播
4、电视信息网络股份有限公司、河北广电无线传媒有限公司、深圳市天威视讯股份有限公司、陕西广电网络传媒(集团)股份有限公司、陕西广信新媒体有限责任公司、贵州省广播电视信息网络股份有限公司、江苏省广电有线信息网络股份有限公司、北京邮电大学、北京海致星图科技有限公司、广西广电大数据科技有限公司、新疆广电网络股份有限公司。本文件主要起草人:余英、韦安明、吴钟乐、张群、刘智、王帅、刘敬玉、唐志燕、李庆国、聂明杰、邓向冬、曹志、王倩男、赵明、赵士原、欧阳峰、杨旭、沈文、唐永壮、董彬、刘军霞、胡其权、刘彦鹏、柳涛、杨晨、王洪波、王飞、梅杨、唐昊、陈昕、尹卓、曹燕明、诸葛海标、胡暐宸、张玮、刘晓敏、王欣然、曹阳、
5、李海波、鞠宏、付晶、赵良福、苟明宇、杨敬一、王季友、刘艺兰、张城瑞、周传淯、傅力军、王瑶、范斐、孙嘉阳、张琦、陶宛昌、张君、王士刚、杨娟、郑璐、林昕、李文、涂均、吕燕、刘波、彭宇涛、杨斌。GY/T 339.22020 III 引 言 GY/T 339有线电视网络大数据技术规范规定了有线电视网络大数据技术规范的通用要求,包括大数据系统和数据服务的功能、性能、接口、安全等方面的要求,适用于有线电视网络大数据系统和业务的规划、设计、实施、验收、升级改造和运行维护。GY/T 339共有三个部分。各部分简述如下。第 1 部分:通用要求。规定了有线电视网络大数据系统和数据服务的功能、性能、接口、安全等方面
6、的要求。第 2 部分:平台要求。规定了有线电视网络大数据平台的结构和技术要求。第 3 部分:数据规则。规定了有线电视网络大数据的数据源、数据内容和数据表达规则。GY/T 339.22020 1 有线电视网络大数据技术规范 第 2 部分:平台要求 1 范围 本文件规定了有线电视网络大数据平台的结构和技术要求,还规定了对有线电视网络大数据采集、接入、存储、处理、分析、展示和开放服务的技术要求。本文件适用于有线电视网络数据的采集、接入、存储、处理、分析、展示和开放服务,还适用于指导有线电视网络运营机构开展大数据平台的规划设计、实施、升级改造和运行维护。2 规范性引用文件 下列文件中的内容通过文中的规
7、范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 222392019 信息安全技术 网络安全等级保护基本要求 GB/T 352952017 信息技术 大数据 术语 GB/T 355892017 信息技术 大数据 技术参考模型 GB 501742017 数据中心设计规范 GY/T 3372020 广播电视网络安全等级保护定级指南 GD/J 0752018 电视收视数据交换接口规范 3 术语和定义 GB/T 352952017界定的以及下列术语和定义适用于本文件。3.1 大数据 bi
8、g data 具有体量巨大、来源多样、生成极快、多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。来源:GB/T 352952017,定义2.1.1 3.2 大数据参考体系结构 big data reference architecture 一种用作工具以便于对大数据内在的要求、设计结构和运行进行开放性探讨的高层概念模型。来源:GB/T 352952017,定义2.1.3 3.3 数据中心 data center GY/T 339.22020 2 由计算机场站(机房)、机房基础设施、信息系统硬件(物理和虚拟资源)、信息系统软件和信息资源(数据)等组成的实体。3.4 大数据平台
9、 big data platform 以大数据参考体系结构为基础的数据中心系统,在本文件中,指集成了大数据采集接入、存储、处理、分析、共享,以及各类配套功能组件及基础设施的数据处理系统。3.5 数据采集终端 data collection terminal 一种部署在数据生成节点的、实现数据规范收集汇总和处理的软件组件或实体设备。3.6 大数据系统 big data system 以大数据参考体系结构为基础的数据处理系统,在本文件中,指由大数据平台、数据源、数据采集终端、网关,以及相关辅助等功能组件构成的数据处理系统。来源:GB/T 352952017,定义2.1.14。3.7 元数据 met
10、a data 一种带有数据类型、编码、名称、业务描述等属性的,可用于描述数据产品特征的数据单元。3.8 框架 framework 一种由数据的采集、接入、存储、处理、分析、服务等功能组件构成的集合。4 缩略语 下列缩略语适用于本文件。API 应用程序编程接口(Application Programming Interface)BSS 业务支撑系统(Business Support System)CEP 复杂事件处理(Complex Event Processing)CPU 中央处理器(Central Processing Unit)GPU 图形处理器(Graphic Processing Un
11、it)HDD 硬盘驱动器(Hard Disk Drive)IO 输入输出(Input and Output)MPI 消息传递接口(Message-Passing-Interface)MSS 管理支撑系统(Management Support System)NoSQL 非关系型的数据库(Not only SQL)OLAP 在线分析处理(On-Line Analysis Processing)OSS 运营支撑系统(Operation Support System)RAID 独立磁盘冗余阵列(Redundant Arrays of Independent Drives)SQL 结构化查询语言(Str
12、uctured Query Language)GY/T 339.22020 3 SSD 固态盘(Solid State Disk)XML 可扩展标记语言(Extensible Markup Language)5 概述 大数据平台实现对运营机构经营和系统运行维护过程中产生的各类大数据的采集、接入、处理、存储、分析、展示、共享和管理,为大数据消费者提供数据和服务,以及为运营机构间的数据交换提供统一接口。图1采用GB/T 355892017中关于大数据参考体系架构的定义,采用角色、活动、组件等逻辑构件描述有线电视网络大数据平台(以下简称大数据平台或平台)的组成和业务逻辑。关于大数据参考体系架构,以及
13、角色、活动、组件的描述见附录A。采集接入框架计算框架大大数数据据平平台台组件组件活动活动图例:角色角色物理安全物理安全通信安全通信安全边界安全边界安全计算安全计算安全安全运行业务安全业务安全基础配套机房设施机房设施计算资源计算资源存储资源存储资源网络资源网络资源批量采集批量采集实时采集实时采集输入API输入API输出API输出API采集与IO采集监控采集监控采集展示采集展示监控展示采集配置采集配置数据源配置数据源配置配置管理流处理流处理数据处理内存计算内存计算批处理批处理图计算图计算批流混合计算批流混合计算离线分析离线分析数据分析交互式分析交互式分析流式分析流式分析支撑组件支撑组件系统资源管理
14、资源管理框架等保定级等保定级定级测评定级测评等保管理能力建设能力建设例行操作例行操作运维管理运维管理运维管理服务开放数据展示数据展示服务能力展现/申请/运营服务能力展现/申请/运营大数据应用精准营销精准营销精细服务精细服务精确管理精确管理精益网运精益网运收视评价收视评价门户服务门户服务企业合作数据共享企业合作数据共享.有线电视网络大数据源MSS域数据MSS域数据BSS域数据BSS域数据其他其他OSS域数据OSS域数据.数据上报平台侧数据平台侧数据元数据格式转换元数据格式转换数据服务框架抽取抽取预处理转换转换清洗清洗加载加载文件系统文件系统数据存储列式数据库列式数据库关系数据库关系数据库图数据库
15、图数据库数据开放数据开放资源管理子系统子系统运行维护子系统运行维护子系统安全运行子系统安全运行子系统基础基础资源资源子系统子系统数数据据核核心心子子系系统统系统安全系统安全元数据管理数据资源管理网关数据流 图1 大数据平台示意图 大数据平台由数据核心子系统、基础资源子系统、安全运行子系统和运行维护子系统组成。数据核心子系统是大数据平台的核心组成部分,由数据采集接入、数据存储、数据处理、数据分析,数据服务、资源管理等框架组成,负责实现数据输入、计算处理和输出功能,以及对外开放大数据平台的数据服务功能。基础资源子系统为大数据平台提供机房、计算资源、存储资源、网络资源等基础服务,安全运行子系统和运行
16、维护子系统为数据处理提供基本保障。大数据平台应支持采集、接入、处理运营机构的BSS、OSS、MSS数据,广告、媒资、用户收视行为、用户体验数据,以及网管、门户网站等数据,具体支持的数据内容如图2所示。上传到大数据平台的数据,其格式和交互方式应与GY/T XXX.1XXXX的要求相符,例如大数据平台应具备采集接入符合GD/J 0752018要求的数据。GY/T 339.22020 4 有线电视网络数据源BSS域数据OSS域数据MSS域数据其他数据客户关系管理数据综合计费账务数据合作伙伴管理数据统一用户认证数据呼叫中心/客服数据服务开通管理数据综合运维管理数据网络监控管理数据综合资源管理数据人力资
17、源管理数据采购与仓储管理数据项目管理数据财产管理数据协同办公数据用户收视行为数据媒资数据广告数据用户体验数据用户宽带行为数据用户自助渠道数据.图2 数据内容 6 数据核心子系统技术要求 6.1 数据采集接入 6.1.1 基本要求 要求如下:a)应支持结构化数据、半结构化数据、非结构化数据的批量导入;b)宜支持从文件服务器的多个目录并发导入数据;c)应支持离线数据导入功能,延时应不超过 24h;d)应支持实时采集;e)应支持定时采集,如可根据预设的频率(小时、天等),自动对选定的数据源进行增量或者全量采集或导入;f)应支持对采集对象进行远程配置,如远程设置采集对象的采集频度、采集时间、采集数据量
18、等;g)应支持采集对象的注册、发布、使用授权、变更、注销等管理;h)应支持手动控制采集任务的执行过程;i)宜支持图形化的数据导入配置界面。6.1.2 输入输出 API 要求如下:a)应为数据采集终端或网关提供数据输入 API;b)应为计算框架提供数据输出 API。6.1.3 采集接入监控 要求如下:a)应支持监控采集对象的运行状态;b)应支持监控釆集网络的运行状态,如采集对象所在网络的通断;c)应支持监控采集任务的执行情况,如支持了解采集任务执行时间、任务进度、已采集数据量等;d)应支持监控采集服务器 CPU、内存、硬盘和网络适配器的使用情况,如果采集服务器部署在虚拟机中,应支持监控虚拟机的
19、CPU、内存、硬盘和网络适配器的使用情况;GY/T 339.22020 5 e)应支持监控采集任务队列状态;f)应支持异常情况预警,包括采集任务执行失败、采集节点状态异常、网络异常等;g)应支持通过任务状态分析、数据完整性分析等方法监控非联网设备的数据采集情况;h)应支持可定制的监控告警,如提供电子邮件、短信、智能终端 APP 等告警方式;i)监控应不影响釆集任务的正常执行;j)宜图形化展示监控数据。6.1.4 性能要求 要求如下:a)采集接入实时数据时,应具备实时接入全网实时数据的能力,并在不超过 3s 内将接收的实时数据存入大数据平台的数据存储系统;b)采集接入 BSS 离线数据时,应具备
20、 1h 内完成当日增量数据接入的能力;c)采集接入 OSS 离线数据时,应具备 1h 内完成当日增量数据接入的能力;d)采集接入 MSS 离线数据时,应具备 1h 内完成当日增量数据接入的能力;e)采集接入其他离线数据时,应具备 1h 内完成当日增量数据接入的能力。6.2 数据存储 6.2.1 基本要求 要求如下:a)应支持存储结构化数据、半结构化和非结构化数据;b)应支持数据上传、数据下载、目录查看、目录创建、目录删除、权限修改等操作;c)应具备标准、开放的数据访问 API,以支持对数据的操作;d)应支持对用户访问进行授权;e)应具备数据加载工具或功能,使系统和关系型数据库、其他文件系统之间
21、可进行数据和文件交换;f)应支持存储调度,可按用户计划对存储节点的迁移、扩容、复制、更改、删除等进行自动操作;g)应支持文件分级存储,如单机级、跨服务器级、跨机柜级、跨数据系统级;h)应支持为用户设置不同的数据存放策略;i)应支持为单个用户提供逻辑存储空间;j)应在多用户之间设置数据隔离机制;k)应支持在数据源端去重处理;l)应支持表管理功能;m)应支持负载均衡,负载均衡切换过程中,业务应不中断;n)应支持对关系型数据库的不同数据实例制定独立的数据备份策略;o)宜支持数据自动备份和手动备份;p)宜支持数据批量更新、删除等数据管理操作;q)宜支持流式实时数据入库和实时查询。6.2.2 文件系统
22、要求如下:a)应支持文件的上传、下载、读写、复制、移动、删除、访问控制等;b)应具备文件容错机制和系统高可用机制,包括数据块备份、系统快速恢复等功能;GY/T 339.22020 6 c)应支持文件数据的校验和同步,保证数据的完整性与一致性;d)应支持分布式文件系统的弹性扩展,支持节点动态添加和删除;e)应支持压缩和加密存储的数据;f)应支持快速检索,如数据资源的统一检索、编目、增加和删除;g)应支持文件的搜索、批量操作、回收站、快照;h)宜支持小文件打包为大文件集中存储;i)宜支持存储配额管理,可基于目录存储空间及文件数量进行配额控制;j)宜支持分级存储的功能,如根据数据的使用热度、时延要求
23、等特性将数据分别存储在 SSD、HDD等介质中。6.2.3 数据库支持 6.2.3.1 关系数据库 要求如下:a)应支持结构化数据存储机制,实现数据存储的可扩展性;b)应支持多表关联;c)应支持数据存储一致性检查,实现数据的完整性与一致性;d)宜支持行列混合存储,支持表按行或列格式组织存储;e)宜支持行列转换。6.2.3.2 列式数据库 要求如下:a)应支持以键值形式进行数据存储;b)应支持基于表、列族和列的用户权限管理,权限管理操作包括读、写、创建等;c)应支持对数据库中的列进行加密;d)应支持数据的备份与恢复,包括库级别的备份和恢复,并提供备份恢复进展、历史记录查看等功能;e)宜支持多级索
24、引;f)宜支持将多个具有类似功能或存在关联关系的业务表进行合并存储。6.2.3.3 图数据库 要求如下:a)应支持由节点及边组成的数据模型;b)应支持图查询、图遍历、图分析、图挖掘等;c)应支持主流开发接口;d)应支持单节点、多节点多层关系扩线查询,支持广度优先、深度优先、最短路径、最优路径遍历搜索算法;e)宜支持顶点、属性的继承操作;g)宜支持长任务异步会话机制。6.2.4 性能要求 要求如下:a)列式数据库存储,实时处理响应时间应小于 1s,一亿条记录的批处理响应时间应小于 10s;GY/T 339.22020 7 b)缓存数据库,响应时间应小于 10ms,IO 能力应不小于 10000
25、条每秒;c)负载均衡切换时间应小于 10s;d)存储处理设备 CPU 忙时平均利用率宜小于 70%;e)存储处理设备内存忙时平均利用率宜小于 80%;f)底层存储的冗余保护能力应不低于 RAID“0+1”方式;g)恢复备份系统中的数据库时,恢复时长应小于 6h;h)备份数据库到备份系统时,每天的备份时间应小于 6h。6.3 数据处理 6.3.1 基本要求 要求如下:a)分布式数据库应支持 CPU、内存、GPU 等异构资源调度和配置;b)分布式数据库应支持计算框架的水平扩展;c)应支持任务优先级调度,能定义不同优先级的任务,使得后启动的高优先级任务能够获取运行中的低优先级任务释放的资源;d)应支
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GYT 339.2-2020 有线电视网络大数据技术规范 第2部分:平台要求广播电影电视 GY 339.2 2020 有线电视网络 数据 技术规范 部分 平台 要求 广播 电影电视

链接地址:https://www.taowenge.com/p-67535982.html
限制150内