GY∕T 339.1-2020 有线电视网络大数据技术规范 第1部分:通用要求(广播电影电视).pdf
《GY∕T 339.1-2020 有线电视网络大数据技术规范 第1部分:通用要求(广播电影电视).pdf》由会员分享,可在线阅读,更多相关《GY∕T 339.1-2020 有线电视网络大数据技术规范 第1部分:通用要求(广播电影电视).pdf(28页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 GY 中华人民共和国广播电视和网络视听行业标准 GY/T 339.12020 有线电视网络大数据技术规范 第 1 部分:通用要求 Technical specification for CATVs big data Part 1:General requirements 2020-12-22 发布 2020-12-22 实施 国家广播电视总局 发 布 GY/T 339.12020 I 目 次 前言.III 引言.IV 1 范围.1 2 规范性引用文件.1 3 术语和定义.1 4 缩略语.2 5 概述.2 6 数据采集接入要求.3 6.1 概述.3 6.2 基本要求.3 6.3 采集接入内容.
2、3 6.4 数据表达.4 6.5 性能要求.4 6.6 交互与接口.4 7 数据处理要求.4 8 数据开放与服务要求.4 8.1 功能要求.4 8.2 开放内容.5 8.3 数据表达.5 8.4 性能要求.5 8.5 交互与数据接口.5 9 数据服务安全要求.5 9.1 概述.5 9.2 数据采集环节.5 9.3 数据传输环节.6 9.4 数据接入平台环节.6 9.5 数据存储环节.6 9.6 数据处理环节.6 9.7 数据开放环节.6 9.8 接口安全.6 9.9 个人信息隐私保护.6 附录 A(规范性)数据采集上报的交互过程与接口要求.8 A.1 交互过程.8 GY/T 339.12020
3、 II A.2 接口.9 A.3 OAuth2 密码模式认证过程.13 A.4 设备注册过程.15 A.5 控制信令消息格式.16 A.6 文件数据上报.18 附录 B(规范性)大数据平台与应用系统的交互过程与接口要求.19 B.1 概述.19 B.2 认证接口.19 B.3 资源调用接口.20 参考文献.22 GY/T 339.12020 III 前 言 本文件按照GB/T 1.12020标准化工作导则 第1部分:标准化文件的结构和起草规则的规定起草。本文件为GY/T 339有线电视网络大数据技术规范的第1部分。GY/T 339已经发布了以下部分:第 1 部分:通用要求;第 2 部分:平台要
4、求;第 3 部分:数据规则。请注意本文件的某些内容可能涉及专利。本文件发布机构不承担识别这些专利的责任。本文件由全国广播电影电视标准化技术委员会(SAC/TC 239)归口。本文件起草单位:国家广播电视总局广播电视规划院、中国电子技术标准化研究院、北京邮电大学、广州市诚毅科技软件开发有限公司、浩鲸云计算科技股份有限公司、北京东方国信科技股份有限公司、华数数字电视传媒集团有限公司、国家广播电视总局广播电视科学研究院、重庆有线电视网络股份有限公司、中国广播电视网络有限公司、北京歌华有线电视网络股份有限公司、广东省广播电视网络股份有限公司、湖北省广播电视信息网络股份有限公司、河北广电无线传媒有限公司
5、、深圳市天威视讯股份有限公司、陕西广电网络传媒(集团)股份有限公司、陕西广信新媒体有限责任公司、贵州省广播电视信息网络股份有限公司、江苏省广电有线信息网络股份有限公司、北京海致星图科技有限公司、广西广电大数据科技有限公司、新疆广电网络股份有限公司。本文件主要起草人:余英、韦安明、吴钟乐、张群、王洪波、刘智、王帅、刘敬玉、唐志燕、李庆国、聂明杰、邓向冬、曹志、王倩男、赵明、赵士原、欧阳峰、杨旭、沈文、唐永壮、董彬、刘军霞、胡其权、刘彦鹏、柳涛、杨晨、王飞、郑璐、林昕、梅杨、唐昊、陈昕、尹卓、曹燕明、诸葛海标、胡暐宸、张玮、刘晓敏、王欣然、曹阳、李海波、鞠宏、付晶、赵良福、苟明宇、杨敬一、王季友、
6、刘艺兰、张城瑞、周传淯、傅力军、王瑶、范斐、孙嘉阳、张琦、陶宛昌、张君、王士刚、杨娟、李文、涂均、吕燕、刘波、彭宇涛、杨斌。GY/T 339.12020 IV 引 言 GY/T 339有线电视网络大数据技术规范规定了有线电视网络大数据技术规范的通用要求,包括大数据系统和数据服务的功能、性能、接口、安全等方面的要求,适用于有线电视网络大数据系统和业务的规划、设计、实施、验收、升级改造和运行维护。GY/T 339共有三个部分。各部分简述如下。第1部分:通用要求。规定了有线电视网络大数据系统和数据服务的功能、性能、接口、安全等方面的要求。第2部分:平台要求。规定了有线电视网络大数据平台的结构和技术要
7、求。第3部分:数据规则。规定了有线电视网络大数据的数据源、数据内容和数据表达规则。GY/T 339.12020 1 有线电视网络大数据技术规范 第 1 部分:通用要求 1 范围 本文件规定了有线电视网络大数据技术规范的通用要求,包括大数据系统和数据服务的功能、性能、接口、安全等方面的要求。本文件适用于有线电视网络大数据系统和业务的规划、设计、实施、验收、升级改造和运行维护。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 74082
8、005 数据元和交换格式 信息交换 日期和时间表示法(ISO 8601:2000,IDT)GB/T 352732017 信息安全技术 个人信息安全规范 GB/T 352952017 信息技术 大数据 术语 GY/T 339.22020 有线电视网络大数据技术规范 第2部分:平台要求 GY/T 339.32020 有线电视网络大数据技术规范 第3部分:数据规则 GD/J 0742018 电视收视数据元素集规范 GD/J 0752018 电视收视数据交换接口规范 IETF RFC 1952 GZIP文件格式规范4.3(GZIP file format specification version 4
9、.3)IETF RFC 3629 UTF-8,ISO 10646的一种转换格式(UTF-8,a transformation format of ISO 10646)IETF RFC 8259 JSON数据交换格式(The JavaScript Object Notation(JSON)Data Interchange Format)3 术语和定义 GB/T 352952017界定的以及下列术语和定义适用于本文件。3.1 大数据 big data 具有体量巨大、来源多样、生成极快、多变等特征并且难以用传统数据体系结构有效处理的包含大量数据集的数据。来源:GB/T 352952017,定义2.1
10、.1 3.2 大数据参考体系结构 big data reference architecture 一种用作工具以便于对大数据内在的要求、设计结构和运行进行开放性探讨的高层概念模型。来源:GB/T 352952017,定义2.1.3 GY/T 339.12020 2 3.3 数据中心 data center 由计算机场站(机房)、机房基础设施、信息系统硬件(物理和虚拟资源)、信息系统软件和信息资源(数据)等组成的实体。3.4 大数据平台 big data platform 以大数据参考体系结构为功能基础的数据中心系统,在本文件中,指集成了大数据采集接入、存储、处理、分析、共享,以及各类配套功能组
11、件及基础设施的数据处理系统。3.5 大数据系统 big data system 以大数据参考体系结构为基础的数据处理系统,在本文件中,指由大数据平台、数据源、数据采集终端、网关以及相关辅助功能组件构成的数据处理系统。来源:GB/T 352952017,定义2.1.14 3.6 数据采集终端 data collection terminal 一种部署在数据源实现数据规范收集汇总的软件组件或实体设备。3.7 OAuth2 The OAuth 2.0 Authorization Framework 通过该框架,允许第三方应用程序通过IETF RFC 6749规定的方法获取HTTP服务或行为的有限制的
12、访问权限。注:OAuth2是由IETF RFC 6749描述的“OAuth 2.0授权框架”的简称。4 缩略语 下列缩略语适用于本文件。API 应用程序编程接口(Application Programming Interface)BSS 业务支撑系统(Business Support System)HTTP 超文本传输协议(HyperText Transfer Protocol)HTTPS 安全超文本传输协议(Secure Hypertext Transfer Protocol)JSON JavaScript对象标记(JavaScript Object Notation)MSS 管理支撑系统(
13、Management Support System)OSS 运营支撑系统(Operation Support System)SQL 结构化查询语言(Structured Query Language)URI 统一资源标识符(Uniform Resource Identifier)UTF-8 8位通用字符集转换格式(8-bit Unicode Transformation Format)5 概述 GY/T 339.12020 3 本文件将大数据系统的结构用图1的形式进行建模,系统中包括数据采集接入、数据处理、数据应用等部分。本文件为大数据系统的通用要求部分,规定数据源、数据采集接入、数据处理、数
14、据开放服务、数据服务安全及个人信息隐私保护的基本要求,以及数据采集终端与平台、平台与应用系统之间的交互和接口。数据采集终端均通过网关与平台进行数据交换。对于不同的应用场景,网关可表现为不同的形式,一种为集成在数据采集终端内部的组件,一种为独立于数据采集终端和大数据平台的实体设备,也可能是集成在大数据平台内部的一个组件。为了便于定义大数据业务流程,本文件不区分网关的具体实现形式和位置,仅将其当成一个实现格式规范化转换和执行通信功能的功能实体。大数据系统模型各单元之间有依赖关系,例如数据采集终端执行数据采集流程并上传数据到网关,网关接收数据采集终端的数据并封装成规范格式后上传到大数据平台,大数据平
15、台接受终端和网关的认证注册,向终端和网关下发操作指令,同时为各类大数据应用提供开放的数据服务。网关采集接入数据处理数据存储数据展示开放服务计算/存储/网络资源池基础配套精细服务精确管理精益网运数据共享数据应用大数据平台数据源精准营销BSS数据OSS数据MSS数据业务平台数据其他数据数据分析安全运维系统管理 图1 大数据系统模型 6 数据采集接入要求 6.1 概述 数据采集接入指大数据平台将外部数据纳入大数据平台内部的过程。6.2 基本要求 要求如下:a)应具备定时采集接入数据的功能;b)应具备定量采集接入数据的功能;c)宜提供图形化的数据采集接入配置或管理界面;d)应具备采集接入结构化数据的功
16、能;e)应具备采集接入半结构化数据的功能;f)应具备采集接入非结构化数据的功能;g)应具备采集接入实时在线数据的功能;h)应具备采集接入离线数据的功能;i)应具备主动采集接入和被动接收数据的功能;j)宜采取措施维持数据源与接入服务器时钟的同步。6.3 采集接入内容 要求如下:a)应具备采集接入 GY/T 339.32020 规定的各类基础数据的功能;GY/T 339.12020 4 b)应具备采集接入 GD/J 0742018 规定的收视评价基础数据的功能。6.4 数据表达 要求如下:a)应支持采集接入按 GY/T 339.32020 规定格式表达的数据;b)应支持采集接入按 GD/J 075
17、2018 规定的格式表达的符合 GD/J 0742018 规定的数据。6.5 性能要求 要求如下:a)采集接入实时数据时,应具备实时传输、接入全网实时数据的能力,实时数据应在不超过 3s内从数据源到达大数据平台的数据存储系统;b)采集接入 BSS 离线数据时,应具备 1h 内完成当日增量数据的传输、接入的能力;c)采集接入 OSS 离线数据时,应具备 1h 内完成当日增量数据的传输、接入的能力;d)采集接入 MSS 离线数据时,应具备 1h 内完成当日增量数据的传输、接入的能力;e)采集接入其他离线数据时,应具备 1h 内完成该类数据当日增量的传输、接入的能力。6.6 交互与接口 要求如下:a
18、)数据源或数据采集终端与大数据平台间的交互应通过网关进行;b)数据源数据采集终端与大数据平台间的交互宜符合附录 A 的要求。7 数据处理要求 大数据平台接入数据后,应具备数据处理功能,要求如下:a)应具备数据预处理功能,可对存放在文件系统和数据库中的数据进行抽取、清洗、转换等操作后加载到数据分析等处理模块;b)应具备存储处理后的数据的功能,可为其他处理模块提供上传、下载、查看、删除、权限管理等操作,并通过冗余备份等机制提供安全的数据存储;c)应具备计算资源配置、调度和回收管理功能,支持水平扩展计算框架、调度任务和管理任务优先级;d)应具备数据分析功能,支持非结构化数据、实时数据、结构化数据的分
19、析,可提供 SQL 分析、跨数据源关联分析、机器学习等数据分析功能,并提供对大数据平台外开放分析服务的 API;e)应具备接入、处理符合 GY/T 339.32020 规定的数据的能力;f)数据处理环节的功能、性能、数据访问、系统和数据管理、基础配套、安全可靠性和运行维护等应满足 GY/T 339.22020 的要求。8 数据开放与服务要求 8.1 功能要求 要求如下:a)应具备对外提供数据服务的功能,如提供数据交换、共享、发布等功能;b)宜具备对外开放数据存储、分析、展示功能;GY/T 339.12020 5 c)应具备管理数据服务用户注册、授权、计费功能,可监看和审计用户的行为;d)应提供
20、开放的数据服务接口,如提供用户注册 API、服务应用 API,宜提供二次开发接口,允许用户自定义业务;e)应能提供至少 1 年内的 BSS、OSS、MSS 数据;f)其他功能应满足 GY/T 339.22020 的要求。8.2 开放内容 要求如下:a)宜具备开放数据终端接入的原始数据的功能;b)应具备开放 GY/T 339.32020 定义的数据集的功能;c)应具备开放处理或分析数据结果的功能;d)宜具备开放数据存储、处理和分析能力的功能。8.3 数据表达 开放的数据集,收视数据应按GD/J 0752018规定的格式表达,其他数据格式应符合GY/T 339.32020的规定。8.4 性能要求
21、大数据平台对外提供数据开放服务时,性能要求如下:a)应用系统向大数据平台发送的注册或认证消息,大数据平台的平均响应时间应小于 1s;b)应用系统向大数据平台请求数据交换的响应时间、交换的数据包大小、共享的数据容量、多数据源访问响应时间、并发用户数等性能应满足 GY/T 339.22020 的要求。8.5 交互与数据接口 平台与应用系统之间的交互宜符合附录B的要求。9 数据服务安全要求 9.1 概述 在开展数据服务的过程中,应采取措施确保大数据系统的数据采集、传输、存储、处理、数据开放的安全。9.2 数据采集环节 要求如下:a)应确保数据采集的合法性和正当性;b)应按照 GY/T 339.320
22、20 规定的范围采集数据,按照 GY/T 339.32020 的要求规范数据格式,明确采集频度;c)应通过对组件、终端、设备等采集终端进行必要的技术控制,如在部署前对采集终端进行采集能力认证、计量等,确保数据的完整性、一致性和真实性;d)应明确数据收集和获取过程中个人信息和重要数据的知悉范围和安全管控措施,确保采集数据的合法性、完整性和真实性;e)应采取脱敏、加密等技术或管理措施确保采集过程中涉及的个人信息和重要数据不被泄露;GY/T 339.12020 6 f)应对数据采集行为进行权限管理。9.3 数据传输环节 要求如下:a)应对敏感数据进行加密传输;b)宜对重要数据进行加密传输。9.4 数
23、据接入平台环节 要求如下:a)应建立数据采集终端/网关接入平台的身份识别与鉴别策略、权限分配策略和相关操作规程,建立访问控制时效管理机制;b)应具备数据接入的安全审计功能。9.5 数据存储环节 要求如下:a)应采取冗余存储或多副本存储措施,确保数据的可用性;b)应采取校验等检验和容错技术措施,确保多副本数据存储的一致性;c)宜具备数据归档离线存储功能;d)应确保存储技术架构具备加密敏感数据、重要数据的能力。9.6 数据处理环节 数据处理发生在大数据平台内部,要求如下:a)应确保处理过程中发生数据迁移、变换时的真实性、完整性和一致性;b)应确保数据处理过程操作行为可审计,数据质量可溯源,重要数据
24、受保护。9.7 数据开放环节 要求如下:a)应建立应用系统接入平台的身份识别与鉴别策略、权限分配策略和相关操作规程,建立访问控制时效管理机制;b)应建立应用系统访问平台数据、服务的控制策略;c)应具备数据交换、共享、发布的安全审计功能。9.8 接口安全 要求如下:a)应制定数据服务接口安全控制策略,明确规定使用服务接口的安全措施,如身份鉴别、授权策略、访问控制机制、签名、时间戳、安全协议等;b)应制定数据服务接口安全规范,包括接口名称、接口参数、对接安全要求等,具备限制或过滤不安全参数的能力;c)应具备数据服务接口访问审计功能;d)宜在数据采集终端与平台、平台与应用系统间采用安全通道或加密通道
25、进行接口调用。9.9 有线电视网络用户个人信息隐私保护 GY/T 339.12020 7 在采集、传输、存储、展示、共享、管理有线电视网络中涉及个人的信息数据时,在以下方面应遵循GB/T 352732017的要求:a)个人信息的采集;b)个人信息的保存;c)个人信息的使用;d)个人信息的委托处理、共享、转让和公开披露;e)个人信息安全事件的处置;f)从事个人信息处理、保管、使用等工作的组织和个人的管理。GY/T 339.12020 8 附 录 A(规范性)数据采集上报的交互过程与接口要求 A.1 交互过程 A.1.1 概述 为了实现大数据系统的整体功能,大数据平台、数据采集终端、网关单元之间应
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- GYT 339.1-2020 有线电视网络大数据技术规范 第1部分:通用要求广播电影电视 GY 339.1 2020 有线电视网络 数据 技术规范 部分 通用 要求 广播 电影电视
链接地址:https://www.taowenge.com/p-67532593.html
限制150内