公共数据在企业征信领域应用的指南(T-NIFA 23—2023).pdf
《公共数据在企业征信领域应用的指南(T-NIFA 23—2023).pdf》由会员分享,可在线阅读,更多相关《公共数据在企业征信领域应用的指南(T-NIFA 23—2023).pdf(22页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、ICS 03.060 CCS A 11 团 体 标 准 T/NIFA 232023 公共数据在企业征信领域应用的指南 Guideline for public data application of enterprise credit 2023-11-10 发布 2023-11-10 实施 中国互联网金融协会 发布 T/NIFA 232023 I 目 次 前言.II 1 范围.1 2 规范性引用文件.1 3 术语与定义.1 4 数据分类.2 4.1 分类原则.2 4.2 分类维度.2 4.3 分类方法.4 5 数据分级.5 5.1 分级原则.5 5.2 分级规则.5 5.3 数据级别变更.6
2、5.4 业务操作指引.6 6 数据采集.7 6.1 采集原则.7 6.2 采集渠道.7 6.3 采集方式.8 7 数据治理.8 7.1 概述.8 7.2 数据安全保障.8 7.3 数据质量管控.9 7.3.1 数据质量管控概述.9 7.3.2 数据质量管控内容.9 8 数据应用.9 8.1 模型构建.9 8.2 入模字段参考.10 9 产品构成.10 附录 A(资料性)公共数据分类分级示例.11 附录 B(资料性)准入规则模型参考字段.13 附录 C(资料性)风险提示参考规则字段.16 参考文献.18 T/NIFA 232023 II 前 言 本文件按照GB/T 1.12020标准化工作导则
3、第1部分:标准化文件的结构和起草规则和GB/T 20004.12016团体标准化 第1部分:良好行为指南给出的规则起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由中国互联网金融协会提出。本文件由中国互联网金融协会归口。本文件起草单位:中国互联网金融协会、同盾科技有限公司、百行征信有限公司、上海冰鉴信息科技有限公司、朴道征信有限公司、重庆三峡银行股份有限公司、四川征信有限公司、江苏省联合征信有限公司、上海市联合征信有限公司、南方电网深圳供电局有限公司、奇富科技股份有限公司、中国人民大学、南方电网数字平台科技(广东)有限公司、深圳信用促进协会、中国邮政储蓄银
4、行股份有限公司、重庆富民银行股份有限公司、重庆银行股份有限公司、海南省财投金控征信有限公司、维沃移动通信有限公司、中国司法大数据研究院、唐山银行股份有限公司、深圳征信服务有限公司。本文件主要起草人:单强、陆书春、朱勇、王新华、马丹、金程铮、李静、黎雪、袁伟斌、邓康、田昆、黄殷、蒋汉彬、张栌文、王诗强、梁平、张颖毅、季毅、胡松鹤、冉铭铭、刘先荣、张李铭、陈康、袁轶慧、陈洪辉、赵少冬、张中峰、苏绥绥、黄丹阳、陈迪、鲜涛、王汉轩、沈澍、李钦、张家铭、曾铮、程莉、廖诗辰、王星、秦雪、李晓智、徐俣、黎峻。T/NIFA 232023 1 公共数据在企业征信领域应用的指南 1 范围 本文件提供了公共数据在企
5、业征信业务场景下的数据分级、数据分类、数据采集、数据治理、数据应用等方面的指南。本文件适用于指导企业征信机构或数据服务公司对公共数据在企业征信业务场景下的数据处理活动,也适用于指导第三方评估机构对前述处理活动进行管理和评估。2 规范性引用文件 下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T 386672020 信息技术 大数据 数据分类 3 术语与定义 下列术语和定义适用于本文件。3.1 公共数据 public data 各级党政机关、企事业单位依法
6、履职或提供公共服务过程中产生的数据。注:参照中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见中对公共数据的描述。3.2 征信业务 credit service 对企业、事业单位等组织的信用信息和个人的信用信息进行采集、整理、保存、加工,并向信息使用者提供的活动。注:参照征信业管理条例对征信业务的定义。3.3 征信机构 credit agency 依法设立,主要经营征信业务的机构。注:参照征信业管理条例对征信机构的定义。3.4 企业征信 enterprise credit T/NIFA 232023 2 征信机构按一定规则合法采集企业的信用信息(含关联个人信息,如企业的董事、监事、
7、高级管理人员与其履行职务相关的信息),加工整理形成企业信用报告等征信产品,提供给经济活动中的贷款方、赊销方、招标方、出租方、保险方等有合法需求的信息使用者,为其了解交易对方的信用状况提供便利。3.5 信用信息 credit information 依法采集,为金融等活动提供服务,用于识别判断企业和个人信用状况的基本信息、借贷信息、其他相关信息,以及基于前述信息形成的分析评价信息。注:参照征信业务管理办法对信用信息的定义。3.6 数据分级 data grading 按照公共数据遭到破坏(包括攻击、泄露、篡改、非法使用等)后对国家安全、社会秩序、公共利益以及个人、法人和其他组织的合法权益(受侵害客
8、体)的危害程度对公共数据进行定级,为数据全生命周期管理的安全策略制定提供支撑。3.7 数据分类 data classification 按照公共数据具有的某种共同属性或特征(包括数据对象、重要程度、共享属性、开放属性、应用场景等),采用一定的原则和方法进行区分和归类,以便于管理和使用公共数据。4 数据分类 4.1 分类原则 数据分类原则如下:a)按照公共数据的多维特征及其相互间存在的逻辑关联进行科学、系统的分类,每一个类目分配唯一的分类号,整个分类体系及分类号具有科学性、延展性,并尽量保持和国家相关产业、主题词、专利、图书等分类体系及行业数据模型等分类体系一致,使其和相关政策规定不冲突;b)使
9、用的词语或短语能准确表达数据类目的实际内容、内涵和外延,相同概念的用语保持一致;c)结合现实需求,符合用户对公共数据区分和归类的普遍认知。每个类目下都有公共数据,尽量不设没有意义的类目,但可根据未来数据内容的衍生和丰富性预留部分分类子类目;d)保持与国家和行业法律法规关于公共数据分类分级的标准和要求相一致,原则上同一分类维度内,同一条公共数据只分入一个类目。4.2 分类维度 4.2.1 数据属性维度 对公共数据资源目录中的数据进行数据属性维度分类,主要包括:a)数据产生频率:根据数据产生的频率(单位时间内产生的数据量)对数据进行分类,数据产生与更新的单位周期可分为秒、分、时、天、周、月、季度、
10、半年、年,不定期,不更新等;b)数据产生方式:根据公共数据产生方式可分为人工采集数据、信息系统产生数据、感知设备产生数据;T/NIFA 232023 3 c)数据加工程度:原始数据和二次加工数据等;d)数据结构化特征:根据公共数据的结构化特征可分为结构化数据、半结构化数据和非结构化数据;e)数据存储方式:根据公共数据储存方式可分为关系型数据库存储数据、键值数据库存储数据、图数据库存储数据和文档数据库存储数据等;f)数据质量要求:根据数据规范性、完整性、准确性、一致性、时效性和可访问性等数据质量要求进行分类;g)数据时效性:根据数据新鲜度及处理应用的时间延迟要求对数据进行分类。按数据时效性可划分
11、为实时数据、准实时数据和历史数据;h)数据主题特征:根据数据主题内容之间的关联性、从属性进行划分。4.2.2 业务应用维度 4.2.2.1 概述 对公共数据资源目录中的数据进行业务应用维度分类,主要包括数据应用领域、数据使用频率、数据共享属性、数据开放属性、安全保护维度及数据对象等方面。4.2.2.2 数据应用领域 根据征信业务场景,数据应用领域分类体现公共数据对企业征信的支撑作用,主要包括信息查询、信用评价、信用反欺诈产品和服务等。4.2.2.3 数据使用频率 根据数据使用的频率进行分类,综合考虑数据的访问频次和分析引用层面可分为下列三种:a)冷数据类:包括离线的,长期存档的,很少被访问和使
12、用的数据;a)温数据类:包括经常被访问和使用的数据,访问频率介于热数据和冷数据之间;b)热数据类:包括需要被计算节点频繁访问的数据。4.2.2.4 数据共享属性 数据根据其共享属性可分为无条件共享类、受限共享类和不共享类。列入受限共享和不共享的数据,经脱敏、脱密等处理后可以向公共管理和服务机构提供,但法律法规另有规定的除外。具体可分为以下三种类型:a)可以提供给所有公共管理和服务机构共享使用的,为无条件共享数据;b)可以部分提供或者按照特定要求提供给相关公共管理和服务机构共享使用的,为受限共享数据。列入受限共享数据的,数据提供单位宜明确共享条件;c)不宜提供给其他公共管理和服务机构共享使用的,
13、为不共享数据。列入不共享数据的,应当提供明确的法律、法规、规章或者国家有关规定作为依据。4.2.2.5 数据开放属性 数据根据其开放属性可分为:禁止开放类、受限开放类、无条件开放类。具体区别如下:a)禁止开放类。包括但不限于:1)开放后危及国家安全、公共安全、经济安全和社会稳定的;2)涉及商业秘密、个人隐私的;3)因数据获取协议或者知识产权保护等禁止开放的;4)法律、法规规定不得开放的。T/NIFA 232023 4 b)受限开放类。包括但不限于:1)涉及商业秘密、个人隐私,其指向的特定公民、法人或者其他组织同意开放,且法律法规未禁止的;2)开放将严重挤占公共基础设施资源,影响公共数据处理效率
14、的;3)开放将导致安全风险难以评估,或者安全评估风险较高的;4)依法经脱敏、脱密等处理的禁止开放类公共数据,符合受限开放的,宜列为受限开放类公共数据。c)无条件开放类。包括:1)除禁止开放类与受限开放类公共数据以外的其他公共数据;2)已脱敏、脱密等处理的禁止开放类与受限开放类公共数据,符合无条件开放的,可列为无条件开放类公共数据。注:相关机构宜根据相关政策规定,视具体情形分析。4.2.3 数据安全保护 参考数据的敏感程度等对公共数据资源目录中的数据进行安全保护维度分类,主要包括:a)核心数据:公共管理和服务机构采集、产生、控制的涉及国家秘密,与国家安全、经济发展、社会稳定,以及公共利益重大相关
15、的,一旦遭到篡改、破坏、泄露或者非法获取、非法利用等,可能对国家安全、经济运行、社会稳定或对公众利益造成严重危害的数据;b)重要数据:公共管理和服务机构采集、产生、控制的不涉及国家秘密,但与国家安全、经济发展、社会稳定,以及公共利益密切相关的,一旦遭到篡改、破坏、泄露或者非法获取、非法利用等,可能对国家安全、经济运行、社会稳定或对公众利益造成危害的数据;c)一般数据:公共管理和服务机构采集、产生、控制的不涉及国家秘密,与国家安全、经济发展、社会稳定,以及公共利益相关,一旦遭到篡改、破坏、泄露或者非法获取、非法利用等,不会对国家安全、经济运行、社会稳定或对公众利益造成危害的数据。4.2.4 数据
16、对象 对公共数据资源目录中的数据进行数据对象维度分类,包括:个人:指自然人,包括属性数据和行为数据;组织:指政府部门、企事业单位、其他法人和非法人组织、团体,包括属性数据和业务数据;客体:指非个人或组织的客观实体,如道路、建筑、视频捕捉设备等,包括属性数据和感应数据。4.3 分类方法 公共数据分类相关方法可参照GB/T 386672020相关要求,分为线分类法、面分类法、混合分类法等,相关概述如下:线分类法:将公共数据按选定的若干个属性或特征,逐次分为若干层级,每个层级又分为若干类別。同一分支的同层级类别之间构成并列关系,不同层级类别之间构成隶属关系。同层级类别互不重复,互不交叉。线分类法适用
17、于针对一个类别只选取单一分类维度进行分类的场景。面分类法:将公共数据依据其本身的固有的各种属性或特征,分成相互之间没有隶属关系即彼此独立的面,每个面中都包含了一组类别。将某个面中的一种类别和另外的一个或多个面的一种类别组合在一起,可以组成一个复合类别。面分类法是并行化分类方式,同一层级可有多个分类维度。面分类法适用于对一个类别同时选取多个分类维度进行分类的场景。混合分类法:将线分类法和面分类法组合使用,克服这两种基本方法的不足,得到更为合理的T/NIFA 232023 5 分类。混合分类法的特点是以其中一种分类方法为主,另一种做补充。混合分类法适用于以一个分类维度划分大类、另一个分类维度划分小
18、类的场景。5 数据分级 5.1 分级原则 公共数据的分级原则如下:a)客观且可被校验,即通过数据自身的属性和分级规则即可判定其分级;b)公共数据的分级与其共享、开放的类型、范围、审批和管理要求直接相关;c)按照就高从严原则确定数据级别;d)充分考虑数据聚合情况、数据体量、数据时效性、数据脱敏处理等因素;e)数据集的级别根据下属数据项的最高级来定级;f)在多类数据中均出现的“通用数据”,可根据实际内容独立分级;g)结合具体应用场景定级;h)公共数据分类分级示例见附录A。5.2 分级规则 按照数据敏感程度和数据遭到篡改、泄露、破坏或非法利用后对国家安全、社会秩序、公共利益和公民、法人、其他组织的合
19、法权益(受侵害客体)的影响程度,根据就高原则进行定级,按照数据对象安全等级最高的要求实施保护。按数据敏感程度及影响程度定级的数据分级规则分别见表1和表2,并满足如下条件:a)法律法规明确保护的数据,3级以上;b)未明示公开要求的个人数据,不低于2级;c)未有任何安全级别标识的数据,默认为2级。表1 数据分级规则(按照数据敏感程度定级)数据级别数据级别 敏感程度敏感程度 判断标准判断标准 1 级 不敏感 依法公开和披露的公共数据 2 级 低敏感 不宜公开的公共数据,如调查、讨论、处理过程中的公共数据,但在公民、法人和其他组织机构的授权下可在一定指定范围内共享的公共数据 3 级 中敏感 不能公开的
20、公共数据,但在公民、法人和其他组织机构的单独授权下可在严格指定范围内共享的数据 4 级 高敏感 涉及公民、法人和其他组织核心利益的公共数据,不得公开,不宜共享 表2 数据分级规则(按照数据影响程度定级)数据级别数据级别 影响程度影响程度 判断标准判断标准 1 级 无 公共数据一旦遭到篡改、泄露、破坏或非法利用后,对国家安全、社会秩序、公共利益以及公民、法人和其他组织的合法权益均无影响,不造成相关经济损失,不涉及监管处罚等 T/NIFA 232023 6 2 级 轻微 公共数据一旦遭到篡改、泄露、破坏或非法利用后,对公民、法人和其他组织的合法权益造成轻微损害,可能造成轻微经济损失,可能引发监管通
21、报批评,但不损害国家安全、社会秩序和公共利益 3 级 中等 公共数据一旦遭到篡改、泄露、破坏或非法利用后,对公民、法人和其他组织的合法权益造成严重损害,可能造成一定经济损失,可能引发监管处罚,或对社会秩序和公共利益造成损害,但不损害国家安全 4 级 严重 公共数据一旦遭到篡改、泄露、破坏或非法利用后,可能造成重大经济损失,可能引发严重监管处罚,可能会对社会秩序和公共利益造成严重损害,或对国家安全造成损害 5.3 数据级别变更 5.3.1 数据级别变更原则 数据级别变更原则如下:a)从原始数据中直接复制出来的新数据,数据级别原则上不高于原有数据安全级别中的最高级别;b)对不同数据选取部分数据进行
22、合并形成的新数据,根据新数据的关键要素进行重新判定,数据级别原则上不低于原有各数据安全级别中的最高级别,或按实际情况进行调整;c)数据内容发生变化,导致原有数据的安全级别不再适用,宜重新定级;d)数据内容未发生变化,但数据时效性、数据规模、数据应用场景、数据加工处理方式等发生变化,宜重新定级;e)数据内容未发生变化,但数据架构、数据建模和设计、数据存储和操作、数据安全、数据集成和互操作、文档和内容管理、参考数据和主数据管理、数据仓库和商务智能、元数据管理和数据质量管理等数据管理制度发生变化,宜根据变更后的情况对数据级别进行适当调整;f)安全级别变更时,宜由指定人员进行审批并保留相关变更理由证明
23、,不同安全等级的数据宜指定相应的审批人员审核。5.3.2 数据级别变更场景 5.3.2.1 等级提升 发生以下场景时,宜考虑提升数据级别:a)因国家或行业主管部门要求,导致原有的数据级别提升;b)数据聚合形成新的数据类别,包括不限于对数据进行集中、清洗、转换、重组等处理过程;c)发生特定事件导致数据敏感性增强;d)数据的影响程度变化,导致原有的数据级别提升。5.3.2.2 等级降低 发生以下场景时,宜考虑降低数据级别:a)因国家或行业主管部门要求,导致原有的数据级别降低;b)数据已依照法律法规进行公开或披露;c)数据已进行脱敏、匿名化、删除关键字段等操作;d)数据的敏感度或影响度具有随着时间推
24、移逐步减弱的特征,且数据已产生较长时间;e)数据发生特定事件导致数据失去敏感性。5.4 业务操作指引 T/NIFA 232023 7 数据分级后,宜根据数据的分级结果,进行业务操作指引。具体如下:a)1 级数据:无需进行额外操作;b)2 级数据:建立审批授权和认责追溯机制,对访问者有身份识别和对访问过程的日志记录;c)3 级数据:建立双人多级审批授权和认责追溯机制,对访问者有身份识别和对访问过程的日志记录,并采取必要的数据安全技术保障措施;d)4 级数据:宜按最小必须原则建立多人多级审批授权和认责追溯机制,对访问者有身份识别和对访问过程的日志记录,并通过制度保障、加密算法等数据安全技术等保障措
25、施有效防止数据泄露。由于日志承载量过高和服务器性能不足等因素,对服务延迟以及服务吞吐量造成较大影响时,宜做好日志级别分类和内容精简等优化工作。6 数据采集 6.1 采集原则 在公共数据采集过程中要体现基于合法目的、基于合法来源、取得合法授权、保障数据安全以及最小必要等原则:a)基于合法目的:在企业征信业务开展中采集公共数据基于合法目的,不得侵犯商业秘密;b)基于合法来源:基于合法途径获取企业主体相关公共数据,包括政府数据管理机构、政府主导的数据汇集机构等,充分保障数据来源合法性;c)取得合法授权:除可以被任何人获得、使用、分享(再分发)而不受版权等限制的开放数据外,需获得企业主体对于数据采集、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 公共数据在企业征信领域应用的指南T-NIFA 232023 公共 数据 企业 领域 应用 指南 NIFA 23 2023
限制150内