数据治理:数据开放与共享的现状与未来.docx
《数据治理:数据开放与共享的现状与未来.docx》由会员分享,可在线阅读,更多相关《数据治理:数据开放与共享的现状与未来.docx(10页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数据治理:数据开放与共享的现状与未来数据治理的核心之一是推动数据有序、安全地流动,以便最大程度地挖掘和释放数 据价值。数据流动则需要推动数据的开放分享,实现数据的“聚”“通”“用近10年 来,发达国家以政府数据开放共享为核心,普遍进行了卓成有效的数据开放分享实 展,在企业数据开放分享方面也有“开放银行”等创新探索实践。我国虽然还处于数 据开放分享的初期阶段,但因为数字中国、数字政府等数字战略的实施,以及数字 技术在各个领域的持续创新应用,数据开放共享也己取得较好成果。数据的开放分 享,核心在于“数据价值、的流通,“分布式数据价值分享或将成为未来数据开放分 享的重要特征,而隐私计算等新型数字技术
2、将为此提供技术支撑。一全球数据开放分享的背景首先,社会对知情权的追求在大数据时代有了新发展。伴随着社会和居民对知情 权的追求不断升级,发达国家在信息公开、政务公开等方面也一直在升级。从整体 来看,美国、英国、德国、法国、加拿大、澳大利亚等主要西方发达国家,早在20 世纪6080年代就开始出台关于信息自由、数据保护等方面的国家层级的法律,并 不断改进信息公开、政府公开的方法。进入21世纪后,数字经济逐渐成形,信息革 命无论是在政府还是经济各个领域都快速展开,大数据以几何级速度增加,传统的 信息公开、政务公开方式已难以全面、有效达成社会知情权的实现。公众和各国政 府普遍认识到,大数据的开放分享,可
3、以有效打破数据孤岛进一步满足社会和 公众的知情权。其次,大数据已成为社会发展的重要资源和新型生产要素,只有推动数据有序、 安全地流动,才能更好发挥其价值。大数据普遍被认为具有规模海量、低价值密 度、维度多样等特点,分散的数据维度少、数据量小、价值低。例如,人们的医疗 数据分散在不同医疗机构,保险数据分散在不同的保险公司,借贷数据则分散在不 同的银行,从而形成互不相连的单一数据源。单一数据源造成数据规模量小、可供 分析维度少、数据质量低等问题,难以通过高级统计分析以及人工智能等技术盘活 海量数据资源,充分发挥数据价值。只有通过算法、算力等实现数据的 聚通用,才能实现数据价值的整合和有效释放。数据
4、开放分享是人类在数字经济时代必须面对的时代新命题,一方面数据融合可以 带来极大的社会价值,大数据作为新型滨源生产要素可以创造更多的消费者福利, 催生更多的经济创新;另方面,数据开放分享稍有不慎也可能带来不利影响,在消 金,而前提是将部分Facebook信息授权给这个第三方程序。在这个事件中, Facebook“被动”分享了用户信息,但其因为对第三方程序的风险把关不严,依然负 有不可推卸的责任。第二重挑战是数据分享方的财产性权益难以有效保障,“不愿分享”。数据作为一 种虚拟资产,具有复制成本低的特征。直接传输和分享原始数据的方式,无法对分 享出去的数据进行有效的管控和保护,可能被复制和滥用,不仅
5、损害数据分享方的 商业利益,甚至导致数据安全隐患。在缺乏机构互信的情况下,数据可复制性进一 步阻碍了数据的跨机构联合应用。二、“分布式数据价值分享”是未来数据开放分享的核心特征少部分人士提出,可以采用集中式、大一统的数据管理和强制性的数据开放模 式,但该方案无法解决安全、激励和创新问题,可能难以持续。以大数据时代的数 据量级,所有数据集中存储和调用的成本极高,且极易产生数据安全漏洞和个人隐 私保护漏洞。更为重要的是,数据不是自然存在的,而是生产出来的。数据是相关 主体投入存储、算法、算力、技术人员等“生产”出来的,是从非结构信息中记录、 清理、整合、提炼、加工出来的。原始大数据的收集、数据处理
6、技术的引入和研 发,个人信息保护和数据安全合规成本的投入,以及相关设备购置等,均需投入巨 大的成本。如果不尊重和保护数据生产者的财产权益,会降低机构进行数据生产和 积累的积极性。最高人民法院也对数据生产者的财产权益表示了认可,在最高人民法院关于支 持和保障深圳建设中国特色社会主义先行示范区的意见最高人民法院关于人民 法院为北京市国家服务业扩大开放综合示范区、中国(北京)自由贸易试验区建设 提供司法服务和保障的意见均明确指出,“依法保护数据要素市场主体以合法收集 和自身生成数据为基础开发的数据产品的财产性权益这也已成为司法实践中遵循 的原则。目前,主流观点认为,对于数据开放分享,还是应该坚持市场
7、机制在资源配置中 的决定性作用。只有尊重和保护市场机构的权益,才能激励市场机构去进行数据的 生产、积累和向业务价值的转化。相比于“大一统”,“分布式”分享符合市场化原 则,“分布式”会成为未来数据开放分享模式的核心特征之一。注重数据价值而不是数据本身的分享,是未来数据开放分享模式的第二个核心特 征。对于数据要素市场的构建,把原始数据拿出来交易只是其中一种方式。数据作 为企业的生产要素、国家的战略资源和个体的数字人格,承载着多元利益,将数据 简单化视为一般商品拿来交易的思路,没能洞见数据利益的多元性。过去的实践也 证明,这种模式并不成功,而且引发了一些问题。中国互联网金融协会发布的金 融业数据要
8、素融合应用研究指出,“数据要素融合是指在数据要素化背景下,对单 一或多个数据源的数据进行关联、组合等操作,从而获得更好的数据处理效果。传 统的公开数据搜集、原始数据共享等融合方式存在一定局限性”。数据价值的流通是数据流通的核,把握住这一点,我们将会看到很多新的解决思 路。通过搭建数据价值的互联互通网络,在确保数据安全可控和隐私保护的同时, 实现数据的“可用不可见”“定量定向使用”,从而构建出一个分布式数据价值流通体 系,这或是我国数据要素市场建设的未来方向。中国人民银行于2021年2月发布的金融业数据能力建设指引提出,“建立 数据规范共享机制,在保障原始数据可用不可见的前提下规范开展数据共享与
9、融合 应用,保证跨行业、跨机构的数据使用合规、范围可控,有效保护数据隐私安全, 确保数据所有权不因共享应用而发生让渡“。这正是”分布式数据价值分享”模式的具 象表述。近年来,快速发展起来的隐私计算技术(多方安全计算、联邦学习、数据可证去 标识化等)已成为分布式数据价值分享体系的技术底座(关于隐私计算的技术体系 和应用,将在第六章详细展开).积极培育壮大数据产业(人民要论)指出, 数据的“价值释放模式不断创新。随着数据要素市场快速壮大,数据要素价值实现手 段持续丰富完善。流通技术方面,数据沙箱、联邦学习、多方安全计算等创新技 术,能够在原始数据不泄露的前提下实现合法合规的数据开放,帮助多个机构在
10、满 足用户隐私、数据安全和法规要求的同时,进行数据使用和机器学习建模中国互 联网金融协会发布的金融业数据要素融合应用研究也强调,“运用多方计算(业 界亦称多方安全计算或安全多方计算八 联邦学习等技术,推动金融业数据要素在 确保安全合规前提下实现融合应用创新,在促进金融业数字化转型、增强数字普惠 金融水平、落实金融消费者保护要求、提升金融穿透式监管效能等方面具有重要意 义。”历史总是在不断解决问题的过程中迸步,而技术创新正是为解决问题而生,相 信在技术创新的加持下,分布式数据价值分享体系指日可待。费者层面可能使个人数据安全和隐私保护受到挑战,在企业数据主体层面可能使商 业秘密、创新动力等受到挑战
11、,在国家层面可能使国家安全受到部分挑战。二国外数据开放分享的发展情况继美国于2009年发布并上线整合联邦政府各行政部门数据的政府数据开放平台 Data.gov以来,数据开放分享在全球范围内出现快速推进的趋势。一、发达国家政府数据开放进展(一)美国1995年,美国共和党众议院创建THOMAS.gov网站,为公众提供有关立法的 全面信息。之后,美国出现了多个数据共享网站,让数据开始走出政府,包括国民 人口及经济数据共享网站Census.gov,竞选财政数据共享网站OpenSecrets. org,国会相关数据共享网站CowTrack.us等。2009年,美国国家级政府数据开 放平台Data, go
12、v正式建立,其整合了联邦政府各行政部门数据,破学者认为是全 球政府数据开放的标志性开端事件。美国政府数据开放有以下几个特征:一是确保数据开放共享平台的数据可利用性较强。首先是数据可操作性强。Data, gov上有50多个组织的近20万个数据集,涉及农业、商业、教育、海洋、公共安 全等10多个主题,但具有丰富的数据格式,可以满足不同用户提取、使用数据的需 求,用户还可以通过该平台获得数据分析、摘录、提取、格式转换等数据处理工具 与应用程序。其次是检索功能强。Data.gov为用户提供了直接检索按分类检索和 按位置检索三种检索方式,能够最大化地方便用户检索。最后是用户参与度高。Data.gov提供
13、了信息分享功能,用户可将部分政府数据分享到Youtube. Flickr 和Facebook等社交媒体上。为了方便与用户的沟通交流,Data gov设置了“问 询”请求和“问题报告”三大板块以提高用户的参与度。二是通过完善的法律体系保障数据自由开放。该法律体系用于保证政府数据的开 放性以及公众所获数据的质量和数量。从前期的阳光下的政府法和电子政务 法,到2009年奥巴马签署的透明与开放的政府备忘录,共同为政府数据开 放打好了基础。2015年,美国颁布第三份开放政府国家行动计划,2016年, 美国发布联邦大数据研究与开发战略计划,2018年12月21日,美国启用公 共、公开、电子与必要性政府数据
14、法案(又称开放政府数据法案),这些让 美国政府在数据开放方面再上新高度。三是通过有效执行机制和管理体系确保数据 开放落实。美国政府为了保障数据开放分享的政策落到实处,制定了配套的政策 执行机制,在人力、政府信息化顶层设计、技术政策制定、技术专项预算管理、数 据战略规划等多个方面为美国政府数据的共享开放提供支持。在以往基础上,最新 的联邦数据战略与2020年行动计划指出,建立联邦首席数据官委员会和联邦 数据政策委员会,并通过专门负责人完成对数据全生命周期的监控和管理。(二)英国英国也是政府数据开放共享程度较高的国家之一。根据2018年万维网基金会的 开放数据晴雨表,英国的政府数据开放总得分位列全
15、球第一。英国的数据开放分享,在平台建设方面注重用户体验以及激发社会使用兴趣。第 一,数据开放提供多种数据分类入口。截至2020年6月,英国政府数据开放平台 共涉及商业与经济、环境、地图、犯罪与司法等12个主题的54000 余个数据集,主要包括国土、地理信息、人口普查、国家预算、公司注册、国家立 法、国际贸易、健康、教育、犯罪、环境、竞选结果等数据。为便于用户检索数 据,平台提供发布机构、主题、数据格式等多种分类维度,在支持关键词检索基础 上,还支持用户利用布尔逻辑组配、短语检索、字段限制、基于地理位置检索等检 索技巧。第二,平台至今已举行七次“数据开放营“,培养全社会对开放数据的使用 兴趣。此
16、外,平台也及时倾听用户反馈并改进数据开放体睑。在政策保障方面,英国具有完善的政府开放数据政策法规体系。近年来,英国政 府高层一直将政府数据开放作为国家战略进行推动。2。10年,英国首相卡梅伦提出 致力于打造“世界上最开放、最透明的政府“。在数据开发战略规划上,2011年至 2019年,英国连续发布四份英国开放政府国家行动计划。在开放数据标准上, 2010年,英国发布公共部门透明委员会:公共数据原则,提高数据开放形式、格 式、许可使用范围等14项原则。2012年,发布开放数据白皮书:释放潜能, 提出数据开放的五星评价标准和专门的“开放标准原则”。在开放数据创新利用上, 英国政府倡导数据分析与可视
17、化技术的创新,奖励推动开放数据创新的最佳组织。在组织机制方面,侧重于“互相协同、共同推进首先,英国十分注重明确数据开 放的责任主体。例如,英国内阁办公室为数据开放领导机构,主要负责协调和监督 各单位数据开放工作,并负责制定与数据开放的相关政策法规。此外,英国还设有 开放数据研究部门等。其次,英国组建了推进数据开放的专门机构。2011年,英国设 立了数据战略委员会和公共数据集团,前者向内阁大臣提供数据发布建议,管理与 公共数据集团合同,以及为中央和地方的开放数据机构提供资金等;后者则致力于 以低廉的价格为数据使用者提供服务,为中小型企业和非营利机构使用数据扫清障 碍等。(三)欧盟近年来,由于数据
18、开放分享主要集中于政府公共数据领域,因此欧盟的数据开放 分享主要由各成员国各自主导。但在欧盟层面,相应的数据开放分享工作也在有序 开展,重点是在制度层面寻求欧盟范围内的统一,以便利化数据在欧盟内部的自由 流通。欧盟于2020年初发布欧盟数据战略,试图通过加强数据流通,建立真正的欧 洲单一数据市场,其中公共数据的开放分享是重点。一是加强欧盟层面在数据公共 空间使用数据的治理机制,优先通过标准化活动,形成数据集、数据对象和标识符 的统一描述,促迸各领域间的数据流动,以符合GDPR的方式保证数据在技术层面 具有可用性。二是使以公共利益为目的的个人数据使用(即“数据利他主义“)更加 便利。三是致力于实
19、现更多高质量公共数据的再利用,使数据集在欧盟内部可以通 过机器可读的格式利用API免费提供。2020年底,欧盟发布数据治理法草 案,进一步要求确保公共部门数据在受他人权利约束(如GDPR )的情况下,允许 出于“利他目的”重复使用。(四)小结:发达国家政府数据开放的主要特点总体来看,发达国家政府数据开放具有以下三个方面的特点:一是各国基本建立 了全国性的“一站式”政府数据共享平台。除美国、英国外,加拿大、德国、法国、 日本和新西兰等主要发达国家近年来均建立起全国统一的“一站式”政府数据门户网 站。数据开放的领域集中在农业、经济、环境、教育、交通、健康、能源、科技等 与公民密切相关的领域,提供P
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 治理 开放 共享 现状 未来
限制150内