2022年大数据与开放数据的政策框架_问题_政策与建议_JohnCarloBertot .pdf
《2022年大数据与开放数据的政策框架_问题_政策与建议_JohnCarloBertot .pdf》由会员分享,可在线阅读,更多相关《2022年大数据与开放数据的政策框架_问题_政策与建议_JohnCarloBertot .pdf(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、6电子政务 E-GOVERNMENT2014 年第1期(总第 133期)大数据与开放数据的政策框架:问题、政策与建议John Carlo Bertot马里兰大学信息科学学院信息政策与获取中心美国马里兰MD20742郑磊*徐慧娜包琳达/ 译复旦大学国际关系与公共事务学院数字与移动治理实验室上海200439摘要:关键词:大数据与开放数据对电子公共服务、开放和透明政府以及政府公众与企业间的互动,都蕴藏着巨大的变革潜力。从“智慧”政府到变革政府,开放数据与大数据可推动协作,为农业、健康和交通运输等领域面临的挑战提出实时解决方案,推动更大程度的开放,并引领政策制定走向新时代。然而,开放数据与大数据也面临
2、着一系列的政策挑战,如数据获取和发布、数字资产管理、归档和保存、隐私及安全等。本文以美国为背景,选择了有关开放数据与大数据的关键政策问题进行评论,并提出建议,以期推进数据驱动的创新。开放政府;大数据;开放数据;电子政务;透明政府 * 通讯作者收稿日期:2013-12-20专题报告一、引言奥巴马在就任美国总统之初就颁布了一系列行政命令和计划,重申了构建一个对公民负责的开放透明政府的承诺。颁布的两项行政命令要求政府部门在依照信息自由法公开政府档案或总统档案时要更倾向于开放。最近,奥巴马政府又通过“开放政府联盟”1(http:/www.opengovpartnership.org/),以及公开“可机
3、读”数据集等措施,进一步推动政府数据开放2。奥巴马政府的科技重心在于利用技术提高政府的透明度,或至少增加可获取的政府信息总量3-4。在此政策影响下,近年来出现的一个整体趋势是利用电子政府来更大程度地开放政府档案,并更加重视主动公开工作5。奥巴马政府推动可获取、开放和透明度的努力围绕着两大技术开放数据和社会化媒体6-9。诸如www.data.gov这样的政府开放数据平台现已发展到可直接为用户提供海量的原始政府数据,并期待用户能挖掘这些数据的新的利用价值,从而以过去无法实现的方式加深我们对政府活动和更庞杂的社会事务的认知;社交媒体,如博客、维基、社交网站、RSS 订阅、云应用、虚拟世界、手机APP
4、 应用和移动资源等,已被用于发布政府信息及与政府开展直接互动,这些工具还被用于鼓励公众为政府自创内容。这些技术方法推动了数据的可获取、开放和透明,同时又让公众、组织、社区和其他社会成员在现有数据的基础上产生新的创新性认知。然而,政府并非是创建大规模数据集的唯一实体。当前很多公司都围绕大数据的采集和利用能力来开展商业活动,并将这些活动作为其产品或运营后端的一部分。科研群体、政府和私营部门也正在加速生成各种主题的大规模数据集,包括气候变化、交通模式、健康和疾病数据、购买行为,以及通过社会化媒体互动表现出的社会行为。大数据的实践案例有:Inrix 公司和新泽西州运输部( NJDOT )之间的合作伙伴
5、关系。Inrix 公司通过汽车和移动电话 GPS 装置上的信号和数据,采集主名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 9 页 - - - - - - - - - 7电子政务 E-GOVERNMENT2014 年第1期(总第 133 期)John Carlo Bertot大数据与开放数据的政策框架:问题、政策与建议干道上的车速数据,然后实时向新泽西州运输部警示任意主干道上的路况险情,同时向司机的车载GPS 装置或移动电话发送警示来提醒司机注意路况险情。10这个项目现已
6、扩展为跨州服务,覆盖范围包括马里兰州和北卡罗来纳州。气候公司(The Climate Corporation )是一家天气保险公司,他们制作保单来弥补联邦农作物保险和因气候造成的农民损失之间的差额。该公司通过庞大的传感器网络来分析和预测2000万英亩美国农田的气温、降水、土壤湿度和产量。在知晓高温天的天数以及土壤湿度数据后,建立的模型可以帮助其预判农民需要的天气保险金额以及公司需要支付的保费等。11纽约州能源研究和发展管理局(NYSERDA)运用一系列的大数据技术来评估气候变化对纽约州的影响,并为农业、公共卫生、能源和交通运输等领域提供应对气候变化的策略。12这一应用也被美国疾病控制中心引入,
7、正与美国其他 10个州和城市一起开展“阅读州和城市计划”(Read States & Cities Initiative,http:/www.cdc.gov/climateandhealth/climate_ready.htm),共同研究和应对气候变化,而大数据技术是其中一个非常重要的组成部分。大数据往往建立在开放数据的基础上,在催生新的科学研究成果,加快经济增长,为政策制定提供信息,以及制定为民服务新政策等方面都深具潜力。有关大数据的政策选择将对大规模数据集应用的创新和研究、政府开放和透明以及其他众多领域产生深远的影响。有关大数据和开放数据的政策决定则涉及如何在数据可获取、隐私、安全问题、数
8、字资产管理、归档和保存等问题上寻求平衡。二、大数据的定义一般我们将大数据定义为不可能用常规软件和分析工具进行分析的巨大数据集11,13。大数据有三个基础设施要素:一个用于组织、存储并且保障数据可获取的平台;能够处理大规模数据集的计算技术和能力;结构化的、可使用的数据格式。此外,大数据涵盖多种数据类型,如文本、数字、图像、视频,并可跨越多个数据平台,如社交媒体网络、网络日志文件、传感器、智能手机的定位数据、数字化文档及归档的照片和视频等。大数据的概念,特别是政府数据的概念在美国并不新奇。出于透明和开放政府的理念,无论是以印刷还是电子形式,美国政府已采集并发布了大量的数据、出版物和其他内容。事实上
9、,美国建国的核心原则之一就是保证政府信息的可获得和公开发布14。多年来,政府的信息和数据在不断变化,采集和发布政府数据的方法和途径也同样经历了这些变化。在美国,这些里程碑主要包括:打孔卡的使用及计算技术的早期版本,用于呈现 1890年人口普查数据 (https:/www.census.gov/history/www/through_the_decades/overview/1890.html);作为 1935年社会保障法的一部分,社保制度的实施需要向2600万工人和 300万雇主采集大量数据, IBM公司获得了该项目的合同以实施这一计划(http:/www.ssa.gov/history/br
10、iefhistory3.html);美国宇航局的研究人员考克斯和埃尔斯沃思首创“大数据”这一术语15,指的是模拟飞机周围气流的大规模数据集,受限于当时的计算技术,这一庞大的数据集极难分析和处理;作为奥巴马政府开放政府实践的一部分, 2010年data.gov 网站建立了向公众开放的“高价值”数据集( http:/www.data.gov/about); 2012年 3月 奥巴马政府 发布“大 数据研究 和发展计划”(http:/www.whitehouse.gov/sites/default/files/microsites/ostp/big_data_press_release_final_
11、2.pdf)。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 9 页 - - - - - - - - - 8电子政务 E-GOVERNMENT2014 年第1期(总第 133期)与以上最后一个实践相关,美国国家科学基金会(NSF )、美国国家卫生研究院(NIH)、国防部、能源部和美国地质调查局都在投资大数据创新。例如,美国国家卫生研究院宣布,在亚马逊网络云服务(AWS )上免费提供由“国际千人基因组计划”生成的数据(200TB ),研究人员只需支付他们所使用的运算服务的费
12、用即可。正如 Lane16和Braveman17提到的那样,投资大数据创新使得我们有能力汇聚那些通常是分立的、过去不可能协作的学科,进而找出重大科学挑战之间的联系。大数据在美国的演进史可以追溯到一百年前,而其真正有新意之处是整体方法、规模和大数据处理技术的整合。本文回顾梳理并讨论美国大数据的关键问题和政策,尤其关注政府与大数据的互动和参与,然后基于美国的经验教训为大数据实践提出建议。三、大数据与目前的政策框架关于开放政府特别是大数据的一个关键问题是政府信息和数据的管理、使用、再利用和可获取政策(参见表1)。美国有一整套复杂且不断变化的信息政策(法律、法规和备忘录),用来管理信息的生命周期,从信
13、息的生成、传播再到信息处理和归档。尽管这一政策框架不断调整,但仍落后于技术的进步。这一脱节使人们对美国现行政策框架是否足以应对大数据带来的问题产生了疑问,并提出以下几个关键问题:在大数据时代我们如何保护隐私?大数据时代我们能否发展有力的数据再利用政策?我们如何确保数据的质量和准确性?我们能确保数据的可获取性吗?在目前的归档和保存条件下,如何管理我们的数字资产?下文强调了当前美国信息政策框架的潜在差距,并给出了弥合这些差距的建议。John Carlo Bertot大数据与开放数据的政策框架:问题、政策与建议表1按政策目标分类的部分信息政策与大数据相关的政策目标部分相关的政策工具获取和发布-美国残
14、疾人法-13166号行政命令 (为英语能力有限的人提供便利使其获得服务)-残疾人教育法-康复法案 504条款-康复法案 508条款-1996年电信法-1962年寄存图书馆法-1993年加强政府印刷局电子信息开放法隐私、安全、准确性和归档-儿童在线隐私保护法 (COPPA)-联邦信息安全管理法 (FISMA)-信息质量法-美国管理和预算办公室备忘录M-03-22 (2002 年电子政务法的实施指南)-美国管理和预算办公室备忘录M-04-04 ( 联邦政府机构电子认证指南)-美国管理和预算办公室备忘录M-05-04 ( 联邦政府机构网站政策)-联邦图书馆项目 (美国国会 44号文件)(一)数据可获
15、取和发布美国管理和预算办公室(OMB )在数据获取和发布方面为政府机构提供了广泛的指导,他们确立了以下原则:政府机构必须以适当的方式及时、公平、有效地把信息发布给公众;政府机构必须建立和维护“信息发布产品清单”;政府机构必须考虑到公民获取能力的差异,让那些不能上网的公众也能获得重要信息;政府机构应制定多种策略来发布信息;当使用电子媒体时,那些涉及妥善管理和文件归档的规定同样适用;政府机构需要评估并确定最合适的方法来采集和保存文件,无论这些信息是在政府服务器上,还是托管在非联邦政府机构的服务器上。美国管理和预算办公室也为政府机构网站上与信息管理相关的问题提供广泛的指导,例如,管理和预算办公室备忘
16、录 M-04-04(联邦政府机构电子认证指名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 9 页 - - - - - - - - - 9电子政务 E-GOVERNMENT2014 年第1期(总第 133 期)南)要求政府机构对提供的所有在线应用进行标准化的风险评估;管理和预算办公室备忘录M-03-22(2002年电子政务法的实施指南)要求政府机构执行多项与隐私相关的措施,包括隐私影响评估。其他有关信息获取和传播的政策工具还包括:13166号行政命令(为英语能力有限的人提供
17、服务)。该法案要求政府机构对英语能力有限的人提供适当的信息获取方式,涉及所有的“联邦的项目和活动”,这一政策旨在解决公民使用电子政务的鸿沟,尤其是那些不以英语为母语的人。针对残障人士的法案。残障人士教育法规定残障人士在公共教育中可平等获取所有的电子材料;残障人士法案规定政府在提供服务和福利以及开展政民沟通时,不得将残障人士排除在外;康复法案504条款建立了一系列标准,以保证残障人士平等地参与政府活动和获取政府信息,并确立他们获取信息和使用通信技术的一般权利;康复法案508条款规定,由联邦政府采购、维护或使用的电子和信息技术必须满足特定的获取性标准,以确保残障人士能够获取在线信息和服务。 199
18、6年的电信法。该法案推进和实施了线上信息和通信技术的可获取性。(二)隐私、安全、准确性和归档政府网站正变成双向社区,增加了网络病毒或其他攻击载体侵入政府环境的可能性,同时也增加了信息意外泄露的可能性。政策框架也作出了相应调整以应对这一变化。比如,管理和预算办公室备忘录M-05-04(联邦政府机构网站政策)要求政府机构尽可能采取足够的安全措施确保信息不被篡改,并确保其准确性、保密性和可获取性,以符合政府机构的预期和用户的需求。然而,当前的相关政策并不能保证解决大数据所带来的大量使用不当问题。对个人身份信息、政府数据与信息的安全性以及对公开数据的准确性的担忧都与大数据相关。大数据的质量、可靠性和权
19、威性是政府、科研群体、非政府组织以及私营部门最关注的问题。未经确认或验证的数据,或用错误方法采集到的低质量数据可能会导致错误的研究发现,进而严重影响一系列的决策和政策制定。用于管理 data.gov 运行的现有数据政策致力于解决这些问题,具体包括:规定负责采集和发布数据的政府机构要确保数据的准确性、及时性和整体质量(根据 2001年信息质量法);要求政府机构进行版本控制,确保数据集具有明确的标签;要求政府机构确保 data.gov 上发布的数据不涉及国家安全;要求政府机构确保发布的数据符合保密和隐私保护的相关规定。沿着信息的生命周期继续往下走,大数据的使用、储存和保存等方面也面临各种挑战。推动
20、大数据的开放和可获取与促进大数据的利用具有显著差别。此外,特定领域的数据应用(即只有某个特定领域的科学家们使用)和广泛的跨学科数据应用(即跨学科领域和跨常见研究领域的应用)之间也有不同。当与诸如社交媒体之类的新兴技术相结合时,它可以创造出基础更宽广的社区,以推动协作和参与、合作生产、众包和创新7,16,18-21。最初的美国开放政府国家行动计划1的一个重要内容是从根本上开放 data.gov 平台的源代码,以使世界各国都可以复制。作为一个面向公众的平台,它可成为一个促进协作、存储数据集、推动社区参与并提供参与机会的工具。除此之外,数据还可以通过这些平台以多种格式(例如 CSV 、XML 和Ex
21、cel 等)储存和开放。每种数据格式都有其特定含义,可限制或促进数据的应用。而如果目标是使广大公众都能获取和使用数据,则常用数据格式就必不可少。同时,需要为大规模科研数据集建立专门的数据John Carlo Bertot大数据与开放数据的政策框架:问题、政策与建议名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 9 页 - - - - - - - - - 10电子政务 E-GOVERNMENT2014 年第1期(总第 133期)库。构建数据社区的一个要素是迫切需要整合和管理
22、来自不同源头和不同部门的数据。已经开发的一系列基于传感技术的产品(如智能汽车、智能建筑和智慧家庭),以及日益普及的智能手机等技术可为交通运输、能源消耗、水利用以及其他领域源源不断地提供地理定位数据22。很显然,这些数据流必须在政府、私营部门、公共事业公司、各种设备(如汽车、智能手机、家庭传感器、楼宇传感器等)和个人之间流动交汇才能真正有用,并为社区和国家发展提供信息。因此,有必要在各个实体之间建立、采用并遵守一套正式的数据管理标准和操作办法,以保障数据兼容性、命名规则和组织架构;而且,为确保研究人员对于数据集的知情使用,也需要制作具有明确定义的数据文件和编码本。“聚合”( Mashups )指
23、的是用户将从不同网站得到的数据结合起来,大数据使当下信息政策环境变得更为复杂,而这不过是其中一个例子。管理和预算办公室备忘录 M-05-04要求各政府机构的公共网站,在可行且对实现预期目标有必要的情况下,提供开放且符合业界标准格式的数据,使得用户能够整合、分解、操纵或分析数据以满足他们的需求。虽然“聚合”对于为研究者、政府、政策制定者和公众提供信息具有潜力,但经过聚合的数据往往缺乏正式的授权和验证程序。正如data.gov 网站所提出的,“一旦数据从该政府机构页面被下载后,政府不再能保证其质量和即时性。此外,美国政府无法对取自 Data.gov 的数据的任何分析结果做担保” (http:/ww
24、w.data.gov/data-policy)。虽然这一免责声明限定了 data.gov 的责任,但二次数据使用问题仍需要解决。大数据的监管也是一个不可忽视的问题。数字化监管“涉及对电子研究数据的维护、保存和增值,并贯穿其整个生命周期”,同时“可信的电子数据库中的受监管数据可在更广泛的研究团体中共享”(http:/www.dcc.ac.uk/digital-curation/what-digital-curation)。重要的是,数据监管更侧重于对数据资源的整个生命周期进行管理,例如:数字资产的概念问题,数字资产的创造、获取和使用问题,以及数字资产的评价和选择工作等。随着新的电子数据资产的持续
25、增长,有必要为大数据的整个生命周期制定有效的数据管理策略。最后,在诸如 data.gov 社区这样的数字“开放空间”里,永久的、最终的“文件”越来越少,而几乎所有文件管理和归档工作都是基于这些“文件”建立起来的。7由于现在使用的是非政府的第三方应用程序或软件,且数据调整和修改不断发生,使得数据所有权、储存进度以及归档工作都面临着巨大的挑战。四、建议大数据带来了一系列问题,而当前的政策框架却无力解决这些问题,这就需要一个大数据的治理模式。(一)大数据治理模式需要解决的问题隐私在个人、家庭、设备或其他层面,大数据包含了各种个人信息数据。隐私保护法律和政策可能会与大数据所带来的机遇相冲突,而与此同时
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年大数据与开放数据的政策框架_问题_政策与建议_JohnCarloBertot 2022 数据 开放 政策 框架 问题 建议 _JohnCarloBertot
限制150内