【数字化】复旦-2019上半年中国地方政府数据开放报告-2019.6-107页.pdf
《【数字化】复旦-2019上半年中国地方政府数据开放报告-2019.6-107页.pdf》由会员分享,可在线阅读,更多相关《【数字化】复旦-2019上半年中国地方政府数据开放报告-2019.6-107页.pdf(108页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、1001总结摘要 EXECUTIVE SUMMARY 评估方法 METHODS 总体发现与建议 FINDINGS AND RECOMMENDATIONS 开放数林指数与排名 INDEX AND RANKING 准备度发现 READINESS 平台层发现 PLATFORM 数据层发现 DATA 利用层发现 USE附录 APPENDIX0020060180300340580780981080020030041. 数林概貌截至 2019 年上半年,我国已有 82 个省级、副省级和地级政府上线了数据开放平台。与 2018 年报告同期相比,新增了 36 个地方平台。东南沿海地区的省级平台已经逐渐相连成片
2、,并向内陆地区不断扩散。 广东省和山东省省内的各地市都推出了数据开放平台,形成我国最为密集的省级“开放数林”。 41.93% 的省级行政区、66.67% 的副省级城市和 18.55% 的地级城市推出了数据开放平台,政府数据开放平台已逐渐成为一个地方数字政府建设的“标配”。指数分值较高的省份主要集中在东部沿海地区, 指数分值较高的副省、 地级城市很多都出现在山东和广东两省内, 同时,位于中西部和东北部地区的贵州省、贵阳市、成都市、银川市、哈尔滨市也表现抢眼。2. 数叶:数据层全国开放数据集总量从 2017 年 8398 个迅速增长到 2019 年的 62801 个,增幅近七倍。开放数据集的容量与
3、 2018年报告同期相比,呈现出爆发式增长,一年之内增幅近 20 倍。约三成的平台上开放的数据集总量已超过了一千个,约两成的平台上开放的数据容量已超过 1 亿,但仍有超过三成的平台上开放的数据容量仅在 10 万及以下。仅有约四成的平台开放了优质数据集, 但优质API接口仍屈指可数, 调用难度较高, 能调取到的数据容量小、 更新频率低。近四成的平台缺少专门的数据开放授权协议,只有 16% 的平台在授权协议中明确授予了用户免费获取、不受歧视、自由利用、自由传播和分享数据的权利。目前只有不到一成的平台为每个数据集明确标示了包括有条件开放在内的多种开放类型。只有不到一成的平台能在近两年来的每个季度中都
4、持续上线新增数据集,而超过九成的平台曾出现数据集增长中断或停滞的情况。在 2019 年第一季度内,近五成的平台没有更新过数据集。3. 数果:利用层有一成多的地方举办过类似开放数据创新利用比赛的利用促进活动,但只有上海市和北京市两个地方连续举办。仅在 3.7% 的平台上发现了少量的有效服务应用,主要关于交通出行、教育科技和卫生健康主题。超过六成的平台展示的是由政府部门自身开发而不是政府数据开放后被社会开发利用所产生的应用。超过九成的平台展示的利用成果未标注数据来源,而即使标注了的数据来源,也普遍存在数据链接无效、数据搜索不到或数据不完整等情况。总结摘要0054. 数干:平台层只有一成的平台能按用
5、户使用场景和标签分类进行数据导引。不到两成的平台提供了开放数据目录。提供了数据请求功能的地方平台已超过六成,但其中真正能回复用户数据请求的地方平台寥寥无几。开通了意见建议和数据纠错功能的平台已占六成左右,但没有一个地方真正回复用户的意见建议和数据纠错反馈。尚未有平台真正对有条件开放的数据开通了申请功能。标明了利用成果的数据集来源、数据提供部门和利用者名称等信息的平台只占一成。能提供数据发布者联系方式的平台不到一成。超过三成平台的账户注册过程较为繁琐且要求用户提供的个人信息较多。5. 数根:准备度各地方陆续组建了专门的政府数据管理部门,其中近七成为一级委办局,数据开放工作的组织基础得到加强。尚未
6、有地方出台专门针对数据开放的地方性法规、地方政府规章或规范性文件。仅有 16 个地方的党政领导在公开场合讲话要求开放数据。仅有广东、山东两省制定了专门针对数据开放的地方标准。只有上海市连续制定和公开了专门针对政府数据开放的年度工作计划。6数林建言:数据是数据开放的核心,没有数叶,就不会有枝繁叶茂的数林。一个地方政府数据开放的水平实际上反映了这个地方的政府数据治理能力,各地应不断提升数据质量,开放更多高价值、高颗粒度、动态更新的优质数据集。对不同安全等级和敏感程度的数据可进行分级分类开放,实现数据开放的精细化管理,在保障数据安全的前提下,尽最大可能将政府数据开放出来。利用成果是数据开放的成果,数
7、木不结果,数据开放的价值无法真正得到释放。目前缺少利用成果的根本原因并不是数据利用者没有需求或缺少能力,而是绝大多数高需求、高价值的政府数据仍没有开放出来。因此,促进利用的关键在于增加数据供给。平台是连接数据供给侧和利用端的通道、 开放和获取数据的载体、 传播资讯动态的渠道、 展示利用成果的平台。 没有数干,数叶中蕴藏的能量无法输送给数果。因此,平台应成为一种持续性提供的服务,而不只是一个一次性开发完成的项目。各地平台的常态化运营服务能力亟待加强,才能及时回应用户提出的意见建议和纠错反馈,快速处理用户提出的数据申请和数据请求,定期审核和上传用户开发的利用成果。法规、组织、标准方面的准备度是数据
8、开放的基础,失去了数根,数木终将枯萎。各地应加强针对数据开放的法规、政策和标准的制定,地方政府主要领导应更多公开表态支持数据开放。006007008一、评估方法1.1 背景与目的“中国开放数林指数”由复旦大学数字与移动治理实验室出品,是国内第一个针对地方政府数据开放水平的专业指数,自 2017 年 5 月首次发布以来,每年定期对我国地方政府数据开放进行综合评价,精心测量各地“数木”们的树形、高度、粗细、材质与价值,助推我国政府数据开放生态体系的建设与发展。2018年以来,“中国开放数林指数” 为国家互联网信息办公室信息化发展局监测我国公共信息资源开放情况提供数据支撑。2018 年 4 月,“中
9、国开放数林指数”被国家信息中心数字中国研究院发布的数字中国发展指数采纳,作为其评估地区数据开放能力的依据。 2019年5月, 指数报告被收录为复旦智库报告系列, 成为复旦大学每年重点推出的有社会影响力的报告之一。开放数据,蔚然成林, “开放数林”意喻我国政府数据开放利用的生态系统。一棵棵地方开放“数木”由最初的丛然并生、成荫如盖,直至枝繁叶茂、花开结果,终将成长为一片繁盛多样、枝杈相连、持续循环的中国“开放数林”。0090101.2 基本理念和框架“中国开放数林指数”对数据开放利用的全过程及其整个生态系统开展评估。政府数据从开放、利用到创造价值是一个动态循环的过程,政府、数据利用者和社会公众共
10、同构成了一个生态系统。政府部门作为供给侧将数据开放出来,数据利用者作为需求端对数据进行利用,并以其开发的创新应用服务于社会公众,数据利用者和社会公众又进一步共同推动政府开放数据。在这个生态系统中,政府部门是原材料的提供者,数据利用者是加工者,社会公众是最终受益者(见图 1)。图 1 政府数据开放利用生态体系0111.3 评估指标体系指数出品方邀请国内外政界、学术界、产业界共七十余位专家共同参与,组成“中国开放数林指数”评估专家委员会(名单附后),体现了跨界、多学科、第三方、中立的专业视角和实际需求。专家委员会基于数据开放的基本原则,借鉴国际数据开放评估报告指标体系的经验,立足我国政府数据开放的
11、政策要求与实践现状,构建起一个系统、科学、可操作的中国地方政府数据开放评估指标体系,并为每项指标分配了权重(见图 2)。评估指标体系共包括准备度、平台层、数据层、利用层四个维度及下属多级指标(见图 3):准备度是“数根”,是数据开放的基础,包括法规与政策、组织与执行、标准规范等三个一级指标。平台层是“数干”,是政府开放数据和用户获取数据的载体,是展示利用成果的中心,也是连接数据开放供给侧和需求端的桥梁,包括数据发现、数据获取、工具提供、利用展示、互动反馈、公众传播和账户体验等七个一级指标。数据层是“数叶”,是数据开放的核心,包括数据数量、数据质量、数据标准、数据覆盖面、数据持续性等五个一级指标
12、。利用层是“数果”,是数据开放的成果。利用层是今年新增加的评价维度,旨在促进政府数据开放后的社会化利用,包括利用促进、成果产出和数据利用等三个一级指标。图 2 评估指标体系构建方法012图 3 评估指标体系0130141.4 评估范围指数出品方根据公开报道,以及使用“数据开放”、“数据公开”、“公共数据”、“政务数据”、“政府数据”、“地名数据”、“地名政府数据”、“地名开放数据”等关键词进行搜索,发现了截至 2019 年 3 月 31 日,我国已上线的地方政府数据开放平台,并从中筛选出符合以下条件的平台:(1) 原则上平台域名中需出现 ,作为确定其为政府官方认可的数据开放平台的依据。(2)
13、平台所代表的地方政府的行政级别为地级及以上。(3) 平台形式为“集中专有式”或“集中嵌入式”。 “集中专有式”是指开放数据集中汇聚在一个专门的平台上进行开放;“集中嵌入式”是指开放数据统一汇聚为一个栏目版块,嵌入在政府门户网站或政务服务网站上。目前,除常州、阳江、阜阳、雅安等少数地方为“集中嵌入式”平台外,其余均为“集中专有式”平台。各个条线部门建设的非集中式开放数据的平台不在指数的评估范围内。有些地市既建设了集中专有式的本地数据开放平台,也在其归属省的省级数据开放平台上开设了本地栏目 , 指数出品方以该地市本地平台为评估对象;对于只在省级平台上开设了本地栏目,未建设本地平台的地市,指数出品方
14、以其在省级平台上开设的地方栏目作为评估对象。(4)平台上确实开放了电子格式、 可通过下载或接口形式获取、 结构化的数据集。 有些地方上线的网站或栏目虽然名为 “数据开放”,但实质上并未开放任何可通过下载或接口形式获取的、结构化的数据集,而只是提供一些非结构化的文件或跳转到其他相关网页的链接。 这类平台并未真正开放数据, 因此未被纳入本次评估范围。 如江苏省人民政府网站上 “数据开放” 栏目、新疆维吾尔自治区政务数据开放网、山西省人民政府网站上“开放数据”模块和徐州市公共数据开放网等。指数出品方共发现符合条件的地方平台 82 个,并将上线了这些平台的地方作为本次评估的对象。具体地方、平台名称和平
15、台域名如表 1 所示。表 1 评估范围(按行政层级及拼音首字母排序)0150161.5 数据采集与分析方法准备度评估主要对相关法律法规、政策、意见、计划、标准规范、新闻报道等资料进行了描述性统计分析和文本分析。搜索方法主要包括以下两种:一是在百度搜索引擎以关键词检索相关法规与政策文本、年度工作计划、有关地方党政领导讲话支持的新闻报道以及数据开放主管部门的信息;二是在地方政府门户网站以及政府数据开放平台上通过人工观察和关键词检索采集数据。指数出品方对法律法规与政策的筛选标准为至少有一节专门针对政府数据开放的内容;对标准规范的筛选标准为有关政府数据开放的地方性标准,行业性的标准规范未纳入本次评估范
16、围。数据采集截止时间为 2019 年 4 月 15 日。平台层评估主要采用人工观察法对各地方政府数据平台上各项功能进行观测并做描述性统计分析,数据采集截止时间为2019 年 3 月 31 日。同时,指数出品方还对平台的回复情况(包括回复时间和回复质量)进行了评估,回复情况采集截止时间为 2019 年 4 月 4 日。 数据层评估主要通过机器自动抓取各地平台上开放的数据结合人工观察采集相关信息,然后对数据进行了描述性统计分析、交叉分析、文本分析和空间分析。数据采集截止时间为 2019 年 4 月 15 日,对“动态更新”这一指标的评测时段为2019 年 1 月 1 日至 2019 年 4 月 1
17、5 日。对于只在省级平台上开设了本地栏目,未建设本地平台的地市,指数出品方以该地市在省级平台本地栏目下开放的数据作为评估对象。对于开设了下属地级市本地栏目的省级平台,指数出品方以其在平台上开放的来自省本级的数据作为评估对象。利用层评估主要对各地政府数据开放平台上展示的利用成果进行了人工观察和测试,对 2017 年以来各地开展的开放数据创新利用比赛信息进行了网络检索,并对采集到的数据进行了描述性统计分析。数据采集截止时间为 2019 年 4 月 4 日。1.6 指标计算方法指数出品方基于各地在各项评估指标上的实际表现从低到高按照 0-5 分共 6 档分值进行评分,其中 5 分为最高分,相应数据缺
18、失或完全不符合标准则分值为 0。对于连续型统计数值类数据则使用极差归一法将各地统计数据结果换算为 0-5 之分间的数值作为该项得分。各地平台在准备度、平台层、数据层、利用层四个维度上的指数总分等于每个单项指标的分值乘以相应权重所得到的加权总和。最终,各地开放数林指数等于准备度指数、平台层指数、数据层指数、利用层指数乘以相应权重的加权平均分。各地开放数林指数计算公式如下:各地开放数林指数017018019020二、总体发现和建议2.1 总体趋势自 2012 年上半年上海市推出全国第一个政府数据开放平台起,截至 2019 年上半年,我国已有 82 个符合政府数据开放基本特征的地级及以上平台陆续上线
19、(如图 2-1 所示)。与 2018 年报告同期相比,增长速度迅猛,新增了 36 个地方平台。截至 2019 年 3 月底,全国各地上线的省级政府数据开放平台的地区分布如图 2-2 所示,副省级和地级政府数据开放平台的地区分布如图 2-3 所示,颜色越深代表平台上线时间越早。从整体上看,我国地方政府数据开放平台的扩散呈现出从东南沿海地区向内陆地区不断发展的趋势,东南沿海地区的省级平台已经逐渐相连成片。另外,各地政府数据开放平台还呈现出“群落式”与“绿洲式”两种分布特征。其中,“群落式”特征以山东省、广东省和长三角地区最为典型。在这些区域中,地市平台竞相开放数据,在广东省、山东省,省内各地市都推
20、出了数据开放平台,形成我国最为密集的省级“开放数林”。相比之下,有些地区的周边均未上线政府数据开放平台,使这些地方成为了所在区域政府数据开放的“绿洲”。图 2-1 各地平台上线时间021图 2-3 各地平台上线时间的地理空间分布(副省级和地级)图 2-2 各地平台上线时间的地理空间分布(省级)报告对全国现有的 82 个政府数据开放平台按行政层级进行了统计(如图 2-4 所示)。其中省级行政区平台(港澳台除外)13个, 占总数的41.93%;副省级城市平台10个, 占总数的66.67%;地级城市平台59个, 占总数的18.55%, 比例相对偏低。0221190607651752019年2018年
21、1310593115318省级副省级地级地方政府总数建有平台总数图 2-5 全国开放的数据集总量图 2-6 全国开放的总数据容量(单位:万)图 2-4 各地平台的行政层级分布自 2017 年开始,报告连续三年跟踪各地数据开放的情况。期间,全国的开放数据集总量从 2017 年 8398 个迅速增长到目前的 62801 个(如图 2-5 所示);开放数据集的容量从 2018 年开始呈现出爆发式增长,一年之间增幅近 20 倍(如图 2-6所示),全国出现了更多高容量、高需求的优质数据集。839817420628012017年2018年2019年0232019 年各地开放的数据集中满足可机读格式标准的
22、比率为 82%(如图 2-7 所示),与去年同期基本持平。全国数据开放的主题覆盖面与部门覆盖面的比例三年来均稳步增长(如图 2-8),参与数据开放的政府部门越来越多,开放的数据愈加丰富多样。76.0%83.0%82.0%2017年2018年2019年图 2-7 2018-2019 年全国开放的可机读格式数据集比例图 2-8 2017-2019 年全国开放数据的部门覆盖面与主题覆盖面50.0%56.0%67.0%65.6%70.5%71.1%2017年2018年2019年部门覆盖主题覆盖0241.8%26.6%11.6%2017年2018年2019年值得注意的是,与 2018 年同期相比,今年各
23、地数据定期更新的比例出现了下滑(如图 2-9)。图 2-9 2017-2019 年全国开放数据的更新比例图 2-10 指数空间分布(省级)2.2 指数分析从省级地方指数分值的空间分布情况来看(图 2-10),目前分值高的省份主要集中在东部沿海,西部的贵州省也表现亮眼。与去年相比,福建省、天津市在新上线平台的地方中表现最为突出,浙江省则进步迅猛。025从地级(含副省级)的空间分布来看(图 2-11),目前分值较高的地市主要集中在山东省、广东省,但贵阳市、哈尔滨市、成都市、银川市等位于中西部和东北部地区的城市也表现抢眼。报告对 2018 下半年评估报告中的 56 个地方半年以来的指数分值和排名变化
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字化 复旦 2019 上半年 中国 地方政府 数据 开放 报告 2019.6 107
限制150内