电子政务领域数字档案本体的构建.docx
《电子政务领域数字档案本体的构建.docx》由会员分享,可在线阅读,更多相关《电子政务领域数字档案本体的构建.docx(17页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、电子政务领域数字档案本体构建周义刚/董慧2012-11-28 15:12:23来源:图书情报工作(京)2009年19期【英文标题】Construction of Digital Archives Ontology in E-government Domain【作者简介】周义刚,女,1977年生,馆员,发表论文10余篇,武汉大学信息管理学院部主任博士,武汉430072;董慧,男,1941年生,教授,博士生导师,发表论文70余篇,出版著作7部,武汉大学信息管理学院,武汉430072【内容提要】 在分析电子政务领域本体构建需求基础上,提出构建领域本体必备条件。针对这种需求,分析电子政务领域数字档案特
2、征,并根据该特征,探讨电子政务领域数字档案本体构建过程。This paper proposes the prerequisites of construction for the domain ontology after analyzing the requirement of ontology construction in the domain of E-government. Aiming at the requirements, the paper analyzes the characteristics of digital archives in E-government dom
3、ain. Then the paper discusses the construction process of digital archives in E-government domain. 【关 键 词】领域本体/数字档案/电子政务/本体构建Domain ontology/Digital archives/E-government/Ontology construction领域本体是用于描述指定领域知识一种专门本体。它给出了领域实体概念及相互关系领域活动以及该领域所具有特性和规律一种形式化描述。目前,本体模型研究已经进入实际应用阶段,许多研究领域都建立了适用于本领域标准本体1-2。We
4、b上有许多可利用本体资源库,这使得诸多领域专家能够使用它们来共享领域中信息。目前,国内图书情报领域关于本体研究尚处于起步阶段,领域本体构建是一项需要投入巨大人力物力科研活动,要构建某一领域内本体,决非某个人或某几个人所能完成。本文以电子政务领域数字档案为例,通过对构建本体具体过程介绍,建立了一个有关数字档案知识本体,希望本文能对未来电子政务领域本体进一步研究和构建提供有益借鉴。1 电子政务领域本体构建问题提出电子政务是指公共管理组织在政务活动中,全面应用现代化信息技术、网络技术以及办公自动化技术等进行办公、管理和为社会提供各种公共服务一种治理方式3。在电子政务初级阶段,需要完成政务数字化、信息
5、化任务:包括电子政务公文数字化、公文流转自动化、数字档案归档、政务信息上网等政务信息化基础工作。湖北省档案局已将2000年以来11 662篇政务公文进行了数字化归档。这些公文涵盖社会经济政治生活各个领域中各种事项:有政府专项工作部署、总结,也有职能部门对相关领域工作汇报;有会议精神传达,也有对社会突发事件报道。内容包括省委、省人大、省政府、省政协以及省委各部委、省级国家机关各委办厅局、各人民团体、各事业单位等形成法规性、政策性、服务性、公益性文件目录。这些公文内容广泛,时间跨度长,信息量大,总共文字统计近2 000万。湖北省档案局不仅将这些政务公文进行扫描,数字化归档为Tif格式图片,还提供这
6、些电子政务公文网上查询服务4。但是这种仅仅基于元数据或主题词查询服务,很难满足知识共享、辅助决策等电子政务需求。在这样背景下,湖北省档案局和武汉大学信息资源研究中心联合申请了“知识管理技术方法在数字档案馆建设中应用研究”项目。在这个项目中,采取本体作为数字档案馆知识管理核心技术,并以湖北省档案局提供政务公文作为原始资料,设计并实现基于本体数字档案馆知识管理模型。基于本体知识管理模型基础是领域本体库构建。2 构建领域本体必备条件本体构建是一项十分复杂系统工程,需要选择合适开发工具辅助并需要领域专家参和。笔者认为构建电子政务领域数字档案本体至少需要以下3个方面准备。2.1 本体形式化描述语言选择本
7、体形式化描述语言直接影响本体模型表达能力和可扩展能力。目前形式化本体描述语言非常多,经过比较,选用了OWL。OWL优点是以Web资源为描述对象,而且是W3C推荐标准,所以具有良好应用前景。另外,OWL是基于描述逻辑。这就意味着基于描述逻辑OWL类构造算子和公理都有相应逻辑描述表示,这样利用OWL构建本体库在具备良好表现能力同时还具有强大推理能力。这对于Web资源逻辑检测、本体集成、知识整合是非常重要。2.2 本体开发工具选择目前,国内外已经有许多成熟本体开发平台软件可供选择。经过我们对部分常见工具试用和比较,最终选择是Protg 3.3。Protg是由斯坦福大学医学信息化研究小组开发,一个基于
8、Java环境开放式架构开源知识建模工具。其扩展OWL插件是目前最为强大OWL本体构建工具。Protg不仅具有良好可扩展性和简单灵活用户定制界面,还具有如下一些特性:支持图形化本体编辑模式、支持数据库存储模式、基于OWL数据库多人开发模式和支持逻辑检测功能等。2.3 领域专家参和领域本体构建是本体开发人员和领域专家共同努力结果。开发人员虽然具有丰富本体知识和较强开发能力,但是对特定领域知识却知之甚少,很难建立起面向特定领域本体模型。所以本体构建非常需要领域专家参和。在电子政务领域数字档案本体构建过程中,湖北省档案局3位专家参和了本体库构建。在整个过程中,他们细致而专业理论支持协助了本体库成功建立
9、。3 电子政务领域数字档案特征3.1 电子政务档案类型分布现行国家行政机关公文处理办法规定国家行政公文有13类:命令(令)、决定、公告、通告、通知、通报、议案、报告、指示、批复、意见、函、会议纪要等。可以按照上行文、下行文和平行文将公文分为三类。其分类情况见表1。其中议案兼有上行文和平行文双重特征,通知同时属于平时文和下行文之列,会议纪要可以是下行文,也可以是平行文。用上述13类公文类型名在湖北省档案局数据库中进行检索,发现其文件类型分布见表2(数据来自检索结果,可能存在较小偏差),其中上先行文请示、报告和议案不出现在档案局数据库中。3.2 电子政务档案结构特点档案局电子政务文件以扫描图片方式
10、进行存放。由于国家对红头文件格式有着一定显性限制,并且长期以来,红头文件书写也存在一定潜在规律。这些限制和规律为档案领域本体构建提供了一定便利。电子政务档案一般由文件头,正文和文件尾组成,某些文件可能有附件。正文一般由以下几部分组成:标题、主送机关、原由和事项组成。原由有依据和目两种。其具体结构见图1所示。图1 电子政务档案结构3.3 电子政务档案内容相对确定性本体在人文社科领域应用相对较少,其中一个重要原因是人文社科领域不确实性,不同于数理公式推理演绎过程,人文社科领域结论多带有主观性。人文社科领域发展为人类社会带来了多样性,但同时也增加信息管理难度。档案公文不同于一般人文社科文献,它具有一
11、定确实性。国家或某一部委在某一时间段政策方针往往是明确。档案文件相对确定性有利于档案本体构建。3.4 电子政务档案内容相互关联性政府公文虽然涉及生活中方方面面,但从系统学上讲,政府公文所联系各个团体和个人组成了一个闭合系统。在这样一个聚集里面,成员是相对稳定,并且成员级别划分明确。各级职权明确,如公文接收单位一般是政府、政府职能部门、企业、机关团体、学校和军区等,并且接收对象往往只能是一个团体,而不是团体某个下属部门或机构。这样在档案领域本体构建中所确定部门本体是有限。在这样一个闭合聚集里面,成员节点数量少,而相互联系较多,这决定了各个成员之间关系是比较复杂,某一个成员可能成为许多联系成员节点
12、。正如政府某一项工作通常要求各个部门合作,发挥各自业务专长来完成。并且在从时间线来看,也存在着多种联系。如一旦上级召开某些会议,作为会议成果,一般会产生一些新思想和会议精神。一段时间后相关部门便会发布公文组织下属各级政府进行学习。政府会承办一些活动,政府会组织各方面人力物力来完成这些任务,在活动结束之后,政府可能会有一些通报和表扬。4 电子政务领域数字档案本体构建过程电子政务中档案领域本体构建用户需求明确而且相对稳定,根据本体构建常用方法:Skeletal Methodology(骨架法)、TOVE、METHONTOLOGY、Cyclic Acquisition Process和IDEF-5等
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 电子政务 领域 数字 档案 本体 构建
限制150内