地方网络资源典藏建设与应用.docx
《地方网络资源典藏建设与应用.docx》由会员分享,可在线阅读,更多相关《地方网络资源典藏建设与应用.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、地方网络资源典藏建设与应用文博系统的图书馆的职责之一是保存和典藏文本资源,它提供了一个供公众了解文化、历史、艺术、科学等知识的窗口。随着互联网的发展,天天在互联网上产生、传播的信息量能够用海量来形容,比方:网页、博客、新闻、日志、论坛等。这些产生的互联网信息中包含了大量有价值的信息,而这些有研究价值的信息并非会通过文本资料的形式保存到图书馆的典藏资源库中。从收集、典藏有价值的信息的角度出发,开发和利用好网络资源信息,是完善好图书馆典藏职能的一条重要的途径,其与纸质文本典藏一样具有重要的价值,今后图书馆典藏工作的发展方向将是纸质资源和数字资源共同发展,在数字图书馆的趋势下,数字典藏的作用越发重要
2、。在互联网时代,开展、建设好网络资源典藏系统具有现实意义和实用价值。网络资源典藏的概念数字资源是文献资料的重要表现形式之一,是利用计算机、通信技术与多媒体技术互相融合而构成的以数字格式获取、处理、的信息资源总和。商业性数据库、机构自建的数据库、政府公开信息、个人信息等都属于数字资源。数字资源与印刷型文献相比类型更为丰富。从数据的组织形式上看,有数据库、电子期刊、电子图书、网页、多媒体资料等类型。从资源提供者来看,可分为:商业化的数字资源和非商业化的数字资源。前者包括数据库商、出版商和其他机构以商业化方式提供的各种电子资源,如:、剑桥期刊、中国期刊网、知网、万方、维普期刊、方正等数据库。公共图书
3、馆需要购买商业数据库后才能向读者开放并有区域局限,但一般是在本馆内。当然个人可以以通过购买服务的方式来获取知识服务。以上数据库中的数字资源内容丰富、数据量大,是目前公共图书馆数字馆藏资源的重要组成部分,在全国各个图书馆基本都有购买和收录。除了购买的数字资源外,各地图书馆机构会自建本地区特色资源库、开放存取资源、地方文献等,这些资源能够由本地图书馆自建,可以以委托专业机构进行搜集、整理、加工。本文重点讨论的是自建类型的资源,从互联网上搜索、整理、公开的资源,经加工后再。网络资源分布在互联网的各个角落,通过资源抓取器网络蜘蛛检索目的地址,并将抓取的资源保存到本地数据库中,赋予标题、关键字、内容持久
4、化保存,并按照特定的组织规则和方式,对数字资源进行特征化,以便对网络典藏资源检索和利用。网络资源典藏实现原理简介搜索引擎由搜索器、索引器、检索器和用户接口部分。机器人程序以一定的策略事先配置好策略自动进行信息搜索,然后由索引器对信息进行理解、处理,从中抽取索引项,建立索引库,再由检索器根据用户的查询在索引库中快速检索文档,进行相关度评价,将要输出的结果排序,并按用户的查询需求合理反应信息,由用户接口来接纳用户查询,显示查询结果,提供个性化查询项。根据信息搜集的方法和服务提供方式的不同,搜索引擎能够分为:全文搜索引擎、目录索引、元搜索引擎。软件系统由应用服务器、蜘蛛、智能、转存器、系统、规则编辑
5、器、图片服务器个子系统组成。此系统是一个分布部署的分布式系统,各个子系统能够运行在多台机器上,可以以运行在一台机器上。应用服务器它是整个系统的调度器,在智能和转存器之间调度数据处理任务,主要是接受蜘蛛抓取来的数据包任务,再将各数据处理任务分配给智能和转存器进行处理。蜘蛛蜘蛛主要是根据用户设定的站点和抓取策略和参数抓取网络数据,并构成多个的数据包数据表发送给应用服务器。智能它主要完成对抓取数据按用户预先建好的导航进行分类,能够按站点或者频道分类,可以以按关键词分类,可以以用样本训练好的模型分类。转存器它主要负责将智能处理完的数据归档到系统的后台数据库中,并对数据新增加的数据进行增量索引,对于图片
6、、文档等数据存放到指定的数据库中或者指定的目录下。若使用的是联合表方式管理数据则对日数据和月数据作定期合并等管理。系统系统是将采集入库的数据在上,用户能够通过形式就能够检索本人所需要的内容。系统采用了种方式的系统,即门户式、数据库式、搜索引擎式。另外,可对系统采集的图片进行并按标题进行检索。规则编辑器它是一个工具,用来建立和管理对数据进行过滤的各种规则。能够是关键词规则或者频道规则以后的版本能够提供分类模型的训练功能。图片服务器它是一个可选工具,当将图片数据存放到数据库中时则需要启动此工具用来用图片服务器,它将从库中读取图片数据并以的方式发送给各请求端。数据导入导出工具这是一个辅助工具,对于一
7、些保密性较高和安全性要求较高的用户,一般采集系统处在与连接的网络上,而系统需要将数据到内网它是与外网绝对隔离,在这种情况下能够用此工具定期将外网的数据导入到内网的库中。建设地方网络典藏资源的意义与需求建设地方网络资源典藏系统服务于当地的经济建设和社会管理。在社会管理电子化的背景下,尤其是电子政务的发展,当地的政府机关、事业单位等职能部门将大量的信息以电子的形式在其网站上,供用户获取和查看。由于信息分布于各个机构网站上,并随着时间的推移,最新的信息会将原有的信息进行覆盖和刷新,当有查询产生时间较早的信息的需求时,往往会出现查询困难或获取失败的情况。在此情形下,图书馆作为一个信息的典藏机构,适时的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 地方 网络资源 典藏 建设 应用
限制150内