数字图书馆建设与发展策略研究--.docx
《数字图书馆建设与发展策略研究--.docx》由会员分享,可在线阅读,更多相关《数字图书馆建设与发展策略研究--.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、数字图书馆建设与发展策略研究一、数字的含义数字就是运用当代信息技术,对数字信息资源进行采集、整理和贮存,并向所有连接的用户提供,为一定的、服务的机构以及这种机构的组合。前者称之为狭义数字图书馆,后者为广义数字图书馆。这个定义明确了数字图书馆的性质机构;明确了数字图书馆的活动目的为一定社会的、服务;明确了数字图书馆的工作对象数字信息资源;明确了数字图书馆的工作内容采集、整理、贮存和提供数字信息资源;区别了数字图书馆和传统图书馆的不同之处利用当代信息技术,工作对象是数字信息资源和服务的对象是所有连接的用户;绘出了广义数字图书馆和狭义数字图书馆的概念。因此这种表述方法还是比较准确、全面的。二、数字图
2、书馆建设面临的技术挑战数字图书馆涉及到许多高新的技术,其建设面临着诸多技术方面的挑战,如超大规模数据库技术、信息压缩与传输技术、分布式处理技术、安全保密技术、可靠性技术、数据仓库与联机分析处理技术、信息抽取技术、数据挖掘技术、基于内容的检索技术、自然语言理解技术等。(一)信息资源建设数字图书馆作为一个数字资料库,首先涉及到众多资料的整理入库问题。已有图书的数字化工作,需要有效的机制。我国目前有各种各样的图书馆几千个,信息资源建设的协调是一个大问题,这其中有工具问题,也有管理问题。例如,对于同一本图书,应该保证:如果某图书馆已经将其录入,其他人就不要再进行录入了。这项工作如果协调不好,很可能同一
3、件事要做若干遍,重复劳动,而给社会造成极大的浪费。(二)数据存储与压缩数字图书馆所涉及的数据类型有文本、图像、声音、视频等,而且所面临的数据是海量的。这么大的数据量是迄今为止其他任何系统都没有理到过的,需要大规模数据库来存储和处理这些数据。因此,如何存储和管理海量数据是系统设计的核心任务之一。在数字图书馆的数据中,文本数据的存储不是很大,真正大的是多媒体数据。因此.对多媒体数据必须进行压缩,然后存储在数据库中,以降低库的成本,使库的规模保持在可管理的范围内。如对一段“联播中主持人讲话的录像,如果将其原封不动地保存下来放到数据库中,可能要占几百兆字节的空间,压缩后,就可能只占几兆的字节空间。(三
4、)分类、索引和检索在图书馆中,分类与索引是检索的基础。分类方法也有各种学派和门类,目前在数字图书馆领域中,还没有完成统一的分类方法,这就提出了一个如何统一分类标准的问题。如果没有一个统一的索引方法和分类带,将来开发的搜索工具就会非常困难,需要针对不同的分类方法制作不同的搜索工具。另外,我们所面临的数据类型也不同,如文本、图像、视频、音频等信息,列不同的内容,需要不同的分类体系和索引机制、而能否制定一个比较好的分类方法、建立一个比较好的索引机制,将直接影响到能否开发出一个比较好的检索工具。对于检索,假如在Internt检索“数字图书馆这个词,目前的检索常常是这样实施的。把“数字图书馆切分成“数字
5、和“图书馆,凡是与“数字、“图书馆、“数字图书馆打出的条目都会检索出来,其实这些并不都是用户所需要的,并且由于这样检索出的条目往往非常之多,从而使用户无从下手,难于找到需要的信息。而目前的分类器绝大多数都是尽可能多地给你信息,而不管你有用没用。因此,怎样做一个比较好的检索工具,使得提供给用户的信息恰恰是用户最需要的(不需要的一条也没有),也就是说,大量数据的搜索效率(最优解)与速度是系统面临的最大挑战,其中包括中文搜索、图像搜索、语音搜索、智能搜索等。这当中涉及大量的人工智能的支持。(四)传输与保护目前,无论是访问国内的站点还是国外的站点,速度都比较慢。因此,怎样从服务器端进行调度、协调,当用
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数字图书馆 建设 发展 策略 研究
限制150内