数字图书馆的发展.ppt
数字图书馆的发展数字图书馆的发展1.引言n图书馆发展的挑战:图书馆发展的挑战:n第一,来自科技第一,来自科技进步的挑步的挑战。互。互联网网、计算机、计算机及其相关技及其相关技术的的发展正在并将展正在并将进一步改一步改变图书馆图书馆服服务的的传统方式。方式。资源数源数字化、字化、传输网网络化、管理自化、管理自动化、化、应用个性化、服用个性化、服务知知识化化成成为必然必然趋势。n第二,来自市第二,来自市场竞争的挑争的挑战。商业性数字图书馆、数据库服商业性数字图书馆、数据库服务商的挑战务商的挑战。n第三,来自服第三,来自服务需求的挑需求的挑战。获取信息取信息资源的渠道不断拓源的渠道不断拓宽,方式更加便捷。提供方式更加便捷。提供资源源检索检索的初的初级服服务被技被技术系系统逐步取逐步取代,用代,用户个性化、高端化的信息需求个性化、高端化的信息需求对图书馆提出了新的挑对图书馆提出了新的挑战。战。n数字图书馆建设成为应对上述挑战的主要举措。数字图书馆建设成为应对上述挑战的主要举措。2.数字图书馆的关键技术n文献数字化与数字资源采集;文献数字化与数字资源采集;n数据的存储和管理;数据的存储和管理;n数据的发布和传输;数据的发布和传输;n数字资源服务;数字资源服务;n系统管理和版权保护。系统管理和版权保护。以上五项,既是数字图书馆的基本功能,以上五项,既是数字图书馆的基本功能,又是数字图书馆进入实用化的五项关键技术。又是数字图书馆进入实用化的五项关键技术。数字图书馆已进入实用阶段n上世纪上世纪9090年代后期以来,数字图书馆进年代后期以来,数字图书馆进入了快速发展与实用阶段:其主要标志入了快速发展与实用阶段:其主要标志是是数字资源的大量涌现、可获得性的迅数字资源的大量涌现、可获得性的迅速改善、共建共享的初步实现以及用户速改善、共建共享的初步实现以及用户利用数字资源的日益普及利用数字资源的日益普及。3.数字资源建设的发展文献扫描文献扫描扫描后数据加工扫描后数据加工数字资源(续)n超星读秀可提供超星读秀可提供228万种中文图书书目检索,万种中文图书书目检索,可阅读可阅读100万种以上的全文电子书。万种以上的全文电子书。nGoogleBookSearch已有已有100万册英文图万册英文图书。书。nCADAL项目已扫描图书资料项目已扫描图书资料107万册。万册。nCNKI中有中文现刊中有中文现刊6642种,中文过刊种,中文过刊8764种,全文种,全文2485万篇。万篇。n目前已有英文电子期刊目前已有英文电子期刊4万余种。万余种。数字资源(续)n国内硕士博士学位论文已基本数字化。国内硕士博士学位论文已基本数字化。n在未来在未来10年左右时间内,国内外馆藏的纸年左右时间内,国内外馆藏的纸质图书和期刊将几乎全部被数字化。质图书和期刊将几乎全部被数字化。n原生数字资源不断增长。原生数字资源不断增长。n中国网页总数已经有中国网页总数已经有84.7亿个,年增长率达到亿个,年增长率达到89.4%。网站总字节数已经达到。网站总字节数已经达到198TB。n全世界有网页数百亿,文字容量相当于上亿册全世界有网页数百亿,文字容量相当于上亿册图书。图书。4.数字资源存储技术的发展无论是自建、无论是自建、购置还是网上搜集购置还是网上搜集数字资源,都需要数字资源,都需要构筑庞大的存储系构筑庞大的存储系统。存储系统是数统。存储系统是数字图书馆建设的重字图书馆建设的重要基础设施和投资要基础设施和投资重点之一。重点之一。浙江大学图书馆存储系统浙江大学图书馆存储系统低成本低成本低成本低成本数据的生命周期数据的生命周期Create创建Protect保护Access访问Archive存档Dispose处置Migrate迁移存储介质的发展250G移动之星硬盘目前价格900元16GB的U盘(30GB的U盘已上市)目前上市的蓝光DVD光盘容量50GB,美国在研究50TB容量的新型DVD光盘n未来未来13年年iPod及类似装及类似装置的存储能力置的存储能力n2012:一年的视频信息:一年的视频信息(8,760小时)小时)n2015:历史上的所有商:历史上的所有商业化音乐业化音乐n2020:历史上的所有内:历史上的所有内容(所有媒体)容(所有媒体)PeterKaufman:Onlinedigitalvideo,inJISCDigitisationConference,2007.075.电子阅读技术的发展动态n电子阅读习惯将逐步形成。电子阅读习惯将逐步形成。n“数字化移民数字化移民”(Digitalimmigrant)与)与“数字化原居民数字化原居民”(Digitalnative)。n无线网络与移动阅读将不断流行。无线网络与移动阅读将不断流行。n手持式电子书阅读设备将逐渐普及。手持式电子书阅读设备将逐渐普及。n电子纸张和电子墨水技术发展迅速。电子纸张和电子墨水技术发展迅速。无线网络无线网络n无线局域网无线局域网WLAN,它是利用无线技术所构成,它是利用无线技术所构成的局域网络,能利用简单的存取架构让用户达的局域网络,能利用简单的存取架构让用户达到在一定区域内随意接收信息的理想境界,且到在一定区域内随意接收信息的理想境界,且价格低廉,已广泛应用于办公室、家庭。价格低廉,已广泛应用于办公室、家庭。n无线广域网,如目前的无线广域网,如目前的GPRS和和CDMA1X的的无线上网,只要有手机信号的地方都可以上网。无线上网,只要有手机信号的地方都可以上网。由于价格昂贵,用户群并不广泛。由于价格昂贵,用户群并不广泛。n全球有全球有600多个城市正在建设无线宽带网。上多个城市正在建设无线宽带网。上海计划在海计划在2010年建成年建成“无线城市无线城市”。到到2007年底,中国有年底,中国有5560万网民在使用无线网。万网民在使用无线网。手持式电子书阅读设备手持式电子书阅读设备nPDA、智能手机n专用电子书阅读器PDA/PDA/智能手机智能手机 iPhoneiPhone智能手机,智能手机,20072007年年6 6月上市。月上市。手机尺寸手机尺寸1156111.6mm 手机重量手机重量:135克 使用时间使用时间音乐播放16小时、视频5小时无线数据无线数据Wi-Fi、蓝牙V2.0手机屏幕手机屏幕3.5英寸、320480像素、160dpi摄像头摄像头:200万像素内存内存:4GB、8GB屏幕尺寸:屏幕尺寸:6.56.5英寸英寸分辨率:分辨率:800600800600颜色:颜色:4 4级灰度级灰度存储器:存储器:FLASH 10MFLASH 10M重量:重量:190g190g Sony Sony 电子书阅读器电子书阅读器2007年年11月月26日出版的日出版的美国新闻周刊封面美国新闻周刊封面 Amazon Kindle电子书电子书阅读器,阅读器,6“E-ink屏幕,屏幕,无背光,重量无背光,重量292克。可克。可利用无线网络下载购书,利用无线网络下载购书,可供书目可供书目9万册以上,还万册以上,还包括重要报刊。内置词典,包括重要报刊。内置词典,链接维基百科全书。内存链接维基百科全书。内存容量容量200册书,可扩充。册书,可扩充。充电充电2小时,可用小时,可用30小时。小时。售价售价399美元。美元。翰林M型手持阅读器方正科技-E312手持阅读器数字资源管理平台数字资源管理平台客户端客户端PC无线局域网无线局域网WiFi/蓝牙蓝牙GPRS/3G移动阅读将逐步普及移动阅读将逐步普及电电子子墨墨水水公公司司与与L LG G公公司司、P Ph hi il li ip ps s 公公司司开开发发的的基基于于电电子子墨墨水水技技术术的的电电子子纸纸显显示示器器。电子纸制作的时钟电子纸制作的时钟电子纸轻薄、分辨率高、电子纸轻薄、分辨率高、无背光,耗电省无背光,耗电省电子纸制作的手持阅读器电子纸制作的手持阅读器6.Web 2.0与Library 2.0nWeb2.0。Web1.0指用户利用浏览器浏览网指用户利用浏览器浏览网站上的信息,并享受网站提供的各项应用服务。站上的信息,并享受网站提供的各项应用服务。而而Web2.0除了具有除了具有Web1.0的功能外,还可的功能外,还可以由用户来参与网站的建设和维护。以由用户来参与网站的建设和维护。nLibrary2.0Web2.0Library,即,即Web2.0的理念与技术在图书馆的应用。的理念与技术在图书馆的应用。nRSS订阅服务,利用推送技术,共享图书馆新闻、新书报道、订阅服务,利用推送技术,共享图书馆新闻、新书报道、新到数字资源等。新到数字资源等。nBlog博客与博客与Podcast播客播客nWIKI维客或维基维客或维基nTagging标签与标签与Folksonomy公众分类公众分类WIKInWIKI是一种多人协作的写作和建立网站的工具。利用是一种多人协作的写作和建立网站的工具。利用WIKI,任何人都可以编辑网页。在每个正常显示的页,任何人都可以编辑网页。在每个正常显示的页面下面都有一个编辑按钮,点击这个按钮就可以编辑面下面都有一个编辑按钮,点击这个按钮就可以编辑页面。它的语法与页面。它的语法与HTML相比要容易得多,几乎与普相比要容易得多,几乎与普通写字板编辑文字差不多,很容易上手。通写字板编辑文字差不多,很容易上手。WIKI很适合很适合做百科全书、知识库、整理某一个领域的知识等知识做百科全书、知识库、整理某一个领域的知识等知识型站点。几个分在不同地区的人利用型站点。几个分在不同地区的人利用WIKI协同工作可协同工作可以共同写一本书。最著名的例子就是以共同写一本书。最著名的例子就是Wikipedia(维基百(维基百科全书)科全书)http:/en.wikipedia.org/。n国内网站:国内网站:n上海大学图书馆、厦门大学图书馆率先在国内图书馆上海大学图书馆、厦门大学图书馆率先在国内图书馆应用应用WIKI技术。技术。维基百科全书,维基百科全书,2001年年1月月15日正式成日正式成立,由维基媒体基金会负责维持。截至立,由维基媒体基金会负责维持。截至2007年年11月,英文维基百科已有月,英文维基百科已有205万个条目万个条目(32卷本的卷本的大英百科全书大英百科全书 约有约有12万个万个条目)条目),每天至少增加,每天至少增加1000个条目或文章;个条目或文章;而所有而所有252种语言的版本共有条目超过种语言的版本共有条目超过500万条,其中,中文条目超过万条,其中,中文条目超过15万条,并以每万条,并以每天天200条的速度递增。条的速度递增。有超过有超过10万人在维基上编写条目,其中,万人在维基上编写条目,其中,活跃编写人员在活跃编写人员在1万人以上。万人以上。据美国自然杂志统计,维基百科的据美国自然杂志统计,维基百科的科学类条目的错误率与大英百科全书不科学类条目的错误率与大英百科全书不相上下。相上下。WIKI(续)n如何不发生混乱:如何不发生混乱:n在哲学上:在哲学上:“人之初,性本善人之初,性本善”。大家来编。大家来编辑网页是为了共同参与而非破坏。辑网页是为了共同参与而非破坏。n在技术上:采取一些规范,做到既坚持面向在技术上:采取一些规范,做到既坚持面向大众公开参与的原则,又尽量降低参与者众大众公开参与的原则,又尽量降低参与者众多所带来的风险。这些技术和规范包括:保多所带来的风险。这些技术和规范包括:保留网页每一次更动的版本留网页每一次更动的版本、锁定网页、版、锁定网页、版本对比、本对比、IP禁止等禁止等。Tagging与Folksonomyn目前,全世界的网页总数达数百亿个,目前,全世界的网页总数达数百亿个,相当于上亿册图书的字数。如此膨大并相当于上亿册图书的字数。如此膨大并且快速增长着的数字资源如何进行分类、且快速增长着的数字资源如何进行分类、组织和导航?显然依靠有限的图书馆员组织和导航?显然依靠有限的图书馆员或信息导航员是做不到的。用户参与为或信息导航员是做不到的。用户参与为解决互联网信息分类问题提供了一种解解决互联网信息分类问题提供了一种解决思路。决思路。Tagging(标签)与(标签)与Folksonomy(公众分类)技术便应运(公众分类)技术便应运而生了。而生了。Tagging与Folksonomy(续)nTagging是一种新的组织和管理互联网信息的方式,是一种新的组织和管理互联网信息的方式,是一种普通用户运用自由定义关键字的方式进行协作是一种普通用户运用自由定义关键字的方式进行协作分类的活动。用户可以为每篇日志、每个帖子或者每分类的活动。用户可以为每篇日志、每个帖子或者每张图片等添加一个或多个自己认定的张图片等添加一个或多个自己认定的Tag(标签),(标签),也可以看到网站上所有使用了相同也可以看到网站上所有使用了相同Tag的内容,由此的内容,由此和他人产生更多的联系。和他人产生更多的联系。Tag体现了群体的力量,使体现了群体的力量,使得内容之间的相关性和用户之间的交互性大大增强。得内容之间的相关性和用户之间的交互性大大增强。nTags便于搜索引擎和基于便于搜索引擎和基于Tags的分类软件更好的搜索的分类软件更好的搜索和分类信息。和分类信息。n普通用户运用普通用户运用Tagging技术进行互联网内容分类就叫技术进行互联网内容分类就叫做公众分类做公众分类(Folksonomy)。用户参与,将大大改)。用户参与,将大大改善互联网信息的无序状态,有利于信息检索与利用。善互联网信息的无序状态,有利于信息检索与利用。7.开放访问(OA)与机构知识库(IR)n学术信息主要是由大学和研究机构产生学术信息主要是由大学和研究机构产生的;学术信息交付出版商发表时,需要的;学术信息交付出版商发表时,需要支付出版费用;当大学和研究机构需要支付出版费用;当大学和研究机构需要利用这些学术信息资源时,还得向出版利用这些学术信息资源时,还得向出版商支付越来越高昂的成本来采购这些信商支付越来越高昂的成本来采购这些信息。这显然是不合理的。为了应对学术息。这显然是不合理的。为了应对学术信息传播费用昂贵的问题,国际上发起信息传播费用昂贵的问题,国际上发起了开放访问(了开放访问(OpenAccess)运动。)运动。n2001年年12月月1日至日至2日在匈牙利布达佩日在匈牙利布达佩斯召开了斯召开了16人的小型会议。会议通过了人的小型会议。会议通过了开放访问(开放访问(OA)宣言。目的是促使)宣言。目的是促使各学科领域的学术信息通过互联网自由各学科领域的学术信息通过互联网自由利用。目前开放访问学术信息主要有两利用。目前开放访问学术信息主要有两部分组成:部分组成:n通过同行评议的开放访问期刊(通过同行评议的开放访问期刊(Peer-reviewedopen-accessjournals)n自存档(自存档(Self-archiving)学术信息)学术信息开放访问期刊开放访问期刊 Open Access Journals Open Access Journals n目前开放访问的电子期刊已超过目前开放访问的电子期刊已超过1万种,是图万种,是图书馆服务的重要资源。书馆服务的重要资源。n瑞典隆德大学(瑞典隆德大学(LundUniversity)图书馆建)图书馆建立了一个开放访问期刊目录站点立了一个开放访问期刊目录站点(DOAJ),该目,该目录目前收集、整理了经过同行评审的高质量的录目前收集、整理了经过同行评审的高质量的开放访问期刊开放访问期刊3309种,可获全文种,可获全文176848篇,篇,已成为开放访问运动中最有影响的热点网站之已成为开放访问运动中最有影响的热点网站之一。一。(访问日期:访问日期:2008.4.7)n网址:网址:自存档学术信息的长期保存、管理与服务问题n人们普遍运用计算机来处理各种信息,使原生人们普遍运用计算机来处理各种信息,使原生数字化资料数字化资料(Born-digitalmaterial)急剧增长。急剧增长。如:已发表或未发表的期刊或会议论文、专著、如:已发表或未发表的期刊或会议论文、专著、学位论文、科技报告、教学课件、软件、数据学位论文、科技报告、教学课件、软件、数据库、库、PPT、声像资料、动画、图片等等,它们、声像资料、动画、图片等等,它们通常分散保存于个人计算机上。通常分散保存于个人计算机上。n不利于共享利用;不利于共享利用;n易丢失;易丢失;n在若干年之后,可能不为更新后的硬软件所支持。在若干年之后,可能不为更新后的硬软件所支持。n如何长期保存、管理和利用这些学术资源,给如何长期保存、管理和利用这些学术资源,给图书馆提出了新的挑战。图书馆提出了新的挑战。解决之道机构知识库(IR)n既然大学和研究机构是学术信息的产生源,而既然大学和研究机构是学术信息的产生源,而且这些学术信息又分散存储在研究人员和师生且这些学术信息又分散存储在研究人员和师生员工、院系或研究所室的计算机上,那么,大员工、院系或研究所室的计算机上,那么,大学和研究机构便可以将这些分散存储的学术信学和研究机构便可以将这些分散存储的学术信息集中起来,构成所谓的机构知识库息集中起来,构成所谓的机构知识库(InstitutionalRepository,IR),再通过校,再通过校园网甚至通过校际之间的协议,开放访问或利园网甚至通过校际之间的协议,开放访问或利用用(OpenAccess,OA)这些学术信息资源。这这些学术信息资源。这构成了应对学术信息交流费用日益增长挑战的构成了应对学术信息交流费用日益增长挑战的基本对策。基本对策。应用广泛的机构知识库系统应用广泛的机构知识库系统DSpaceDSpace doesnCaptures数字资源采集数字资源采集nDigital research material in any formats directly from creators nDescribes数字资源描述数字资源描述nDescriptive,technical,rights metadatanAssigns persistent identifiersnDistributes数字资源发布数字资源发布nSearches metadatanDelivers via Web,with necessary access controlnPreserves数字资源存储数字资源存储nLarge-scale,stable,managed long-term storage8.结束语n互联网的发展,数字化技术的集聚,是互联网的发展,数字化技术的集聚,是不可阻挡的进程。数字图书馆是新生事不可阻挡的进程。数字图书馆是新生事物,目前的运行方式更多地在模拟传统物,目前的运行方式更多地在模拟传统图书馆。这样做的好处是易于接受,不图书馆。这样做的好处是易于接受,不足是未能充分发挥它的优势。如同其他足是未能充分发挥它的优势。如同其他新技术的发展轨迹那样,数字图书馆的新技术的发展轨迹那样,数字图书馆的发展终将突破传统图书馆的运行模式,发展终将突破传统图书馆的运行模式,成为人们获取信息、存储知识、学习研成为人们获取信息、存储知识、学习研究、学术交流的基本平台。究、学术交流的基本平台。