基于学科内容特征的图情档一体化程度测度研究.docx
《基于学科内容特征的图情档一体化程度测度研究.docx》由会员分享,可在线阅读,更多相关《基于学科内容特征的图情档一体化程度测度研究.docx(9页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、基于学科内容特征的图情档一体化程度测度研究基于学科内容特征的图情档一体化程度测度研究 王光志 武华维 王超 摘 要 随着互联网和信息技术的发展,图书情报与档案的工作环境、内容、方式等发生了变化。本文从学科内容角度出发,利用期刊论文的题录信息,提出一种测度图书情报与档案一体化程度的方法。根据齐普夫定律对主题词赋权,对通过改进Jaccard相似系数计算学科内容特征的相似度,提出一体化指数测度三者一体化程度,最后以中国图书馆学报情报学报档案学研究三种核心期刊为对象进行实证研究。结果发现,三者在某些领域存在逐渐融合的态势,但是这种融合的主题内容范围和融合的程度仍然限制在一定范围,即没有出现较为明显、剧
2、烈变化。 关键词 学科内容 图情档一体化 测度方法 Abstract The development of the Internet and information technology has changed the working environment, content and methods of library, information and archives. To this end, from the perspective of subject content, a method for measuring the degree of integration of libra
3、ry, information and archives is proposed. Firstly, according to Zipfs law, the subject words are empowered. Secondly, the Jaccard similarity coefficient is improved to measure the similarity of the subject content. Thirdly, the integration degree of the integration index is proposed. Finally, Journa
4、l of the Library Science in China, Journal of the China Society for Scientific and Technical Information and Archives Science Study are empirically analyzed. The results show that there is a gradual integration of the three in some areas, but the scope of the subject matter of the fusion and the deg
5、ree of integration are still limited to a certain extent, that is, no obvious and dramatic change. Keywords Subject content. Integration of library, information and archives. Measurement method. 0 引言 自上世紀六七十年代,“图书、情报、档案一体化”被提出以来1,国内有相当一部分学者认为图书、情报、档案工作一体化是必然的发展趋势,并以此为中心展开了许多相关研究。随着互联网和信息技术的迅猛发展,图书情报
6、、档案的工作环境、内容、方式等内容也随之发生变化,尤其是人工智能、物联网、云计算等信息技术的出现,使得图情档的学科体系和能力建设无法忽视信息和数据这一核心2。在信息化、网络化的今天,图书、情报、档案一体化这一命题是否仍然成立,并且图书、情报、档案的一体化程度如何?现有的研究似乎对这一疑问尚未有充分的认识和研究。鉴于此,本文采用一种定量分析的方式,从学科内容的角度出发,构建一种图书、情报、档案一体化的测度方法,以期为相关研究人员提供一种观测新背景下图书、情报、档案一体化发展程度的新方法或新途径。 1 相关研究综述 1978年,中国科学院最早提出“图书与情报一体化”,以提高工作效率、避免重复浪费,
7、便于统一领导规划3。这引起学界广泛关注,随后国内学者展开了一系列图书、情报、档案一体化的相关研究。首先,部分学者对图书、情报、档案一体化的必要性和内在依据展开相关研究,如刘英则和吕福玲4认为图书、情报、档案同属于知识载体,都是信息的范畴,这便为三者一体化管理提供了理论依据。李学军5认为图书、情报、档案三者都属于信息源的一种,这种共性便为图情档一体化提供了理论基础,同时,这种共性使得三者会拥有相同的服务或工作对象,其工作方式和技术方法手段也会相同。另外,许芳6、符少华7、李华8等学者认为,图书、情报、档案是企业进行科技信息管理的重要手段,在信息技术时代背景下,通过图书、情报、档案三者间的知识共享
8、,可以增强企业知识创新,提供企业竞争力,所以对企业来说,图书、情报、档案一体化是必然趋势;而宋雄伟9、余敏10、翁雪梅11等学者认为,图书、情报、档案一体化,对高校的教育、教学、科研发展起着重要的推动作用,便于图书情报学科相关知识在学校内部的共享与流动,所以实行图情档一体化是改善和发展现代高校信息服务的趋势。 为了进一步论证图情档一体化的可行性,相关学者调研了欧美国家中图情档一体化的理论和实践研究。李群和刘维荣12发现,美国、英国和日本在图情档一体化方面主要体现在利用网络和信息技术实现三者数字资源的共享以及一体化管理。李群13进一步对美国的教学实践进行研究,发现美国大学的档案学与图书馆学、情报
9、学之间的教学联系紧密,三者在教学中相互渗透。张锦和王海兰14研究发现,英国电影组织(BFI) 在组织和功能上实现英国电影信息中心、英国国家影视图书馆、英国国家影视档案馆三者之间的一体化运行模式。 随着研究程度的深入,学者开始重点研究图书、情报、档案一体化策略,具体来说,就是研究从哪些方面可以更好地实现图书、情报、档案一体化的开展和进行。如叶鹰15进一步探讨了图书情报档案一体化的学理基础;吴营和季晓琳16参考xxxx标准管理原则,探讨了图书情报档案一体化的质量管理。田丽17探讨了辽宁省图书、情报、档案专业人才校馆所联合培养的模式。王小云18从图书、情报、档案的专业课程资源的建设角度,探讨了图书、
10、情报、档案一体化专业教育的问题。赵益民19探索了图书情报档案的一体化整合模式,尝试通过行业联盟的形式对图书情报档案从虚拟层次进行一体化整合,以实现资源建设和业务管理的整合。 综上所述,可以发现几乎所有涉及图情档一体化的相关研究都未持怀疑乃至否定态度,当然也有部分学者就图情档一体化的可行性进行了论证,如葛翠玲20对图情档一体化开展了否定性检验研究,论证结果多认为图情档一体化在我国具有很强(或者一定的)可行性。但是,笔者认为部分学者显然混淆了图情档一体化的概念内涵。其实,图情档的一体化是在保持三者独立性,而不是取消三者独立性的基础上相互联系、相互渗透的,三者是在较高程度的协调性、统一性和整体性21
11、上,为社会提供信息保障,三者的本质都是信息工作系统22,包括工作流程的一体化、服务对象的一体化、资源建设的一体化,学科建设的一体化等等。从现有文献中发现,学者多从信息资源一体化、工作流程一体化、服务流程一体化等工作实务上进行的定性研究,尚未提及较为系统或详实的定量分析。当然也有部分学者从学科建设方面了一些图书、情报、档案一体化的定性探讨,但是多数研究似尚未对学科内容方面进行较为深入的定量分析。如刘满闪和焦运立23从基本共性和非基本共性的角度探讨了图书、情报、档案一体化的学科依据;赵国俊24研究了图书、情报、档案三个学科发展的分化和整合趋势,他认为当前三个学科在不断分化和整合,其中整合成为主流形
12、态。张莉娅和邓勇25从著者交叉和知识网络的角度分析了图书、情报、档案三个学科的交叉融合,利用期刊论文中的著者和关键词分析发现三者虽属于同源性学科但是三者之间有着本质的区别。初景利和张颖2指出当前图情档存在学科边界模糊、学科融合危机、体系构建艰巨等问题。闫慧26认为图情档三个学科之间存在认同危机,三者不仅长期以来存在话语碎片化、内生力不足的问题,而且图书馆、档案两个学科偏文和情报学话语偏理,这一切都使得三者之间的融合难道较大。 2 图情档一体化程度分析框架 随着期刊全文数据库、文摘数据库及信息技术的发展,期刊论文的题录信息成为承载文献内容的重要元数据。利用相关技术和方法对某一学科领域的期刊题录信
13、息进行处理与分析,可以揭示该学科研究与发展的内外部特征27-29。考虑到学科内容主要以文本信息为承载对象,而期刊承载了学科发展、建设方面的信息,所以本文从学科内容的角度来测度图书、情报、档案一体化程度时,主要以期刊为数据对象、以文本处理及分析方法为手段。如果代表学科内容的图情档三类期刊题录信息之间呈现较高的一致性,即研究内容较为相似,则说明图书、情报、档案在学科内容的一体化程度较高,反之则说明三者一体化程度不紧密。其具体的分析框架见图1。 3 数据处理方法 本文以期刊的题名、摘要、关键词三种题录信息来表征图书馆学、情报学、档案学学科的主要内容。考虑到主题是表示学科内容的基本单位,本文利用自然语
14、言处理技术对题名、作者关键词和摘要作为输入数据源作进一步的文本分词处理,以分别获取图书馆学、情报学、档案学学科领域主题词。 3.1 数据处理工具及流程 本文主要采用python语言中的jieba分词工具来进行文本分词。同时,考虑到该工具中分词词表可能无法识别这三个学科的专业主题词,所以本文同时将作者关键词作为分词词典的重要补充;然后,使用自建的常用停用词表对分词结果进行进一步过滤,然后再进行词性分析,仅保留包含实意的动词、动名词。最后,分別对图书馆学、情报学和档案学数据集中的关键词进行频次统计,然后根据词频的大小选取前100个高频词,分别形成三个主题词集合Term情报、Term图书馆、Term
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 学科 内容 特征 图情档 一体化 程度 测度 研究
限制150内