文献信息资源建设与开发.ppt
文献信息资源建设与开发周庆山北京大学信息管理系(Z)文献资源建设部分第一章概述第一节文献基本概念一、什么是文献?外延在扩大标准的概念文献是一种记录知识的传播媒介。二、文献类型:印刷型、缩微型、视听型、电子型、网络传递型三、文献的整体发展特征与规律:数量急剧增长:内容交叉重复类型、语种多样老化速度加快载文聚散呈现规律第二节文献资源:社会智力资源和物化了的知识财富。特点:再生性积累性可建性冗余性共享性价值潜在性资源分布文献资源建设:是指一定范围内的图书馆及其它文献情报机构对文献资源进行有计划的积累和合理布局,以满足、保障社会发展和国家建设需要的全部活动。微观意义的文献资源建设是指各个文献情报机构对文献的收集、组织、管理、储存等工作。宏观意义的文献资源建设是它突破了馆与馆的界限,立足于一个地区、一个国家乃至国际之间的需求而进行全局性的文献资源布局和协调发展工作。文献资源建设与图书馆藏书建设的关系文献资源建设工作的主要内容对现有的文献资源开展调研确定目标、制订规划馆藏文献的收集与选择建立有权威的文献资源管理或协调机构,确定成员单位、建立各种协作关系文献资源组织、管理、评价我国文献资源建设的问题文献藏量不足入藏文献重复浪费现象较为严重:如,外文原版科技期刊重复率60%,而专业覆盖面不到38%。文献资源利用率较低:据统计,我国外文科技期刊的利用率最高为30%,利用低的不到5%,文献存储单位平均有50%-70%的书刊处于无人问津的状态。利用国际联机检索终端检出的文献约有40%-50%在我国找不到原文。文献资源建设资金缺乏有效保障队伍素质不高,将文献采选工作简单化。网络信息资源组织缺乏有效组织方法第三节文献资源建设工作的基本任务1、确定文献资源建设工作的基本指导思想2、加强藏书发展政策研究图书选择与采访政策经费分配政策藏书管理政策藏书发展纲要合作藏书、馆际互借与资源共享政策捐赠政策机读数据库文件政策藏书保护政策文献剔除、评估政策信息自由与检查政策3、合理配置与优化配置文献资源:文献资源布局原则完备性适应性协调共建效益4、建立各具特色的馆藏文献:文献的地方特色、类型特色、专业特色、文种特色等5、加强协作协调、推进共建共享第二章馆藏文献资源结构与建设原则第一节馆藏文献结构图书馆藏书体系中不同藏书成分、不同学科内容、不同收藏水平的藏书间的关联组合形式,它反映藏书体系各个部分的组织形式及相互关系,规定着不同学科、类型、水平的文献在藏书体系中所占的比例。学科结构等级结构:完整级研究级大学级基础级最低级时间结构文种结构类型结构第二节各类型图书馆的藏书体系一、国家图书馆二、省市公共馆市县公共馆高校系统专门图书馆第三节实用性原则第四节系统性原则其他原则1.经济性原则2.针对性原则3.区域性原则4.互补性原则第三章文献资源的来源第一节国内外出版物系统第二节文献发行系统国内国内外文献发行方式的趋向网上售书活跃大型书店向图书超级市场转化兴办连锁书店或联号书店:我国全国购书网第三节网络信息资源早期联机检索系统中的信息资源因特网资源:书目信息、电子报刊、文件文档、电子邮件等信息网络信息资源建设的任务跟踪调研技术与工具的使用规划和布局协调各个机构和图书馆第四章馆藏文献的选择与采集第一节文献选择及其组织形式文献选择是指图书馆遵循一定的方针、原则、标准,对众多的文献进行鉴别、判断,从中挑选出适合馆藏文献资源建设目标及用户需要的文献的过程。文献选择的标准和方法:文献选择标准的理论及流派19世纪末20世纪初,杜威的“价值论”克特的“需要论”1925年,英国麦高文公共图书馆选书理论中的“图书选择评分法”。文献计量学方法:阮冈纳赞“使用概率”标准文献选择标准文献内容的主题文献的用户对象文献的责任者文献的出版者文献的价格文献选择中的几种关系重点和一般的关系入藏与本地区生产建设和科研的一致与原有馆藏重点一致本地区历史地理条件与其它图书情报机构协调品种和复本的关系:复本量的确定现实用户数文献借阅制度有效使用期文献类型、专业价格图书馆复制文献能力网络化程度复本量确定的经验模式法和数学方法:D=LR/12E(1+C)+S+K+WD:复本量R:某种文献的用户数L:借阅期限(月)E:文献内容的有效期C:用户续借该书的概率S:分馆K:保存本数W:预计损耗数图书与期刊的关系中文与外文的关系印刷型出版物与电子网络出版物的关系:检索类第二节文献采集方式:文献购入:订购、现货选购、委托代购、邮购、复制、文献非购入:呈缴、调拨、征集、交换、捐赠文献资源网上采集:网络工具书、期刊、报纸网络手段:获取出版信息、选择文献、电子订购、催询、数据分析第三节文献采集的书目工具第四节文献采访工作流程书目搜集文献选择文献查重文献订购文献验收第五章馆藏文献的布局与典藏第一节馆藏文献的布局原则馆藏文献的布局原则藏书方便利用功能明确实用运转灵活馆藏空间布局结构形式第二节馆藏文献排架第三节馆藏文献的管理第六章馆藏文献的评估与剔除第一节馆藏文献的评估第二节馆藏文献的剔除第七章整体化文献资源建设第一节历史第二节面临的问题和目标第三节布局模式第四节加强建设第八章组织管理第一节文献购置费的筹措与管理第二节队伍建设第三节采访、典藏流程与职责规范第四节采访、典藏制度与考核文献资源开发部分信息资源的开发利用是国家信息基础结构建设的首位(1)信息技术是指开发和利用信息资源的一切工具或手段;(2)信息产业是由信息技术产品制造业和信息内容服务业构成。制造业是信息资源开发利用的支撑体系,服务业是信息资源开发利用的中介体系;(3)信息活动包括信息市场交易、信息咨询服务、信息发布交流、信息广告宣传等。但不论是哪一种形式,都是以信息资源开发为基础,以信息资源利用为目的的信息行为;(4)信息高速公路是为了行车拉货。信息高速公路上的“车”、“货”就是信息。立法、规章制度、条例、标准规范、是为了保证信息资源开发利用等所有活动的有序化、合法法等。有效开发利用信息资源推动新生产力的发展信息化解放了生产知识、智慧和发展科学技术的生产力,形成了人类有史以来最先进最强大的社会生产力。统计数据表明,如果以一项科研成果的研究费用为1,发展推广费用则为10,生产费用达100,而信息获取的费用只有0.05。日本战后二十年中,共花了57亿美元引进国外的信息专利和设备,若全由日本自己研制,则需要2000亿美元。我国航天部710所也作过测算,对信息每投入一元,可以得到13元的产出。衡量国家综合国力的重要指标首先它是一个国家信息产业发展水平的重要标志,而包括信息技术产业、信息内容和服务业在内的信息产业在国民经济中有着举足轻重的作用,占有很大的比例,是一个国家尤其是现代国家国民经济和国家实力的重要组成部分。其次,信息资源的开发利用还可以对国民经济的其他部门起到倍增器的作用,提高其他部门的经济效益,直接或间接促进经济、科技、政治、军事和外交能力的提高,从而增强综合国力。第三,信息资源的开发利用涉及到信息内容、信息载体、信息系统与网络、计算机硬件与软件、通信以及人才等诸多方面,而这些又是构成一个国家经济、科技、文化和国防实力的因素之一。第一章概述第一节文献信息开发的意义和作用第二节 概念和种类(信息需求)文献信息开发:对内容进行多层次加工揭示和有序化,并根据读者需求和信息市场营销策略以多样化产品形式提供给用户的工作。传统型和新技术型加工深度载体形式第三节影响文献信息开发的因素第四节开发原则衡量信息资源的开发利用程度的指标信息资源的收全率、信息资源的有序化、信息资源的可获取性、信息资源的时效性、信息资源的利用率等。原则社会需求市场营销产品标准化整体协作第五节开发现状与发展开发过程传统型文献开发阶段剪报、综述、调研报告等产品开发音像型和数据库型文献产品多媒体和网络型开发复合文献开发:集印刷与附带电子媒介于一体的文献信息第六节拓宽图书馆的信息形式兼具博物馆、美术馆和综合文化实体的职能实物和形象资料第七节 从文献信息开发到信息资源开发与加值DefinitionofTerms事实(facts):人类思想和社会活动的映射数据(data):事实的数字化和序列化信息(information):事实和数据在信息媒介上的映射知识(knowledge):对信息的加工、吸收、提取、评价的结果智慧(wisdom):运用知识的能力创新(innovation):发展社会生产力的新智慧事实信息数据知识创新智慧记录加工R&D运用评价信息交流过程信息:包含内容和形式两个侧面-信息内容传递信息的含义-信息形式指信息格式和信息类型(例如文本、数学模型、数值数据、编码数据,影象、图表等)和内容表达和结构(例如语言、句法和语义结构、模型类型、图形类型、图表结构等)介质:传递信息的载体与信息有关的过程信息编写-写作、设想数学模型、编码信息内容的转换-改变主题和重新编辑等格式化-文本描述、数学模型转换为数据库或图表等结构转换-语言翻译、数学模型转换等描述和合成-HTML编码、索引、文摘和摘要、最新动向评述、情报检索、情报评估和分析等与介质有关的过程记录-数字化、包装、HTML标准格式、复制等物理转换从某种媒体转换为另一种媒体存储为长时间访问某种媒体作准备,例如馆藏和计算机文件保管保证媒体长时间的可用性物理存取媒体的存取和传递,如书刊传递、电子媒体传递、Internet等网络传递等衡量信息资源的开发利用程度的指标信息资源的收全率、信息资源的有序化、信息资源的可获取性、信息资源的时效性、信息资源的利用率等。信息资源n数字化、多媒体、TB量、网络传播的信息资源n为信息化社会和信息社会化开发利用信息资源n为提供知识服务开发和利用信息资源n去伪存真的信息资源的开发和利用n内容创建的自动化和智能化n信息挖掘和知识发现n数字地球共建和共享信息战略n更新传统信息采集、数据库建设和信息提供模式和观念信息资源开发的规律探讨信息经开发而成为资源内容创建是开发的基础信息开发遵循热力学法则信息技术是推动力有效高效开发信息资源信息资源开发的规律探讨l信息经开发而成为资源信息同自然资源一样,不经过开发即不能造福于人类和社会。不是所有的信息都是有用的,信息有垃圾,需要去伪存真。社会需求不同,信息的有用性和价值也不同。开发是信息资源服务于社会的必要前提,信息资源开发是社会信息基础结构的组成部分。l内容创建是开发的基础信息的开发就是利用信息技术对信息内容的表达、传递和加值过程的不断循环。信息的内容创建没有止境。内容创建的广度和深度决定信息资源开发的水平和质量。信息资源开发的规律探讨l信息开发遵循热力学法则信息同其他物质一样按特定的规律运动,同样遵循热力学的熵法则。物质的有序化需要功的作用。信息内容的开发是社会行为,需要社会投入,有序化程度同投入的能量成正比。信息资源开发的规律探讨l信息技术是推动力信息技术是信息内容的表达、传递和加工的方法和技术,是决定信息生产力的决定性因素和推动力。但是,“信息技术”的“信息”是目的,“技术”是手段,信息技术推动的是信息生产力的发展。信息资源开发的规律探讨l有效高效开发信息资源信息需求和信息资源之间需要信息服务业的社会存在。信息服务业的任务是有效高效开发信息资源,节省信息使用者利用信息的时间和努力。第二章二次文献信息开发工作第一节概述二次文献:对大量的无序的一次文献按照编辑目的进行收集、特征著录和内容浓缩,并按照一定的规则有序化而形成的可供检索的一种文献形式,如书目、索引和文摘等书目作用:检索、报道和导读类型国家书目出版社和书店联合目录专题文献目录索引:作用类型文摘:作用类型第二节开发总论确定检索要求综合检索分析检索分级检索编制体例主体部分检索部分说明部分附录部分文献源:确定文献收录范围内容范围文献类型文献载体时间跨度语种著录项目和款目格式著录事项款目格式:检索期刊编辑总则检索期刊条目著录规则排检系统:存储和检出标引系统检索语言:描述外表特征的描述内容特征标引工具;分类法,主题词表连结系统参照注释倒置排列检索系统评测标准(1)运行在多种OS/硬件平台的能力跨库检索数据库建库速度数据库数据容量数据库检索速度文本和索引的膨胀比数据的查准率、查全率查询结果的相关性排序能力检索系统评测标准(2)WEB应用支持、WEB服务和数据库服务的分布处理系统二次开发支持集群、负载自动均衡功能支持简、繁体和中英文混合检索对光盘库的支持数据库记录的追加、删除、修改、恢复数据库备份、结构重组、优化检索系统评测标准(3)分布式检索支持并发访问的最大用户数安全防范机制数据类型完整性系统管理用户能力数据库日志分类表、主题词表管理能力多媒体数据的处理支持大量用户并发查询的技术措施检索系统评测标准(4)用户界面的通用和完整性检索功能完备性系统对版本升级或运行平台迁移的支持也包括数据库、管理方式、web开发工具的兼容性CD-ROM电子出版计帐管理网上数据采集搜寻工具检索系统评测标准(5)售后服务WEB信息发布的方便性各种数据格式的处理及转换能力(包括HTML文件的收集与入库)数据转换的准确性数据辅助标引的方便性对原有检索数据的包容和转换入库用户规模和使用的情况第三节书目和文摘的编制书目的编制:分类号顺序或主题词字顺文摘的编制文摘杂志著录事项、格式和排检法编写要求:相符性、不变性浓缩法移植法组面分析法第四节索引的编制编制流程选取标目编制参照制作和排列款目编辑加工机编索引各类型索引的编制法著者索引引文索引序号索引题名索引分类索引主题索引关键词索引概念组配索引第三章三次文献信息开发工作第一节类型与作用类型:综述类、报道类、工具类综述简讯述评调研报告百科全书年鉴手册、工具书指南三次文献的编辑原则针对性和独立性客观性和准确性科学性和兼容性及时性和导向性第二节各类型开发不同需求的三次文献开发决策需求立项需求检索需求事实数据查源水平对照需求教育普及需求处理综述的六大关系综与述冷与热多与寡回朔与即时庄与谐规范与自由开发注意事项效用与成本理想与可行先进与适用政策与保密第三节预测性信息资源开发方法预测信息资源开发预测性信息资源开发的特性规律性动态性抽象性想象性创造性多元性超前性开发方法趋势外推法类比推理法文献计量法特尔菲法经验预测法相关预测法第四章一次文献信息开发工作第一节概述一次文献就是原始文献:包括一些特种文献开发一次文献有利于变无序为有序,提高利用率。开发和加工的类型著录分类与主题标引第二节剪报工作一种专题资料。作用有针对性发挥资源优势节约阅读时间延伸领域培养适应市场需要的专业人员类型报纸剪报预定专题信息用户自定专题信息常年专题信息剪报阶段信息剪报综合信息剪报网络剪报第三节外文文献开发工作包括外文图书、报刊以及电子出版物外文文献信息编译编译资料索引数据库建设与企业联姻外文图书开发主动揭示外文图书提要导读书展馆际互借剔旧更新检索系统第四节竞争情报开发研究竞争情报环境调查竞争情报对手分析自身素质提供竞争情报咨询第五章数据库开发工作第一节概述计算机可读的、有组织的数据集合层次型、网络型和关系型主要类型依内容分文献型和非文献型文献型书目数据库二次文献数据库书目相关数据库全文数据库非文献型数值事实管理型源数据库依数据库媒体类型分数据库的作用发展状况20世纪60年代到70年代初,以科技文献为主20世纪70年代中到80年代中为商业和金融数据库为主的市场导向80年代后进入社会应用,1985年光盘应用国外发展状况一体化产业化法制化高速化网络化世界性的大型数据库在全球近3000个,其中70设在美国;在互联网上被频频访问的也主要是美国等发达国家的站点,世界最大站点的前几位都在美国。第二节数据库资源建设的必要和可行性必要性资源战略需要自动化与网络化、资源共享的保证适应用户需求变化改变资源不合理布局可行性网络计算机制作技术国家政策用户利用第三节原则、对策原则适合国情原则特色化与分工协作、引进与自建结合资源共享完备性我国现状与问题对策宏观调控信息元为单位优先发展商用横向联合光盘数据库标准化建设人才培养第四节具体开发工作立项原则定位需求特色效益共享标准化持续发展建库地方文献特藏开发产品特殊服务建库方案目标主体具体规划工作与管理机构与人员硬件与软件流程培训组织质量控制第五节标准化和规范化数据通讯格式标准化国际和国家标准载体格式、数据元素定义和数据元素组定义ISO书目信息交换用磁带格式国际标准中国机读目录格式编目格式一体化解决出版物多类型问题多语种虚拟信息资源编目文献著录标准化著录总则和分则各种代码标准分类、主题标引和规范控制多媒体数据库和电子出版物标准化SGML:标准通用置标语言,将一些标识符添加到文献中,用来划定结构元素的界限并说明元素的类型和属性。应用于电子出版物可进行字符集与字符转换是一种元语言通用置标数据库生产能力评价实用、精品、商业数据库数量数据库质量数据库覆盖率数据库收全率数据库检索性数据库可获取性数据库经济性数据库时效性数据库规范性多媒体数据库数据库产品形式官学产数据库生产协调性第六节各类文献数据库开发二次文献数据库的开发确定建库目标及功能确定建库数据来源、项目、格式及标准选定软硬件环境建库流程和质量控制产品与效果事实和数值数据库开发中国自然资源数据库事实与数值数据库的特点可靠和权威性结构化定长数据,无标准交换格式综合性强定性和定量结合3、系统4、产品和效益三、全文数据库开发工作1、类型2、特点3、开发方式4、开发技术四、多媒体数据库开发1、类型2、开发特点和流程3、输入与格式4、开发技术第七节数据库开发与数字图书馆实例1、建库2、信息内容分析与组织3、模型第八章因特网信息资源 第一节概况、因特网服务(含个性化服务)可编索引的网页已超过亿Internet上可编索引的网页已超过亿,如果加上大量无法编索引的网页,Internet网页总数则更多。亿多网页中,近为英语,法语网页占。10亿网页中除了存在丰富的有益信息外,还存在大量色情、暴力、虚假广告等有害信息,这些垃圾信息泛滥已形成网络新公害,阻碍了用户迅速查找有用信息。来源:美国基础软件开发商英克托米1月日公布的研究结果第二节基本功能第三节网络环境信息组织面临的新问题第九章因特网信息资源开发工作第一节资源的特点和选取原则选取原则1、准确性2、权威性3、时效性4、稳定性和连续性5、使用频率6、覆盖面7、重复性8、容易使用第二节网上搜寻工具和技巧检索策略和搜索技巧1、搜索范围限定2、组配检索3、检索结果输出4、快速浏览第三节传统技术在网络组织和检索中的应用第四节图书馆网络信息资源开发及利用(网络信息资源评估)一、馆藏发展中的应用书目核实工具发行订购信息电子出版物试用发展资源二、参考咨询应用综合联机检索系统各专科信息服务网络咨询服务第五节 图书馆网络信息资源建设和管理(适应网络环境的信息分类)提供分类链接数据库查询网络资源数据库建设信息内容的加值内容创建是指按照特定的信息需求对信息内容进行表达、传播和加工的信息产品和服务。社会的信息需求千差万别,信息内容的价值也随着对信息内容表达、传播和加工的方式不同而异。对信息内容表达、传播和加工而创建新的信息内容,就是信息加值的过程。内容创建的结果就是信息的加值。信息内容表达的加值数字化:把信息内容转换成计算机可存取或可转换的符号系列。多媒体化:信息内容以文本、数值、图形、图象、视频、声音表达。多介质化:信息内容记载在各种纸介质、磁介质、通信介质上。多语言化:语言相互转换。信息内容传播的加值网络提供:通过Internet/Intranet或其他通信网络对外提供。广播提供:通过广播或电视提供数据广播或图文广播。封装提供:出版印刷、出版CD-ROM或提供软盘、磁盘等介质。信息内容加工的加值(1)有序化:抽取特征并按特征的特定序列进行组织。结构化:按数据处理的要求加以结构化,越结构化,处理量越大,但越便于处理。格式化:按数据处理规范要求加以格式化或进行格式转换。,存贮化:视信息内容是永久保存、短期保存或不保存采取不同的存贮策略。检索化:信息是否需要检索,复杂检索还是简易检索记录化:产生的信息按成品信息、半成品信息或一过性信息加以记录。信息内容加工的加值(2)加工性:为以后对信息内容的处理或精密加工事先做好准备,提供现成半成品。合成化:综合不同来源、不同格式、不同媒体的内容为新的内容。浓缩化:制作二次文献、数据手册、年鉴、汇编或自动摘要等。成品化:提供现成可用的信息产品。精品化:为特殊需要对信息内容进行精雕细刻,作为精品提供。信息内容加工的加值(3)交互化:是否需要人机对话,是1:1或1:M或N:M对话。,时效化:按信息需求规定的时限完成内容创 建,例如股市、新闻等时效要求很强。友好化:让用户易学易用,操作简便。机动化:使用场所无需选择低价化:使用成本越低越好本地化:结合用户本地情况创建内容。客户化:按照客户“定做”的要求创建内容。智能化:赋予信息内容以新知识、智能和智慧,例如情报研究、数据挖掘等。