南昌大学文献检索PPT课件(全).ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《南昌大学文献检索PPT课件(全).ppt》由会员分享,可在线阅读,更多相关《南昌大学文献检索PPT课件(全).ppt(100页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、教学目的和任务:教学目的和任务: 本课程是一门本课程是一门实践性很强实践性很强的的科学方法课科学方法课,其其教学目的教学目的有两个:有两个: 一个是培养学生的信息意识(内在动因);一个是培养学生的信息意识(内在动因); 另一个是训练学生的检索技能另一个是训练学生的检索技能 (教学活动的最终目的)。(教学活动的最终目的)。 开设本门课程的开设本门课程的任务任务是:是: 通过本课程学习,使学生了解各自专业及相关通过本课程学习,使学生了解各自专业及相关专业文献概况,掌握信息检索的基本原理与方法,专业文献概况,掌握信息检索的基本原理与方法,掌握信息检索的检索方法及技巧,从大量的文献信掌握信息检索的检索
2、方法及技巧,从大量的文献信息源中息源中快、准、全快、准、全地地获取有用的信息。获取有用的信息。学时学分:学时学分:2020学时、学时、2 2学分学分授课方式授课方式: : 课堂讲授(多媒体教学)课堂讲授(多媒体教学) 检索实习(计算机检索)检索实习(计算机检索)实习和考试地点:实习和考试地点:图书馆电子阅览室图书馆电子阅览室考试形式:考试形式:开卷考试开卷考试要求:要求:1、认真对待每一次实习,并当堂完成实习报告、认真对待每一次实习,并当堂完成实习报告2、遵守图书馆的规章制度:、遵守图书馆的规章制度: 保持室内安静,不准高声喧哗;保持室内环境卫保持室内安静,不准高声喧哗;保持室内环境卫生,严禁
3、吸烟、随地吐痰、乱扔纸屑,不得在生,严禁吸烟、随地吐痰、乱扔纸屑,不得在门窗、桌椅上乱涂、乱划。门窗、桌椅上乱涂、乱划。3、上机实习时禁止玩游戏、聊天、看电影等。、上机实习时禁止玩游戏、聊天、看电影等。4、实习作业要求独立完成,不得相互抄袭,违者、实习作业要求独立完成,不得相互抄袭,违者双方实习成绩均以零分计。双方实习成绩均以零分计。 第一单元第一单元 信息检索基础知识信息检索基础知识 1.1 1.1 信息与文献信息与文献 1.1.1 信息、文献信息、文献 1、信息、信息信息信息是既古老又年轻的一个词汇。是既古老又年轻的一个词汇。 字面上:信息是音信、消息的意思。字面上:信息是音信、消息的意思
4、。 本质上:信息是客观事物的存在方式本质上:信息是客观事物的存在方式 和运动状态的反映。和运动状态的反映。(物质的属性物质的属性)数字信息数字信息是以数字化形式存储和检索的是以数字化形式存储和检索的 信息。信息。 2、文献、文献 文献文献是记录有知识和信息的一切载体。是记录有知识和信息的一切载体。 具体地说,文献是将知识和信息用文字、具体地说,文献是将知识和信息用文字、图表、图像、音频、视频等记录在一定的物图表、图像、音频、视频等记录在一定的物质载体上的结合体。质载体上的结合体。 它由它由 4个要素个要素组成组成: 所记录的知识和信息,即文献的所记录的知识和信息,即文献的内容内容。 用于记录知
5、识和信息的物质用于记录知识和信息的物质载体载体。 记录知识和信息的记录知识和信息的符号符号。 记录的记录的方式或手段方式或手段。 文献的类型多种多样。文献的类型多种多样。1、按、按载体形式载体形式(即按(即按信息存储信息存储载体的物质形态载体的物质形态)分可分为:)分可分为: 印刷型印刷型 缩微型缩微型 电子型(机读型)电子型(机读型) 声像型(视听型)声像型(视听型)1.1.2 文献类型文献类型(信息源信息源)印刷型文献印刷型文献(传统的文献形式)(传统的文献形式)载体:载体: 纸张纸张记录手段:记录手段:手写、印刷等;手写、印刷等;记录符号:记录符号:文字、图表文字、图表等;等; 优点:优
6、点:便于阅读和流通;便于阅读和流通;缺点:缺点:存储密度低、占用储藏空存储密度低、占用储藏空 间多,不易管理和保存等。间多,不易管理和保存等。电子型文献电子型文献(文献的发展方向)(文献的发展方向) 电子型文献:电子型文献:(前身是(前身是机读型机读型文献文献)是指把原有的论文、照片、)是指把原有的论文、照片、录音和图像等非数字信息,运用数录音和图像等非数字信息,运用数字化技术处理后存贮在一定的介质字化技术处理后存贮在一定的介质上,成为上,成为计算机可以读取、检索的计算机可以读取、检索的数字信息。数字信息。载体:载体:磁带、磁盘、光盘等磁性或磁带、磁盘、光盘等磁性或 光学信息介质;光学信息介质
7、;记录手段:记录手段:打字、穿孔、光学字符打字、穿孔、光学字符 识别等;识别等;种类:种类:电子图书、电子杂志、电子电子图书、电子杂志、电子 报纸、联机数据库、网络数据库、报纸、联机数据库、网络数据库、 光盘数据库、计算机软件等。光盘数据库、计算机软件等。优点:优点:存储密度高,存储速度快、存储密度高,存储速度快、 信息处理方便等;信息处理方便等;缺点:缺点:使用费用高等。使用费用高等。电子文献按载体形式分电子文献按载体形式分: 2、按、按文献内容加工文献内容加工情况情况(即按(即按信息的加工信息的加工深度和结构等级深度和结构等级),),分为:分为: 一次文献(原始文献);一次文献(原始文献)
8、; 二次文献(检索工具)二次文献(检索工具) (主要用于文献检索);(主要用于文献检索); 三次文献(参考性文献)三次文献(参考性文献) (主要用于事实与数据检索)。(主要用于事实与数据检索)。 3、按、按出版形式出版形式(即(即信息的不同出信息的不同出版类型版类型),可分为:),可分为: 图书、报刊(连续出版物)、科技图书、报刊(连续出版物)、科技报告、会议文献、专利文献、标准报告、会议文献、专利文献、标准文献、产品样本、学位论文、档案文献、产品样本、学位论文、档案文献、政府出版物等。文献、政府出版物等。 非书非刊的文献统称为非书非刊的文献统称为特种文献特种文献。1.2 1.2 信息检索与检
9、索系统信息检索与检索系统1.2.1 信息检索信息检索 信息检索(信息检索(Information RetrievalInformation Retrieval) 广义的广义的“信息检索信息检索”概念包括两个方面:概念包括两个方面: 其一,将信息按一定的方式组织存储其一,将信息按一定的方式组织存储起来(存储过程);起来(存储过程); 其二,根据信息用户的需要找出有关其二,根据信息用户的需要找出有关信息(检索过程)。信息(检索过程)。狭义的信息检索狭义的信息检索则仅指后者。即则仅指后者。即指指根据信息根据信息用户的需要,用户的需要,运用检索工具或书目数据库运用检索工具或书目数据库等信息集合,从中等
10、信息集合,从中查找所需信息的过程查找所需信息的过程。 信息检索基本原理信息检索基本原理 特征化特征化表示表示特征化特征化表示表示信息信息需求需求信息信息集合集合个人问题与知识个人问题与知识匹配与选择匹配与选择外部知识外部知识信息检索的信息检索的基本原理基本原理,我们可以用一,我们可以用一句话把它最本质的部分概括为:对句话把它最本质的部分概括为:对信信息集合息集合与与信息需求信息需求的的匹配与选择匹配与选择。1.2.2 检索系统检索系统 检索系统检索系统(Information retrieval system)是利用一定的是利用一定的设备和方法设备和方法从某种从某种载体载体(书本、胶卷、磁带、
11、光盘、网络等)书本、胶卷、磁带、光盘、网络等)上的文献、事实或数值记录等上的文献、事实或数值记录等信息集合信息集合中中查找查找所需信息的系统。所需信息的系统。 检索系统具有检索系统具有存储和检索存储和检索两种基本功能。两种基本功能。检索系统按其功能可分为:检索系统按其功能可分为: 目录检索目录检索系统系统 文献检索文献检索系统系统 事实检索事实检索系统系统检索系统按所使用的检索系统按所使用的技术手段技术手段可分为:可分为: 手工检索手工检索系统系统 计算机检索计算机检索系统系统已知条件已知条件检索性质检索性质检索工具检索工具检索结果检索结果目录检索目录检索期刊刊名或期刊刊名或图书名图书名确定性
12、检索确定性检索馆藏目录馆藏目录(联机公共检索(联机公共检索目录目录OPAC)收藏单位收藏单位(收藏地)(收藏地)文献检索文献检索课题课题相关性检索相关性检索题录、文摘及相题录、文摘及相应的数据库应的数据库(全文数据库)(全文数据库)文献线索文献线索或全文或全文(原始文献(原始文献 )事实检索事实检索 事实、事实、数据数据确定性检索确定性检索词典、年鉴等、词典、年鉴等、网上搜索引擎等网上搜索引擎等(源数据库(源数据库) 事实、数据事实、数据计算机检索系统与手工检索系统比较,计算机检索系统与手工检索系统比较,有以下有以下优点优点:a、检索速度快;、检索速度快;b、检索点多,检出率高,且能满足、检索
13、点多,检出率高,且能满足 多元检索的要求;多元检索的要求;c、信息量大,信息内容更新快;、信息量大,信息内容更新快;d、能充分达到资源共享的目的;、能充分达到资源共享的目的;e、服务方式和输出方式灵活多样。、服务方式和输出方式灵活多样。计算机检索系统计算机检索系统一般一般由硬件、软件和机由硬件、软件和机读数据库组成。读数据库组成。应用软件系统软件硬件部分软件部分数据库硬件部分硬件部分: :它是系统采用的各种硬设备的总称。它是系统采用的各种硬设备的总称。软件部分软件部分:它是信息检索系统有关的程序和:它是信息检索系统有关的程序和各种文件资料的总称,包括系统软件和应各种文件资料的总称,包括系统软件
14、和应用软件。用软件。数据库数据库:数据库是在计算机上按一定方式合:数据库是在计算机上按一定方式合理存放的相互关联的数据的集合。它由文理存放的相互关联的数据的集合。它由文档、记录、字段组成。通常有题录数据库、档、记录、字段组成。通常有题录数据库、文摘数据库、指南数据库、数值数据库、文摘数据库、指南数据库、数值数据库、全文数据库等。全文数据库等。 检索是针对数据库进行的,数据库是计算机检索是针对数据库进行的,数据库是计算机可读数据的集合。可读数据的集合。数据库主要包括数据库主要包括四个部分四个部分: 检索界面模块检索界面模块:接受用户检索要求,有一般检:接受用户检索要求,有一般检索界面和高级检索界
15、面。索界面和高级检索界面。 检索策略模块:将用户输入的检索要求编制成检索策略模块:将用户输入的检索要求编制成计算机可执行的规范化检索式。计算机可执行的规范化检索式。 检索执行模块:利用检索式检索索引数据库,检索执行模块:利用检索式检索索引数据库,并保证检索的速度和准确性。并保证检索的速度和准确性。 检索结果组织模块:检索结果组织模块:对检中记录的整理组织。对检中记录的整理组织。 数据库类型:数据库类型:1、目录型数据库、目录型数据库2、题录型数据库、题录型数据库3、文摘型数据库、文摘型数据库4、全文型数据库、全文型数据库5、指南数值型数据库、指南数值型数据库数据库由文档、记录、字段组成。数据库
16、由文档、记录、字段组成。 1 1) 目录目录 目录目录(catalog)是图书、期刊等)是图书、期刊等单位出版物外表特征单位出版物外表特征的揭示和报道,是按的揭示和报道,是按某种顺序编列的文献清单。某种顺序编列的文献清单。 在信息检索中,目录主要用于查找所在信息检索中,目录主要用于查找所需文献的需文献的收藏单位(即馆藏信息)。收藏单位(即馆藏信息)。 目录主要有馆藏目录、联合目录、目录主要有馆藏目录、联合目录、联联机公共检索目录(机公共检索目录(OPAC)。2 2)题录)题录 题录题录是是单篇文献外表特征单篇文献外表特征的揭示和报的揭示和报道。主要用于道。主要用于查找最新的相关文献线索查找最新
17、的相关文献线索。05063821 基于加权概念网络的用基于加权概念网络的用户兴趣建模户兴趣建模 /许欢庆;王永成(上海许欢庆;王永成(上海交通大学计算机科学与工程系)交通大学计算机科学与工程系)/上上海交通大学学报(上海),海交通大学学报(上海),-2004,56(1).-56-613 3)文摘)文摘 文摘文摘(abstract)是系统著录、是系统著录、报道、积累和揭示文献报道、积累和揭示文献外部特征和内外部特征和内容特征容特征的检索工具(即为带有内容简的检索工具(即为带有内容简介的、扩展了的题录),介的、扩展了的题录),是最常用的是最常用的文献检索工具。文摘既可用于文献检索工具。文摘既可用于
18、查找最查找最新的文献线索新的文献线索,又可用于,又可用于了解文献的了解文献的主要内容。主要内容。05063821 基于加权概念网络的用基于加权概念网络的用户兴趣建模户兴趣建模 /许欢庆;王永成(上海许欢庆;王永成(上海交通大学计算机科学与工程系)交通大学计算机科学与工程系)/上上海交通大学学报(海交通大学学报(上海)上海),-2004,56(1).-56-61 提出了一种基于加权概念网络提出了一种基于加权概念网络(WCN)的用户兴趣建模方法的用户兴趣建模方法,该方该方法利用动态学习算法法利用动态学习算法,挖掘蕴含在用户反馈文档中的概念及其概念关系挖掘蕴含在用户反馈文档中的概念及其概念关系,建立
19、建立WCN的用户模型的用户模型,从而捕捉和表述用户兴趣偏好从而捕捉和表述用户兴趣偏好.基于基于WCN用户兴用户兴趣模型趣模型,提出了检索提问个性化理解以及文档个性化重评价的实现方法提出了检索提问个性化理解以及文档个性化重评价的实现方法.为了检验提出方法的建模性能为了检验提出方法的建模性能,设计了信息过滤仿真试验设计了信息过滤仿真试验.测试结果表测试结果表明明,WCN有较好的用户建模性能有较好的用户建模性能. 4)索引)索引 索引索引就是将文献中的一些就是将文献中的一些检索标检索标识(如人名、题名、分类号、主题词识(如人名、题名、分类号、主题词等)等)分别摘录出来,并分别摘录出来,并注明它们所在
20、注明它们所在的位置(如题录号、文摘号等),的位置(如题录号、文摘号等),再再按一定的规则排列和组织,一般只起按一定的规则排列和组织,一般只起指引特定信息内容及其存储地址指引特定信息内容及其存储地址的作的作用。用。 索引不能作为一个单独的检索系统存索引不能作为一个单独的检索系统存在,它是目录、题录、文摘检索系统中的在,它是目录、题录、文摘检索系统中的一个重要组成部分,在检索系统中占有重一个重要组成部分,在检索系统中占有重要位置,它要位置,它提供了从不同角度(检索点)提供了从不同角度(检索点)对特定信息集合检索的途经。对特定信息集合检索的途经。不同的检索标识系统构成不同的检索标识系统构成不同类型的
21、索引不同类型的索引:著者索引著者索引主题索引主题索引分类索引分类索引题名索引题名索引号码索引号码索引1.3 1.3 计算机信息检索技术计算机信息检索技术 1、布尔逻辑组配检索技术、布尔逻辑组配检索技术 布尔逻辑组配检索布尔逻辑组配检索:是指利用:是指利用标准的标准的布尔逻辑运算符布尔逻辑运算符(关系词)(关系词)来限定检索词之间的来限定检索词之间的逻辑关系逻辑关系的的检索技术,它是现行计算机检索检索技术,它是现行计算机检索的基本技术。的基本技术。 主要的主要的布尔逻辑关系词布尔逻辑关系词有有3种:种:与(与(AND)、或(或(OR)、非(非(NOT),),其优先级依次为其优先级依次为NOT、A
22、ND和和OR,改变优先级的方法是使,改变优先级的方法是使用括号(用括号( ),括号内的逻辑式优先),括号内的逻辑式优先执行。执行。 逻辑与(逻辑乘)逻辑与(逻辑乘) 用关系词用关系词AND或或“*”表示,表示它表示,表示它所连接的两个检索词必须所连接的两个检索词必须同时出现同时出现在结果中在结果中才满足检索条件。才满足检索条件。例如:美国例如:美国 * 金融危机金融危机 或:美国或:美国 AND 金融危机金融危机 聚乙烯聚乙烯 * 复合材料复合材料 * 制备制备 Intelligent and robot and control 逻辑与是逻辑与是缩小文献检索范围,提高查准率,缩小文献检索范围,
23、提高查准率,是具有概念交叉和限定关系的一种组配。是具有概念交叉和限定关系的一种组配。 逻辑或(逻辑加)逻辑或(逻辑加) 用关系词用关系词OR或或“+”表示,表示它表示,表示它所连接的两个检索词中所连接的两个检索词中任意一个出现任意一个出现在在结果中就满足检索条件。结果中就满足检索条件。 例如:例如: 金融危机金融危机 OR 金融风暴金融风暴 计算机计算机 or 电脑电脑 or 微机微机 airplane or aircraft or plane 逻辑或用来逻辑或用来扩大文献检索范围,提高查扩大文献检索范围,提高查全率全率,是具有概念并列关系的一种组配。,是具有概念并列关系的一种组配。 逻辑非(
24、逻辑减)逻辑非(逻辑减) 用关系词用关系词not或或“-”表示,表示表示,表示它所连接的两个检索词中它所连接的两个检索词中应从第一个概应从第一个概念中排除第二个概念念中排除第二个概念。 例如:例如:Automobile NOT truck 高等教育高等教育 - 成人教育成人教育 逻辑非用来逻辑非用来缩小文献检索范围,缩小文献检索范围,提高查准率。提高查准率。 用用A和和B表示两个检索词,布尔逻辑表示两个检索词,布尔逻辑关系词的逻辑组配关系如图所示:关系词的逻辑组配关系如图所示:1.A and B 2. A or B 3.A not B 2、截词检索技术、截词检索技术 所谓所谓截词检索截词检索,
25、是指在检索式中用专门,是指在检索式中用专门的的截词符号(如截词符号(如“?”、 “*” 或或“!”)表)表示检索词的某一部分允许有一定的词形变化示检索词的某一部分允许有一定的词形变化,结果中只要包含其中任意一个就满足检索要求。结果中只要包含其中任意一个就满足检索要求。 截词检索的截词检索的作用作用是对检索词进行截词处是对检索词进行截词处理,解决一个检索词的理,解决一个检索词的单、复数单、复数问题,问题,不同词不同词性性的问题以及的问题以及英美词汇拼写差异英美词汇拼写差异的问题等。由的问题等。由于截词检索是隐含的布尔逻辑或的检索,因此于截词检索是隐含的布尔逻辑或的检索,因此能够防止漏检,能够防止
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 南昌大学 文献 检索 PPT 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内