第二讲计算机检索基本原理.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《第二讲计算机检索基本原理.ppt》由会员分享,可在线阅读,更多相关《第二讲计算机检索基本原理.ppt(79页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第二第二讲计算机算机检索基索基本原理本原理现在学习的是第1页,共79页2第三讲第三讲中文数据库资源中文数据库资源 第六讲第六讲英文全文数据库检索英文全文数据库检索网络资源与信息检索课程安排第四讲第四讲搜索引擎检索搜索引擎检索 第二讲第二讲计算机检索基本原理计算机检索基本原理第七讲第七讲数字信息资源综合利用数字信息资源综合利用 第五讲第五讲英文综合参考数据库检索英文综合参考数据库检索第一讲第一讲概述概述现在学习的是第2页,共79页3v本章具体内容安排:本章具体内容安排:v2.1 2.1 计算机检索基本原理概述计算机检索基本原理概述v2.2 2.2 计算机检索基本原理和检索语言计算机检索基本原理和
2、检索语言v2.3 2.3 文献信息数据库的基本概念文献信息数据库的基本概念v2.4 2.4 计算机检索策略的构建与调整计算机检索策略的构建与调整v要求:初步掌握计算机检索的基本原理、基要求:初步掌握计算机检索的基本原理、基本类型及其检索策略的构建与调整。本类型及其检索策略的构建与调整。第二讲第二讲 计算机检索基本原理计算机检索基本原理现在学习的是第3页,共79页42.1 2.1 计算机检索基本原理概述计算机检索基本原理概述2.1.1计算机检索概念计算机检索概念通过计算机进行的文献信息检索称为计算机通过计算机进行的文献信息检索称为计算机检索。检索。随着计算机技术、远程通讯技术和信息存储随着计算机
3、技术、远程通讯技术和信息存储技术的飞速发展,技术的飞速发展,信息检索由手工检索过渡到了信息检索由手工检索过渡到了计算机信息检索计算机信息检索。计算机检索的成功应用,为我。计算机检索的成功应用,为我们更为及时、准确、全面地继承、利用和发展人们更为及时、准确、全面地继承、利用和发展人类的科研成果提供了先进的手段。类的科研成果提供了先进的手段。现在学习的是第4页,共79页52.1计算机检索基本原理概述计算机检索基本原理概述2.1.22.1.2计算机检索发展计算机检索发展第一个阶段:脱机检索阶段(第一个阶段:脱机检索阶段(5050年代至年代至6060年代)年代)脱机检索(脱机检索(Offline Re
4、trievalOffline Retrieval):即批处理检索):即批处理检索 检索要求检索要求 检索系统检索系统 检索结果检索结果 检索人员检索人员检索策略检索策略成批检索成批检索用户用户 缺点:缺点:1.1.地理上的障碍地理上的障碍(远、不便于检索结果的获取)远、不便于检索结果的获取)2.2.时间上的迟滞(定期检索,不能及时获取)时间上的迟滞(定期检索,不能及时获取)3.3.封闭式的检索(指检索策略一经输入系统就不能更封闭式的检索(指检索策略一经输入系统就不能更改,更不能依据机检应答来修改检索式)改,更不能依据机检应答来修改检索式)现在学习的是第5页,共79页62.1计算机检索基本原理概
5、述计算机检索基本原理概述第二个阶段:联机检索阶段第二个阶段:联机检索阶段(OnlineRetrieval)()(60-80年代年代)终端设备终端设备 通讯网络通讯网络 检索系统检索系统用户用户 检索策略检索策略 人机对话人机对话 获取信息获取信息 三个时期:三个时期:6060年代开发试验;年代开发试验;7070年代年代末应用阶段;末应用阶段;8080年代以后进入年代以后进入信息信息计算机计算机卫星通卫星通信信三维一体的新阶段,即以信息文献不受地区、国三维一体的新阶段,即以信息文献不受地区、国家限制而真正实现全世界资源共享为目的的国际联家限制而真正实现全世界资源共享为目的的国际联机信息检索阶段。
6、机信息检索阶段。现在学习的是第6页,共79页72.1计算机检索基本原理概述计算机检索基本原理概述著名的国际联机检索系统有美国的著名的国际联机检索系统有美国的DIALOGDIALOG系统、系统、ORBITORBIT系统、系统、BRSBRS系统以及系统以及MEDLARSMEDLARS系统,还有欧洲的系统,还有欧洲的ESA/IRSESA/IRS系统、英国的系统、英国的BLAESEBLAESE系统等。系统等。这些系统很快发展成为国际性情报检索系统,数据这些系统很快发展成为国际性情报检索系统,数据库种类及其检索存储记录都在迅速增加,如:美国的库种类及其检索存储记录都在迅速增加,如:美国的DialogDi
7、alog系统系统,19841984年就有年就有200200多个数据库,其中包括多个数据库,其中包括美美国的国的医学索引医学索引、荷兰、荷兰医学文摘医学文摘、美国、美国生物生物学文摘学文摘、美国、美国化学文摘化学文摘等。等。如今此联机检索系统仍然是世界上最有影响的联机如今此联机检索系统仍然是世界上最有影响的联机检索系统。检索系统。现在学习的是第7页,共79页82.1计算机检索基本原理概述计算机检索基本原理概述第三阶段:光盘检索阶段第三阶段:光盘检索阶段 19831983年,出现了一种新的存储器,年,出现了一种新的存储器,CD-ROMCD-ROM光盘。光光盘。光盘检索具有储量极大而体积微小,要求设
8、备简单,可随盘检索具有储量极大而体积微小,要求设备简单,可随地安装,使用方便、易于操作,检索费用低(不需要昂地安装,使用方便、易于操作,检索费用低(不需要昂贵的联机检索通讯费用),因可随时修改检索策略而具贵的联机检索通讯费用),因可随时修改检索策略而具有很高的查全率和查准率等优点。有很高的查全率和查准率等优点。例:例:Chemical Abstracts IndexChemical Abstracts Index光盘(光盘(1987-19911987-1991):):由美国化学文摘社与美国剑桥光盘公司联合研制,由美国化学文摘社与美国剑桥光盘公司联合研制,收录收录1987-19911987-19
9、91年年化学文摘化学文摘的全部内容。的全部内容。现在学习的是第8页,共79页92.1计算机检索基本原理概述计算机检索基本原理概述ScienceCitationIndex(SCI)光盘)光盘(科学引文索引科学引文索引):由美国费城科学情报研究所编辑出版,收录:由美国费城科学情报研究所编辑出版,收录1961年年以来有关生命科学、医学、物理、化学、农业、工以来有关生命科学、医学、物理、化学、农业、工程技术、行为科学等方面的文献及引文程技术、行为科学等方面的文献及引文CAJ(中国学术期刊):是由清华大学开发研制,(中国学术期刊):是由清华大学开发研制,分题录、文摘、全文三个层次的数据库,其中全文数据分
10、题录、文摘、全文三个层次的数据库,其中全文数据库是国内最常用的全文数据库。库是国内最常用的全文数据库。现在学习的是第9页,共79页102.1 2.1 计算机检索基本原理概述计算机检索基本原理概述第四阶段:网络化检索阶段第四阶段:网络化检索阶段 进入进入9090年代,随着卫星通讯、公共数据通讯、年代,随着卫星通讯、公共数据通讯、光缆通讯技术以及信息高速公路事业在全世界的迅光缆通讯技术以及信息高速公路事业在全世界的迅猛发展,计算机情报检索走向了全球大联网。猛发展,计算机情报检索走向了全球大联网。网上资源具有具有信息的时效性、内容的广泛性、网上资源具有具有信息的时效性、内容的广泛性、访问的快速性、搜
11、索的网络性和资源的动态性五大特点,访问的快速性、搜索的网络性和资源的动态性五大特点,那么要及时、准确、有效地获取与自身需求相关的实用那么要及时、准确、有效地获取与自身需求相关的实用信息,对所有网络用户都非常具有挑战性。信息,对所有网络用户都非常具有挑战性。现在学习的是第10页,共79页11计算机检索发展阶段图计算机检索发展阶段图光盘信息检索系统光盘信息检索系统光盘信息检索系统光盘信息检索系统联机信息检索系统联机信息检索系统联机信息检索系统联机信息检索系统网络信息检索系统网络信息检索系统网络信息检索系统网络信息检索系统脱机检索系统脱机检索系统脱机检索系统脱机检索系统198019801990199
12、019197 70 0现在学习的是第11页,共79页122.1计算机检索基本原理概述计算机检索基本原理概述INTERNET就是这个时期的最杰出代表。它能够跨就是这个时期的最杰出代表。它能够跨越时空,进行实时信息检索、资源共享的国际性计算机越时空,进行实时信息检索、资源共享的国际性计算机网络。网络。INTERNET飞速的发展,已成为人们进行飞速的发展,已成为人们进行全球全球范围的合作、信息交流与资源共享的不可替代的通讯交范围的合作、信息交流与资源共享的不可替代的通讯交流方式流方式。随着计算机技术的智能化、数据库载体的高密度随着计算机技术的智能化、数据库载体的高密度化和多媒体化、通讯技术的网络化,
13、化和多媒体化、通讯技术的网络化,计算机情报检索计算机情报检索将走向办公室化、家庭化将走向办公室化、家庭化。现在学习的是第12页,共79页132.2 2.2 计算机检索基本原理和检索语言计算机检索基本原理和检索语言一般地说,计算机检索包括一般地说,计算机检索包括信息的存储信息的存储和和检索检索两个部分,两个部分,即对应数据库的建立和查找两个部分。即对应数据库的建立和查找两个部分。2.2.12.2.1信息存储信息存储 就是文献标引人员对文献内容进行主题分析,即把文就是文献标引人员对文献内容进行主题分析,即把文献包含的信息内容分析成若干能代表文献主题的概念,并用献包含的信息内容分析成若干能代表文献主
14、题的概念,并用词表、分类表等规范化标识的情报检索语言对词表、分类表等规范化标识的情报检索语言对文献主题进文献主题进行标引行标引、按所选数据库结构的索引结构输入到计算机进行存储,、按所选数据库结构的索引结构输入到计算机进行存储,同时把入选文献中的其他特征标识(标题、著者、文摘、原文出同时把入选文献中的其他特征标识(标题、著者、文摘、原文出处等)也一起输入计算机,处等)也一起输入计算机,编制成一系列索引数据库编制成一系列索引数据库,这便是,这便是信息的存储。信息的存储。现在学习的是第13页,共79页142.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言2.2.2 2.2.2 信息检索信
15、息检索 1 1、检检索索者者对对检检索索课课题题进进行行主主题题分分析析、明明确确检检索索范范围围,形形成成能代表情报需求的若干主题概念。能代表情报需求的若干主题概念。2 2、把把这这些些主主题题概概念念转转换换成成计计算算机机信信息息检检索索语语言言,即即用用数数据据库库检检索索工工具具书书对对各各概概念念选选词词和和进进行行逻逻辑辑组组配配,编编制制成成检检索索提提问问式。式。3 3、用用计计算算机机检检索索系系统统功功能能在在文文献献资资料料数数据据库库中中将将信信息息需需求求主主题概念和数据库内文献主题概念标识进行题概念和数据库内文献主题概念标识进行匹配匹配,找到命中文献。,找到命中文
16、献。v 用图表示如下:用图表示如下:现在学习的是第14页,共79页15计算机检索原理的示意图计算机检索原理的示意图一次一次一次一次信息信息信息信息标识标识检检检检索索索索语语语语言言言言分析分析信信息息检检索索工工具具(系系统)统)检检索索结结果果信息信息信息信息特征特征特征特征信息信息信息信息需求需求需求需求检索检索检索检索提问提问提问提问标识标识存储存储过程过程检索检索过程过程分析分析标引标引标引标引输入输入检索检索检索检索现在学习的是第15页,共79页162.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言2.2.3信息检索语言信息检索语言 又称文献存储和检索语言,是根又称文献
17、存储和检索语言,是根据文献信息存储与检索的需要而创制据文献信息存储与检索的需要而创制的一种人工语言,是汇集、组织、存的一种人工语言,是汇集、组织、存储、检索文献信息的工具和手段。储、检索文献信息的工具和手段。标引语言标引语言索引语言索引语言索引语言索引语言检索语言检索语言检索语言检索语言编制编制 索引索引文献文献 检索检索文献文献 整序整序现在学习的是第16页,共79页17文献内容特征文献内容特征文献外表特征文献外表特征分类语言分类语言代码语言代码语言主题语言主题语言题名索引题名索引作者索引作者索引引文索引引文索引序号索引序号索引分分 类类检检索索语语言言2.2计算机检索基本原理和检索语言计算
18、机检索基本原理和检索语言现在学习的是第17页,共79页18定义:定义:以数字、字母与数字结合作为基本字以数字、字母与数字结合作为基本字符,采用字符直接连接并以圆点(或符,采用字符直接连接并以圆点(或其它符号)作为分隔符的书写法,以其它符号)作为分隔符的书写法,以基本类目作为基本词汇,以类目的从基本类目作为基本词汇,以类目的从属关系来表达复杂概念的一类检索语属关系来表达复杂概念的一类检索语言。言。分类语言分类语言分类法分类法2.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言现在学习的是第18页,共79页19国外主要分类法简介国外主要分类法简介 杜威十进分类法杜威十进分类法(DDC)国
19、际十进分类法国际十进分类法(UDC)美国国会图书馆分类法美国国会图书馆分类法(LCC)美国国立医学图书馆分类法美国国立医学图书馆分类法(NLMC)冒号分类法冒号分类法(CC)布利斯书目分类法布利斯书目分类法(BC2)2.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言现在学习的是第19页,共79页20国内主要分类法简介国内主要分类法简介中国图书馆分类法中国图书馆分类法(CLC)*中国图书资料分类法中国图书资料分类法中国人民大学图书馆图书分类法中国人民大学图书馆图书分类法中国科学院图书馆图书分类法中国科学院图书馆图书分类法中国档案分类法中国档案分类法2.2计算机检索基本原理和检索语言计
20、算机检索基本原理和检索语言现在学习的是第20页,共79页212.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言现在学习的是第21页,共79页222.2 2.2 计算机检索基本原理和检索语言计算机检索基本原理和检索语言v中图法分类号由字母和数字组成,采用等级列举表中图法分类号由字母和数字组成,采用等级列举表达从属关系达从属关系:T 工业技术一级类目 TH 机械、仪表工业二级类目 TH12 机械设计、计算与制图三级类目 TH121 标准、规格四级类目 TH126 机械制图四级类目 TH126.1 识图法五级类目 TH126.2 作图法五级类目现在学习的是第22页,共79页232.2计算
21、机检索基本原理和检索语言计算机检索基本原理和检索语言T-0 工业技术理念工业技术理念T-1 工业技术现状与发展工业技术现状与发展.TP 自动化、计算机技术自动化、计算机技术TQ 化学工业化学工业TS 轻工业、手工业轻工业、手工业TU 建筑科学建筑科学TV 水利工程水利工程TP1 自动化基础理论自动化基础理论TP2 自动化技术及设备自动化技术及设备TP3 计算机技术计算机技术TP6 射流技术射流技术TP7 遥感技术遥感技术TP8 运动技术运动技术TP30 一般性问题一般性问题TP31 计算机软件计算机软件TP32 一般计算器一般计算器TP33 电子数字计算机电子数字计算机TP34 电子模拟计算机
22、电子模拟计算机TP35 混合电子计算机混合电子计算机TP36 微型计算机微型计算机TP37 多媒体技术多媒体技术TP38 其他计算机其他计算机TP39 计算机的应用计算机的应用T 工工业业技技术术(一级)(一级)(二级)(二级)(三级)(三级)(四级)(四级)现在学习的是第23页,共79页24分类语言的优缺点分类语言的优缺点p优点优点以学科和专业集中以学科和专业集中文献的,有较好的文献的,有较好的族性检索效果族性检索效果将概念逐级划分,将概念逐级划分,便于扩大和缩小便于扩大和缩小检索范围检索范围p缺点缺点对新兴学科、边缘学对新兴学科、边缘学科或交叉学科而产生科或交叉学科而产生的类目不能及时体现
23、。的类目不能及时体现。必须了解科学分类体必须了解科学分类体系,否则不容易找到系,否则不容易找到准确的类目。准确的类目。2.2 2.2 计算机检索基本原理和检索语言计算机检索基本原理和检索语言现在学习的是第24页,共79页25代码语言代码语言 根据文献中论述事物的代码作为标识和检根据文献中论述事物的代码作为标识和检索系统的索引语言。索系统的索引语言。例:例:化学文摘化学文摘中的分子式索引中的分子式索引C2H6O4SSn Tin,dimethylsulfato(2-)-O-44657-51-4,91:99600jC2H6O4S2 Disulfone,dimethyl-10383-49-0,94:1
24、38838b2.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言现在学习的是第25页,共79页26主题语言主题语言定义:定义:以主题词来表达信息主题概念的语言。以主题词来表达信息主题概念的语言。它按事物对文献信息进行浓缩、描述和它按事物对文献信息进行浓缩、描述和整序,借用自然语言的词语,作为信息整序,借用自然语言的词语,作为信息检索的内容标识检索的内容标识,又可分为关键词语言、叙又可分为关键词语言、叙词语言、标题词语言及单元词语言等。的检词语言、标题词语言及单元词语言等。的检索语言。索语言。分类:分类:主主 题题 词词关关 键键 词词2.2 2.2 计算机检索基本原理和检索语言计算机
25、检索基本原理和检索语言现在学习的是第26页,共79页27主题词主题词 经人工经人工规范化处理规范化处理的最能表达文中主题的最能表达文中主题概念的语词。概念的语词。规范化处理规范化处理:文献存储时,对文献中的同义文献存储时,对文献中的同义词、近义词、多义词等加以规词、近义词、多义词等加以规范,并采用参照系统间接反映范,并采用参照系统间接反映主题概念之间的关系,从而体主题概念之间的关系,从而体现主题词的单一性。现主题词的单一性。2.2计算机检索基本原理和检索语言计算机检索基本原理和检索语言现在学习的是第27页,共79页28 从文献的题名、摘要、章节标题或正文中抽从文献的题名、摘要、章节标题或正文中
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 计算机 检索 基本原理
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内