计算机信息检索基础知识PPT学习课件.ppt
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_1.gif)
![资源得分’ title=](/images/score_05.gif)
《计算机信息检索基础知识PPT学习课件.ppt》由会员分享,可在线阅读,更多相关《计算机信息检索基础知识PPT学习课件.ppt(68页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、 第二讲 计算机信息检索基础知识1 主要内容n计算机检索的概念n数据库及其类型n数据库的结构n计算机检索技术n计算机检索的步骤、方法、途径2n指利用计算机存储和检索信息。具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息的过程。一 计算机信息检索的定义3计算机信息检索包含两个内涵:n存储过程:大量的数据按一定的格式输入到计算机中,经过计算机的加工处理,以一定的结构有序地存储在计算机的存储介质上。n查找过程:用户的需求输入到计算机中,由计算机对其进行处理,并与已存储在计算机中的信息进行查询与匹配,最后按要求的格
2、式输出检索结果4信息检索原理5举例:n【题名】信息检索技术在网络数据库中的应用研究n【作者】邹小筑1 缪红梅2n【机构】1南京大学信息管理系,南京210093 2南京航空航天大学,南京210016n【刊名】图书情报工作.2007,51(2).-104-106,131n【ISSN号】0252-3116n【关键词】信息检索技术 网络数据库 检索平台n【文摘】以信息检索技术为脉络,结合Ei Village2、ISI Web of Knowledge、CSAIDS、EBSCOHost、ProQuestordjne等多个著名检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙词表构建技术在网络数据库
3、的应用,研究表明信息检索技术已深深植入网络信息资源管理之中,深入剖析信息检索技术,可以清晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方法,为网络信息资源评价和建设提供依据。6n输入:“信息检索技术”(题名字段)-命中该信息n输入:“光盘数据库”(题名字段)-不会命中该信息7输入“信息检索技术”检索结果检索结果8计算机信息检索特点n检索速度快,效益高;n检索功能强,数量大;n检索途径多,手段灵活;n检索范围广,服务方式多。9二 数据库及其类型n概念概念 数据库是在计算机存贮设备上按数据库是在计算机存贮设备上按一定方式存储的相互关联的数据集一定方式存储的相互关联的数据集合。合。10数据库
4、类型按内容和功能划分n参考型数据库参考型数据库 以文档的形式组织起来,提供文献的题录、文摘等书目信息n全文型数据库全文型数据库 存储文献全文或其中的主要部分的源数据库n事实型数据库事实型数据库 供查询某一客体的基本事实或简况,包括名录、传记等数据库n数值型数据库数值型数据库 提供各类数值型数据n图象数据库图象数据库 以图形、图象为记录单位11返回12返回13返回14返回15 返回16数据库类型按收录专业范围划分n综合性数据库综合性数据库 收录多个学科或专业的信息资料。如中国期刊网n专业性数据库专业性数据库 收录单一学科或专业的信息资料。n专题性数据库专题性数据库 收录某一特定专题的信息资料17
5、综合型数据库返回18专业数据库 :返回19专题数据库20三 数据库的结构字段、记录和文档字段:文献著录的基本单元,反映文献文献著录的基本单元,反映文献外部特征和内容特征的每一项目,在数外部特征和内容特征的每一项目,在数据库中就称为字段。据库中就称为字段。如:关键词如:关键词KWKW、题名、题名TITI、文摘、文摘ABAB、作者、作者AUAU、刊名刊名JNJN、出版时间、出版时间PYPY、语种、语种LALA等等21记录 由若干不同字段组成的文献单元,一条记录在由若干不同字段组成的文献单元,一条记录在数据库中代表一篇文献。数据库中代表一篇文献。数据库(文档)由若干数量的记录构成的数据的集合。大型的
6、由若干数量的记录构成的数据的集合。大型的数据库检索系统中称为文档。数据库检索系统中称为文档。22中国期刊网字段示例可检索字段可检索字段2324详详细细记记录录命中记录列表25四四 计算机检索技术计算机检索技术1 布尔逻辑运算符2 截词算符3 字段限制4 范围限制5.短语检索6.括号检索261、布尔逻辑运算符逻辑与:“*”或“and”逻辑或:“+”或“or”逻辑非:“-”或“not”27“与”算符 and AND *“与与”算符用于描述概念间的交叉关系和限算符用于描述概念间的交叉关系和限定关系。定关系。n含义:含义:检出文献中必须同时包含被其连检出文献中必须同时包含被其连接的所有词或词组。接的所
7、有词或词组。n作用:作用:缩小检索范围,提高查准率。缩小检索范围,提高查准率。例如:例如:儿童儿童*心理学心理学 computer AND virus28ABA and B计算机计算机*病毒病毒作用:作用:缩小检索范围,缩小检索范围,提高检准率提高检准率与运算示意图与运算示意图computervirus29“或”算符 or OR +“或或”算符可描述概念间的并列关系和相关算符可描述概念间的并列关系和相关关系,用来组配同义词或相关词等。关系,用来组配同义词或相关词等。n含义:含义:检出文献中包含有被其连接的任检出文献中包含有被其连接的任意一个词或词组。意一个词或词组。n作用:作用:扩大检索范围,
8、提高查全率。扩大检索范围,提高查全率。例如:自行车例如:自行车+脚踏车脚踏车 CAD or computer aided design30BAA or B作用:扩大检索范围,提高检全率或运算示意图或运算示意图pipetube31“非”算符 not NOT -“非非”算符用于描述概念间的排斥关系和特算符用于描述概念间的排斥关系和特殊限定关系。殊限定关系。n含义:含义:检出文献中必须包含这个算符前检出文献中必须包含这个算符前的词,必须不含这个算符后的词。的词,必须不含这个算符后的词。n作用:作用:缩小检索范围,提高查准率。缩小检索范围,提高查准率。例如:例如:水果水果 香蕉香蕉 Patent no
9、t German32BAA not B专利专利 德国德国作用:缩小检索范围,排除某一集合概念非运算示意图非运算示意图GermanPatent332、截词(?或*)将截词符加在检索词的前后或中间,以检索一将截词符加在检索词的前后或中间,以检索一组概念相关或同一词根的词。组概念相关或同一词根的词。作用:扩大检索范围,提高文献的查全率。如:comput?computer computers computing dam*dam dams wom?n woman women343、字段限制指将检索词限定在特定的字段中进行。指将检索词限定在特定的字段中进行。同样的检索词,选择在不同字段中进行检索,同样的检
10、索词,选择在不同字段中进行检索,得到的结果是不同的。得到的结果是不同的。检索系统通常都会设置默认的检索字段,如检索系统通常都会设置默认的检索字段,如“所有字段所有字段”。如果想指定在特定的字段中查找。如果想指定在特定的字段中查找检索词,就需要调整检索字段,进行字段限制。检索词,就需要调整检索字段,进行字段限制。35缺省字段缺省字段为为“篇名篇名”36缺省字段为缺省字段为“关键词关键词”37缺省字段为缺省字段为“All fields”38n如果从文献的内容特征出发查找文献,如果从文献的内容特征出发查找文献,可选的检索字段有可选的检索字段有“篇(题)名篇(题)名 title”、“关键词关键词 ke
11、yword”、“文摘文摘 abstract”以及以及“全文全文 fulltext”。39n一般,如果使用相同的检索词分别在这一般,如果使用相同的检索词分别在这几个字段中检索,那么检到的文献数会几个字段中检索,那么检到的文献数会依次递增,而命中的准确率则依次递减。依次递增,而命中的准确率则依次递减。n题名 关键词(文摘)全文检检 全全 率率 递递 增增检检 准准 率率 递递 增增40命中命中31篇篇命中命中80篇篇41命中命中44篇篇命中命中410篇篇424 范围限制n指对检索词的范围(如时间、国别、语种、信息类型等)进行约束或压缩的方法,它大多通过检索系统的限制指令或菜单选择来实现。43工程索
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机信息 检索 基础知识 PPT 学习 课件
![提示](https://www.taowenge.com/images/bang_tan.gif)
限制150内