医学文献检索概论09研1.ppt
2009年年8月月为什么要学习文献检索?为什么要学习文献检索?科学研究的一般工作流程:检索相关的研究检索相关的研究 分析现有的研究结果分析现有的研究结果 发现问题发现问题 提出假说提出假说 制订试验方案制订试验方案 定义试验步骤定义试验步骤 试验试验 数据汇总数据汇总 数据可视化数据可视化 数据验证数据验证 调整试验调整试验 重新校验假说重新校验假说 写作研究论文写作研究论文 发表研究论文发表研究论文发现问题发现问题试验试验数据分析数据分析发现发现研究活动:研究活动:-反复、重复、动态、以人为中心反复、重复、动态、以人为中心-依赖于各种不同的资源依赖于各种不同的资源为什么要学习文献检索?为什么要学习文献检索?n n据美国科学基金会统计,一个科研人员花费在查找和消化科技资料上的时间需占全部科研时间的51%,计划思考占8%,实验研究占32%,书面总结占9%。由上述统计数字可以看出,科研人员花费在科技出版物上的时间为全部科研时间的60%。基础知识基础知识一一一一.文献及其类型文献及其类型文献及其类型文献及其类型 1.1.文献文献文献文献(documents(documents,literature)literature):是记录有知识的:是记录有知识的:是记录有知识的:是记录有知识的一切载体。一切载体。一切载体。一切载体。四要素:四要素:四要素:四要素:(1 1)记录知识的具体内容)记录知识的具体内容)记录知识的具体内容)记录知识的具体内容 (2 2)记录知识的手段,如文字、图像、符号、)记录知识的手段,如文字、图像、符号、)记录知识的手段,如文字、图像、符号、)记录知识的手段,如文字、图像、符号、声频、视频等声频、视频等声频、视频等声频、视频等 (3 3)记录知识的物质载体,如纸张、光盘、)记录知识的物质载体,如纸张、光盘、)记录知识的物质载体,如纸张、光盘、)记录知识的物质载体,如纸张、光盘、录像带等录像带等录像带等录像带等 (4 4)记录知识的表现形态,如图书、期刊、)记录知识的表现形态,如图书、期刊、)记录知识的表现形态,如图书、期刊、)记录知识的表现形态,如图书、期刊、专利说明书等专利说明书等专利说明书等专利说明书等基础知识基础知识2.2.文献的类型文献的类型文献的类型文献的类型:(按载体类型、出版形式、内容加工深度、获:(按载体类型、出版形式、内容加工深度、获:(按载体类型、出版形式、内容加工深度、获:(按载体类型、出版形式、内容加工深度、获取难易程度等进行分类)取难易程度等进行分类)取难易程度等进行分类)取难易程度等进行分类)A.A.文献按内容加工深度可分四类:文献按内容加工深度可分四类:文献按内容加工深度可分四类:文献按内容加工深度可分四类:(1 1)一次文献()一次文献()一次文献()一次文献(Primary Document)Primary Document):指作者以其本人的研:指作者以其本人的研:指作者以其本人的研:指作者以其本人的研究成果(如实验、观察、调查研究等结果)为基本素材写成究成果(如实验、观察、调查研究等结果)为基本素材写成究成果(如实验、观察、调查研究等结果)为基本素材写成究成果(如实验、观察、调查研究等结果)为基本素材写成的原始创作。的原始创作。的原始创作。的原始创作。(2 2)二次文献()二次文献()二次文献()二次文献(Secondary Document)Secondary Document):即检索工具,是指将:即检索工具,是指将:即检索工具,是指将:即检索工具,是指将大量无序、分散的一次文献收集、整理、加工、著录其特征大量无序、分散的一次文献收集、整理、加工、著录其特征大量无序、分散的一次文献收集、整理、加工、著录其特征大量无序、分散的一次文献收集、整理、加工、著录其特征如著者、篇名、分类、主题、出处等,并按一定的顺序加以如著者、篇名、分类、主题、出处等,并按一定的顺序加以如著者、篇名、分类、主题、出处等,并按一定的顺序加以如著者、篇名、分类、主题、出处等,并按一定的顺序加以编排,形成供读者检索所需一次文献线索的新的文献形式。编排,形成供读者检索所需一次文献线索的新的文献形式。编排,形成供读者检索所需一次文献线索的新的文献形式。编排,形成供读者检索所需一次文献线索的新的文献形式。(3 3)三次文献)三次文献)三次文献)三次文献(Tertiary Document)(Tertiary Document):科技人员围绕某一主题,:科技人员围绕某一主题,:科技人员围绕某一主题,:科技人员围绕某一主题,利用二次文献的检索,在吸取一次文献内容的基础上,即经利用二次文献的检索,在吸取一次文献内容的基础上,即经利用二次文献的检索,在吸取一次文献内容的基础上,即经利用二次文献的检索,在吸取一次文献内容的基础上,即经过阅读、分析、归纳、概括,撰写而成的新的文献,或综述过阅读、分析、归纳、概括,撰写而成的新的文献,或综述过阅读、分析、归纳、概括,撰写而成的新的文献,或综述过阅读、分析、归纳、概括,撰写而成的新的文献,或综述已取得的成果进展,或加评论、或预测发展趋势。已取得的成果进展,或加评论、或预测发展趋势。已取得的成果进展,或加评论、或预测发展趋势。已取得的成果进展,或加评论、或预测发展趋势。(4 4)零次文献)零次文献)零次文献)零次文献(Zero Document)(Zero Document):指未经信息加工,直接记录:指未经信息加工,直接记录:指未经信息加工,直接记录:指未经信息加工,直接记录在载体上的原始信息,如实验数据、观测记录、调查材料等。在载体上的原始信息,如实验数据、观测记录、调查材料等。在载体上的原始信息,如实验数据、观测记录、调查材料等。在载体上的原始信息,如实验数据、观测记录、调查材料等。基础知识基础知识B.文献按获取的难易程度可分三类:文献按获取的难易程度可分三类:(1)白色文献:完全公开白色文献:完全公开 (2)黑色文献:完全不公开黑色文献:完全不公开 (3)灰色文献:灰色文献:内部交流内部交流基础知识基础知识3.科技文献的作用(社会职能)科技文献的作用(社会职能)(1)是科学表现的存在形式,是创造人类财)是科学表现的存在形式,是创造人类财富的智慧资源富的智慧资源(2)是衡量科学技术水平的重要依据)是衡量科学技术水平的重要依据(3)是传播科学知识的最基本、最主要的手)是传播科学知识的最基本、最主要的手段段(4)是确认科学发现与技术发明优先权的认)是确认科学发现与技术发明优先权的认证记录证记录基础知识基础知识4.医学文献的结构医学文献的结构(1)图书的结构:主要包括封面、封底、书)图书的结构:主要包括封面、封底、书脊、书名页、出版说明、前言(序)、目次、脊、书名页、出版说明、前言(序)、目次、附录、后记等。附录、后记等。参考文献的格式参考文献的格式(NLM采用的采用的ANSI标准格标准格式)式)Norman IJ,Redfern SJ,editors.Mental healthcare for elderly people.New York:Churchill Livingstone;1996基础知识基础知识书中的章节:书中的章节:Philips SJ,Whisnant JP.Hypertension and stroke.In:Laragh JH,Brenner BM,editors.Hypertension:pathophysiology,diagnosis,and management.2nd ed.N e w York:Raven Press;1995.p.465-78.基础知识基础知识(2)期刊论文结构:)期刊论文结构:期刊论文包括文章题目、作者、摘要、期刊论文包括文章题目、作者、摘要、关键词、(分类号)、正文、参考文献。关键词、(分类号)、正文、参考文献。参考文献格式:参考文献格式:1)Vega KJ,Pina I,Krevsky B.Heart transplantation is associated with an increased risk for pancreatobiliary disease.Am Intern Med 1996 Jun 1;124(11):980-3基础知识基础知识 2)Semin Oncol 1996;23(1 Suppl 2):80-97 3)Clin Orthop 1995;(320):110-4基础知识基础知识5.参考工具书的类型与使用参考工具书的类型与使用 参参考考工工具具书书(reference books,reference tools)是是专专供供查查考考资资料料和和线线索索的的特特种种图图书书,它它广广泛泛汇汇集集某某一一学学科科范范围围的的知知识识信信息息,按按照照一一定定的体例和检索方法编排而成。的体例和检索方法编排而成。工具书特点:查考性、概括性、易检性工具书特点:查考性、概括性、易检性 类类型型:词词典典、百百科科全全书书、年年鉴鉴、手手册册、名名录、医学图谱、药典等。录、医学图谱、药典等。基础知识基础知识二二二二.文献检索文献检索文献检索文献检索1.1.定义:根据用户需要,利用检索技术从数据库定义:根据用户需要,利用检索技术从数据库定义:根据用户需要,利用检索技术从数据库定义:根据用户需要,利用检索技术从数据库中查找出相关文献的过程。中查找出相关文献的过程。中查找出相关文献的过程。中查找出相关文献的过程。2.2.方法:方法:方法:方法:(1 1)常用法(工具法):顺查法,倒查法,抽查)常用法(工具法):顺查法,倒查法,抽查)常用法(工具法):顺查法,倒查法,抽查)常用法(工具法):顺查法,倒查法,抽查法法法法(2 2)追溯法)追溯法)追溯法)追溯法(3 3)分段法)分段法)分段法)分段法(4 4)浏览法)浏览法)浏览法)浏览法基础知识基础知识3.文献检索的作用:文献检索的作用:(1)继承和借鉴前人的成果,避免重复研)继承和借鉴前人的成果,避免重复研究。究。(2)协助决策者做出正确的决策。)协助决策者做出正确的决策。(3)节省查找文献的时间。)节省查找文献的时间。(4)继续医学教育作用。)继续医学教育作用。基础知识基础知识4.数据库(数据库(database)定义:指由计算机进行处理的一定数量同类定义:指由计算机进行处理的一定数量同类信息的有序集合,是用来查找信息的电子信息的有序集合,是用来查找信息的电子化检索工具。化检索工具。基础知识基础知识类型:文献数据库按其文献信息的内容形式类型:文献数据库按其文献信息的内容形式不同可分为如下类型:不同可分为如下类型:(1)书目数据库()书目数据库(Bibliographic Database)(2)事实数据库()事实数据库(Fact Database)(3)数值数据库()数值数据库(Numeric Database)(4)全文数据库()全文数据库(Full-text Database)(5)多媒体数据库()多媒体数据库(Multimedia Database)(6)知识库()知识库(Knowledge Base)基础知识基础知识5.5.常用术语常用术语常用术语常用术语(1 1)记录()记录()记录()记录(record)record):构成文献信息数据库的基本单:构成文献信息数据库的基本单:构成文献信息数据库的基本单:构成文献信息数据库的基本单元,它揭示了文献的内容特征和外表特征。元,它揭示了文献的内容特征和外表特征。元,它揭示了文献的内容特征和外表特征。元,它揭示了文献的内容特征和外表特征。(2 2)字段)字段)字段)字段(field):(field):比记录更小的单位,是组成记录的比记录更小的单位,是组成记录的比记录更小的单位,是组成记录的比记录更小的单位,是组成记录的数据项目数据项目数据项目数据项目(3 3)文档)文档)文档)文档(document):(document):两重含义:两重含义:两重含义:两重含义:一是指数据库中一部分记录的集合一是指数据库中一部分记录的集合一是指数据库中一部分记录的集合一是指数据库中一部分记录的集合二是从数据库的结构分:顺排文档(按记录的二是从数据库的结构分:顺排文档(按记录的二是从数据库的结构分:顺排文档(按记录的二是从数据库的结构分:顺排文档(按记录的顺序号排列)、倒排文档(按主题词或作者排列)顺序号排列)、倒排文档(按主题词或作者排列)顺序号排列)、倒排文档(按主题词或作者排列)顺序号排列)、倒排文档(按主题词或作者排列)基础知识基础知识6.数据库检索途径:数据库检索途径:检索途径是指用数据库中记录的某一特征检索途径是指用数据库中记录的某一特征标识作为检索起点,通常体现为字段检索,标识作为检索起点,通常体现为字段检索,常用的检索途径有:常用的检索途径有:(1)自由词(文本词)检索:包括标题词、)自由词(文本词)检索:包括标题词、关键词、文摘词、全文词,注意同义词!关键词、文摘词、全文词,注意同义词!(2)主题词检索:推荐!)主题词检索:推荐!医学主题词表医学主题词表MeSH基础知识基础知识 (3)分类检索:中国图书馆分类法(中图)分类检索:中国图书馆分类法(中图法)法)(4)著者检索:姓前用全称,名后用首字,)著者检索:姓前用全称,名后用首字,注意东西方人名书写习惯。注意东西方人名书写习惯。(5)引文检索:被引文献)引文检索:被引文献引用文献引用文献 (6)机构检索:)机构检索:名称、所在地、国家,名称、所在地、国家,照照录原文,注意不同写法录原文,注意不同写法 (7)刊名检索:全称、缩写、)刊名检索:全称、缩写、ISSN (8)默认检索:预先设定的多字段组合检)默认检索:预先设定的多字段组合检索索 基础知识基础知识7.文献检索步骤:文献检索步骤:分分析析检检索索课课题题,明明确确实实质质需需求求选选择择合合适适的的工工具具数数据据库库分分析析主主题题概概念念换换成成系系统统检检索索用用词词制制定定检检索索策策略略检检索索检检索索结结果果是是否否满满意意修正检索策略修正检索策略输输出出检检索索结结果果是是否否基础知识基础知识8.文献检索技术文献检索技术(1)布尔逻辑组配检索)布尔逻辑组配检索 三种逻辑关系:与、或、非三种逻辑关系:与、或、非A AND BA OR BA NOT B基础知识基础知识 实际检索时通过逻辑运算符号实际检索时通过逻辑运算符号and(与)、与)、or(或)、(或)、not(非)将几个检索词连接起(非)将几个检索词连接起来进行逻辑运算,从而达到检索要求。在来进行逻辑运算,从而达到检索要求。在一个检索式中如果含有两个以上的布尔逻一个检索式中如果含有两个以上的布尔逻辑运算符,运算次序一般为()辑运算符,运算次序一般为()NOTANDOR,即先括号内的逻辑关系,再依,即先括号内的逻辑关系,再依次算次算“非非”、“与与”、“或或”关系。关系。基础知识基础知识(2 2)截词检索和通配检索)截词检索和通配检索)截词检索和通配检索)截词检索和通配检索截词符和通配符在不同检索系统用不同的符号,截词符和通配符在不同检索系统用不同的符号,截词符和通配符在不同检索系统用不同的符号,截词符和通配符在不同检索系统用不同的符号,一般为一般为一般为一般为*、?、?、?、?、#、$等。等。等。等。截词符代表截词符代表截词符代表截词符代表0 0到多个字符,可以检索词根相同但到多个字符,可以检索词根相同但到多个字符,可以检索词根相同但到多个字符,可以检索词根相同但词尾不同的检索词,如词尾不同的检索词,如词尾不同的检索词,如词尾不同的检索词,如transplant*transplant*,表示检索词根,表示检索词根,表示检索词根,表示检索词根为为为为transplanttransplant,词尾可以是,词尾可以是,词尾可以是,词尾可以是-e,-ation,-ing,-able-e,-ation,-ing,-able等所等所等所等所有词。有词。有词。有词。通配符?代表通配符?代表通配符?代表通配符?代表0 0到到到到1 1个字符,可以检索单复数、个字符,可以检索单复数、个字符,可以检索单复数、个字符,可以检索单复数、英美不同拼写方式等检索词,如英美不同拼写方式等检索词,如英美不同拼写方式等检索词,如英美不同拼写方式等检索词,如ratrat?代表(?代表(?代表(?代表(rat rat OR rats),anOR rats),an?esthesiaesthesia代表(代表(代表(代表(anaesthesia OR anaesthesia OR anesthesia)anesthesia)使用这两种符号一方面可以避免漏检,同时也使用这两种符号一方面可以避免漏检,同时也使用这两种符号一方面可以避免漏检,同时也使用这两种符号一方面可以避免漏检,同时也避免了多次输入的麻烦。避免了多次输入的麻烦。避免了多次输入的麻烦。避免了多次输入的麻烦。基础知识基础知识(3)限定检索)限定检索在绝大多数检索系统中都有一些缩小或在绝大多数检索系统中都有一些缩小或约束检索结果的方法,最常用的是对特定约束检索结果的方法,最常用的是对特定字段的限定检索,通常用字段的限定检索,通常用in、=、等符号等符号对字段进行限定。用这种方法可以将检索对字段进行限定。用这种方法可以将检索词限制在特定的字段中,如词限制在特定的字段中,如LA=chinese,表示检索结果的语种为中文文献,表示检索结果的语种为中文文献,LA代表代表语种字段。语种字段。基础知识基础知识(4 4)位置运算符)位置运算符)位置运算符)位置运算符在某些数据库检索中,要表达检索词在记录中相互位置在某些数据库检索中,要表达检索词在记录中相互位置在某些数据库检索中,要表达检索词在记录中相互位置在某些数据库检索中,要表达检索词在记录中相互位置关系时使用的符号,不同的检索系统用不同的符号,如关系时使用的符号,不同的检索系统用不同的符号,如关系时使用的符号,不同的检索系统用不同的符号,如关系时使用的符号,不同的检索系统用不同的符号,如same,same,with,with,nearnear等。运算符主要有以下等。运算符主要有以下等。运算符主要有以下等。运算符主要有以下4 4个级别:个级别:个级别:个级别:记录级检索,要求检索词出现在同一记录中;记录级检索,要求检索词出现在同一记录中;记录级检索,要求检索词出现在同一记录中;记录级检索,要求检索词出现在同一记录中;字段级检索,要求检索词出现在同一字段中;字段级检索,要求检索词出现在同一字段中;字段级检索,要求检索词出现在同一字段中;字段级检索,要求检索词出现在同一字段中;子字段级检索,要求检索词出现在同一子字段或同一自子字段级检索,要求检索词出现在同一子字段或同一自子字段级检索,要求检索词出现在同一子字段或同一自子字段级检索,要求检索词出现在同一子字段或同一自然句中;然句中;然句中;然句中;词位置检索,要求检索词之间的相互位置满足某些条件。词位置检索,要求检索词之间的相互位置满足某些条件。词位置检索,要求检索词之间的相互位置满足某些条件。词位置检索,要求检索词之间的相互位置满足某些条件。位置运算符可以弥补布尔逻辑运算、截词运算检索的一位置运算符可以弥补布尔逻辑运算、截词运算检索的一位置运算符可以弥补布尔逻辑运算、截词运算检索的一位置运算符可以弥补布尔逻辑运算、截词运算检索的一些不足。使用位置运算符可以增强选词的灵活性,部分地些不足。使用位置运算符可以增强选词的灵活性,部分地些不足。使用位置运算符可以增强选词的灵活性,部分地些不足。使用位置运算符可以增强选词的灵活性,部分地解决布尔检索不能解决的问题,从而提高文献检索的水平解决布尔检索不能解决的问题,从而提高文献检索的水平解决布尔检索不能解决的问题,从而提高文献检索的水平解决布尔检索不能解决的问题,从而提高文献检索的水平和筛选能力,但美中不足的是提供位置运算符的检索系统和筛选能力,但美中不足的是提供位置运算符的检索系统和筛选能力,但美中不足的是提供位置运算符的检索系统和筛选能力,但美中不足的是提供位置运算符的检索系统并不多。并不多。并不多。并不多。基础知识基础知识9.检索技巧检索技巧(1)扩大检索范围的方法:)扩大检索范围的方法:增加同义词,用增加同义词,用增加同义词,用增加同义词,用OROR组配;组配;组配;组配;主题词扩展检索主题词扩展检索主题词扩展检索主题词扩展检索(有下位词有下位词有下位词有下位词)或使用上位或使用上位或使用上位或使用上位主题词进行检索;主题词进行检索;主题词进行检索;主题词进行检索;检索相关主题词;检索相关主题词;检索相关主题词;检索相关主题词;使用截词符或通配符;使用截词符或通配符;使用截词符或通配符;使用截词符或通配符;减少检索的字段限定;减少检索的字段限定;减少检索的字段限定;减少检索的字段限定;横向检索;横向检索;横向检索;横向检索;检索引文。检索引文。检索引文。检索引文。基础知识基础知识 (2)缩小检索范围的方法:)缩小检索范围的方法:使用逻辑运算符使用逻辑运算符使用逻辑运算符使用逻辑运算符“andand”或或或或“notnot”;选择专指性的检索词;选择专指性的检索词;选择专指性的检索词;选择专指性的检索词;使用副主题词;使用副主题词;使用副主题词;使用副主题词;主题词加权检索;主题词加权检索;主题词加权检索;主题词加权检索;限制字段检索。限制字段检索。限制字段检索。限制字段检索。基础知识基础知识10.10.检索策略的制定检索策略的制定检索策略的制定检索策略的制定 制定检索策略时要注意以下几点:制定检索策略时要注意以下几点:制定检索策略时要注意以下几点:制定检索策略时要注意以下几点:(1)(1)尽可能采用主题词检索;尽可能采用主题词检索;尽可能采用主题词检索;尽可能采用主题词检索;(2)(2)为保证检出切题文献,可使用自由词检索;为保证检出切题文献,可使用自由词检索;为保证检出切题文献,可使用自由词检索;为保证检出切题文献,可使用自由词检索;(3)(3)注意用好逻辑组配关系;注意用好逻辑组配关系;注意用好逻辑组配关系;注意用好逻辑组配关系;(4)(4)如果检出的同类文献过多,使用缩小检索范围如果检出的同类文献过多,使用缩小检索范围如果检出的同类文献过多,使用缩小检索范围如果检出的同类文献过多,使用缩小检索范围的方法;的方法;的方法;的方法;(5)(5)如果检出的同类文献过少,使用扩大检索范围如果检出的同类文献过少,使用扩大检索范围如果检出的同类文献过少,使用扩大检索范围如果检出的同类文献过少,使用扩大检索范围的方法。的方法。的方法。的方法。基础知识基础知识11.11.检索效果的评价检索效果的评价检索效果的评价检索效果的评价查全率(查全率(查全率(查全率(recallrecall):指系统在进行某一检索时,):指系统在进行某一检索时,):指系统在进行某一检索时,):指系统在进行某一检索时,检出的相关文献量占系统文献库中相关文献量的检出的相关文献量占系统文献库中相关文献量的检出的相关文献量占系统文献库中相关文献量的检出的相关文献量占系统文献库中相关文献量的比率,它反映该系统文献库中实有的相关文献量比率,它反映该系统文献库中实有的相关文献量比率,它反映该系统文献库中实有的相关文献量比率,它反映该系统文献库中实有的相关文献量在多大程度上被检索出来。在多大程度上被检索出来。在多大程度上被检索出来。在多大程度上被检索出来。R R(检出相关文献量(检出相关文献量(检出相关文献量(检出相关文献量/系统文献库中相关文献总量)系统文献库中相关文献总量)系统文献库中相关文献总量)系统文献库中相关文献总量)100%100%查准率(查准率(查准率(查准率(precision):precision):指系统在进行某一检索时,指系统在进行某一检索时,指系统在进行某一检索时,指系统在进行某一检索时,检出的相关文献量占检出的文献总量的比率,它检出的相关文献量占检出的文献总量的比率,它检出的相关文献量占检出的文献总量的比率,它检出的相关文献量占检出的文献总量的比率,它反映每次从该系统文献库中实际检出的全部文献反映每次从该系统文献库中实际检出的全部文献反映每次从该系统文献库中实际检出的全部文献反映每次从该系统文献库中实际检出的全部文献中有多少是相关的。中有多少是相关的。中有多少是相关的。中有多少是相关的。P=(P=(检出相关文献量检出相关文献量检出相关文献量检出相关文献量/检出文献总量检出文献总量检出文献总量检出文献总量)100%)100%