欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    信息检索基础知识.pdf

    • 资源ID:85969946       资源大小:196.57KB        全文页数:4页
    • 资源格式: PDF        下载积分:14.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要14.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    信息检索基础知识.pdf

    第一章 信息检索基础知识 一 概述 1 信息与文献信息 知识的分类:已掌握的知识和需查询的知识。信息的定义:信息是事物运动的状态与方式,是物质的一种属性,并且借助于一定的物质载体传输和储存。这里有几个词组需说明:事物:泛指一切可能研究的对象(包括物质的和精神的)。运动:泛指一切意义上的变化(机械运动、化学运动、思维运动和社会运动)运动方式:在时间上所呈现的过程和规律:运动状态:在空间上所展示的形状和态势。信息已成为与物质、能量同样重要的三大资源之一。信息是一种原料,人类接受外界大量信息后,经过实践活动和大脑的思维机制加工提炼后变成有用的知识(知识的认识程度)。文献:将知识记录并保持在一定的载体上,就形成了文献。文献信息是文献所表达的内载信息,以文字、符号、声像信息为编码的人类精神信息,也是经过人们筛选、归纳和整理后记录下来的信息。科技文献是科学技术研究成果的记录,积累了许多有用的事实、数据、理论、方法和科学假设,反映了科学技术研究的进展和水平,是科学信息的主要来源。2 信息的特点(1)普遍性;信息是无处不在,无时不在的,c从宏观的宇宙天体到微观粒子,从自然界到人类社会,万事万物都是信息的母体;(2)时效性:信息的获得和传送需要时间,信息反映的总是特定时刻事物的运动状态和方式,当人们获得信息后,它反映的是某段时间的事物,是一种历史纪录,如果传递很慢,信息就会失去应有的价值;(3)传递性:指信息的空间和时间效应,信息可以从一个地方传到另一个地方,从一个时期传到另一个时期;信息的传递决定了信息的可扩散性,信息是通过各种渠道、媒介传播和扩散;(4)共享性:信息在传播和使用的过程中,载体本身的信息并不因此而减少,信息资源的共享将极大地推进人类文明的发展;(5)可转换性:信息的物质载体形态是可以相互转移变换的;信息在一定条件下可以转化为物质、能量、时间、金钱、效益、质量等;(6)可伪性:在人们得到信息后,必须进行分析判断和筛选,以便正确享用信息。3 信息的分类:3 1 按信息内容和性质划分为:(1)自然信息:指自然界随时间发生的声、光、冷、热、风、雨、雾、雪雷电及地壳运动、天体演化等。(2)生物信息:生物为繁衍、生存而表现出来的各种形态和行为,如遗传信息,生物体内信息交流、动物种群内的信息交流。(3)机械信息:如计算机和自动控制系统中使用的机器传输、控制、交换的信息。(4)人类社会信息:指人与人之间交流的信息(包括科技信息、经济信息、政治信息、军事信息和文化信息等),即包括通过手势、身体、眼神所传达的非语言信息,也包括用语言、文字、图表等语义信息传达的一切队人类社会运动变化状态的描述。3 2 按信息的加工程度划分:(1)一次信息:指原始形式中的信息:一次信息是人们以自己的经验和研究成果为依据而形成的。(2)二次信息:指通过对一次信息的加工、提炼和浓缩而成的、报道和查找依次文献的检索书刊。各种条目、题录、索引、文摘等。(3)三次信息:指对一次信息和二次信息进行汇集、综合、分析、评价等深度加工而形成的评价。包括词典、百科全书、年鉴、名录等。3 3 按信息载体的物理类型划分:(1)印刷型:它是通过铅印、油印和胶印、复印、手写等为记录手段形成的,将知识附着在自纸上的一类文献(图书、期刊以及各种印刷资料)。优点是便于阅读和流传,缺点是体积大,信息密度低,长期保存有一定困难。(2)微缩型:它是以印刷型文献为母本,以感光材料为载体,利用光学技术将文字、图像、影像等信息符号按比例缩小的文献形式(微型胶卷和微型平片);他的缺点是一定要借助阅读机才能阅读,其使用效率低;(3)声像一视听型:这是一种非文字形式的文献,是通过特定设备,使用光、声、磁、电等技术将信息表现为声音、图像、影视和动画等形式,给人以直观、形象的感受(唱机、录音机、录像机、放映机和投影仪等);(4)电子型(机读型):它是通过计算机对电子格式的信息进行存取和处理,即采用高技术手段,将信息储存在磁盘、磁带或光盘等一些媒体中,形成多种类型的电子出版物(包括电子报纸、电子期刊、电子新闻,各种联机信息库和光盘数据库产品和软盘、磁带等产品,电子传讯和电子传本,电子邮件等;二 信息检索原理 1 信息检索出现的背景:目前世界上每年出版图书 50 万种以上、期刊 10 万种以上、专利约 50 万件、科技报告约90 万件、会议文献 10 多万篇、产品样本 50 多万种,每年发表的论文 500万篇。科技文献的使用周期在缩短,一般认为,80%-90%的科技文献的有效周期只有 5 年。2 信息检索的含义:完整地说,信息检索指信息的存储与检索,即信息按一定的方式组织和储存起来,并根据信息用户的需求索出有关信息的过程和技术.一般认为,信息检索的内容包括如下三个方面:(1)数据检索:一文献中的数据为检验对象,检索结果是特定的数值性数据,是用户可以直接利用的信息。(2)事实检索:以事实为检索对象,检索某一事物发生的时间、地点和过程。(3)文献检索:以文献为检索对象,检索结果是文献资料。三检索语言 检索语言是根据文献信息检索所需要创造的一种人工语言,是信息检索系统存储与检验所使用的共同语言。它是专门用来描述文献的内容特征、外表特征和表达信息提问的一种人工语言。代表文献外表特征的有;著者姓名、题名、报告号、标准号、专利号等检索标识。代表文献内容特征的有;类号、叙词、标题词和关键词。使用检索工具,必须了解和掌握约定俗成的符号系统,既检索语言。信息检索语言可以分为;分类语言、主题语言、代码语言和引文言。分类语言又可分为;体系分类法、组配分类法。主题语言又可分为;标题词法、关键词法和叙词法。1 分类检索语言和分类表 分类检索语言用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列。其特点是能集中体现学科的系统性,反映事物的从属、派生关系,便于按学科门类进行族性检索。它的基本结构是按知识门类的逻辑次序,从一般到具体,从低级到高级,从简单到复杂的层层划分、逐级展开的层累制号码体系。体系分类法:它是一种直接体现知识分类的等级制概念标识系统,是通过对概括文献信息内容及某些外表特征的概念进行逻辑分类和系统排列而构成的。体系分类法的主要特点是按学科、专业集中文献、并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索信息的途径。分类检索语言通过分类表来体现。组配分类法;它的构成基于概念的可分析性和可综合性,即一个复杂概念可以分为若干简单概念,若干简单概念可以综合为一个复杂概念。2 主题法和主题检索语言 主题检索语言用语词来表达各种概念,将各种概念不考虑其相互关系,完全按字序排列。主题检索语言包括标题词型主题检索语言(标题法)、叙词型主题检索语言(叙词法)和关键词主题检索语言等,它们可统称为主题法系统。(1)标题词语言和标题词表 标题词的含义是“主题标目”,即以某种主题词为索引款目的标目或标识。在索引工作中,标题词是比较定型的事物名称。标题词语言是采用规范化了的自然语言,即经过标准化处理的名词术语作为标识,来表达文献所论述或涉及的事物主题,并将全部标识按字序排列。标题词语言的构成原理可归纳为:按主题集中文献;用经过规范化的语词直接标引文献主题:用参照系统间接显示主题之间的相互关系:用字顺序直接提供主题检索途径。标题词表是标题词的汇编,是一部标题词典。一部标题词表一般由以下 3 个部分组成:(a)编制说明:指本表的编制经过,收录标题词的学科范围、选词形式、标题形式、参照系统、各种符号的意义、标引及排列规则等。(b)主表:是标题词的正文,包括全部标题词和非标题词,按字顺排列,并有参照体系和注释。(c)副表:也称标题细分表,有通用和专用之分。(2)叙词语言与叙词表 叙词是指一些以概念为基础的,经过规范化的,具有组配功能并可以显示 词间关系和动态性的词或词组。叙词语言就是以叙词作为文献检索标识和查找依据的一种检索语言,是多种信息检索语言的原理和方法的综合,体现了信息检索语言的发展趋势。概念组配是叙词语言的基本原理。叙词语言吸取了多种信息检索语言的原理和方法,叙词作为标引和检索人员之间的共同语言,是通过叙词表来实现的。叙词表的结构比较复杂,一般由一个主表和若干附表构成。附表包括:(a)叙词字顺表;(b)叙词分类索引;(c)叙词轮排表索引;(d)叙词双语种对照索引;(e)专有叙词索引。(3)关键词语言 关键词语言是直接选用文献中的自然语言作为基本词汇,并将那些能够揭示文献题名或主要意旨的关键性自然语词作为关键词进行标引的一种检索语言。关键词索引大体可分为两类:一类是带上下文的关键词索引,包括题内关键词和题外关键词索引等;另一类是不带上下文的关键词索引,包括单纯关键词索引、词对关键词索引和简单关键词索引。3 代码语言 代码语言是根据事物的某些方面特征,用某种代码系统来表达和排列事物概念,从而提供检索的检索语言。例如根据化合物的分子式的代码语言可以构成分子式索引系统。4 引证关系追逐法 引证关系追逐法即引文索引法,是显示科学论文之间互相引证而形成的论文网的一种方法。这种方法提供了从被引论文来检索引用它的全部论文的途径,从而能顺着一种科学思想发展过程的线索找到有关的信息。四检索途径、方法和步骤 1 检索途径 在一般情况下,使用检索工具主要是通过各种检索途径来查找文献线索,采用荷重途径取决于得到的信息。检索途径包括以下几方面;(1)著者途径:它是通过已知著者名称来查找文献的一种途径(著者、专利文献专利权人、编者、译者等);(2)题名途径:一些检索系统中提供按题名字顺检索的途径,如书名目录、刊名目录和篇名目录等;它应当属于主题途径检索。(3)分类途径:指按照文献所属的学科体系检索文献的途径;(4)主题途径:指通过能表达文献内容的主题词来检索文献的一种途径(主题索引、关键词索引、主题轮排索引等;(5)引文途径:文献所属参考文献或引用文献,利用这种引文而编制的索引系统,称为引文索引系统;(6)序号、代码途径:有些文献有特定的序号,如专利号、报告号、合同号、标准号和刊号等。这种途径主要是利用各种号码索引,而号码索引一般是按字母顺序编排。(7)专门项目途径:从文献信息所包含的或有关的名词术语、地名、人名、机构名、商品名、生物属名、年代等的特定顺序进行检索。2 检索的一般程序 检索程序有 4 个主要步骤:(1)分析问题 分析研究课题,明确检索要求(包括问题分类、课题性质、学科专业等)。(2)选择检索工具 根究检索课题的要求,选择最能满足检索要求的检索工具书。(3)从检索中查找所需信息 确定检索入口(多入口)。(4)获取原文 习题:1 简述信息的特征与分类:2 信息有哪些检索途径?

    注意事项

    本文(信息检索基础知识.pdf)为本站会员(g****s)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开