欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    《信息存储与检索》复习资料.doc

    • 资源ID:54321306       资源大小:30.50KB        全文页数:5页
    • 资源格式: DOC        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    《信息存储与检索》复习资料.doc

    第一章 绪 论 l 信息是认识主体所感知或所表述的事物运动的状态与方式。l 知识,是人类对于客观世界的认识。信息是知识的重要组成部分。 l 在大学期间,信息技能具体表现为以下6种技能:、明确任务、信息查询策略、查找和检索、信息利用、信息综合、信息评价。l 信息意识是人们利用信息系统获取所需信息的内在动因,具体表现为对信息的敏感性、选择能力和消化吸收能力。l 信息意识含有信息认知、信息情感和信息行为倾向三个层面。 l 文献是“记录有人类精神信息的、且便于存贮或传递的人工固态附载物”。 l 文献的构成:文献信息、文献载体、符号系统和记录方式。 l 按文献生产加工层次划分的文献形式:一次文献、二次文献和三次文献 l 口头信息指通过交谈、讨论、报告等方式交流传播的信息。l 咨询业是以知识和技术为手段,以协助客户解决复杂的决策问题为目的向社会提供智力服务的行业。l 信息素质是从各种信息源检索、评价和使用信息的能力,是信息社会劳动者必须掌握的终身技能。l 信息素质的内涵包括:认识到准确和完整的信息是 明智决策的基础;认识到信息需求及问题所在;制订信息检索策略;掌握信息检索(计算机检索)技术;能评价信息;根据实际用途组织信息;将新信息融会到现有知识结构中,在批判性思考、解决问题和交流的过程中使用信息。 l 无偿信息资源网的问题:专业知识检索的结果不准确、不可靠、不能直接作为研究的论据,信息质量无法保证。信息的揭示不充分、不深入。信息的组织科学性差、绝大多数用的分类粗糙。关键词索引质量较差。信息管理差,不容易查到真正需求的专业知识信息。信息内可能包含不安全因素。l 信息传播的四个基本要素:信息源、传播者、传播媒介和载体、受传者。l 信息传播是指通过信息的发送、传递、接收跨越空间和时间,把信息从一方传到另一方的过程。l 信息存储是指工作人员将大量无序的信息集中起来,根据信息源的外表和内容特征,经过整理、分类、浓缩、标引等处理,使其系统化、有序化,并按一定的技术要求建成一个具有检索功能的工具或检索系统,供人们检索和利用。l 信息检索是指运用编制好的检索工具或检索系统,依据一定的方法查找满足用户要求的特定信息。第二章 信息存储与检索的基本知识l 信息存储与检索是将特征化表示的信息集合与特征化表示的用户需求集合进行匹配与选择过程。l 整个检索过程通常要考虑以下四个主要步骤:如何分析问题如何选择检索工具如何从检索工具中查找所需信息如何获取原文l 分析问题的步骤是:问题的分类分析“已知”和“欲知”信息分析需求的主题内容确定文献类型和时间范围 l 网上检索与手工检索不同的是,提供查询条件限制和检索逻辑条件限制。l 检索语言是根据文献检索需要创造的一种人工语言,又称检索标识。l 体系分类法是一种直接体现知识分类的等级制概念标识系统,是通过对概括文献信息内容及某些外表特征的概念进行逻辑分类(划分与概括)和系统排列而构成的。l 主题检索语言是直接以代表文献内容特征和科学概念作为检索标识,并按其外部形式(字顺)组织起来的一种检索语言。l 主题法最常用的有叙词法和标题法。l 评判工具书的质量可以用以下几条途径可作辅助评价:(1)检查收录范围(2)权威性(3)客观性(4)可靠性(4)可读性(5)易用性(6)适时性(7)利用书评资料(8)专家推荐。l 目录是指著录一批相关的图书或其他文献,按照某种次序编排而成的揭示和报道文献及其收藏情况的工具。 l 评价网站中的信息质量可以归纳为以下五条标准:第一,权威性;第二,准确性;第三,客观性;第四,适时性;第五,内容范围。第三章 计算机联机检索和光盘检索l 布尔检索式优先执行顺序通常是NOT、AND、OR,在有括号的情况下,先执行括号内的逻辑运算,在多层括号时,先执行最内层括号中的运算。l 截词方式有多种,按截断的字符数量分,有有限截断和无限截断;按截断的位置分,有后截断、前截断、中间截断。 l 传统联机检索的优点:u 传统联机检索基本上是集中式管理,有专人负责维护整个系统,定期更新信息。u 联机检索系统是个成熟的系统,信息质量较高,信息的附加值高,可靠性好,来源可靠。u 集中管理使得安全性有了一定保障。u 传统联机检索的准确率较网络检索高。l 传统联机检索的缺陷:u 集中式管理主要缺点是主机负担重,联机网络的扩展性较差,相关技术缺乏发展的动力,灵活性较差。u 在信息组织方式上,传统联机系统的普通文本数据库多以线性方式组织,其基本组成单位是记录;而在Internet上,基于WWW的信息组织采用超文本组织方式,其数据库由节点和链路组成。可以按单元、片段、关系将知识存贮,用链路网将同一文献或不同文献的相关部分结构化地连接起来,这是传统检索系统没有做到的。u Internet网不是一种网络,而是一个由许多类型、结构不同的分组交换网通过路由器连接而成的一个庞大的、能整体运作的网络。这种分布式的系统将分散的资源调集在一起解决同一个问题,分散的用户可以共享网络中各点的数据而不必知道某种资源的具体地址,这一特点是传统联机系统远远不及的。u Internet 网是面向最终用户的,操作较联机方便。第四章 网络信息检索的基本技术l IP地址 l Gopher是一个客户机/服务器系统(Client/Server)。l Gopher是深受用户欢迎的基于菜单驱动的Internet信息查询工具。l WWW以Client/Server模式进行数据通信。l WWW的特性:u WWW是一种超文本信息系统u WWW是多媒体的和易于导航的(navigate)u WWW与平台无关u WWW是分布式的u WWW是动态的u WWW是交互的 第五章 书刊资料的查找l 书目著录一批相关的图书或报刊,按一定的次序编排而成,是一种登记、报道和宣传书刊文献的检索工具。 l 书目的作用 :推荐作用。检索工具。文献工作。提供出处。l 索引是将报刊书籍中某些重要的或有意义的信息分别择录出来,按一定方式编排,并注明出处,以供检索的工具。它包括四个基本要素:索引源、索引款目、编排方法和出处指引系统。 l 索引的主要作用:了解已有的学术成果。从多种途径提供更深层次的信息。l 文摘是以提供文献内容梗概为目的、简明、确切地记述文献主要内容的短文。l 文摘作用:通报最新科学文献、节省阅读时间、引导检索原文、能获得因语言障碍无法得到的科学文献。l CALIS是中国高等教育文献保障体系(英文名称China Academic Library & Information System)的简称。第六章 中外百科知识的检索l 百科全书是汇集人类已有知识、加以整理和概述,并提供学习和检索的工具书。l 类书是从多种书籍中辑录资料,按类别或韵部编排,供寻检或征引资料的工具书。 l 皇览,我国古代类书之祖,中国三国魏文帝时刘劭、王象、桓范、韦诞、缪袭等奉敕所撰,四十余部,约八百余万字。远远超过大宝鉴的内容含量和水平。 l 现存最早、最完整的类书是唐高祖李渊命欧阳询等人编纂的艺文类聚。 l 永乐大典,全书正文22877卷,凡例、目录60卷,总字数达3.7亿字,是我国历史上最大的一部类书。l 现存最大的类书是清代陈梦雷、蒋廷锡等编纂的古今图书集成。该书正文一万卷、目录四十卷,约1.6亿字。 l 类书与百科全书的区别:u 编纂方式不同。类书是辑录原始资料,重在资料性,是原始资料的汇集。百科全书是根据已有的资料进行加工整理,是对已有知识的加工、整理和浓缩,反映了编纂者本人的知识水平。u 编排方式不同。类书是根据原始资料分类进行编排,通过分类编排反映原始资料之间的内部联系。百科全书则是以条目的字顺进行编排,条目之间通过索引反映内部之间的联系。u 内容有别。类书一般侧重于文史资料,而百科全书以反映人类全部知识为己任,对自然科学方面的知识更为重视。u 后期工作不同。类书编纂完成以后,一般很少进行补充或修订。而百科全书有连续修订制度,一般每隔5到10年要进行一次全面修订,保证知识的准确性。u 此外,百科全书有完备的索引体系、部分条目有参考书目指引读者进一步阅读等,也是类书不具备的。因此从根本上讲,类书与百科全书不是同一种工具书。l 类书的作用:保存资料;查考资料。第七章 经济信息的检索l 中文经济论文手工检索工具首推综合性报刊索引。而专题索引文摘在报道某一个时段论文资料方面内容较丰富,查找方便,可以作为综合性索引的补充 。l 企业名录是了解企业情况和产品信息的检索工具。l 价格信息指关于价格形成和作用的消息、资料,也包括与价格形成及其作用相关的法律、条令、规则及必要的知识。l 价格信息的内容很广,凡是反映价格及其形成和变化因素的信息,都属于价格信息的范围。归纳起来可有以下几个方面:价格决策信息、价格构成变化信息、价格动态信息、国际市场价格。l 统计资料是经济信息不可缺少的部分。掌握统计信息,有利于评价市场机会和可能的风险、制定投资策略、估计成本、分析竞争对手。 l 寻找统计检索工具要利用各种综合性或专科性工具书指南。 第八章 综合性科技信息检索工具l 科技信息检索包括对事实型资源(Fact Resources)的检索和科技文献的检索。l 了解科技名词、术语和概念的最好工具是专业词典和百科全书。l 百科在释疑和科学背景知识的介绍方面优于词典,条目由专家撰写,有综述的性质,还有参考文献、图表数据等,信息密度更大,浓缩性和汇编性很强。 l 数据是科学技术研究中经常使用的数字和文字,公式是数据内部规律性的抽象表述,这些资料通常被收辑在手册、表图册和便览中。 l 中文科技书刊、论文的综合性检索工具指包括自然科学和工程技术各个学科在内的印刷版或电子版索引、目录、文摘。 l 外文科技书刊、论文的综合性检索工具指包括自然科学和工程技术各个学科在内的印刷版或电子版索引、目录、文摘。第十章信息检索评价l 评价研究的作用 提高系统资源分配的合理性; 找出系统存在的缺陷及其原因,以便改进; 比较各种检索技术的优劣; 有助于新系统的设计; 丰富信息检索理论。l 网络搜索引擎的检索性能评价指标主要涉及以下8个方面: 数据库规模与内容 索引方法 检索功能 检索结果处理 分类功能(主要考察分类类目体系的深度、数量、合理性等) 用户界面(包括界面布局、联机帮助、界面定制、界面广告量等) 汉字处理(包括词语切分、多内码处理及中英文混合检索等) 其他(例如:响应时间、系统稳定性等)l 传统信息检索系统的性能评价指标体系主要包括以下7个: 收录范围(Coverage):主要指检索系统数据库覆盖的学科范围、信息类型、数量及时间跨度; 查全率(Recall Ratio):R=检出的相关文献量系统数据库中的相关文献总量 查准率(Precision Ratio):P=检出的相关文献量/检出文献总量 响应时间(Response Time) 用户负担(User Effort) 输出方式(Output /Display Format) 新颖率(Novelty Ratio)l TREC的目标:总目标:支持在信息检索领域的基础研究,提供对大规模文本检索方法的评估办法通过提供大型的语料库,统一的测试程序及系统整理评测的结果数据,以促进信息检索技术的发展;强调检索技术的先进性与实用性的有机结合;强调以大规模数据为基础的信息检索研究;为学术界、工业界、政府部门提供交流研究思想的公开论坛;便利从研究实验室到商品化产品的技术转换。第十一章 论文写作与检索工具的利用l 信息素养构成体系:包含文化素养、信息意识、信息技能。l 大学生信息素养特点:知识性、普及性、操作性。l 论文选题的基本原则:创造性、科学性、现实性、新颖性、具体性、选题不宜大、稳定性、可能性。l 在论文的写作中,要做到以下几点: u 在论文的具体写作过程中,要求做到语言准确、精练,行文流畅,这是学术论文的基本要求。u 在行文准确的基础上要适当注意学术论文的文采。u 在写作时还要注意标点符号、计量单位、数字的用法。u 此外,在论文写作中还要注意提炼中心句。

    注意事项

    本文(《信息存储与检索》复习资料.doc)为本站会员(飞****2)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开