欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    信息源与信息检索一般原理.ppt

    • 资源ID:77601385       资源大小:1.15MB        全文页数:67页
    • 资源格式: PPT        下载积分:20金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要20金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    信息源与信息检索一般原理.ppt

    信息源与信息检索一般原理 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望提纲提纲信息源信息源信息检索基本知识信息检索基本知识检索原理检索原理检索语言检索语言检索技术检索技术检索步骤检索步骤1信息源及其类型学习目标:学习目标:信息源的概念和类型;信息源的概念和类型;掌握文献的类型,了解各类型文献的特点掌握文献的类型,了解各类型文献的特点 在学习和研究中学会有针对性地选择不同类型的文献在学习和研究中学会有针对性地选择不同类型的文献 1.1信息源的概念l 信息源是信息源是产生产生信息的源泉信息的源泉,也是人们也是人们获得获得信息的来源信息的来源.l信息是物质的一种属性信息是物质的一种属性,因此因此“万物皆是信息源万物皆是信息源”,所有,所有能给人们提供信息的环境、人或事物都被看做是信息源。能给人们提供信息的环境、人或事物都被看做是信息源。l 如果从更专业化的角度来看待如果从更专业化的角度来看待“信息信息”的话,那么可以的话,那么可以将信息源理解为:人们在科研、生产及其他一切人类活动将信息源理解为:人们在科研、生产及其他一切人类活动中产生并积累下来的成果和各种原始记录,以及对这些成中产生并积累下来的成果和各种原始记录,以及对这些成果和原始记录加工整理后得到的产品。果和原始记录加工整理后得到的产品。1.2信息源的类型l 文献信息源:以文字、图形、符号、声频、视频等方式文献信息源:以文字、图形、符号、声频、视频等方式记录记录在在各种载体各种载体上的知识和信息。这类信息源是当前数量上的知识和信息。这类信息源是当前数量最大、利用率最高的信息源。如:图书、学术论文等。最大、利用率最高的信息源。如:图书、学术论文等。l 非文献信息源:非文字记录性信息的来源,如口头言论非文献信息源:非文字记录性信息的来源,如口头言论传播的信息、参观考察、会议、展览等无文献记录或不做传播的信息、参观考察、会议、展览等无文献记录或不做记录的信息来源。记录的信息来源。文献文献 记录有人类精神信息的、且便于存贮或传递的人工记录有人类精神信息的、且便于存贮或传递的人工固态附载物固态附载物记录知识的载体记录知识的载体 文献的特点文献的特点:知识是文献的本质属性;知识是文献的本质属性;载体是文献的存在形式;载体是文献的存在形式;记录是构成文献的重要手段;记录是构成文献的重要手段;新陈代谢是文献发展、运动的规律。新陈代谢是文献发展、运动的规律。1.3文献及其类型 1.3.1 1.3.1 按载体形态划分按载体形态划分 1.3.2 1.3.2 按文献加工层次划分按文献加工层次划分 1.3.3 1.3.3 按出版类型划分按出版类型划分1.3 文献及其类型文献及其类型1.3.1 1.3.1 按载体形态划分按载体形态划分 印刷型(印刷型(Printed FormPrinted Form)缩微型(缩微型(Micro FormMicro Form)声像声像-视听型(视听型(Audio-Visual FormAudio-Visual Form)电子型电子型 (Electronic FormElectronic Form)1.3 文献及其类型文献及其类型1.3.2 1.3.2 按文献加工层次划分按文献加工层次划分 一次文献(专著、报纸、期刊、特种文献)一次文献(专著、报纸、期刊、特种文献)二次文献(目录、题录、索引、文摘)二次文献(目录、题录、索引、文摘)三次文献(专题报告、综述、手册、百科全书)三次文献(专题报告、综述、手册、百科全书)1.3 文献及其类型文献及其类型1.3.3 1.3.3 按出版类型划分按出版类型划分图书图书期刊期刊会议文献会议文献专利文献专利文献学位论文学位论文政府出版物政府出版物标准标准1.3 文献及其类型文献及其类型 图书图书(Book)通过图书可以了解他人关于某个专门问题通过图书可以了解他人关于某个专门问题的研究或对实践经验的系统论述。的研究或对实践经验的系统论述。特点特点:知识内容更成熟、更稳定、更可靠。:知识内容更成熟、更稳定、更可靠。缺点缺点:出版周期长、内容更新慢:出版周期长、内容更新慢 若要对某些问题获得较全面、系统的了解,或对不熟若要对某些问题获得较全面、系统的了解,或对不熟若要对某些问题获得较全面、系统的了解,或对不熟若要对某些问题获得较全面、系统的了解,或对不熟悉的领域有个初步、基本的了解,阅读有关图书是个较好悉的领域有个初步、基本的了解,阅读有关图书是个较好悉的领域有个初步、基本的了解,阅读有关图书是个较好悉的领域有个初步、基本的了解,阅读有关图书是个较好的办法。的办法。的办法。的办法。一般分为两类:一般分为两类:一般分为两类:一般分为两类:阅读型阅读型阅读型阅读型;工具型工具型工具型工具型 唯一标识:唯一标识:唯一标识:唯一标识:ISBNISBNISBNISBN号(国际标准书号)号(国际标准书号)号(国际标准书号)号(国际标准书号)期刊期刊 期刊是一种有固定名称、有连续的卷、期年期刊是一种有固定名称、有连续的卷、期年月顺序号,并计划无限期出版的连续出版物。月顺序号,并计划无限期出版的连续出版物。特点:出版周期短特点:出版周期短特点:出版周期短特点:出版周期短 内容新颖内容新颖内容新颖内容新颖是科研人员获取信息的重要来源。是科研人员获取信息的重要来源。是科研人员获取信息的重要来源。是科研人员获取信息的重要来源。看哪些期刊论文?据统计据统计,目前世界上科技期刊已达目前世界上科技期刊已达10101212万种万种*在在收集和阅读收集和阅读文献信息时,应首先选择本专业的文献信息时,应首先选择本专业的核心期刊核心期刊。核心期刊核心期刊:指刊载该专业论文数量较大指刊载该专业论文数量较大(信息量信息量较大较大),学术水平较高的,能反映本学科最新研,学术水平较高的,能反映本学科最新研究成果及本学科前沿研究状况与发展趋势的,倍究成果及本学科前沿研究状况与发展趋势的,倍受该学科专业读者重视的期刊。受该学科专业读者重视的期刊。核心期刊的评定核心期刊的评定北大北大中文核心期刊要目总览中文核心期刊要目总览 4 4年更新一次年更新一次 http:/ 20082008年版年版 图情类核心期刊表图情类核心期刊表CSSCICSSCI南大中国社会科学引文索引南大中国社会科学引文索引 http:/ CSSCICSSCI来源期刊(来源期刊(2008200820092009年)年)SCDSCD(科学引文数据库)源期刊(科学引文数据库)源期刊,是中国大学评价是中国大学评价课题组研发。自课题组研发。自20062006年开始用于中国大学评价和年开始用于中国大学评价和中国大学研究生院评价中国大学研究生院评价 每年更新一次。每年更新一次。图情、档案类核心期刊表图情、档案类核心期刊表 专利文献专利文献(Patent Document)广义:包括专利申请书、专利说明书、专利公报和专利检广义:包括专利申请书、专利说明书、专利公报和专利检索工具,以及与专利有关的一切资料索工具,以及与专利有关的一切资料狭义:指各国专利局出版的专利说明书。狭义:指各国专利局出版的专利说明书。专利号是识别专利文献的重要依据。专利号是识别专利文献的重要依据。例如:例如:USUS:828496828496专利文献具有新颖性、创新性和实用性的特点专利文献具有新颖性、创新性和实用性的特点.备注备注:7月月8日(星期三)日(星期三)15:3016:20 中外专利数据库的检索与利用(王秀红)中外专利数据库的检索与利用(王秀红)会议文献会议文献主要指在各种学术会议上发表的论文。主要指在各种学术会议上发表的论文。特点特点:专业性强、内容新、针对性强、学术水平高、出版专业性强、内容新、针对性强、学术水平高、出版发行较快、信息传递及时。发行较快、信息传递及时。会议文献大部分是本学科领域内的新成果、新理论、新方法。会议文献大部分是本学科领域内的新成果、新理论、新方法。学位论文学位论文(Dissertation/thesis)为获得某种学位而撰写的为获得某种学位而撰写的科学论文。科学论文。一般不出版发行,保存在一般不出版发行,保存在授予学位单位的图书馆里。授予学位单位的图书馆里。标准文献标准文献(Standard Literature)定义:定义:狭义的标准指按规定程序狭义的标准指按规定程序制订、经公认的权威机构批准的制订、经公认的权威机构批准的一整套在特定范围内须执行的规一整套在特定范围内须执行的规格、规则、技术要求等规范性文格、规则、技术要求等规范性文献;广义的标准指与标准化工作献;广义的标准指与标准化工作有关的一切文献。有关的一切文献。特点:特点:特点:特点:具有约束力;时效性;针对性。具有约束力;时效性;针对性。具有约束力;时效性;针对性。具有约束力;时效性;针对性。标准文献的识别特征是标准文献的识别特征是标准文献的识别特征是标准文献的识别特征是标准号标准号标准号标准号,通常由标准代号、顺序号、,通常由标准代号、顺序号、,通常由标准代号、顺序号、,通常由标准代号、顺序号、颁布年代构成。颁布年代构成。颁布年代构成。颁布年代构成。标准代号:标准代号:标准代号:标准代号:GBGBGBGB、ISOISOISOISO、ANSIANSIANSIANSI、IECIECIECIEC、ENENENEN其他还有:其他还有:科技报告、档案文献、政府出版物、报纸、新科技报告、档案文献、政府出版物、报纸、新闻稿、产品样本、统计资料等文献类型。闻稿、产品样本、统计资料等文献类型。信息源信息源图书期刊特种文献会会议议文文献献科科技技报报告告专专利利文文献献学学位位论论文文政政府府出出版版物物标标准准文文献献公公司司产产品品资资料料技技术术档档案案2信息检索基本知识信息检索基本知识学习目标学习目标:检索原理检索原理检索语言检索语言检索技术检索技术检索步骤检索步骤2.1 2.1 信息检索原理信息检索原理 从已存储的文献资源中找出与用户情报提问相从已存储的文献资源中找出与用户情报提问相关的文献信息。关的文献信息。广义的信息检索全称为广义的信息检索全称为“信息存储与检索信息存储与检索”(Information Storage and RetrievalInformation Storage and Retrieval),包),包括信息存储和信息检索两个方面。括信息存储和信息检索两个方面。狭义的信息检索仅指广义的信息检索的后半部狭义的信息检索仅指广义的信息检索的后半部分,即信息检索部分。分,即信息检索部分。信息检索的实质是反映和寻求提问标识与检索信息检索的实质是反映和寻求提问标识与检索标识之间相匹配的信息。标识之间相匹配的信息。2.1 2.1 检索原理检索原理输出输出表述表述外表特征外表特征内容特征内容特征思考思考:1.前面几种文献类型的外表特征和内容特征有哪些前面几种文献类型的外表特征和内容特征有哪些?2.文献的标题是外表特征还是内容特征文献的标题是外表特征还是内容特征?2.2 2.2 检索语言检索语言用来描述文献特征和表达检索提问的一种专门用来描述文献特征和表达检索提问的一种专门语言语言,是用于文献标引和检索提问的约定语言。是用于文献标引和检索提问的约定语言。在信息存贮过程中,使用检索语言描述信息在信息存贮过程中,使用检索语言描述信息的内容特征和外表特征,从而形成文献标识;的内容特征和外表特征,从而形成文献标识;在信息检索过程中,使用检索语言描述检索在信息检索过程中,使用检索语言描述检索提问,从而形成提问标识。提问,从而形成提问标识。当提问标识与文献标识完全匹配或部分匹配当提问标识与文献标识完全匹配或部分匹配时,需要的信息就被检索出来了。时,需要的信息就被检索出来了。2.2 2.2 检索语言检索语言描述文献描述文献信息特征信息特征内容特征语言内容特征语言分类语言分类语言 主题语言主题语言 标题词标题词 单元词单元词 叙叙 词词 关键词关键词 外表特征语言外表特征语言著著 者者题题 名名文献号文献号检检 索索 词词规范与否规范与否 人工语言人工语言 自然语言自然语言 标题词、标题词、单元词、单元词、叙叙 词词关键词、关键词、自由词自由词2.2.1 2.2.1 分类语言分类语言 又称分类法,又称分类法,将文献主题概念按将文献主题概念按知识学科性质知识学科性质进行分类进行分类和系统排列和系统排列 并用并用号码号码(分类号)表达各种概念(分类号)表达各种概念中国图书馆分类法中国图书馆分类法l中图法中图法l将学科知识分为将学科知识分为5 5大基本部类,大基本部类,2222个基本大类个基本大类l分类标识即分类号,由字母和数字组成分类标识即分类号,由字母和数字组成l采用等级列举表达从属关系采用等级列举表达从属关系中图法简表中图法简表A马、列、毛、马、列、毛、邓理论邓理论B哲学、宗教哲学、宗教C社会科学总论社会科学总论D政治、法律政治、法律E军事军事F经济经济G文化、科学、教育、体育文化、科学、教育、体育H语言、文字语言、文字 I文学文学J艺术艺术K历史、地理历史、地理 N自然科学总论自然科学总论O数理科学和化学数理科学和化学P天文学、地球科学天文学、地球科学Q生物科学生物科学R医药、卫生医药、卫生S农业科学农业科学T工业技术工业技术U交通运输交通运输V航空、航天航空、航天X环境科学、安全科学环境科学、安全科学Z综合性图书综合性图书F F 经济经济 F0 F0 经济学经济学 F1 F1世界各国经济概况、经济史、经济地理世界各国经济概况、经济史、经济地理 F2 F2经济计划与管理经济计划与管理 F20 F20国民经济管理国民经济管理 F21 F21经济计划经济计划 F22 F22经济计算、经济数学方法经济计算、经济数学方法 F23 F23会计会计 F230 F230 会计学会计学 F231 F231 会计簿记方法会计簿记方法 F232 F232 会计设备会计设备 F233 F233 会计工作组织与制度会计工作组织与制度 F234 F234 各种会计和簿记各种会计和簿记 F234.1 F234.1 社会会计社会会计 F234.2 F234.2 成本会计成本会计 F234.3 F234.3 管理会计管理会计 F234.4 F234.4 财务会计财务会计 F234.5 F234.5 国际会计国际会计 .F3 F3农业经济农业经济 F4 F4工业经济工业经济l中国科学院图书馆图书分类法(科图法)中国科学院图书馆图书分类法(科图法)l中国人民大学图书馆图书分类法(人大法)中国人民大学图书馆图书分类法(人大法)l国际十进分类法国际十进分类法 UDCl杜威十进分类法杜威十进分类法 DDCl国际专利分类表国际专利分类表IPC主题语言主题语言,也称主题法,是一种用,也称主题法,是一种用语词语词标识处标识处理原始信息、组织主题检索工具或检索系统的理原始信息、组织主题检索工具或检索系统的检索语言。主题语言又分为标题词语言、单元检索语言。主题语言又分为标题词语言、单元词语言、词语言、关键词语言关键词语言和和叙词语言叙词语言。2.2.2 主题语言主题语言1)叙词语言叙词语言 叙词语言叙词语言是以自然语言词汇为基础,以概念组配为是以自然语言词汇为基础,以概念组配为基本特征,适应现代信息需求而发展起来的一种信基本特征,适应现代信息需求而发展起来的一种信息检索语言类型。息检索语言类型。叙词叙词又称描述词、叙述词,是以概念为基础,经过又称描述词、叙述词,是以概念为基础,经过优选和规范化处理并具有概念组配和词间语义关系优选和规范化处理并具有概念组配和词间语义关系显示功能,用以表达文献主题和检索需要的语词。显示功能,用以表达文献主题和检索需要的语词。叙词语言的特点:直观,专指性强,组配性高,结叙词语言的特点:直观,专指性强,组配性高,结构严谨,标引能力强。构严谨,标引能力强。叙词语言示例:汉语主题词表、英国科学文叙词语言示例:汉语主题词表、英国科学文摘使用的摘使用的INSPEC ThesaurusINSPEC Thesaurus、美国工程索、美国工程索引引9393年后使用的年后使用的Ei ThesaurusEi Thesaurus等。等。图书馆员图书馆员D图书馆工作人员D图书馆工作者D图书馆馆员D图书馆管理人员D图书馆管理员D图书馆人员C图书馆工作C图书馆领导图书馆工作人员图书馆工作人员Y图书馆员图书图书 D多语文图书D普通图书D书籍别集畅销书丛书地方丛书辑佚丛书自助丛书族姓丛书单行本电子图书多卷书复本书汉语主题词表示例汉语主题词表示例2)2)关键词语言关键词语言 关键词语言是直接选用文献信息中的自然语关键词语言是直接选用文献信息中的自然语言作基本词汇,并将那些能够揭示文献信息言作基本词汇,并将那些能够揭示文献信息题名或主题意旨的关键性自然语词作为关键题名或主题意旨的关键性自然语词作为关键词进行标引的一种检索语言。词进行标引的一种检索语言。扩展学习阅读书目扩展学习阅读书目信息组织的分类法与主题法 曹树金,罗春荣编著 北京图书馆出版社主题法导论 侯汉清,马张华主编 北京大学出版社主题法的理论与标引 刘湘生编著 书目文献出版社 主题法基础知识 卢子博著 江苏省图书馆学会文献分类法主题法导论 马张华,侯汉清著 北京图书馆出版社2.3 计算机检索技术计算机检索技术2.3.1 布尔逻辑检索布尔逻辑检索2.3.2 截词检索截词检索2.3.3 原文检索原文检索2.3.4 加权检索加权检索 逻辑逻辑“与与”:and;*and;*逻辑逻辑“或或”:oror;+逻辑逻辑“非非”:not;-not;-2.3.1 布尔逻辑检索布尔逻辑检索1)“与与”逻辑乘逻辑乘用于表达两个或两个以上检索用于表达两个或两个以上检索词之间的相交关系或限定关系词之间的相交关系或限定关系运算。运算。逻辑逻辑“与与”检索能增强检索的检索能增强检索的专指性,使检索范围缩小。专指性,使检索范围缩小。2.3.1 布尔逻辑检索布尔逻辑检索n 用符号用符号“and”“and”或或“*”“*”表示,表示,n 其逻辑表达式为:其逻辑表达式为:A*B A*B 或或 A and B A and B(交集)(交集)n 例如:查找有关例如:查找有关“英语歌曲在英语教学中的应用英语歌曲在英语教学中的应用”的文的文献献:“英语歌曲英语歌曲*英语教学英语教学”或或 “英语歌曲英语歌曲 AND AND 英语教学英语教学”2.3.1 布尔逻辑检索布尔逻辑检索2)“或或”逻辑和逻辑和用于表达两个或两个以上检索词用于表达两个或两个以上检索词之间的并列关系。之间的并列关系。逻辑逻辑“或或”检索扩大了检索范围,检索扩大了检索范围,提高检索信息的查全率。提高检索信息的查全率。n 用符号用符号“or”“or”或或“+”“+”表示表示n 其逻辑表达式为:其逻辑表达式为:A or B A or B 或或 A+B A+B(并集)(并集)n 如逻辑式如逻辑式“enterprise OR company”“enterprise OR company”或者或者 “enterprise+company”“enterprise+company”n 表示文献中只要含有检索词中任何一个或两个同时存在表示文献中只要含有检索词中任何一个或两个同时存在的文献为命中文献的文献为命中文献.此算符适于连接有同义关系或相关关系的词。此算符适于连接有同义关系或相关关系的词。2.3.1 布尔逻辑检索布尔逻辑检索3)“非非”逻辑差逻辑差用于表达两个或两个以上检索词用于表达两个或两个以上检索词之间排除不需要的检索词的运算之间排除不需要的检索词的运算可以缩小检索范围,增强检索的可以缩小检索范围,增强检索的准确性。准确性。此运算适于排除那些含有某个指定检索词的记录。此运算适于排除那些含有某个指定检索词的记录。n 用符号用符号“not”“not”或或“-”“-”n 其逻辑表达式为:其逻辑表达式为:A not B A not B 或或 A-B A-Bn 如逻辑式如逻辑式“英语语法英语语法 NOT NOT 构词法构词法”n 表示检索除构词法以外的、有关英语语法方面的文献表示检索除构词法以外的、有关英语语法方面的文献2.3.1 布尔逻辑检索布尔逻辑检索逻辑算符的运算次序逻辑算符的运算次序:在有括号的情况下,先执行括号内的运算;有多层括号在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。时,先执行最内层括号中的运算,逐层向外进行。例如例如:(A+B)*C-D(A+B)*C-D在没有括号的情况下,在没有括号的情况下,AndAnd、OrOr、NotNot的运算次序,在不的运算次序,在不同的系统中有不同的规定。同的系统中有不同的规定。2.3 计算机检索技术计算机检索技术2.3.1 布尔逻辑检索布尔逻辑检索2.3.2 截词检索截词检索2.3.3 原文检索原文检索2.3.4 加权检索加权检索2.3.2 2.3.2 截词检索截词检索截词检索:利用检索词的词干或不完整词形进行查找的截词检索:利用检索词的词干或不完整词形进行查找的过程。过程。可以起到扩大检索范围,提高查全率,减少检索词的输可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间。入量,节省检索时间。尤其在英文检索系统中检索时,若遇到名词的单复数形尤其在英文检索系统中检索时,若遇到名词的单复数形式,词的不同拼写法,词的后缀变化时,均可采用此方式,词的不同拼写法,词的后缀变化时,均可采用此方法。法。如如:comput*常用的截词符有:常用的截词符有:*,#,?,!*,#,?,!,$注:不同的数据库所用的截词符不一样,使用前应先注:不同的数据库所用的截词符不一样,使用前应先查一下各数据库的帮助加以确认查一下各数据库的帮助加以确认2.3.2 截词检索截词检索截词的方式有多种,可以分为有限截词、无限截词截词的方式有多种,可以分为有限截词、无限截词有限截词有限截词一个符号表示一个字母一个符号表示一个字母如:如:wom?n wom?n 可检索出:可检索出:woman,womenwoman,women(中间截断)(中间截断)无限截词无限截词一个符号表示任意多个字母一个符号表示任意多个字母如:如:comput*comput*可检出:可检出:Computer,computers,Computer,computers,computeringcomputering2.3.2 2.3.2 截词检索截词检索2.3.2 2.3.2 截词检索截词检索按照截词的位置,可分为:按照截词的位置,可分为:1 1)后截断、前方一致后截断、前方一致lComput*computer,computers,computingComput*computer,computers,computing2 2)前截断、后方一致前截断、后方一致 l*computerminicomputer,microcomputer,*computerminicomputer,microcomputer,3 3)中间截断、前后一致中间截断、前后一致 lFib*board fibFib*board fibererboard,fibboard,fibrereboardboard2.3 计算机检索技术计算机检索技术2.3.1 布尔逻辑检索布尔逻辑检索2.3.2 截词检索截词检索2.3.3 原文检索原文检索2.3.4 加权检索加权检索 “原文原文”是指数据库中的原始记录。是指数据库中的原始记录。原文检索即以原始记录中的检索词与检索词间特定位原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的运算。置关系为对象的运算。原文检索是直接使用自由词的检索方法。原文检索是直接使用自由词的检索方法。2.3.3 原文检索原文检索1 1)记录级检索:要求检索词出现在同一记录中,不管在该)记录级检索:要求检索词出现在同一记录中,不管在该记录的哪一字段含有所输入的检索字符,即:在所有字记录的哪一字段含有所输入的检索字符,即:在所有字段中检索。段中检索。“all fields”“all fields”、“任意字段任意字段”2 2)字段级检索:用字段对检索词加以限定)字段级检索:用字段对检索词加以限定 题名=(英语语法);TI=(“英语语法”)3 3)子字段或自然句级检索)子字段或自然句级检索4 4)位置检索)位置检索 2.3.3 原文检索原文检索4 4)位置检索:要求检索词之间的相互位置满足某些条件)位置检索:要求检索词之间的相互位置满足某些条件2.3.3 原文检索原文检索 词序词序间隔词间隔词数限制数限制不能颠倒不能颠倒能颠倒能颠倒0个个(W)(N)n个个(nW)(nN)任意多个任意多个(F)(S)注:在不同的数据库中,位置算符的表达方式和检索功能注:在不同的数据库中,位置算符的表达方式和检索功能有可能不同,具体应用时应参看数据库的使用说明。有可能不同,具体应用时应参看数据库的使用说明。例例:Tax (W8)reform Tax (N5)reform2.3 计算机检索技术计算机检索技术2.3.1 布尔逻辑检索布尔逻辑检索2.3.2 截词检索截词检索2.3.3 原文检索原文检索2.3.4 加权检索加权检索 在每个提问词后面给定一个数值表示其重要程度,这个在每个提问词后面给定一个数值表示其重要程度,这个数值称为权,在检索时,先查找这些检索词在数据库记录中数值称为权,在检索时,先查找这些检索词在数据库记录中是否存在,然后计算存在的检索词的权值总和。权值之和达是否存在,然后计算存在的检索词的权值总和。权值之和达到或超过预先给定的阈值,该记录即为命中记录。到或超过预先给定的阈值,该记录即为命中记录。例如例如:Q=:Q=英语英语(1 1)口语口语(3 3)教学教学(2 2)阈值阈值=4=4 1.提高提高英语口语英语口语水平的几点建议水平的几点建议 (权值总和权值总和=4)2.高职学校高职学校英语教学英语教学存在的问题与对策存在的问题与对策(权值总和权值总和=3)2.3.4 加权检索加权检索2.4 计算机检索计算机检索的一般步骤与方法(一一)分析检索课题、明确检索要求分析检索课题、明确检索要求(二二)制定检索策略制定检索策略(三三)选择数据库选择数据库(四四)实施检索,反馈调整实施检索,反馈调整(五五)获取原文获取原文(六六)整理和利用文献整理和利用文献(一一)分析检索课题、明确检索要求分析检索课题、明确检索要求 课题的内容是什么?主要解决什么问题?获取何种相关文献?课题分析要从以下几个方面进行:(1)分析课题内涵 (2)分析文献需求类型 (3)分析查找年代实例:实例:基于社会化标签的大众分类研究基于社会化标签的大众分类研究 计算机检索步骤计算机检索步骤(二二)制定检索策略制定检索策略 1对课题进行词切分词切分,选择检索词 2选择布尔逻辑运算符、位置算符、截词符等 3.构造检索式注意:尽量收全检索课题的注意:尽量收全检索课题的同义词同义词、相关词相关词计算机检索步骤计算机检索步骤基于社会化标签的大众分类研究基于社会化标签的大众分类研究基于基于|社会化标签社会化标签|的的|大众分类大众分类|研究研究社会化标签社会化标签社会化标签社会化标签 and and and and 大众分类大众分类大众分类大众分类课题课题:词切分词切分:检索式检索式:(三三)选择相关数据库选择相关数据库应注意以下几点:1数据库收录的文献内容 2数据库收录的文献的出版类型 3数据库中收录文献的时间范围 4数据库的更新情况计算机检索步骤计算机检索步骤(四四)实施检索,反馈调整实施检索,反馈调整 当检索结果很多或很少甚至为零时必须对初步拟订的检索策略进行调整。扩大检索范围的方法(逻辑“或”、截词等、字段扩展、位置算符号等)缩小检索范围的方法(逻辑“与”、字段限制等)实例:基于社会化标签的大众分类研究基于社会化标签的大众分类研究计算机检索步骤计算机检索步骤(五)获取原文1)查找全文数据库下载查找全文数据库下载2)到网上找免费资源到网上找免费资源,GOOGLE学术搜索,如法律法规、新闻、一些OA电子期刊和科技报告等。3)向收藏单位借阅或联系复制向收藏单位借阅或联系复制,图书馆原文传递图书馆原文传递 馆内馆外,本地区外地区,选择适合要求的馆藏目录进行查找。4)发动朋友发动朋友。让朋友利用他周围的资源检索,将全文mail给你。5)向著者索取向著者索取计算机检索步骤计算机检索步骤(六)整理和利用文献(六)整理和利用文献文献管理软件(文献管理软件(NoteExpress;ENDNOTENoteExpress;ENDNOTE)计算机检索步骤计算机检索步骤2.4.2 计算机检索计算机检索的一般步骤与方法(一一)分析检索课题、明确检索要求分析检索课题、明确检索要求(二二)制定检索策略制定检索策略(三三)选择数据库选择数据库(四四)实施检索,反馈调整实施检索,反馈调整(五五)获取原文获取原文(六六)整理和利用文献整理和利用文献小结信息源信息源l信息源的概念和类型信息源的概念和类型l文献的类型及其特点文献的类型及其特点信息检索基本知识信息检索基本知识检索原理检索原理检索语言检索语言检索技术检索技术检索步骤检索步骤思考题思考题1.文献类型有哪些?若想了解某课题的最新研究成果,可选择哪些文献类型?为什么?2.自拟一课题,思考和阐述计算机信息检索的一般步骤。谢谢大家!谢谢大家!欢迎提问,共同探讨!欢迎提问,共同探讨!2008版北大核心期刊目录(图情)版北大核心期刊目录(图情)(共(共19种)种)1.中国图书馆学报中国图书馆学报2.图书情报工作图书情报工作3.情报学报情报学报4.大学图书馆学报大学图书馆学报5.图书馆杂志图书馆杂志6.图书馆论坛图书馆论坛7.图书馆图书馆8.情报科学情报科学9.图书馆建设图书馆建设10.现代图书情报技术现代图书情报技术1.图书情报知识图书情报知识2.情报资料工作情报资料工作3.情报理论与实践情报理论与实践4.情报杂志情报杂志5.图书馆工作与研究图书馆工作与研究6.图书馆理论与实践图书馆理论与实践7.图书馆学研究图书馆学研究8.图书与情报图书与情报9.国家图书馆学刊国家图书馆学刊返回返回CSSCI来源期刊(来源期刊(20082009年)年)(图情、档案类(图情、档案类 共共6种)种)返回返回1.中国图书馆学报 2.大学图书馆学报 3.情报学报 4.图书情报工作 5.情报理论与实践 6.图书情报知识 7.图书馆 8.现代图书情报技术 9.情报资料工作 10.图书馆建设11.情报科学 12.图书馆论坛 13.图书馆杂志 14.国家图书馆学刊15.图书馆工作与研究 16.情报杂志 17.图书馆学研究18.图书与情报 19.档案学研究20.档案学通讯SCD2008收录源刊(图情、档案)收录源刊(图情、档案)(共(共6种)种)返回返回1.中国中国图书馆学学报2.大学大学图书馆学学报3.图书馆工作与研究工作与研究4.情情报学学报5.情情报理理论与与实践践6.档案学通档案学通讯

    注意事项

    本文(信息源与信息检索一般原理.ppt)为本站会员(豆****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开