计算机信息检索.ppt
《计算机信息检索.ppt》由会员分享,可在线阅读,更多相关《计算机信息检索.ppt(165页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机信息检索导 论一、为什么要学习这门课程?一、为什么要学习这门课程?二、本课程能学到些什么?二、本课程能学到些什么?三、怎样学好这门课程?三、怎样学好这门课程?一、为什么要学习这门课程一、为什么要学习这门课程1.1.学习本课程能解决的问题学习本课程能解决的问题2.2.高等教育高等教育明确规定的培养要求;明确规定的培养要求;培养信息素质培养信息素质的重要内容的重要内容学习本课程能解决的问题:学习本课程能解决的问题:l问题问题1 1:我听说了大学生数学建模竞赛,并对此很感兴趣,想看看2005年全国大学生数学建模竞赛试题,怎么获得呢?l问题问题2 2:我要考英语四六级,我想找一些历年的试题做做。
2、到哪儿能获得这些资料呢?(最好是免费获取)l问题问题3 3:我想报考某学校某位导师的研究生,想知道这个教授的研究方向和研究内容,需要阅读该教授近几年来发表的论文,怎样才能看到这些文章呢?l问题问题4 4:我要写毕业论文了,需要参考一些外文资料,但这些外文资料该去哪儿找呢?l问题问题5 5:我在从事某个科研课题的研究,需要全面掌握该课题国内外有关研究的背景与进展,从而保证研究成果的先进性、新颖性等,怎样才能有效获取相关信息?l 等等本课程解决:如何科学地检索和利用文献信息资源满足个人的信息需求l我们处的信息状态1、信息爆炸信息社会掌握信息的人掌握机会,掌握信息的掌握财富,掌握信息的人可以把握先机
3、2、科研重复率40%(我国)3、我们面对的信息问题是:信息无限增长,而人的接受能力和理解能力的有限(人不可能将所有信息转化为自身有用的信息)l信息的多源性、可选性和易得性信息的多源性、可选性和易得性,这在便利人们的同时也导,这在便利人们的同时也导致了致了信息污染、信息过载信息污染、信息过载等问题。庞大复杂的文献信息资源等问题。庞大复杂的文献信息资源与人们的特定需求之间的矛盾,向我们提出了如何科学地检与人们的特定需求之间的矛盾,向我们提出了如何科学地检索和利用文献信息资源满足个人的信息需求的问题。索和利用文献信息资源满足个人的信息需求的问题。l如果掌握了信息检索技术,我们就可以最快速度、最为精确
4、如果掌握了信息检索技术,我们就可以最快速度、最为精确的途径获得需要的信息,最大程度地节省用于信息搜集的时的途径获得需要的信息,最大程度地节省用于信息搜集的时间和精力;我们可以继承和借鉴前人的成果,充分了解和利间和精力;我们可以继承和借鉴前人的成果,充分了解和利用国内外前人和他人对该研究课题的研究成果。用国内外前人和他人对该研究课题的研究成果。“如果我看得远,那是因为我站在巨人的肩上。”牛顿知识的一半就是知道到哪儿去寻找 彼得德鲁克在后资本主义社会中所说:“在知识社会里,对于任何一个人、组织、企业和国家,获取和应用知识的能力是竞争成败的关键。”路易斯肖:“懂得如何查询到所需要的知识等于掌握了知识
5、的一半。”高等教育专业培养要求l教育部1998年颁发的普通高等学校本科专业目录和专业介绍包括249种专业,有218种专业在它的培养要求中明确规定“掌握文献检索、资料查询的基本方法”或“掌握文献检索及运用现代信息技术获取相关信息的基本方法。”l文献信息资源的检索与利用是一门信息素质教育的基础课程,是培养学生良好的信息素养,学习科学地检索和利用文献信息资源满足个人信息需求的一门方法课。信息素养(Information Literacy)能能够够认认识识到到何何时时需需要要信信息息、查查找找、评评价价和和有有效效利利用用所所需需信信息息的的一一系系列列能能力。主要包括四个方面:力。主要包括四个方面:
6、1.1.信信息息意意识识 即即人人的的信信息息敏敏感感程程度度。面面对对不不懂懂的的东东西西,能能积积极极主主动地去寻找答案,并知道到哪里、用什么方法去寻求答案。动地去寻找答案,并知道到哪里、用什么方法去寻求答案。2.2.信信息息知知识识 既既是是信信息息科科学学技技术术的的理理论论基基础础,又又是是学学习习信信息息技技术术的基本要求。的基本要求。3.3.信信息息能能力力 包包括括信信息息系系统统的的基基本本操操作作能能力力,信信息息的的采采集集、传传输输、加加工工处处理理和和应应用用的的能能力力,以以及及对对信信息息系系统统与与信信息息进进行行评评价价的的能力等。能力等。4.4.信信息息道道
7、德德 对对媒媒体体信信息息进进行行正正确确的的判判断断和和选选择择,合合理理、合合法法地地检索、搜集和利用信息。检索、搜集和利用信息。信息素养能力标准信息素养能力标准l美美国国在在20002000年年批批准准的的高高等等教教育育信信息息素素养养能能力力标标准准认认为为,一一个个具具备备信信息息素素养养的的人人应应达达到到如如下下的的标准:标准:确定所需信息的范围;确定所需信息的范围;有效地获取所需的信息;有效地获取所需的信息;鉴别信息及其来源;鉴别信息及其来源;将检索出的信息融入自己的知识基础;将检索出的信息融入自己的知识基础;有效地利用信息去完成一个具体任务;有效地利用信息去完成一个具体任务
8、;了了解解利利用用信信息息过过程程中中所所涉涉及及的的经经济济、法法律律和和社社会会问问题题,合合理、合法地检索、搜集和利用信息。理、合法地检索、搜集和利用信息。“计算机信息检索课是不可多得的中国高校开展信息素质教育的一个重要基地。”“计算机信息检索课是我们研究和试验信息素质教育的一个重要平台。”导 论一、为什么要学习这门课程?一、为什么要学习这门课程?二、本课程能学到些什么?二、本课程能学到些什么?三、怎样学好这门课程?三、怎样学好这门课程?二、本课程能学到些什么?(课程内容)第一章信息资源概述第二章信息检索基本原理第三章网络信息资源第四章主要中文数据库第五章主要西文文摘数据库第六章主要西文
9、全文数据库第八章会议论文、学位论文、科技报告、专利二、本课程能学到些什么?1.培养和强化信息意识,提高信息化生存策略n重视信息资源n信息的检索能力知道何时需要信息知道如何查找所需的信息知道如何有效的利用信息,解决问题2.了解信息检索与利用的基础知识和检索原理3.从宏观层面上掌握信息组织和加工的基本方法4.熟练掌握我国和世界上几种主要数据库的使用方法和检索技巧5.掌握有效索取原始文献各种途径导 论一、为什么要学习这门课程?一、为什么要学习这门课程?二、本课程能学到些什么?二、本课程能学到些什么?三、怎样学好这门课程?三、怎样学好这门课程?三、怎样学好这门课程三、怎样学好这门课程?l课时安排课时安
10、排l成绩测算成绩测算课时安排课时安排l我们这门课分为两大部分,第一部分我们在教学楼学习基础知识和一些检索方法技巧;第二部分同学们上机演练,当堂完成上机实习报告。l教学课程9次l上机实习3次成绩测算方式成绩测算方式l我们这门课不考试我们这门课不考试l实习报告成绩占实习报告成绩占60%60%l考勤占考勤占40%40%第一章信息资源概述1.1 信息概述1.1.1信息、知识、情报、文献1.1.2信息的类型 1.2 信息资源概述1.2.1信息资源定义1.2.2信息资源特性1.2.3信息资源类型1.1 信息概述1.1.1 信息、知识、情报、文献一、信息l信息无处不在,无时不有,无人不用l“信息”是一个既古
11、老又年轻的概念n梦断美人沉信息,目空长路传楼台n控制论的创始人维纳说:“信息既不是物质,又不是能量”n现代信息论的创始人申农从研究通信理论出发,把信息定义为“用来减少随机不确定性的东西”。n意大利学者朗高在信息论:新的趋势与未决问题一书的序言中指出:“信息是反映事物的形成、关系和差别的东西,它包含在事物的差异之中,而不在事物本身。”l总结:n信息不是事件或物体的本身,不像物质那样有实体,而是一种对事件和事物的抽象反映,是客观事物存在的方式和运动状态的描述。n在现代社会中,信息与物质和能源共成为人类社会存在发展的三大要素。二、知识l知识,是人们对客观事物存在和运动规律的认识。l知识是信息中被人们
12、认识的部分。l信息包含了知识。三、情报l情报就是人们在特定时间内为一定目的而传递的有特殊效用的知识或信息。l传递是情报的基本属性,也是辨别知识(或信息)是否转换成情报的重要标志。四、文献l文献文献是记录所有知识的一切载体。是人类将知识(用文字、符号、图形及声频视频信号)记录在一定载体上形成的。l构成文献的三个基本要素n知识:知识:决定文献的内容,n载体:载体:决定文献的形态,n记录:记录:则是构成文献的手段。五、信息、知识、情报、文献的关系l信息是情报和知识的载体l情报是特指的专业信息l知识是信息的内核事物事物信息信息知识知识情报情报文献文献发生反馈大脑加工传递利用存储传递1.1.2 信息的类
13、型1按信息的产生客体来划分(1)自然信息(2)生物信息(3)社会信息2按信息的加工层次来划分(1)零次信息(2)一次信息(3)二次信息(4)三次信息3按信息所依附的载体来划分(1)口语信息(2)实物信息(3)文献信息(4)数字信息1按信息的产生客体来划分(1)自然信息:(2)生物信息:(3)社会信息:是指自然界中的各种信息是指生物为繁衍生存而产生的信息是指人类各种活动所产生、传递与利用的信息2按信息的加工层次来划分(1)零次信息:l是指记录在非正规物理载体上的、未经加工整理的信息,l零星的、分散的和无规则,具有原始性、新颖性、分散性和不可检索性等特征。(2)一次信息:l是指记录在正规载体上的、
14、经过一定加工整理的信息。l具有创造性、系统性和新颖性等特征。是我们查找的目标。(3)二次信息:l是指将分散、无序的一次信息进行加工整理,使之成为系统有序的信息l具有浓缩性、汇集性和有序性等特点。是查找一次信息的工具。(4)三次信息:l是根据二次信息提供的线索,找出一批相关的一次信息,经过调研、分析、综合后而形成的信息,l具有较强的概括性,成为人们研究新事物的具体结论和成果。是情报研究的成果。3按信息所依附的载体来划分(1)口语信息:l指存在于人脑中、通过口传耳授(交谈、讨论、报告等)的方式传播的信息。l在不同领域人们通过交流而获得的信息占所有获得信息的从4080不等。(2)实物信息:l是指固化
15、在实物中的信息,包括自然实物和人工实物l其特点是直观性强、感觉实在、信息量大,但需要通过知识、智慧、经验和工具挖掘隐含的大量信息。(3)文献信息:l是以文字、图形、符号、声频、视频等方式记录在各种载体上的信息。l优点是,易识别、易保存、易传播。(4)数字信息:l亦可称为电子信息,是指以数字代码方式(即“0”和“1”)将文字、图形、图像、声音、动画等信息存储在磁带、磁盘、光盘等介质上,以电信号、光信号的形式传输,并通过网络通信、计算机及其终端设备再现出来的一种信息。l具有存储容量大、存取速度快、体积小、可共享等特点。1.2信息资源概述1.2.1信息资源定义l信息资源是指人类社会活动中经过加工处理
16、有序化并大量积累后的有用信息的集合。l是人类获取知识情报的来源。l“信息资源”与自然资源、人力资源共同构成支撑现代经济社会发展的资源体系。1.2.2信息资源特性1社会性2知识性3关联性4动态性5增长性6共享性1.2.3信息资源类型l按信息资源的加工层次来划分:n零次信息资源、一次信息资源、二次信息资源、三次信息资源;l按信息资源所依附的载体来划分:n口语信息资源、实物信息资源、文献信息资源、数字信文献信息资源、数字信息资源息资源一、文献信息资源1、定义:l文献信息资源是迄今为止人类所积累和存储的、不断增长的全部文献的总和。l文献信息资源是信息资源的主体部分,是信息搜集、存储、检索、利用的主要对
17、象。2、类型不同划分标准可以划分出不同的文献信息资源类型l根据文献记录方式和载体材料的不同,可以将现代的文献信息资源划分为:书写型、印刷型、缩微型、声像型和机读型(或称电子型信息资源,或数字信息资源)。l根据文献信息加工深度划分,可以分为:零次文献、一次文献、二次文献和三次文献。l根据出版形式划分的文献信息资源类型:图书、期刊、报纸、专利文献、标准文献、会议文献、学位论文、科技报告、档案文献和产品样本。2、文献信息资源类型:文献信息资源以记录方式和载体材料为依据可划分为l书写型文献信息资源:n纸张为载体,记录方式为人工抄写,n包括手稿、信件、日记、原始档案等。l印刷型文献信息资源n以纸张为载体
18、,记录方式主要是印刷技术,n包括油印、铅印、胶印、木板印刷、复印、激光打印等。l缩微型文献信息资源n以感光材料为载体,记录方式主要是光学记录技术,n主要类型有缩微胶卷、缩微平片、缩微卡片等。l机读型文献信息资源n以磁介质、光介质材料为载体,记录方式为磁录、光录技术,n主要类型有磁带、磁盘、软盘、光盘等。l声像型文献信息资源n感光材料和磁性材料为载体,记录方式为光录技术和磁录技术,n主要类型有唱片、录音录像带、电影胶卷、胶片、幻灯片等。二、数字信息资源1、数字信息资源定义n数字信息资源,亦可称为电子资源,是指将大量的数字信息集合在一起,存储在磁带、磁盘、光盘等介质上。n简单说,就是数字信息的集合
19、。用户通过计算机和网络获取。2、数字信息资源特点(1)存贮介质l磁性材料或光学材料,存贮信息密度高,重复利用(2)传播形式l可借助通信网络进行远距离传播(3)信息资源内容丰富l集图、文、声、像于一体的动态多媒体信息(4)数字信息资源具有通用性、开放性l可以被每一个用户所使用,是一种具有共享性的信息资源(5)共享性l不受时间、空间限制,任何用户都可使用3、数字信息资源类型l数字信息资源的范围非常广泛,类型多种多样,划分标准也有很多种。1)按照数字资源的加工深度,可以分为一次文献、二次文献、三次文献。2)按照数字资源的生产途径和发布范围划分为:商用电子资源、网络公开学术资源、特色资源等。3)按照数
20、字资源的载体可以划分为光盘数据库、网络数据库等。4)按照出版形式和检索对象的不同,可以划分为参考数据库、全文数据库、事实数据库、电子图书、电子期刊、电子报纸、搜索引擎分类指南、网络学术资源学科导航、个人主页、BBS、FTP、博客等网络信息资源。3、数字信息资源类型按照数字资源的生产途径和发布范围(1)商业电子资源:l也称正式电子出版物,正式出版商或数据库商出版发行的,是数字资源的主流部分。l包括各类数据库、电子期刊、电子图书。l特点:学术信息含量高,具备检索系统,出版成本高,必须购买才可使用,因此不是免费开放的。(2)网络公开学术资源:l完全向免费开放,l包括各专业团体、学协会、教育机构、行政
21、机构等在网上发布的正式信息,其中有大量的一次文献资源,l各图书馆的馆藏书刊目录(WEBOPEC)也属于这个范畴。(3)特色资源:l也属于半正式出版物,主要是各教育机构、政府机关、图书馆的一些特色收藏制作成电子资源,但是不是完全公开的,只在一定的范围内公开。(4)其他资源:l如FTP、新闻组、BBS、电子邮件等都属于非正式出版物。l信息的真实性没有保障。介绍一些主要的信息资源l图书l期刊l会议文献l学位论文l科技报告l专利l标准l1、图书(Book):l定义:n它是对某一研究、技术、经验或知识体系的概括和总结。比如教科书、专著、工具书等。l特点:n是系统全面、观点成熟,它是传播知识、培养人才主要
22、工具。但出版周期长,报道速度慢。l特征(如何识别):n作者(Author)、书名(Title)、出版社(Press、Publication)、出版地、版次(Edition)、国际标准书号(ISBN)。l收藏特点:n图书在大型图书馆均有广泛收藏,多数图书较易获取。国家图书馆是我国收藏图书最全的单位。图书书名:MBA英语精读文选责任者:吴启金出版社:机械工业出版社出版日期:2002-5-24年份:2002ISBN号:7-111-08867-0l参考文献书写方法nBirdRB,StewartWE,LightfootEN.TransportPhenomenaM.NewYork:JohnWiley&So
23、nsInc,1960.75n刘国钧,王连成图书馆史研究M北京:高等教育出版社,1979:15-18n作者.书名 M.出版地:出版者,出版年.n原作者.译著名 M.译者,译.出版地:出版者,出版年.n作者.文集名 C.出版地:出版者,出版年.国际标准书号国际标准书号(InternationalStandardBookNumber,ISBN)国际通行的出版物代码,由13位阿拉伯数字组成,ISBN号具有专指性,唯一代表某种书的某一版本,2007年1月1日起正式使用13位ISBN号。978-7-118-05497-2组号出版社号书序号校验号n前缀号:国际物品编码协会(ENA)为图书分配的商品代码。目前
24、使用978,预留979。n组号:组号是国家、地区、语言或其他组织集团的代号。由国际书号中心(International ISBN agency)负责分配。中国组号为一位数字“7”。n出版社号:由国家标准书号中心负责分配,其位数视申请出版社图书出版量多少而异。n书序号:由出版社负责管理分配,每个出版社所出各种图书的序号n校验号:是校验ISBN编号是否合法。n比较:ISBN 978-7-5064-2595-7,ISBN 978-7-04-021737-7 前缀号2、期刊或杂志(Periodical,Journal,Magazine)l定义:n是一种有固定名称的连续出版物。可分为学术性、通讯性、消息
25、性、资料性和检索性期刊等。l特点:n使用固定的刊名,每期均有连续的卷、期号和年月顺序号。n具有报道速度快、出版周期短、内容新、数量大、品种多等特点。n期刊是利用率最大的文献。l特征:n作者(Author)、题目(Title)、刊名(JournalName)、卷(Vol)、期(No)、起止页码、出版年度、国际标准刊号(ISSN)、语种。l收藏特点:n国内图书馆和情报所均有不同程度的收藏,期刊原文较易获取。期刊【题名题名】吸波材料研究现状及碳团簇型吸波材料设计【作者作者】徐国亮蒋刚朱正和【机构机构】四川大学原子分子物理研究所,成都,610065【刊名刊名】原子与分子物理学报.2004,21(B04
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机信息 检索
限制150内