网络信息的检索.ppt
《网络信息的检索.ppt》由会员分享,可在线阅读,更多相关《网络信息的检索.ppt(120页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络信息的检索 Still waters run deep.流静水深流静水深,人静心深人静心深 Where there is life,there is hope。有生命必有希望。有生命必有希望一、网络信息的特点1.信息源数量庞大、增长迅速2.信息内容丰富、多样,覆盖面广3.传输速度快、共享程度高4.交叉性强、分布广泛而不均匀5.变化频繁、动态性强6.信息使用成本低7.信息质量良莠不齐二、搜索引擎 网络搜索引擎的历史最早可以追溯到 1991年,尽管搜索引擎发展时间并不长,但其观念却是深入人心的。第 22次中国互联网发展状况统计报告显示,在中国 2.5 3亿网民中,搜索引擎的使用率为 6 9.2
2、,达 1.7 5亿。目前为中国第五大网络应用技术。从数据中不难看出,网络搜索引擎所发挥的作用是非常大的。工作原理 搜索引擎是互联网上的分布式搜索系统,它在传统数据库检索技术基础上,增加了自动收集和更新数据库信息的功能,并采用人工智能方法对检索结果进行区分和排序。主要由信息采集器、查询表和检索接口三大模块组成。搜索引擎系统的分类1.机器人搜索引擎 由一个称为蜘蛛(Spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器将用户的查询输入检索索引库,并将查询结果返回给用户。服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、毋
3、需人工干预,缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。2.目录搜索引擎 以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎因为加入了人的智能,所以信息准确,导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。严格意义上算不上真正的搜索引擎。Dmoz:open directory project:是世界上最大也是最好的网站分类目录主页3.元搜索引擎 也称集成搜索引擎。是对搜索引擎进行搜索的搜索引擎。它可以没有自己的资源库和机器人,仅充当一个中间
4、代理的角色,接受用户的查询请求,讲请求翻译成相应搜索引擎的查询语法。在向各个搜索引擎发送查询请求并获得反馈后,进行综合相关度排序,然后把整理后的查询结果发送给用户。Dogpile共收集了26个搜索引擎,包括WEB检索、新闻组检索、FTP检索、新闻检索、股市检索、黄页检索、白页检索、地图检索、天气检索等。http:/ 1999年底,百度成立于美国硅谷,2000年1月创立于北京中关村,是目前全球最大的中文搜索引擎。百度的起名,来自于“众里寻她千百度”的灵感,它寄托着百度公司对自身技术的信心,象征着百度对中文信息检索技术的执著追求。百度除数据库的规模及部分特殊搜索功百度除数据库的规模及部分特殊搜索功
5、能外,其他方面可与当前的搜索引擎业界能外,其他方面可与当前的搜索引擎业界领军人物领军人物Google相媲美,在中文搜索支持相媲美,在中文搜索支持方面有些地方甚至超过了方面有些地方甚至超过了Google,是目前,是目前国内技术水平最高的搜索引擎之一。国内技术水平最高的搜索引擎之一。成为成为“最受欢迎的中文搜索引擎最受欢迎的中文搜索引擎”和和“全全球最大的球最大的 中文搜索引擎中文搜索引擎”(百度自称),(百度自称),其数据库中存有其数据库中存有3亿页网页。百度搜索引擎亿页网页。百度搜索引擎具有高准确性、高查全率、更新快以及服具有高准确性、高查全率、更新快以及服务稳定的特点,能够帮助广大网民快速的
6、务稳定的特点,能够帮助广大网民快速的在浩如烟海的互联网信息中找到自己需要在浩如烟海的互联网信息中找到自己需要的信息,因此深受网民的喜爱。的信息,因此深受网民的喜爱。百度主页百度国学和端午相关的诗词古代典籍对普洱的描述古诗静夜思2.Google www.G 成立于1997年9月,几年间迅速发展成为目前规模最大的搜索引擎,目前Google每天处理的搜索请求已达2亿次!而且这一数字还在不断增长。Google提供常规及高级搜索功能。在高级搜索中,用户可限制某一搜索必须包含或排除特定的关键词或短语。该引擎允许用户定制搜索结果页面所含信息条目数量,可从10到100条任选。提供网站内部查询和横向相关查询。G
7、oogle允许以多种语言进行搜索,在操作界面中提供多达30余种语言选择,包括英语、主要欧洲国家语言(含13种东欧语言)、日语、中文简繁体、朝语等。同时还可以在多达40多个国别专属引擎中进行选择。Google主页1.糖醋排骨Google的基本检索算符是:空格、减号和“OR”,逻辑“与”(AND)用空格代替。“糖醋排骨 做法”,注意空格的使用空格在搜索中起到的作用是非常大的,如果想查询中国跨度最大的公路隧道中国跨度最大的公路隧道,可以这样搜索:“中国中国 跨度最大跨度最大 公路隧道公路隧道”使用减号 有时你可能在查询某个题材时又不希望在这个题材中包含另一个题材,这时你就可以使用减号了。比如你想查询
8、有关冯小刚的文件,但又不希望看到有关葛优的消息,用google检索你可以这样查找:冯小刚 葛优(注意减号前有一个空格)减号的作用在于可以使搜索结果集中反映你的需求,减号的作用在于可以使搜索结果集中反映你的需求,而你无需为大量无关的搜索结果而头疼。而你无需为大量无关的搜索结果而头疼。减号前不加空格的检索结果松茸 保鲜 检索结果松茸-姬松茸 保鲜 的检索结果使用引号“”通过添加英文双引号来搜索短语。双引号中的词语在查询到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。例:查一个管理学的概念:系数推导法(没有作为一个短语检索,结果难以找到有用的资料)用一个短语检索的结果查
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 网络 信息 检索
限制150内