搜索引擎的未来发展趋势课件.pptx
《搜索引擎的未来发展趋势课件.pptx》由会员分享,可在线阅读,更多相关《搜索引擎的未来发展趋势课件.pptx(69页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、本讲提纲v搜索引擎的发展简史搜索引擎的发展简史v搜索引擎的分类搜索引擎的分类v搜索引擎的技术原理搜索引擎的技术原理v搜索经济的诞生搜索经济的诞生v搜索引擎的未来发展趋势搜索引擎的未来发展趋势1 搜索引擎的发展简史搜索引擎的发展简史-搜索引擎的鼻祖:Archiev1990年由年由Montreal的的McGill University(麦吉尔大学)(麦吉尔大学)学生学生Alan Emtage、Peter Deutsch、Bill Wheelan发明的发明的Archie(Archie FAQ)v实际上是一个可搜索实际上是一个可搜索的的FTP文件名列表文件名列表现代搜索引擎的起源:Wandererv1
2、993年年MIT 的学生的学生Matthew Gray开发了开发了World Wide Web Wanderer,它是世界上第一个利用网,它是世界上第一个利用网页之间的链接关系来监测页之间的链接关系来监测Web发展规模的机器人发展规模的机器人(Robot)程序。)程序。v最开始只是用来统计互联网上的服务器数量,之最开始只是用来统计互联网上的服务器数量,之后发展为也能捕获网址。后发展为也能捕获网址。Yahoov1994.4美籍华人美籍华人Jerry Yang(杨致远杨致远)和和David Filo完成了一套搜索软完成了一套搜索软件。件。v最初最初Yahoo的数据是的数据是手工手工输入的,实际上输
3、入的,实际上只是一个可搜索的目只是一个可搜索的目录。录。v1995年年1月,正式成立月,正式成立Yahoo网站网站 第一个现代意义上的搜索引擎:Lycosv1994.7 Carnegie Mellon University 的的Michael Mauldin 将将 John Leavitt的的蜘蛛蜘蛛程序程序接入到其索引程接入到其索引程序中,创建了序中,创建了Lycos.v提供了前缀匹配和字提供了前缀匹配和字符相近限制、网页自符相近限制、网页自动摘要、数据量相对动摘要、数据量相对较大。较大。Infoseekv1994年底,年底,Infoseek推出,沿推出,沿袭袭Yahoo!和和Lycos的概
4、念。的概念。v友善的用户界面、大量附加服务友善的用户界面、大量附加服务使其使其后来者居上后来者居上。v1995.12与与Netscape的战略性的战略性协议使它变得很强势协议使它变得很强势v2001年年2月,月,Infoseek改用改用Overture的搜索结果的搜索结果第一个元搜索引擎:Metacrawlerv元搜索引擎元搜索引擎(A Meta Search Engine Roundup)。用户提交搜索后,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将从各独立搜索引擎返回的所有查询结果,集中起来处理后再返回给用户。v第一个元搜索引擎,是第一个元搜索引擎,是Washingto
5、n大学硕士生大学硕士生 Eric Selberg 和和 Oren Etzioni开发的开发的 Metacrawler。第一个支持自然语言搜索的搜索引擎:AltaVistav1995年年12月出现月出现(AltaVista Public Beta Press Release)。vAltaVista是第一个支持自是第一个支持自然语言搜索的搜索引擎。然语言搜索的搜索引擎。v2003年年AltaVista被被Overture收购,后者是收购,后者是Yahoo的子公司。的子公司。搜索引擎的后来之王:Googlev1995年,佩奇来到斯年,佩奇来到斯坦福读博士,开始网坦福读博士,开始网络链接结构方面的研络
6、链接结构方面的研究项目究项目BackRub。v之后,他和布林提出之后,他和布林提出了了PageRank技术,用技术,用于对网页评级于对网页评级v之后用于搜索引擎,之后用于搜索引擎,改写了搜索引擎的定改写了搜索引擎的定义,建立了义,建立了Google。搜索引擎的后来之王:GooglevGoogle在斯坦福引起了人们的关注。在斯坦福引起了人们的关注。v佩奇开始准备出售该技术,但是没有成功。佩奇开始准备出售该技术,但是没有成功。vSun公司创始人的投资,随后成立公司。公司创始人的投资,随后成立公司。v2000年和年和Yahoo合作,一飞冲天。合作,一飞冲天。v2004年年7月上市,市值月上市,市值2
7、50亿,增长速度超过微软。亿,增长速度超过微软。Google之特点v专注、进取、朴素、低调、神话般的创业故事专注、进取、朴素、低调、神话般的创业故事中文搜索引擎老大:百度v2000.1李彦宏创立了李彦宏创立了百度。百度。v2001.8发布百度测试发布百度测试版。版。v目前是最大的中文搜目前是最大的中文搜索引擎索引擎vMP3搜索特色搜索特色百度的特点v专注于技术专注于技术v专注于中文搜索专注于中文搜索北大天网v由北大计算机系网络由北大计算机系网络与分布式系统研究室与分布式系统研究室开发,于开发,于1997年年10月月29日正式在日正式在CERNET上提供服务。上提供服务。v利用教育网优势,有利用
8、教育网优势,有强大的强大的FTP搜索功能。搜索功能。中国互联网使用率使用率使用率信息渠道信息渠道生活助手生活助手网络新闻77.3%网络求职15.2%搜索引擎搜索引擎74.8%网络教育24.0%写博客19.1%网络购物25.5%交流工具交流工具网络销售4.3%即时通信69.8%网上旅行预订3.9%电子邮件55.4%网上银行20.9%娱乐工具娱乐工具网上炒股14.1%网络音乐68.5%网络影视61.1%网络游戏47.0%2007年7月中国互联网信息中心第20次网络调查报告2 搜索引擎的分类搜索引擎的分类-目录搜索引擎v以人工方式或半自动以人工方式或半自动方式搜集信息方式搜集信息v信息准确、导航质量
9、信息准确、导航质量v缺点是需要人工介入、缺点是需要人工介入、维护量大、信息量少、维护量大、信息量少、信息更新不及时信息更新不及时机器人搜索引擎v由一个称为蜘蛛由一个称为蜘蛛(Spider)的机器人)的机器人程序自动搜索信息程序自动搜索信息v优点:信息量大、更优点:信息量大、更新及时、无需人工干新及时、无需人工干预预v缺点:返回信息过多,缺点:返回信息过多,有很多无用信息。有很多无用信息。元搜索引擎v利用其他搜索引擎返利用其他搜索引擎返回统一的搜索结果。回统一的搜索结果。v返回信息量更大、更返回信息量更大、更全。全。v缺点是不能充分使用缺点是不能充分使用所有搜索引擎的功能所有搜索引擎的功能其他搜
10、索产品v建站时间建站时间 1999.5v世界排名世界排名20v站长年龄站长年龄22岁岁v收购前月收入收购前月收入100万万v收购价格,号称收购价格,号称5000万,实际可能万,实际可能1000万万3 搜索引擎的技术原理搜索引擎的技术原理-搜索引擎的基本要求v接受用户提交的关键字,然后接受用户提交的关键字,然后 在一个在一个可以接受的可以接受的时间时间内返回一个和该用户查询内返回一个和该用户查询匹配匹配的网页信息的网页信息列列表表搜索引擎工作流程网页搜集预处理查询服务网页搜集v网页数据库的基本策略:网页数据库的基本策略:1)定期搜集:2)增量搜集:v网页的抓取策略:网页的抓取策略:1)“爬取”策
11、略:2)维护URL:定期搜集v定期搜索,隔一段时间后对整个网页重新搜集一定期搜索,隔一段时间后对整个网页重新搜集一遍,替换以前的内容。遍,替换以前的内容。v优点:实现起来较简单优点:实现起来较简单v缺点:开销较大,两次搜集的时间间隔不会很短,缺点:开销较大,两次搜集的时间间隔不会很短,“时新性(时新性(freshness)”不高不高增量搜集v开始时搜集一遍,然后:开始时搜集一遍,然后:v1.搜集新出现的网页搜集新出现的网页v2.搜集更新了的网页搜集更新了的网页v3.发现有网页已经不存在,则从库中删除发现有网页已经不存在,则从库中删除“爬取”策略v将将Web看作是一个有向看作是一个有向图,搜集过
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 搜索引擎 未来 发展趋势 课件
限制150内