《搜索引擎·ppt课件.pptx》由会员分享,可在线阅读,更多相关《搜索引擎·ppt课件.pptx(66页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络资源信息检索与利用参考课件2023/1/61问题问题 1 1红豆杉被剥皮,为什么吗?2023/1/62问题问题 2 2互联网上检索最近三个月关于融智学院的新闻报道2023/1/63问题问题3 3p一个朋友家住江北区东方家园,在互联网上可能通过哪几种地图工具搜到该小区信息?有多少种地图方式可以呈现?2023/1/64p搜索引擎简史p关于百度p网页搜索的特色功能p怎样成为搜索高手选择适当的查询词p新闻搜索的介绍与基本问题pMP3的搜索与下载pWord文档及其它格式信息的搜索2023/1/65发展史发展史p现代意义上的搜索引擎的祖先祖先,是1990年由蒙特利尔大学加学生AlanEmtage发明的
2、Archie。p最早最早现代意义上的搜索引擎出现于1994年7月。当时MichaelMauldin将JohnLeavitt的蜘蛛程序接入到其索引程序中,创建了大家现在熟知的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,DavidFilo和美籍华人杨致远(GerryYang)共同创办了超级目录索引Yahoo,并成功地使搜索引擎的概念深入人心。从此搜索引擎进入了高速发展时期。p1998年,9月7日:斯坦福大学的谢尔盖-布林和拉里-佩奇组建了Google公司,位于加州一个车库,有四名员工。布林和佩奇从家人、朋友和投资者募集了100万美元。当时布林和佩奇分别为24岁和25岁。202
3、3/1/66p雅虎是全球第一家提供因特网导航服务的网站,总部设在美国加州圣克拉克市。p雅虎是最老的“分类目录”搜索数据库,也是最重要的搜索服务网站之一,在全部互联网搜索应用中所占份额达36%左右。p所收录的网站全部被人工编辑按照类目分类。其数据库中的注册网站无论是在形式上还是内容上质量都非常高。2023/1/67pGoogle公司(谷歌),是一家美国的跨国科技企业,致力于互联网搜索、云计算、广告技术等领域,开发并提供大量基于互联网的产品与服务。p Google由当时在斯坦福大学攻读理工博士的拉里佩奇和谢尔盖布卢姆共同创建,因此两人也被称为“GoogleGuys”。p1998年9月4日,Goog
4、le以私营公司的形式创立;1999年下半年,Google网站启用。pGoogle的使命是整合全球信息,使人人皆可访问并从中受益。pGoogle是第一个被公认为全球最大的搜索引擎。2023/1/68完美的搜索引擎,不作恶(完美的搜索引擎,不作恶(Dont Dont Be EviBe Evi)拉里拉里佩奇佩奇谢尔盖谢尔盖布林布林2023/1/692023/1/6102023/1/611BAIDUBAIDU2023/1/612搜狗搜狗2023/1/613必应网典必应网典2023/1/614p2012年8月16日推出;2012年9月21日,360综合搜索正式启动独立域名so,花了七位数美元购买,sou
5、则为辅助域名。3B大战。p360综合搜索,属于元搜索引擎,是搜索引擎的一种,是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的(甚至是同时利用若干个)搜索引擎来实现检索操作。p360搜索+,属于全文搜索引擎,是奇虎360公司开发的基于机器学习技术的第三代搜索引擎,具备“自学习、自进化”能力和发现用户最需要的搜索结果。2023/1/6152023/1/616p有道搜索是网易公司的搜索服务。p 有道(youdao)的发起者是一群执着于搜索技术的年轻人,他们发现中文网络中的搜索还远未达到理想,所以希望通过他们现在和将来的努力,把设想中的服务一点点变成现实,分享给大家使用,让搜索引擎使用
6、者更快一秒找到想要的好东西。2023/1/6172023/1/618p邓亚萍做搜索的难度跟李彦宏拿女子乒乓球世界冠军差不多。p即刻搜索是由人民搜索网络股份公司于2011年6月20日推出的通用搜索引擎平台,之前称“人民搜索”。p旗下产品包括“曝光台”、“食品安全”等。2014年3月1日,盘古搜索和即刻搜索合并的中国搜索低调上线。2023/1/619p中国搜索由中国搜索信息科技股份有限公司创办运营,该公司是由中国七大新闻机构人民日报社、新华通讯社、中央电视台、光明日报社、经济日报社、中国日报社、中国新闻社联合设立的互联网企业,于2013年10月开始筹建,2014年3月21日正式上线,首批推出新闻、
7、报刊、网页、图片、视频、地图、网址导航七大类综合搜索服务,以及国情、社科、理论、法规、时政、地方、国际、军事、体育、财经、房产、汽车、家居、购物、食品、智慧城市等16个垂直频道和“中国新闻”等移动客户端产品和服务。2023/1/620p名字来源:“众里寻他千百度,蓦然回首,那人却在灯火阑珊处”辛弃疾 青玉案象征着百度对中文信息检索技术执著的追求,寄托着百度对自身技术的信心。p创立者:1999年底成立于美国硅谷,资深信息检索技术专家、超链分析专利的唯一持有人百度总裁李彦宏,及其好友在硅谷有多年商界成功经验的百度执行副总裁徐勇博士。2023/1/621青玉案青玉案 元夕 辛弃疾 东风夜放花千树,更
8、吹落、星如雨。宝马雕车香满路。凤箫声动,玉壶光转,一夜鱼龙舞。蛾儿雪柳黄金缕,笑语盈盈暗香去。众里寻他千百度百度。蓦然回首,那人却在,灯火阑珊处。p19871991北大信息管理p19911999留学美国闯荡硅谷p超链分析专利唯一持有人 p1999回国创业2023/1/622p昨夜西风凋碧树。独上高楼,望尽天涯路。晏殊的蝶恋花p衣带渐宽终不悔,为伊消得人憔悴。柳永的蝶恋花p众里寻他千百度,蓦然回首,那人却在,灯火阑珊处。p这三句本来都是言情话相思的佳句,却被王国维用以表现“悬思苦索顿悟”的治学三重境界,它巧妙地运用了三句中蕴含的哲理意趣,把诗句由爱情领域推绎到治学领域,赋予了它以深刻的内涵。20
9、23/1/623p1999年,李彦宏和徐勇回国创建了百度,一年后百度成为全球最大的中文搜寻引擎技术公司。2003年第二季,百度宣布全面盈利。2005年,百度的竞价排名客户达3万余家。2014年4月9日,CEO李彦宏成中国新首富身价122亿美元。2023/1/624p世界上规模最大的中文搜索引擎p拥有全球最大的中文网页库:p总量超过6亿页以上,并且还在以每天几十万页的速度快速增长,每天处理来自p一百多个国家的超过一亿人次的搜索请求。简单强大的搜索功能深受网民的信赖,p每天有超过七万用户将百度设为首页。p 目前全球最优秀的中文信息检索与传递技术供应商p中国所有提供搜索引擎的门户网站中,超过80%以
10、上都由百度提供搜索引擎技术p支持,现有客户包括新浪、腾讯、263、21cn、上海热线、广州视窗、新华网p凭借“简单,可依赖”的搜索体验使“百度一下”成为搜索的代名词2023/1/6p中国的民族产业中国的民族产业百度的多数支持者认为,百度搜寻引擎是中百度的多数支持者认为,百度搜寻引擎是中国人自己的搜寻引擎。国人自己的搜寻引擎。p服务稳定快速服务稳定快速 中国国家防火墙中国国家防火墙Google无法打开、连线较慢。无法打开、连线较慢。百度主动过滤了可能违反中国国家法律的政治百度主动过滤了可能违反中国国家法律的政治和新闻事件。和新闻事件。p中文搜寻功能更强中文搜寻功能更强百度比其她搜寻引擎对中文资料
11、的搜寻更准确、百度比其她搜寻引擎对中文资料的搜寻更准确、更完善。更完善。2023/1/626p百度快照p相关搜索p拼音提示p错别字提示p英汉互译词典p计算器和度量衡转换p专业文档搜索p股票,列车时刻表和飞机航班查询p高级搜索语法p高级搜索,地区搜索和个人设置2023/1/627p如果无法打开某个搜索结果,或者打开速度特别慢,该怎么办?“百度快照”能帮解决问题。每个被收录的网页,在百度上都存有一个纯文本的备份,称为“百度快照”。可以通过“快照”快速浏览页面内容。不过,百度只保留文本内容,所以,那些图片、音乐等非文本信息,快照页面还是直接从原网页调用。如果无法连接原网页,那么快照上的图片等非文本内
12、容,会无法显示。2023/1/6282023/1/629p搜索结果不佳,有时候是因为选择的查询词不是很妥当。可以通过参考别人是怎么搜的,来获得一些启发。百度的“相关搜索”,就是和的搜索很相似的一系列查询词。百度相关搜索排布在搜索结果页的下方,按搜索热门度排序。p下面是“小说”的相关搜索。点击这些词,可以直接获得他们的搜索结果。2023/1/630p如果只知道某个词的发音,却不知道怎么写,或者嫌某个词拼写输入太麻烦,该怎么办?百度拼音提示能帮解决问题。只要输入查询词的汉语拼音,百度就能把最符合要求的对应汉字提示出来。它事实上是一个无比强大的拼音输入法。拼音提示显示在搜索结果上方。如,输入“zhu
13、rongji”,提示如下:要找的是不是:朱鎔基2023/1/631p由于汉字输入法的局限性,我们在搜索时经常会输入一些错别字,导致搜索结果不佳。别担心,百度会给出错别字纠正提示。错别字提示显示在搜索结果上方。如,输入“唐醋排骨”,提示如下:要找的是不是:糖醋排骨;输入“融知学院”,得到“融智学院”。2023/1/632p可以通过 百度词典搜索 界面(http:/),直接使用英汉互译功能。2023/1/633p计算四则运算 35*82-(32+11)p公式计算 log(sin(5)2)-3+pi=0.1051612789959p单位换算 1海里?公里2023/1/634p很多有价值的资料,在互联
14、网上并非是普通的网页,而是以Word、PowerPoint、PDF等格式存在。p百度支持对Office文档(包括Word、Excel、Powerpoint)、AdobePDF文档、RTF文档进行的全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype:”文档类型限定。“Filetype:”后可以跟以下文件格式:DOC、XLS、PPT、PDF、RTF、ALL。其中,ALL表示搜索所有这些文件类型。p例如,查找张五常关于交易费用方面的经济学论文。“交易费用 张五常 filetype:doc”p例如:霍金 黑洞 filetype:pdfp也可以通过 百度文档搜索 界面(htt
15、p:/),直接使用专业文档搜索功能。2023/1/635p点击结果标题,直接下载该文档,也可以点点击结果标题,直接下载该文档,也可以点击标题后的击标题后的“HTML版版”快速查看该文档的网快速查看该文档的网页格式内容。页格式内容。2023/1/636p也可以通过 百度文档搜索界面(http:/),直接使用专业文档搜索功能。2023/1/637p在百度搜索框中输入股票代码、列车车次或者飞机航班号,就能直接获得相关信息。例如,输入深发展的股票代码“000001”,搜索结果上方,显示深发展的股票实时行情。也可以在百度常用搜索(http:/ intitle:林青霞注意,intitle:和后面的关键词之
16、间,不要有空格。2023/1/639p有时候,如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。例如,天空网下载软件不错,就可以这样查询:pmsnsite:p注意:“site:”后面跟的站点域名,不要带“http:/”;另外,site:和站点名之间,不要带空格。2023/1/6402023/1/641p把搜索范围限定在url链接中inurl网页url中的某些信息,常常有某种有价值的含义。于是,如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中
17、出现的关键词。例如,找关于PhotoShop的使用技巧,可以这样查询:photoshopinurl:jiqiao上面这个查询串中的“photoshop”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。注意,inurl:语法和后面所跟的关键词,不要有空格。p 例如:问情 inurl:mp3photoshopinurl:softp神雕侠侣 inurl:book(inrul也可以搜索文档,如 信息检索 inurl:doc)2023/1/642p如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果对这种情况不满意,可以尝试让百度不拆分查询词。给
18、查询词加上双引号,就可以达到这种效果。例如,搜索 上海科技大学,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海科技大学”,获得的结果就全是符合要求的了。p书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具手机,而加上书名号后,手机结果就都是关于电影方面的了。2023/1/6432023/1/644p如果发现搜索结果中,有某一类网页是不希望看见的,而且,这
19、些网页都包含特定关键词,用减号语法,就可以去除含有特定关键词的网页。例如,搜 神雕侠侣,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:神雕侠侣-电视剧 注意,前一个关键词,和减号之间须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。逻辑逻辑“与与”:空格即可空格即可 逻辑逻辑“或或”:|逻辑逻辑“非非”:用:用“-”表示,表示,“-”前必須有空格前必須有空格2023/1/645p使用百度就可以随时查询天气预报。再也不用四处打听天气情况了。在百度搜索框中输入要查询的城市名称加上天气这个词,就能获得该城市当天的天气
20、情况。例如,搜索“福州天气”,就可以在搜索结果上面看到福州今天的天气情况。百度支持全国多达400多个城市和近百个国外著名城市的天气查询。2023/1/646p赟 p不认识这个字。p百度一下:p关键词:文 武 贝p网上已经有人帮你了p复制“赟”粘贴到Word。选中,“格式”“中文版式”“拼音指南”,得出读音是yun2023/1/647p搜索技巧,最基本同时也是最有效的,就是选择合适的查询词。选择查询词是一种经验积累,在一定程度上也有章可循。2023/1/648p百度会严格按照提交的查询词去搜索,因此查询词表述准确是获得良好搜索结果的必要前提。p一类常见的表述不准确情况是,脑袋里想着一回事,搜索框
21、里输入的是另一回事。例如,要查找2009年国内十大新闻,查询词可以是“2009年国内十大新闻”;但如果把查询词换成“2009年国内十大事件”,搜索结果就没有能满足需求的了。p另一类典型的表述不准确,是查询词中包含错别字。不过好在,百度对于用户常见的错别字输入,有纠错提示。如,输入“唐醋排骨”,提示如下:要找的是不是:糖醋排骨。2023/1/649p目前的搜索引擎并不能很好的处理自然语言。因此,在提交搜索请求时,最好把自己的想法,提炼成简单的,而且与希望找到的信息内容主题关联的查询词。p 例如:某三年级小学生,想查一些关于时间的名人 名言,他的查询词是“小学三年级关于时间的名人名言”。p“时间
22、名言”可否?2023/1/650p日常工作和娱乐需要用到大量的软件,很多软件属于共享或者自由性质,可以在网上免费下载到。直接找下载页面 这是最直接的方式。软件名称,加上“下载”这个特征词,通常可以很快找到下载点。例:flashget下载在著名的软件下载站找软件 由于网站质量参差不齐,下载速度也快慢不一。如果我们积累了一些好用的下载站(如天空网,华军网,电脑之家等),就可以用site语法把搜索范围局限在这些网站内,以提高搜索效率。p例:网际快车 site:小提示:一旦搜索范围局限在专业下载站中,“下载”这个特征词就不必在查询词中出现了。2023/1/651p我们在工作和生活中,会遇到各种各样的疑
23、难问题,比如电脑中毒了,被开水烫伤了等等。很多问题其实都可以在网上找到解决办法。因为某类问题发生的几率是稳定的,而网络用户有好几千万,于是几千万人中遇到同样问题的人就会很多,其中一部分人会把问题贴在网络上求助,而另一部分人,可能就会把问题解决办法发布在网络上。有了搜索引擎,我们就可以把这些信息找出来。p找这类信息,核心问题是如何构建查询关键词。一个基本原则是,在构建关键词时,我们尽量不要用自然语言(所谓自然语言,就是我们平时说话的语言和口气),而要从自然语言中提炼关键词。这个提炼过程并不容易,但是我们可以用一种将心比心的方式思考:如果我知道问题的解决办法,我会怎样对此作出回答。也就是说,猜测信
24、息的表达方式,然后根据这种表达方式,取其中的特征关键词,从而达到搜索目的。p例;“我的浏览器主页被修改了,谁能帮帮我呀”2023/1/652(1)找申请书范文 申请书有多种多样,常见的比如入党申请书。申请书有一定的格式,因此只要找到相应的特征词,问题也就迎刃而解。比如入党申请书的最明显的特征词就是“我志愿加入中国共产党”。p 例:我志愿加入中国共产党 入党申请书(2)找工作总结范文 还是那个关键问题,工作总结会有什么样的特征词?将心比心的设想一下,就会发现,工作总结,总会写的象八股文一样,“一、二、三”,“第一,第二,第三”,“首先,其次,最后”。而且工作总结的标题中,通常会出现“工作总结”四
25、个字,于是,问题就很好解决了。p 例:第一 第二 第三 intitle:工作总结2023/1/653p百度新闻不含任何人工编辑成分,没有新闻偏见,真实地反映每时每刻的新闻热点,突出新闻的客观性和完整性。p 焦点新闻是通过自动计算一篇新闻被所有新闻网站转载和引用的次数,鉴于越受关注的新闻将会被越多的转载或引用,相当于由每个新闻网站和报刊杂志的编辑记者一起参与投票民主选举热点新闻。p 百度新闻每天发布 80000-100000条2023/1/654pA新闻导航:百度新闻共有8个分类“财经,互联网、房产,汽车,体育、娱乐、科技,生活”点击相关链接即可浏览各个分类中的新闻浏览界面,在各个新闻分类中,百
26、度为提供了该类别中最热门的 20条焦点新闻;还可以通过选择显示方式 焦点、最新、图片查看各个新闻分类中的焦点新闻、滚动新闻和新闻图片;百度新闻将给你带来更多的搜索体验!pB个性化新闻和偏好设置:可以根据自己的兴趣定制个性化的搜索服务,包括选择浏览地区新闻,历史新闻,新闻图片,滚动新闻pC百度新闻头条:百度为推荐的当日最热门的焦点新闻pD焦点新闻:百度推荐的当日最热门的 10条新闻 pE分类新闻头条:各分类新闻中最热门的新闻pF分类新闻:分类新闻为推荐的该分类中最热门的 10条焦点新闻2023/1/655p百度MP3搜索 是百度在天天更新的6亿中文网页中提取MP3链接从而建立的庞大 MP3歌曲链
27、接库。百度MP3搜索拥有自动验证下载速度的卓越功能,总是把下载速度最快的排在前列,使用户下载MP3歌曲的速度总是保持最快p MP3搜索步骤p百度歌词搜索,通过歌曲名或是歌词片断,都可以用来搜索你想要的歌词p输入关键词,点击“百度搜索”p在返回的页面中点击歌曲链接p右键单击选择“目标另存为”,保存到指定的目录文件夹处2023/1/656p百度搜索风云榜p百度指数p百度行业报告2023/1/657p百度搜索引擎利用用户查询关键词,按照搜索量排列整理而成p通过搜索量的大小,用户可以了解Internet用户的信息需求特点和社会热点问题p百度每天都会根据前一天的搜索量自动计算统计得到当日的搜索风云榜p其中重要栏目还包括今日搜索量、历史总搜索量和Top50上榜天数等内容2023/1/6582023/1/6592023/1/6602023/1/661p较搜索风云榜而言,百度指数对这些关键词信息进行了更多的汇总,可以提供诸如关键词详细数据和曲线图、关键词对比分析、查看关键词搜索排名前十的省份和城市分布和人群属性分布等数据分析功能。2023/1/6622023/1/6632023/1/6642023/1/6652023/1/666
限制150内