网络商务信息检索幻灯片.ppt
网络商务信息检索网络商务信息检索第1页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作2搜索引擎简介 GoogleGoogle是万维网上最大的搜索引擎,为用户提供了简单易是万维网上最大的搜索引擎,为用户提供了简单易用的免费服务,可以在瞬间查询到相关的搜索结果。用户可以用的免费服务,可以在瞬间查询到相关的搜索结果。用户可以使用多种语言查找信息、查看新闻标题、搜索访问超过使用多种语言查找信息、查看新闻标题、搜索访问超过8080亿个亿个网页和网页和1010亿幅图片的索引,并能够细读全球最大的亿幅图片的索引,并能够细读全球最大的UsenetUsenet消息消息存档,其中提供的帖子超过存档,其中提供的帖子超过1010亿个。亿个。20052005年底美国网民最常用的搜索引擎分别为年底美国网民最常用的搜索引擎分别为GoogleGoogle(96.5%96.5%)、)、Yahoo!Yahoo!(52.9%52.9%)和)和MSN SearchMSN Search(28.6%28.6%)。)。GoogleGoogle在中国网络搜在中国网络搜索市场上仅次于中国本土的百度居第二位,总的市场份额为索市场上仅次于中国本土的百度居第二位,总的市场份额为33%33%,其中北京为,其中北京为32.9%32.9%、上海为、上海为38.2%38.2%、广州为、广州为28.7%28.7%。第2页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作3主要搜索引擎第3页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作4Google简单查询 第4页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作5多个关键词的查询 在关键字之间加空格在关键字之间加空格在关键字之间加空格在关键字之间加空格第5页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作6避免搜索某个词语 第6页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作7强制搜索操作指导 第7页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作8设置高级搜索条件查询。第8页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作9在指定的网站内部进行查询。第9页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作10168000168000项!太多了项!太多了用用“-”隔开隔开第10页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作11本章作业实验二实验二实验二实验二 搜索引擎的使用搜索引擎的使用搜索引擎的使用搜索引擎的使用【实验目的实验目的】掌握百度、掌握百度、Google和天网搜索引擎的基本知和天网搜索引擎的基本知识和使用方法识和使用方法【使用环境】连接到因特网的实验室局域网环境连接到因特网的实验室局域网环境【实验内容】通过以下作业掌握搜索引擎的基本知识和使用方法 作业3 3 下载下载PPT模板 作业4 4 迅雷资源下载迅雷资源下载 作业作业5 5 寻找蒙娜丽莎第11页,共59页,编辑于2022年,星期二第五节 P2P搜索引擎使用方法第12页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作13什么是FTP资源 FTP 是在 Internet 网上使用最广泛的一种服务,使用FTP几乎可以传送任何类型的文件:如文本文件、二进制的可执行程序、科学论文、图像文件、压缩文件、声音文件等。因此有大量有价值的信息资源存储在Internet网上的FTP服务器上,获取这些资源也是信息检索的一项内容。第13页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作14FTP的工作原理 FTP(File Transfer Protocol)是 TCP/IP 协议的一种,它是在Internet网上使用最广泛的一种服务,它可被用来在两台位于Internet网上的计算机之间传输文件,它是一种实时的联机服务,使用时,用户应首先登录到对方的主机上,登录成功后,可以进行文件搜索和文件传送的操作,如列文件目录,改变当前目录,设置传送参数等。第14页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作15 像其它像其它InternetInternet服务一样服务一样,FTP采用 Client/Server 结构。用户在使用FTP服务时服务时,需要输入远程主机的用户名和口令才能被允许登录,在Internet 网上有许多数据服务中心提供一种称为匿名文件传送服务(Anonymous FTP),(Anonymous FTP),用户在登录时,以以Anonymous 作为作为用户名用户名,以自己的邮件地址做为以自己的邮件地址做为 Password 即可。一旦主即可。一旦主机提供了匿名的机提供了匿名的FTP服务,它有限制地允许客户访问远程主它有限制地允许客户访问远程主机。因此,网页搜索引擎一般不能访问到机。因此,网页搜索引擎一般不能访问到FTPFTP服务器上的信息资源。第15页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作16什么是P2P P2P在IT界最初的含义是Peer-to-peer(点对点)。现在P2P已经被更广泛的理解为Pointer-to-Pointer,PC-to-PC等等。简单来说,P2P就是指数据的传输不再通过服务器,而是网络用户之间直接传递数据。第16页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作17 举一个简单的例子,在QQ出现之前,人们上网聊天出现之前,人们上网聊天大多通过聊天室,信息的传递方式是:用户大多通过聊天室,信息的传递方式是:用户A聊天室服务聊天室服务器用户器用户B B。这些不是。这些不是P2PP2P的方式。在QQ时代,用户与服务器的交互仅用来完成登陆、维持在线状态等等,信息用户之间的信息传递不需要服务器参与,信息传递方式为:用户A A用户B。这就是。这就是典型的典型的P2P应用。应用。不过,当信息的接收方不在线时,信息会通过服务器不过,当信息的接收方不在线时,信息会通过服务器中转,这就又变成了上面提到的中转,这就又变成了上面提到的C/S模式模式第17页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作18第二类搜索引擎 从FTP和P2P的工作方式可以看出,它们都不是传统意义上的www网站,而是直接在两台计算机之间进行的远程通信和文件传输。所以象百度和谷歌这类搜索引擎对这两种信息资源的搜索往往不能奏效。这就需要有新的类型的搜索引擎诞生。其中有代表性的是迅雷和天网搜索引擎。第18页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作19一、迅雷在线搜索引擎第19页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作20第20页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作21迅雷在线搜索引擎 迅雷是一款免费下载工具,号称第三代快速下载工具,迅雷是一款免费下载工具,号称第三代快速下载工具,它使用的多资源超线程技术基于网格原理,能够将网络上存在它使用的多资源超线程技术基于网格原理,能够将网络上存在的服务器和计算机资源进行有效的整合,构成独特的迅雷网络,的服务器和计算机资源进行有效的整合,构成独特的迅雷网络,通过迅雷网络各种数据文件能够以最快的速度进行传递,据说通过迅雷网络各种数据文件能够以最快的速度进行传递,据说下载速度是网际快车的下载速度是网际快车的7-87-8倍,支持断点续传。倍,支持断点续传。迅雷还拥有一个强大的资源网络,实际上构成了一个迅雷还拥有一个强大的资源网络,实际上构成了一个独特的搜索引擎。任何人都可以将自己在因特网搜索到的独特的搜索引擎。任何人都可以将自己在因特网搜索到的资源再次在迅雷上发布,成为迅雷的资源再次在迅雷上发布,成为迅雷的“雷友雷友”,拥有自己,拥有自己的迅雷博客。这样,迅雷就可以通过对雷友博客的搜索,提供的迅雷博客。这样,迅雷就可以通过对雷友博客的搜索,提供更多的信息资源。更多的信息资源。第21页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作22作业4 迅雷在线搜索 本作业要求,对2006年最火爆的“明星学者”易中天先生的力作:CCTV百家讲坛易中天品三国在迅雷上进行搜索,将这套系列视频教程的总目录列出来(据说有30多集),按演讲顺序编号,并附上资源发布站点的屏幕抓图,以使读者能够方便地下载自己需要的讲座内容。第22页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作23作业4 迅雷在线搜索 如果有哪位同学愿意将易中天先生这些视频教程全部下载下来,配上目录和解说词,刻成光盘,就可以申请免考啦!同样的道理,如果谁制作出李阳疯狂英语视频教程光盘等等,也可以申请免考。第23页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作24二、天网搜索引擎第24页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作25第25页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作26天网中文搜索引擎北大天网 http:/ 它的下载方式类似BT下载方式,浏览方式类似FTP浏览方式,下载速度快,支持断点续传。特别是它的主要用户都是教育网上的用户,所以在校园网上下载速度极快。本作业要求从天网大学课程在线上下载一部指定的视频教程。这也将是本课程期末考试的必考题目之一,请用心掌握下述操作技巧。第34页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作35 用天网妹子搜索到的大学课程在线第35页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作36三、其他P2P搜索引擎BT电驴电骡第36页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作37第37页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作38特色搜索引擎1.图像搜索引擎2.FTP搜索引擎3.新闻组搜索引擎4.新闻搜索引擎5.MP3搜索引擎6.Flash搜索引擎7.其他特色搜索引擎第38页,共59页,编辑于2022年,星期二第六节门户网站和“看不见的”网站第39页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作40一、门户网站的概念 中国有三大网站被称为“门户网站”(新浪、搜狐和网易)。之所以他们被称为中国最大的三大门户网站,除了因为它们有搜索引擎以外,还因为它们安排了多种多样的信息服务,使得人们能自觉自愿地登陆这些网站开始“网上冲浪”,恰似因特网的大门一样。第40页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作41一、搜狐网站及其搜索引擎一、搜狐网站及其搜索引擎 Keyword searching第41页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作42第三代互动式搜索引擎搜狗搜狗是搜狐()推出的第三代互动式搜索引擎,在用户输入一个查询词后,尝试理解用户可能的查询意图,给出多个主题概念的搜索提示,通过人机交互过程,智能展开多组相关的主题概念,引导用户更快速准确定位自己所关注的内容。第42页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作43搜狗的地图功能第43页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作44第44页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作45第45页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作46搜狐博客搜狐博客第46页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作47二、新浪网站及其搜索引擎二、新浪网站及其搜索引擎第47页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作48新浪网的搜索引擎第48页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作49第49页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作50第50页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作51新浪博客新浪博客 第51页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作52三、网易网站及其搜索引擎三、网易网站及其搜索引擎Keyword searching第52页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作53网易博客网易博客 第53页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作54网易相册第54页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作55第55页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作56二、看不见的网站 与门户网站相反,有相当一批网络信息资源是搜索引擎看不到的,譬如天网妹子上的大学视频教程,以及私人服务器上的BT资源,百度、谷歌就对它们无能为力。因而就有了“看不见、搜不着的网站”的说法。但这些信息资源绝不是不重要的。第56页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作571.WWW信息资源2.FTP信息资源3.Blog信息资源4.Telenet信息资源5.BBS、新闻组信息资源6.P2P信息资源7.数据库和收费网站信息资源这三类资源可见度较高,这三类资源可见度较高,但每个搜索引擎最多能但每个搜索引擎最多能搜到其中的搜到其中的40%40%大多数情况下,搜索引擎对这几类资源无能为力,只能另想办法查找。看得见和看不见的网站第57页,共59页,编辑于2022年,星期二网络信息检索第2章张胜光制作58轻轻松松学检索轻轻松松学检索四次文献四次文献三大系列中文网站三大系列中文网站两类搜索引擎两类搜索引擎KeywordKeyword原则原则第58页,共59页,编辑于2022年,星期二课件制作:张胜光课件制作:张胜光课件制作:张胜光课件制作:张胜光第59页,共59页,编辑于2022年,星期二