《因特网上的信息检索ppt课件.ppt》由会员分享,可在线阅读,更多相关《因特网上的信息检索ppt课件.ppt(23页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。阅读教材回答如下问题:网络信息检索的方法搜索引擎的分类及特点搜索引擎的工作过程有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。因特网信息检索方法在因特网中信息检索的方法有三种:1、基于超文本/超媒体的信息浏览 从一个超文本
2、/超媒体文档入手,沿着嵌入其中的、用户感兴趣的超链接区搜索信息2、基于目录服务的信息查询 根据信息的主题降网络上的信息资源进行分类,并以目录的形式组织和表现3、基于搜索引擎的信息检索 搜索引擎是一种信息检索工具,它从因特网上接受用户的查询请求,在数据库中进行检索,然后返回查询结果有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。基于超文本基于超文本/ /超媒体的信息浏览超媒体的信息浏览有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放
3、又相互信任的合作环境。基于目录服务的信息查询基于目录服务的信息查询有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。基于搜索引擎的信息检索基于搜索引擎的信息检索有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的产生 最早的搜索引擎出现于1994年4月。斯坦福大学的两名博士生,美籍华人杨致远和美国人David Filo共同创办了超级目录索引雅虎(Yahoo),并成功地使搜索引擎的概念深入人心。有利于学习和
4、创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。1994年起搜索引擎发展举例年起搜索引擎发展举例产生时间产生时间搜索工具搜索工具开发组或公司开发组或公司网站特点网站特点1994.4Yahoo斯坦福大学斯坦福大学早期早期Yahoo数据是手工输入数据是手工输入1995.12AltavistaDEC公司公司第一个支持自然语言关键词和第一个支持自然语言关键词和高级检索的引擎高级检索的引擎1997.10北大天网北大天网北大计算机研究室北大计算机研究室收录网页约收录网页约6000万万,有强大的有强大的FTP搜索功能搜索功能1
5、998.9Google斯坦福大学斯坦福大学提供网页评级动态摘要、网页提供网页评级动态摘要、网页快照,每天更新、多文档格式快照,每天更新、多文档格式支持支持2001.8Baidu百度公司百度公司快照、预览、相关词搜索、快照、预览、相关词搜索、mp3、 flash搜索功能搜索功能有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的分类 按照信息收集方法和服务提供方式,搜索引擎可分为: 目录式搜索引擎 全文搜索引擎 元搜索引擎有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以
6、顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的分类搜索引擎的分类类型定义举例目录搜索网络信息资源,通过人工整理分类,按照主题分类,并以层次树状形式进行组织的一类搜索引擎.代表:雅虎 新浪 搜狐 优点:实实在在找到用户所关心内容分类实实在在找到用户所关心内容分类,网站导航质量高网站导航质量高缺点:分类不够细分类不够细,需要人工介入需要人工介入,目录的维护量大目录的维护量大, 更新可更新可能不够及时能不够及时.有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的分类搜索
7、引擎的分类类型定义举例全文搜索使用关键词到预先建好的或租用其它索引数据库查询信息的一类搜索引擎. 代表:百度 谷歌 优点:信息量大、更新较及时、不需人工干预。信息量大、更新较及时、不需人工干预。缺点:返回信息过多,有很多无关信息,返回信息过多,有很多无关信息,广告也特别多。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。全文搜索引擎全文搜索引擎输入关键字输入关键字查询信息排序查询信息排序索引索引 数据库数据库用户查询用户查询查询结果查询结果检索检索搜索搜索有利于学习和创新的组织管理机制,创造充满活力的
8、创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的分类搜索引擎的分类类型定义举例元搜索引擎元搜索引擎就是通过一个统一的用户界面向多个搜索引擎同时递交用户查询,返回结果去重合并,综合结果返回给用户.(没有自己的数据库) 优点: 结果精确、全面,汇聚各大搜索引擎的结果。结果精确、全面,汇聚各大搜索引擎的结果。 缺点:检索速度较慢、牺牲个别搜索引擎性能,并非检索速度较慢、牺牲个别搜索引擎性能,并非1+1=2 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环
9、境。元搜索引擎示意图元搜索引擎示意图有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的工作原理目录式搜索引擎是以人工或半自动方式收集信息,有编辑人员查看信息后,人工形成信息摘要,并将信息至于事先确定的分类框架中。用户通过浏览分类目录来查看自己所需要的信息,在链接信息资源所在的位置。有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的工作原理1、目录式搜索引擎是以人工或者半自动方式收集信息,由编辑
10、人员查看信息后,人工形式信息摘要,并将信息置于事先确定的分类框架中有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。搜索引擎的工作原理2、全文搜索引擎并不能真正理解用户的查询内容,只能把匹配查询关键词与索引数据库中的内容进行匹配。 全文搜索引擎的工作过程是: 从网上抓取网页建立索引数据库在索引数据库中搜索排序响应用户查询有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。1、如何从互联网抓取网页使用蜘蛛(Spide
11、r)系统程序,自动访问因特网,并沿着网页中所有的URL爬到其他网页,重复这一过程,把爬过的网页收集回来搜索引擎的蜘蛛(Spider)系统程序会定期重新访问所有网页,以实现该网站信息的更新蜘蛛模拟器有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。2、建立索引数据库由分析索引系统程序对蜘蛛收集到的网页进行分析,提取相关网页信息(包括网页的URL、编码类型、页面内容所包含的关键词、关键词位置、生成时间、大小等),进行大量复杂的计算(算出网页中每一个关算出网页中每一个关键词的相关度,即出现的次数键词的相关度,
12、即出现的次数),然后放到响应的索引数据库中有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。3、在索引数据库中搜索排序当用户输入关键词搜索后,由搜索程序从网页索引数据库中找到符合该关键词的所有网页,按照该关键词在各网页中的相关度即次数,进行排序,并返回给用户,相关度越高,排名越靠前有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。4、查询和响应有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导
13、向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。选择最好的搜索工具每一个搜索都是不同的,如果你为每一个搜索都选择最好的搜索工具,那么每次你都会得到最好的搜索结果。最常见的选择是使用全文搜索引擎还是网站分类目录。 一般的规则是,如果你在找什么特殊的内容或文件,那么使用全文搜索引擎如google和baidu,如果你想从总体上或比较全面的了解一个主题,那么使用网站分类目录如yahoo和sohu。对于特殊类型的信息考虑使用特殊的搜索工具,比如你要找人或找地点,那么使用专业的寻人引擎或地图和位置搜索网站。事实上几乎每种主题都有特殊的搜索工具。 有利于学习和创新的组织管理机制,创造充满活力的创新激励机制,以市场为导向,以顾客价值追求为中心的企业文化氛围,依赖既开放又相互信任的合作环境。使用自然语言搜索使用自然语言搜索 多数搜索引擎对自然语言的处理很好。事实上,搜索引擎能够从语句结构得到很有用的信息,不会象仅得到几个关键词那样容易迷失。与其输入几个不合语法的关键词,还不如试一下一句自然的提问。与其搜索“昆明公交车路线”,不如试一下 “我在昆明如何乘坐公交车?
限制150内