因特网信息检索与应用.ppt





《因特网信息检索与应用.ppt》由会员分享,可在线阅读,更多相关《因特网信息检索与应用.ppt(29页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Web信息检索搜索引擎的应用现状从用户使用的角度,国外的调查发现:网上搜索信息的人很少考虑如何找到他们所需要的信息,因此搜索信息时象动物猎食般盲目;只有18%的用户表示总能在网上搜索到需要的信息。68%的用户说他们对搜索引擎很失望;平均每个搜搜者在12分钟的徒劳搜索后就感到恼火和受挫。46%的人只会用同一个关键词搜啊搜啊,而且是在同一个搜索引擎。国外的应用状况那些每周平均花5个小时以上时间上网的人,将其上网时间的71%都花在了搜索引擎上;人机界面高手nielsen(google的设计者)研究表明:略超过1/2的互联网用户属于search-dominant,约1/5用户属于 link-domin
2、ant,其它用户的搜索倾向属于混合行为型。search-dominant在到达一个网站后直接就奔向搜索按钮,他们对浏览网站不感兴趣,他们有明确的目的,倾向于以最快速度找到信息。相反,link-dominant喜欢点击浏览一个网站,即使他们想找特殊信息时也是这样,只有在他们用点击超链的方法已经实在找不到了,才会想起搜索按钮。国内的应用状况国内的调查发现:cnnic2004年1月的调查:61.6%的中国互联网用户经常使用搜索引擎(仅次于E-mail)。83.4%的中国互联网用户得知新网站的主要途径是搜索引擎。赛迪咨询的搜索引擎调查:截止2000年8月,92.9%的网民使用过搜索引擎,同时有六成左右
3、的网民将搜索引擎列为经常使用的网络服务。新浪搜索的统计表明:第1条搜索结果获得的点击量,是第2页第1条的150倍。信息检索工具及其分类1.目录型检索工具由信息管理专业人员广泛搜集网络资源,并进行加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录。典型:yahoo!搜狐2.搜索引擎使用自动检索软件来发现、收集并标引网页,建立数据库,以web页形式提供给用户一个检索界面,供用户输入关键词、词组或短语等检索项,代替用户在数据库中查找出与其提问匹配的记录并返回结果,且按其相关度顺讯输出。典型:Google,Baidu搜索引擎的基本功能1.一般检索功能Boolean(布尔逻辑检索)
4、+、-Phrase(词组检索)“”Truncation(截词检索)*?Fields(字段检索)2.特殊检索功能自然语言检索多语种检索区分大小写的检索值得推荐的几个中文搜索引擎全文搜索衡量搜索引擎的指标:查全率查准率速度Google:http:/新浪使用了它的全文搜索引擎服务百度:21CN使用了它的全文搜索引擎服务中国搜索(原来的慧聪搜索)网易、搜狐、263使用了它的搜索引擎。北大天网:http:/大量教育网内的资源,提供FTP搜索几大门户网站也有自己的搜索引擎,有时也能发挥作用。推荐的搜索引擎网站分类目录搜索新浪:其网站搜索最好搜狐:网站的分类目录整理最好,最适合于浏览网易:开放式目录,有许多
5、网上高手加盟中文Yahoo另类:网络实名新浪图片搜索:新视科技:,提供多媒体搜索找地图城市通:图行天下:使用Google进行搜索Google简介Google是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc.于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。1998年至今,Google已经获得30多项业界大奖。Google支持多达132种语言,包括简体中文和繁体中文;Google网站只提供搜索引擎功能,没有花里胡哨的累赘;G
6、oogle速度极快,据说有15000多台服务器,200多条T3级宽带;Google的专利网页级别技术PageRank能够提供高命中率的搜索结果;Google智能化的“手气不错”功能,提供可能最符合要求的网站;Google的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。福布斯富豪榜所有排名1 William Gates(比尔-盖茨)2 Warren Buffett(沃伦-巴菲特)3 Sheldon Adelson(谢尔登-阿德尔森)4 Lawrence Ellison(劳伦斯-埃里森)5 Sergey Brin(谢尔盖-布林)6 Larry Page(拉里-佩奇)7 Kirk K
7、erkorian(柯克-科克莱恩)8 Michael Dell(迈克尔-戴尔)9 Charles Koch(查尔斯-科赫)10 David Koch(戴维-科赫)文本搜索文本搜索目前Google已经收集索引了40多亿张网页使用单个关键词进行搜索理解什么是“关键词”,跟普通意义上的关键词不同。想象目标网页上应该有的若干个词。网页的排名问题使用两个及两个以上关键词进行搜索直接输入多个关键词,关键词之间用空格,这样就表示“AND”关系;用减号“-”表示“非”,用于表示要求搜索结果不包含某些特定信息;Google的帮助网页上说,不支持OR关系,实际上是支持得不好;使用一句话进行搜索加上双引号。这在查找
8、名言警句或专有名词时显得格外有用。Google对网络上常见得英文单词及一些标点符号作忽略处理 图象搜索目前Google可搜索8.8亿张图片,自称为“因特网上最好用的图像搜索工具”或点击Google主页上的“图象搜索”链接。目前的图象搜索主要是基于文件名的搜索,不是基于图象内容的。用法:关键词的输入方法同文字搜索,不过搜索图象一般不会用太长、太复杂的关键词。图象搜索中,使用英文作关键词使用英文作关键词可以搜到许多准确的结果,使用中文,效果较差,但有时Google会自动转换为英文或中文的拼音去搜索(有时欠稳定,其他内容的搜索也有此现象)。可以指定图片文件的类型:JPG或GIF 如 panda fi
9、letype:jpg搜索特殊格式的文件目前可搜索的文件格式:DOC、PPT、XLS、RTF、PS、TXT、Lotus文件;PDF格式最精彩的,可搜索Flash文件:SWF文件方法:关键词 filetype:*搜索包含关键词的文档(但又不尽然)。搜索到后,可点击打开,也可右键快捷菜单用“另存为”。对于Office文档,还可以用HTML方式打开,以避免病毒的袭击。其他特殊的搜索搜索的关键词包含在URL链接中Inurl:mp3 yesterday once more可用于搜索MIDI、MP3等文件搜索的关键词包含在网页标题中Intitle:Foshan University搜索指定的网站范围在图象搜
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 因特网 信息 检索 应用

限制150内