Google搜索技巧-.pdf
《Google搜索技巧-.pdf》由会员分享,可在线阅读,更多相关《Google搜索技巧-.pdf(13页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Google 搜索技巧Google 搜索从入门到精通 v4.0 1、前言我是在 2000 年上半年知道 Google 的。在这之前,我搜索英文信息通常用AltaVista,而搜索中文信息则常用Sina。但自使用了 Google 之后,它便成为我的Favorite Search engine了。这也得感谢新浪网友曹溪,因为当初正是因为他的大力推介,才使我识得了Google。记得 1996 年夏季的时候,当我第一次接触Internet,便被扑面而来的魔力征服了。那种天涯咫尺的感觉,真是妙不可言。在经历了疯狂的WWW 冲浪和如痴如醉的BBS 沉迷之后,我意识到Internet 对我影响至深的还是在于
2、学习方式的变迁。如何来描述这种变迁呢?以前的学习,一般需要预先在肚子里存储下足够的知识,必要时,就从海量的信息中提取所需的部分。这种学习方式造就了很多“才高八斗,学富五车”的大才子。但是,到了信息领域大大超出“四书五经”的新时期,预先无目的的吞下海量信息的学习方式就有些不合时宜了。比方说,我们到了大型的图书城,往往有一种不知所措的感觉。旧有的学习方式需要变更以适应这个信息爆炸的年代。目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。我不妨把这称为“即学式”,相应的,旧有的称为“预学式”。不过,“即学式”的实施是有前提的。首先,要求学习者拥有一个包罗万象的信息
3、库,以供随时抽取各种目的信息;其次,是需要一个强劲的信息检索工具,以便高效率的从信息库中提取信息。很明显,Internet 可以充当那个海量的信息库,而搜索引擎,则正是寻找光明之火的绝好工具。“公欲善其事,必先利其器”。Internet 只有一个,而搜索引擎则有N 多个。有搜索高手说,所谓搜索,就是“在正确的地方使用正确的工具和正确的方法寻找正确的内容”。但是,对于普通人而言,掌握诸多搜索引擎的可能性似乎不大。用一两个相对强劲的具代表性的工具达到绝大多数搜索目的更为人们所迫切希望。不同的时期,涌现出不同的强者。就目前而言,我们非常幸运的有了:*Google*2、摘要本文简要的介绍了Google
4、 的历史和特点,Google 的基本搜索语法和高级搜索语法,Google 的特色功能,包括图片搜索、新闻组搜索和集成工具条等。尽管本文名为“Google搜索从入门到精通”,但事实上,本文只能算是对Google 的一个并不十分完全的介绍而已。:)3、如何使用本文阅读本文最好具备一些最基本的布尔代数基础,如“与”、“或”、“非”等。不过,即便你没有这方面的知识,也不必在意。对那些实例进行练习,你的疑惑就会迎刃而解。对于刚刚接触网络搜索的读者而言,也许你应该从头到尾的阅读本文;但对于那些有一定搜索基础的读者而言,只需要跳跃着寻找自己所需要的信息就可以了。此外,你也可以参考中文Google 大全:ht
5、tp:/www.G 使用手册以及问题解答中心。4、Google简介Google(www.G)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin 于 1998 年 9 月发明,Google Inc.于 1999 年创立。2000 年 7 月份,Google 替代 Inktomi 成为 Yahoo 公司的搜索引擎,同年9 月份,Google 成为中国网易公司的搜索引擎。98 年至今,Google 已经获得 30 多项业界大奖。到 Google 的新闻中心(http:/www.G 的成功得益于其强大的功能和独到的特点:Google 检索网页数量达24 亿,搜索引擎中排
6、名第一;Google 支持多达 132 种语言,包括简体中文和繁体中文;Google 网站只提供搜索引擎功能,没有花里胡哨的累赘;Google 速度极快,年初时据说有15000 多台服务器,200 多条 T3 级宽带;Google 的专利网页级别技术PageRank能够提供准确率极高的搜索结果;Google 智能化的“手气不错”功能,提供可能最符合要求的网站;Google 的“网页快照”功能,能从Google 服务器里直接取出缓存的网页。Google 具有独到的图片搜索功能;Google 具有强大的新闻组搜索功能;Google 具有二进制文件搜索功能(PDF,DOC,SWF 等);Google
7、 还有很多尚在开发阶段的令人吃惊的设想和功能。等等 5、搜索入门要用 Google 做搜索,当然首先要进Google 网站-www.G;不过, 和 使用的实际上也是Google 搜索引擎(因种种原因,网易和雅虎中国现已改用百度引擎 本站注),只是对搜索结果进行了编排,而且无法提供一些特色功能,如图片搜索等。因此,如果你要搜索网页的话,就直接使用 G吧。第一次进入 Google,它会根据你的操作系统,确定语言界面。需要提醒的是,Google 是通过 cookie 来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google 界面进行个人设定了。Google 的首页很清爽,LOGO
8、下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”,选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。搜索:“搜索引擎”结果:已搜索有关搜索引擎的中文(简体)网页。共约有 707,000 项查询结果,这是第1-10 项。搜索用时 0.08 秒。仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍。注意:文章中搜索语法外面的引号仅起引用作用,不能带入
9、搜索栏内。6、初阶搜索上例是最基本的搜索,即查询包含单个关键字的信息。但是,你可以发现,上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。6.1、搜索结果要求包含两个及两个以上关键字一般搜索引擎需要在多个关键字之间加上“”,而 Google 无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页搜索:“搜索引擎历史”结果:已搜索有关搜索引擎历史的中文(简体)网页。共
10、约有 78,600 项查询结果,这是第1-10 项。搜索用时 0.36 秒。用了两个关键字,查询结果已经从70 多万项减少到7 万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。6.2、搜索结果要求不包含某些特定信息Google 用减号“-”表示逻辑“非”操作。“A B”表示搜索包含A 但没有 B 的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”
11、、“中国历史”和“世界历史”的中文网页搜索:“搜索引擎历史-文化-中国历史-世界历史”结果:已搜索有关搜索引擎历史-文化-中国历史-世界历史的中文(简体)网页。共约有 36,800 项查询结果,这是第1-10 项。搜索用时 0.22 秒。我们看到,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:搜索引擎直通车 搜索引擎发展历史搜索引擎直通车,.搜索引擎专业介绍站点.www.se- -类似网页非常符合搜索要求。另外,第八项搜索结果:463 搜索王本站检索整个网站在此输入关键词.你的当前位置:首页 Internet搜索手册 搜索引擎的历史 -类似网页也符合搜索要求。但是,10 个结
12、果只有两个符合要求,未免太少了点。不过,在没有更好的策略之前,不妨先点开一个结果看看。点开se-的这个名为“搜索引擎发展历史”的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。此外,搜索引擎似乎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深入人心的是“Yahoo”。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。注意:这里的“”和“-”号,是英文字符,而不是中文字符的“”和“”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 -文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“
13、-”被忽略。6.3、搜索结果至少包含多个关键字中的任意一个Google 用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有 B,要么同时有A 和 B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。搜索:“搜索引擎历史 archie OR 蜘蛛 OR lycos OR yahoo-文化”结果:
14、已搜索有关搜索引擎历史 archie OR 蜘蛛 OR lycos OR yahoo-文化的中文(简体)网页。共约有 8,400 项查询结果,这是第1-10 项。搜索用时0.16 秒。我们看到,搜索结果缩小到8 千多项,前20 项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。注意:“与”操作必须用大写的“OR”,而不是小写的“or”。在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google 分别用“”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方
15、法:目标信息一定含有的关键字(用“”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。7、杂项语法7.1、通配符问题很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google 对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用 引起来。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。7.2、关键字的字母大小写Google 对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。7.3、搜索整个短语或者句子Google 的关键字可以是单词
16、(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。示例:搜索关于第一次世界大战的英文信息。搜索:“world war I”结果:已向英特网搜索world war i.共约有 937,000 项查询结果,这是第1-10 项。搜索用时 0.06 秒。7.4、搜索引擎忽略的字符以及强制搜索Google 对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。示例:搜索关于www 起源的一些历史资料。搜索:“www的历史 internet”结果:以下的字词因为使用过于频繁,没有被
17、列入搜索范围:www 的.已搜索有关www 的历史 internet的中文(简体)网页。共约有 75,100 项查询结果,这是第1-10 项。搜索用时 0.22 秒。我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。如果要对忽略的关
18、键字进行强制搜索,则需要在该关键字前加上明文的“+”号。搜索:“+www+的历史 internet”结果:已搜索有关+www+的历史 internet的中文(简体)网页。共约有 25,000 项查询结果,这是第1-10项。搜索用时 0.05 秒。另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I”中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。搜索:“www的历史 internet”结果:已搜索有关www 的历史 internet的中文(简体)网页。共约有 7 项查询结果,这是第1-6 项。搜索用时 0.26 秒。我们看
19、到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。8、进阶搜索上面已经探讨了Google 的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。8.1、对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。示例:搜
20、索中文教育科研网站()上关于搜索引擎技巧的页面。搜索:“搜索引擎技巧 site:”结果:已搜索有关搜索引擎技巧 site:的中文(简体)网页。共约有 608 项查询结果,这是第1-10项。搜索用时 0.05 秒。示例:上著名IT 门户网站 ZDNET 和 CNET 搜索一下关于搜索引擎技巧方面的资讯。搜索:“search engine tips site: OR site:”结果:已在 内搜索有关 search engine tips OR site:的网页。共约有 1,040 项查询结果,这是第1-10 项。搜索用时 0.09 秒。注意,在这里Google 有个小 BUG。“已在 内搜索”,
21、其实应该表述成“已在 和 内搜索”。示例:搜索新浪科技频道中关于搜索引擎技巧的信息。搜索:“搜索引擎技巧 site:”结果:已在 搜索有关搜索引擎技巧的中文(简体)网页。共约有 163 项查询结果,这是第 1-10 项。搜索用时 0.07 秒。注意:site 后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http:/”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。8.2、在某一类文件中查找信息“filetype:”是 Google 开发的非常强大实用的一个搜索语法。也就
22、是说,Google 不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google 已经能检索微软的Office 文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe 的.pdf 文档,ShockWave的.swf 文档(Flash 动画)等。其中最实用的文档搜索是PDF 搜索。PDF 是 ADOBE 公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google 检索的 PDF 文档大约有2500 万左右,大约占所有索引的二进制文档数量的80。PDF 文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中
23、全面。示例:搜索几个资产负债表的Office 文档。搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt的中文(简体)网页。共约有 481 项查询结果,这是第1-10 项。搜索用时 0.04 秒。注意,下载的Office 文件可能含有宏病毒,谨慎操作。示例:搜索一些关于搜索引擎知识和技巧方面的PDF 文档搜索:“search engine tips OR tutorial filetype:pdf”结果:已向英特网搜索 s
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Google 搜索 技巧
限制150内