欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年搜索引擎从入门到精通搜索研究教程.docx

    • 资源ID:61830947       资源大小:14.42KB        全文页数:10页
    • 资源格式: DOCX        下载积分:9.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年搜索引擎从入门到精通搜索研究教程.docx

    2022年搜索引擎从入门到精通搜索研究教程搜寻引擎从入门到精通之一_基础篇美美(15岁)爱上网,通常她就是泡闲聊室、看新闻、玩网络嬉戏之类的,时间一长,觉得有些无聊了。这天美美问:“妮妮表姐,你成天上网做什么呢?”妮妮说:“上网查资料呀。查资料?”“怎么查?上哪查?”美美一连串的疑问。妮妮说:“查资料当然是要用搜寻引擎啊。我平常写论文用的资料、做主页用的图片、电脑学问、甚至电子版的小说、最新的CD试听都是通过搜寻引擎找到的。还有,我的主页这半年访问量剧增,也要归功于搜寻引擎啊。”搜寻引擎?美美觉得挺惊奇的:“这搜寻引擎有这么大威力?嗯,我也要学习用搜寻引擎。”“可以啊,不过,最近我挺忙的,要不,先让小张(妮妮的男挚友)教你一些基本学问吧。”“美美,学习运用搜寻引擎先要了解一些基本学问,可是有点枯燥哦,要有心理打算哟。”小张在旁边嘿嘿的笑着。美美嘴里哼了哼:“谁怕呀,来吧。”小张清了清嗓子,起先了讲解:“十几年前,WWW(World Wide Web,万维网)还没有诞生的时候,互联网上只有冰冷的文字,没有图像和声音,而且网站数量也不多,感爱好的网站就那么几个,可以在很短的时间内就驾驭其中的全部信息,搜寻引擎完全没有出现的必要。1993年,互联网上出现了最早的Web阅读器Mosaic,次年Netscape推出了Navigator。阅读器的发展促使Web得到快速推广,站点数目以惊人的速度增加,我们再也不能用传统记忆方式来应付与日俱增的站点。于是,搜寻引擎就诞生了。第一个搜寻引擎的诞生地在美国,它的名字叫Archie,是由McGill高校的一个小组开发的。”“早期的搜寻引擎是把互联网中资源服务器的地址收集起来,由其供应资源的类型不同而分成不同的书目,再一层层地进行分类。人们要找自己想要的信息可按它们的分类一层层进入,就能最终到达目的地,找到自己想要的信息。这种方式,只适用于互联网信息并不多的时候。”“随着互联网的信息按几何式增长,搜寻引擎起先快速发展。1994年春天,世界上出现了真正意义上的搜寻引擎Lycos。随着Yahoo!的出现,搜寻引擎的发展也进入了黄金时代。搜寻引擎家族不断发展壮大,渐渐分布到信息世界的各个角落,它们的种类、技术也在不断的发生改变。”美美听了半天,嘴越张越大:“哇,没想到搜寻引擎也有这样的历史呀。”“那当然了,别打岔,下面要讲搜寻引擎的分类及原理了,细致听着。”“尽管目前存在数量众多的搜寻引擎,但根据它们信息搜集方法和服务供应方式的不同,可以大致划分为三大类型。”“我们先来讲讲基于蜘蛛程序的的机器人搜寻引擎,这种搜寻引擎由一个称为蜘蛛(Spider)的机器人程序自动访问Web站点,提取站点上的网页,并依据网页中的链接进一步提取其它网页,或转移到其它站点上。由索引器为搜集到的信息建立索引,由检索器依据用户的查询输入检索索引库,并将查询结果返回给用户。”美美又忍不住了:“太难了,我听不懂。”“听起来感觉很困难吧?简洁讲,就是由程序自动抓去网上的信息,搜寻引擎这个词的原义就是指这种狭义的搜寻引擎。”“该类搜寻引擎的优点是信息量大、更新刚好、毋需人工干预,缺点是返回信息过多,有许多无关信息,用户必需从结果中进行筛选。这类搜寻引擎的代表是:AltaVista、Excite、Inktomi、FAST、Lycos、Google;国内代表为:百度、OpenFind等。”“哦,我这下我明白了,而且我还知道Google呢,好出名的。呵呵!你接着讲吧。”美美最终弄懂了。“接着给你讲引擎书目式搜寻引擎,它是以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面对网站,供应书目阅读服务和干脆检索服务。该类搜寻引擎因为加入了人的智能,所以信息精确、导航质量高,缺点是须要人工介入、维护量大、信息量少、信息更新不刚好。这类搜寻引擎的国外代表是:Yahoo、LookSmart、Open Directory等;国内代表有新浪网、搜狐等的网站书目。”“美美,美美,哎,你在干嘛哟,睡着了?”“哪里呀,我只是在想它和前面那种搜寻引擎有什么不同嘛!”“哦,我刚要讲呢。书目的数据库是依靠专职编辑或志愿人员建立起来的,这些编辑人员在访问了某个Web站点后撰写一段对该站点的描述,并依据站点的内容和性质将其归为一个预先分好的类别,把站点的URL和描述放在这个类别中,当用户查询某个关键词时,搜寻软件只在这些描述中进行搜寻。”“书目的用户界面基本上都是分级结构,首页供应了最基本的几个大类的入口,用户可以一级一级地向下访问,直至找到自己感爱好的类别,另外,用户也可以利用书目供应的搜寻功能干脆查找一个关键词,不过,由于书目只在保存的对站点的描述中进行搜寻,因此站点本身的动态改变不会反映到搜寻结果中来,这也是书目与基于Robot的搜寻引擎之间的一大区分。”“最终要讲的是Meta元搜寻引擎,它的特点是本身并没有存放网页信息的数据库,当用户查询一个关键词时,它把用户的查询恳求转换成其它搜寻引擎能够接受的吩咐格式,并访问数个搜寻引擎来查询这个关键词,并把这些搜寻引擎返回的结果经过处理后再返回给用户。对于返回的结果系统会进行重复解除、重新排序等处理。服务方式为面对网页的全文检索。这类搜寻引擎的优点是返回结果的信息量更大、更全,缺点是用户须要做更多的筛选。这类搜寻引擎的代表是WebCrawler、InfoMarket等,国内的一网打尽、飓风搜寻通等供应类似的功能。”“我真不知道搜寻引擎还有这么多名堂呀,真是长了见识。”美美感叹道。“呵,这还只是起先呢,今日我们就到这儿了,你也该休息了,下次我们再接着吧。”美美(15岁)爱上网,通常她就是泡闲聊室、看新闻、玩网络嬉戏之类的,时间一长,觉得有些无聊了。这天美美问:“妮妮表姐,你成天上网做什么呢?”妮妮说:“上网查资料呀。查资料?”“怎么查?上哪查?”美美一连串的疑问。妮妮说:“查资料当然是要用搜寻引擎啊。我平常写论文用的资料、做主页用的图片、电脑学问、甚至电子版的小说、最新的CD试听都是通过搜寻引擎找到的。还有,我的主页这半年访问量剧增,也要归功于搜寻引擎啊。”搜寻引擎?美美觉得挺惊奇的:“这搜寻引擎有这么大威力?嗯,我也要学习用搜寻引擎。”“可以啊,不过,最近我挺忙的,要不,先让小张(妮妮的男挚友)教你一些基本学问吧。”“美美,学习运用搜寻引擎先要了解一些基本学问,可是有点枯燥哦,要有心理打算哟。”小张在旁边嘿嘿的笑着。美美嘴里哼了哼:“谁怕呀,来吧。”小张清了清嗓子,起先了讲解:“十几年前,WWW(World Wide Web,万维网)还没有诞生的时候,互联网上只有冰冷的文字,没有图像和声音,而且网站数量也不多,感爱好的网站就那么几个,可以在很短的时间内就驾驭其中的全部信息,搜寻引擎完全没有出现的必要。1993年,互联网上出现了最早的Web阅读器Mosaic,次年Netscape推出了Navigator。阅读器的发展促使Web得到快速推广,站点数目以惊人的速度增加,我们再也不能用传统记忆方式来应付与日俱增的站点。于是,搜寻引擎就诞生了。第一个搜寻引擎的诞生地在美国,它的名字叫Archie,是由McGill高校的一个小组开发的。”“早期的搜寻引擎是把互联网中资源服务器的地址收集起来,由其供应资源的类型不同而分成不同的书目,再一层层地进行分类。人们要找自己想要的信息可按它们的分类一层层进入,就能最终到达目的地,找到自己想要的信息。这种方式,只适用于互联网信息并不多的时候。”“随着互联网的信息按几何式增长,搜寻引擎起先快速发展。1994年春天,世界上出现了真正意义上的搜寻引擎Lycos。随着Yahoo!的出现,搜寻引擎的发展也进入了黄金时代。搜寻引擎家族不断发展壮大,渐渐分布到信息世界的各个角落,它们的种类、技术也在不断的发生改变。”美美听了半天,嘴越张越大:“哇,没想到搜寻引擎也有这样的历史呀。”“那当然了,别打岔,下面要讲搜寻引擎的分类及原理了,细致听着。”“尽管目前存在数量众多的搜寻引擎,但根据它们信息搜集方法和服务供应方式的不同,可以大致划分为三大类型。”“我们先来讲讲基于蜘蛛程序的的机器人搜寻引擎,这种搜寻引擎由一个称为蜘蛛(Spider)的机器人程序自动访问Web站点,提取站点上的网页,并依据网页中的链接进一步提取其它网页,或转移到其它站点上。由索引器为搜集到的信息建立索引,由检索器依据用户的查询输入检索索引库,并将查询结果返回给用户。”美美又忍不住了:“太难了,我听不懂。”“听起来感觉很困难吧?简洁讲,就是由程序自动抓去网上的信息,搜寻引擎这个词的原义就是指这种狭义的搜寻引擎。”“该类搜寻引擎的优点是信息量大、更新刚好、毋需人工干预,缺点是返回信息过多,有许多无关信息,用户必需从结果中进行筛选。这类搜寻引擎的代表是:AltaVista、Excite、Inktomi、FAST、Lycos、Google;国内代表为:百度、OpenFind等。”“哦,我这下我明白了,而且我还知道Google呢,好出名的。呵呵!你接着讲吧。”美美最终弄懂了。“接着给你讲引擎书目式搜寻引擎,它是以人工方式或半自动方式搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面对网站,供应书目阅读服务和干脆检索服务。该类搜寻引擎因为加入了人的智能,所以信息精确、导航质量高,缺点是须要人工介入、维护量大、信息量少、信息更新不刚好。这类搜寻引擎的国外代表是:Yahoo、LookSmart、Open Directory等;国内代表有新浪网、搜狐等的网站书目。”<

    注意事项

    本文(2022年搜索引擎从入门到精通搜索研究教程.docx)为本站会员(w****)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开