欢迎来到淘文阁 - 分享文档赚钱的网站! | 帮助中心 好文档才是您的得力助手!
淘文阁 - 分享文档赚钱的网站
全部分类
  • 研究报告>
  • 管理文献>
  • 标准材料>
  • 技术资料>
  • 教育专区>
  • 应用文书>
  • 生活休闲>
  • 考试试题>
  • pptx模板>
  • 工商注册>
  • 期刊短文>
  • 图片设计>
  • ImageVerifierCode 换一换

    2022年搜索引擎是如何工作的搜索研究教程.docx

    • 资源ID:62209650       资源大小:12.99KB        全文页数:5页
    • 资源格式: DOCX        下载积分:9.9金币
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录   QQ登录  
    二维码
    微信扫一扫登录
    下载资源需要9.9金币
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2022年搜索引擎是如何工作的搜索研究教程.docx

    2022年搜索引擎是如何工作的搜索研究教程本文旨在帮你揭示一些你对搜寻引擎还不是很确定的东西。终归,假如你想通过得到搜寻引擎的收录而受益,你还是了解一下搜寻引擎如何工作为好。合三为一基于爬行程序的搜寻引擎是由三部分组成的:爬行程序、索引和软件。每一部分都具有自己的功能并且三个部分一起产生了我们在搜寻引擎结果页面(SERPs)上所看到的内容。饥饿的爬行程序另一个广为人知的名字是网络爬行程序或者机器人,搜寻引擎爬行程序就是能阅读网页和跟踪站点内到其它网页任何链接的一个自动程序。我们常常将一个称为被“爬行”或“索引”。在网络上有三种特别饥饿、特别活跃的爬行程序。它们的名字为Googlebot(Google)、Slurp( Yahoo!)和MSNBot(MSN 搜寻)。爬行程序会从从前添加到它们索引(数据库)中的系列网页URLs起先网络之旅。在它们访问这些网页时,它们爬行编码和副本,它将在网络上找到的新网页(链接)也添加到它的索引之中。对于这个过程,我们可以将爬行程序称为是正在建立索引,稍后将进一步加以探讨。爬行程序会依据一个固定的周期回访其书目中的站点,找寻任何的更新。至于爬行程序回访的频率,这要由搜寻引擎确定。网站拥有者通过采纳一个名为robot.txt的文件的确能限制爬行程序访问这个站点的频率。搜寻引擎在进一步爬行一个网站之前首先查看这个文件。正在成长的索引索引就像是一个包含爬行程序所找到网站每一个网页和文件副本的巨大书目或者具体书目。假如某一个网页发生了改变,则会运用新的信息来更新这个书目。为了能使一个数量的概念给你描述这些索引的大小,Google最新公布的数字是80亿个网页。有时候须要肯定的时间才能让爬行程序找到新的网页和更改并添加到自己的索引中。由此,一个网页可能已被“爬行”但尚未“索引”。知道一个网页被索引后添加到索引中此时在搜寻引擎中是搜寻不到这些被爬行过的网页的。搜寻引擎的工作模式每天,搜寻引擎都通过一个设计好的软件来具体审核其索引中的数十亿的网页索引,并找出哪些与搜寻查询最为匹配以及将其按最为相关的依次进行 排名。搜寻引擎面对的是数百亿须要排序的网页,它如何确定相关性呢?每一个搜寻引擎都已形成了一套规则和数学公式,我们将其称之为算法,用这种算法来确定网页的排名。至于每一家搜寻引擎的算法是如何工作的这是一个隐私,但经常用来改进一个网站的排名性能的一般原则大家还是知道的,我们将其称之为搜寻引擎优化。搜寻引擎时常简洁地采纳网页副本将相关的网页依据一个垂直的主题进行分组。假如我们取出一个与电影行业相关的网页,这些主题或者组可能是消遣、电影消遣、电影明星消遣等等。每一个主题都有描述这个组所包含网页的公共字和短语。有些网页可能不单单属于一个组,例如:与电影利润相关的一个网页可能既属于金融组又属于消遣组。SERP(或搜寻引擎结果页)将此算法应用于索引的站点后,依据所执行的搜寻,搜寻引擎会给出一些最相关的搜寻结果。我们来简化一个困难的过程,当一位用户输入一个搜寻查询时,搜寻引擎依据这个网页对其认为相关的索引进行分析和检索。假如它具有一个相关网页的候选名单,它会依据另外的算法因素对这些列表进行进一步计算,以便确定以何种依次将其展示给用户。这些因素或许是用户的位置,当然了,甚至也可能是用户的搜寻历史记录。每个搜寻引擎所运用的算法是不同的,这就是为什么对于相同的查询,每个搜寻引擎所搜寻到的结果不尽相同的缘由。每一个搜寻引擎都有自己的小生境,因此,对于一个用户经常同时运用多个搜寻引擎来搜寻一个内容并不少见。这进一步说明白网站拥有者将其网站在全部搜寻引擎上获得索引并得到较好的排名是特别重要的。结论搜寻引擎的目标是如何适合用户的口味。它们因此想在第一时间给用户供应合适的、相关的、信息量大的站点来满意他们。(出处:

    注意事项

    本文(2022年搜索引擎是如何工作的搜索研究教程.docx)为本站会员(l***)主动上传,淘文阁 - 分享文档赚钱的网站仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知淘文阁 - 分享文档赚钱的网站(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    关于淘文阁 - 版权申诉 - 用户使用规则 - 积分规则 - 联系我们

    本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

    工信部备案号:黑ICP备15003705号 © 2020-2023 www.taowenge.com 淘文阁 

    收起
    展开