2022年seo教程:搜索引擎优化入门与进阶笔记 .pdf
《2022年seo教程:搜索引擎优化入门与进阶笔记 .pdf》由会员分享,可在线阅读,更多相关《2022年seo教程:搜索引擎优化入门与进阶笔记 .pdf(7页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、S,欢迎访问搜索引擎工作原理收录流程1、提交 url 是一个被动且费时间的行为。2、建立外链,外链的数量、质量及相关性左右着录入时间,是主动的。页面收录方式页面收录使用的策略,目的是从互联网筛选出相对重要的信息。若使用相同抓取策略,在同一站中抓取页面资源更具效率,那么则会再网站上停留更长的时间,收录的页面数自然也就爱更多。广度优先。优点:优先抓取重要的页面。应对策略:将重要信息设计在较浅层次的页面上。深度优先。优点:页面需求的长尾,抓取更多冷门、隐藏的页面,满足更多用户的需求。名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 7 页 -应对策略:重要信息放置在多层次的页面上。用户提
2、交。优点:大大提高页面收录效率、数量和收录页面的质量。如何避免重复收录(页面重复、内容重复)网站中的重复信息:转载内容、镜像内容。重复信息的影响:占用硬盘、延长用户搜素时间权重:原创 转载 镜像(几乎完全被忽略)转载页面比较多个被划分为N 个区域页面的M 个区域。若MA(某阀值),则互为转载。通过比较最后修改时间、页面权重等因素判断哪个是原创。镜像页面比较多个被划分为N 个区域的页面,若N 个区域内容完全一样,则认为这些页面互为镜像页面。判断原创如转载一样。镜像网站狭义的镜像网站是指内容完全相同的网站。形成原因:1、多个域名或IP指向同一服务器的同一个物理目录;2、整个网站内容被复制到使用不同
3、域名或IP的服务器上。识别源网站是通过判断这些网站的首页以及首页直接链接的页面是否互为镜像页面。再综合多项因素(如网站权重值、建立时间等)识别。镜像网站只收录极少页面,甚至不收录页面。页面维护方式为让搜索引擎适应网站的不断变化和缺录。名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 7 页 -定期抓取周期性针对全部已收录页面进行维护。页面权重的再分配也是与页面维护同步进行。适用于页面较少,内容更新慢的网站。缺点:由于维护周期长,是的不能及时向用户反映更新期间页面的变化情况。增量抓取对已抓取的页面进行定时监控,实现对页面的更新及维护。(不现实)基于 80/20 法则,搜索引擎只针对某
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年seo教程:搜索引擎优化入门与进阶笔记 2022 seo 教程 搜索引擎 优化 入门 进阶 笔记
限制150内