2022年网站的搜索引擎优化 .pdf
《2022年网站的搜索引擎优化 .pdf》由会员分享,可在线阅读,更多相关《2022年网站的搜索引擎优化 .pdf(27页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、第 7 章网站的搜索引擎优化(SEO)教学任务 随着计算机互联网的快速普及,据最新统计,全球网民突破10 亿,全球网站个数突破2.3 亿个, 而且这个数值每天还在增加。如何在海量信息中找到我们所需要的信息,如何让更多的人找到我们制作的网站,搜索引擎可以轻松解决这个问题。现在搜索引擎网站已经是每个网民浏览最多的网站,我们在这一章学习,如何通过一定的策略让网站能够被搜索引擎容易收录,能够被更多的人轻松找到,以达到宣传推广网站的目的。该教学过程可分成5 个任务完成:任务 1:认识 SEO。主要包括搜索引擎优化概念、SEO 的作用、 著名搜索引擎功能介绍。任务 2:SE 工作原理及关键技术。主要包括S
2、E 工作原理、 SEO 关键技术、 SEO 框架。任务 3:SEO 实例操作。 主要包括优化网站域名、优化网站结构和内链接、优化关键字、优化外链接。教学过程 本章根据网站建设过程中网站发布后要对网站进行搜索引擎进行优化,提高网站的排名, 从不同的角度对网站进行优化。按照实际工作流程,从域名的命名, 网站结构,关键字,链接,注册进行基于工作流程的教学方式进行讲解。教学目标主要描述学生自测掌握搜索引擎优化的基本知识(1)掌握搜索引擎优化的概念(2)掌握搜索引擎优化的作用(3)掌握谷歌所提供的功能(4)掌握百度所提供的功能能够利用网站查询网站的优化程序了解 SE工作原理及关键技术(1)了解 SE 工
3、作原理(2)了解 SEO 关键技术(3)了解 SEO 框架在设计网站时以SEO 的角度出发进行设计网站 SEO (1)掌握网站域名优化(2)掌握网站结构和内链接优化(3)掌握网站关键字优化(4)掌握网站外部链接优化能够对网站进行各方面优化名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 27 页 - - - - - - - - - 7.1 认识 SEO 7.1.1任务分析SEO 为搜索引擎优化,为近年来较为流行的网络营销方式,主要目的是增加特定关键字的曝光率以增加网站的能见
4、度,进而增加销售的机会。分为站外SEO 和站内 SEO 两种。 本节的主要任务就是对SEO 进行介绍,让读者对SEO 有一个初步认识。7.1.2 相关知识1. 什么是搜索引擎?搜索引擎(searchengine),简称SE ,是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。2. 什么是搜索引擎优化?搜索引擎优化(Search Engine Optimisation),简称 SEO ,是通过研究各类搜索引擎如何抓取互联网页面和文件,研究搜索引擎进行排序的规则,来对网页进行相关的优化,使其有更多的内容被搜
5、索引擎收录,并针对不同的关键字获得搜索引擎更高的排名,从而提高网站访问量,最终提升网站的销售能力及宣传效果。目前, SEO是网站中最热门的话题,也是网站推广中最重要的技术之一。现在, IT 行业对 SEO人才的需求也非常大,所以学好SEO技术对我们从事IT 行业人员来说非常重要。3.SEO的作用网站优化是指在搜索引擎许可的优化原则下,通过对网站中代码、链接和文字描述的重组优化, 以及后期对该优化网站进行合理的反向链接操作;最终实现被优化的网站在搜索引擎的检索结果中得到排名提升。网站优化就是通过对网站功能、网站结构、 网页布局、 网站内容等要素的合理设计,使得网站内容和功能表现形式达到对用户友好
6、并易于宣传推广的最佳效果,充分发挥网站的网络营销价值。 搜索引擎优化工作贯穿网站策划、建设、 维护全过程的每个细节,值得网站设计、开发和推广的每个参与人员了解其职责对于SEO效果的意义。优化好的网站, 从搜索引擎来的流量将会有很大的提高,不过这仅仅是能带来用户,而真正能够留住用户的是网站的内容,所以搜索引擎优化仅仅是辅助手段,在网站建设的过程中仍然要将大部分精力放着网站内容的完善上。由于优化目的是在搜索引擎上获得好的排名,而搜索引擎不属于我们,排名的影响因素有很多,所以对优化的效果就不可能有100%的把握,我们能做的是就是在已知的关键因素上下功夫,这样不论搜索引擎算法如何改变,都不会使排名有特
7、别大的波动。4. 国际著名搜索引擎谷歌(Google)Google目前被公认为是全球规模最大的搜索引擎,它提供了简单易用的免费服务,用户可以在瞬间得到相关的搜索结果。当 您访问www.G或其它Google域名时,如图7.1 所示,您可以使用多种语言查找信息、查看股价、地图和要闻、查名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 27 页 - - - - - - - - - 找美国境内所有城市的电话簿名单、搜索数十亿计的图片并详读全球最大的Usenet信息存档 超过十亿条帖
8、子,发布日期可以追溯到1981 年。图 7.1 谷歌中国网站Google除了搜索引擎外,还提供很多其它服务,见表7-1 和如图7.2 所示。表 7-1Google所提供的网络服务GoogleWebAPI GoogleBookSearch Gmail Blogger Orkut GoogleNotebook Picasa Chrome谷歌浏览器Google桌面搜索Google工具栏GoogleWebAccelerator GoogleMars GoogleMaps GoogleMoon GoogleSketchUp Google新闻Google网页目录GoogleAnswers GoogleTa
9、lk GoogleLocal GoogleSpecial GoogleScholar FriendConnect GoogleVideo YouTube iGoogle Google音乐搜索服务Google谷歌拼音输入法谷歌搜索服务器虚拟版GSAve GoogleEarth GoogleStreetView 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 27 页 - - - - - - - - - 图 7.2Google 大 全5. 国内著名搜索引擎百度(baidu )
10、百度公司( ,inc )于 1999 年底成立于美国硅谷,它的创建者是在美国硅谷有多年成功经验的李彦宏先生及徐勇先生。2000 年 1 月,百度公司在中国成立了它的全资子公司百度网络技术(北京)有限公司,随后于同年10 月成立了深圳分公司,2001 年 6月又在上海成立了上海办事处。其主页如图7.3 所示。图 7.3 百度主页百度以自身的核心技术“超链分析” 为基础, 提供的搜索服务体验赢得了广大用户的喜爱;超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - -
11、 名师精心整理 - - - - - - - 第 4 页,共 27 页 - - - - - - - - - 搜索时,越受用户欢迎的内容排名越靠前。百度总裁李彦宏就是超链分析专利的唯一持有人,该技术已为世界各大搜索引擎普遍采用。百度拥有全球最大的中文网页库,收录中文网页已超过20 亿,这些网页的数量每天正以千万级的速度在增长;同时,百度在中国各地分布的服务器,能直接从最近的服务器上,把所搜索信息返回给当地用户,使用户享受极快的搜索传输速度。百度每天处理来自超过138 个国家超过数亿次的搜索请求,每天有超过7 万用户将百度设为首页,用户通过百度搜索引擎可以搜到世界上最新最全的中文信息。2004 年起
12、, “有问题,百度一下”在中国开始风行,百度成为搜索的代名词。百度除了搜索引擎外,还提供很多其它服务,如图7.4 所示。图 7.4 百度产品大全7.2SE 工作原理及关键技术7.2.1任务分析搜索引擎公司各自研发关键技术和经验,它们使用的技术也不太一样。通过本节不仅可以让大众技术人员通过了解搜索引擎的工作原理,提高对技术的理解,而且还可以为更为网站设计者、网站站长更好地运用搜索引擎。7.2.2相关知识1. 名词解释(1) spider : 又称网络蜘蛛, 是搜索引擎用来访问Internet上网页的自动程序。 Spiders根据 html 的语法和格式,对读取的页面进行代码过滤,收录相关的文字内
13、容。目前搜索引名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 27 页 - - - - - - - - - 擎无法像人那样去读取相应的图片、Flash 、影片里面的内容。图片中的文字对Spider 来说是毫无意义的。对于javascript里面的内容,现在已经有部分网站开始收录。(2)PR值 :即PageRank ,网页级别。 Google对网页级别的描述是这样的:“为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构”。PR 值级别从 0到 10级, 1
14、0级为满分,越高说明该网页越受欢迎越重要。(3)开放目录 DMOZ : 即Open Directory Project,是互联网上最大的,最广泛的人工目录。 它是由来自世界各地的志愿者共同维护与建设的最大的全球目录社区。开放目录专案是建立在开放资源共享的理念上的,是唯一的 100% 免费的大型目录。提交一个网站或使用目录数据不需要支付任何费用。开放目录专案的数据在同意遵守免费使用条款的情况下,任何人都可以免费使用。(4)搜索频率 :搜索引擎对网站的访问频率。网站内容更新越快,一定的周期内搜索引擎对网站的访问次数增多。(5)搜索深度 :理论上,搜索引擎可以搜索到网站的每一个链接。搜索引擎每增加一
15、个访问的层次,就会产生组合爆炸,对于高权重的网站,搜索引擎会增加网站的搜索深度,对于普通的网站,搜索的深度一般为3层,对于访问深度 4层以上的页面不再继续收录。假如搜索引擎访问网站的首页为访问入口,首页上所有列出的链接为访问的第一层,第一层链接进去的页面上的链接为第二层,以此类推。(6)爬虫 crawler:搜索引擎根据spider 收集回来的 URL 链接库去收集网站的程序。(7)网站地图 sitemap : Sitemap 可方便管理员通知搜索引擎他们网站上有哪些可供抓取的网页。最简单的Sitepmap 形式,就是 XML 文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新
16、的时间、更改的频率以及相对于网站上其他网址的重要程度为何等) ,以便搜索引擎可以更加智能地抓取网站。GoogleSiteMapProtocol是 Google 自己推出的一种站点地图协议,此协议文件基于早期的 robots.txt文件协议,并有所升级。在Google 官方指南中指出加入了GoogleSiteMap文件的网站将更有利于Google 网页爬行机器人的爬行索引,这样将提高索引网站内容的效率和准确度。 文件协议应用了简单的XML格式, 一共用到6 个标签, 其中关键标签包括链接地址、更新时间、更新频率和索引优先权。(8)关键字 :简单的说,关键字就是用户在使用搜索引擎时输入的、能够最大
17、程度概括用户所要查找的信息内容的字或者词,是信息的概括化和集中化。在搜索引擎优化SEO行业谈到的关键字,往往是指网页的核心和主要内容。对于搜索引擎来说,你的网页主要是讲关于哪方面的内容,那个方面就可以归结出一个(更多时候会是多个)关键字。 为了更好的让自己的网页在搜索引擎的搜索中有很好的排名。(9)分词技术 :英文是以词为单位的,词和词之间是用安全可靠隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如:英文句子“This is an apple ”。用中文则为:“这是一个苹果” 。计算机可以很简单通过安全可靠知道apple 是一个单词, 但是不能很容易明白“苹”和“果”两个字
18、合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,也称为切词。搜索引擎要对所收集到的信息进行整理、分类、 索引以产生索引库,而中文搜索引擎的核心是分词技术。分词技术是利用一定的规则和词库,切分出一个句子中的词,为自动索引做好准备。(10)Google dance:是指 Google 搜索引擎数据库每月一次的大规模升级。在升级期间, 新的网页被加入,无效网页被删除,对收录网站进行全面深度检索,也可能在这期间调整算法。Goolge 搜索结果显示出剧烈的排名波动,同时被索引网站的外部链接也获得更新。每个季度更新一次的网页级别(PageRank)也发生在Google dance期间。
19、名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 27 页 - - - - - - - - - Dance 一般持续几天时间,Dance结束后, Google 搜索结果和网站外部链接数量趋于稳定,直至下一个周期的Google dance到来。Google Dance 是 Google 定期更新它的索引的活动,给人感觉就像是跳舞一样。在这个Dance 的过程中, Google 所储存的索引都被重新更新,网站的排名会发生剧烈变化,有的网站在 Google 上的排名一夜之间消失,
20、有的网站则名列首位。Google Dance通常在月末的那周开始,新结果在月初几天可以看到,大概是每36 天一次或者一年10 次。2搜索引擎工作原理及分类1)搜索引擎工作原理大型互联网搜索引擎的数据中心一般运行数千台甚至数十万台计算机,而且每天向计算机集群里添加数十台机器,以保持与网络发展的同步。搜集机器自动搜集网页信息,平均速度每秒数十个网页, 检索机器则提供容错的可缩放的体系架构以应对每天数千万甚至数亿的用户查询请求。 企业搜索引擎可根据不同的应用规模,从单台计算机到计算机集群都可以进行部署。搜索引擎一般的工作过程是:首先对互联网上的网页进行搜集,然后对搜集来的网页进行预处理, 建立网页索
21、引库,实时响应用户的查询请求,并对查找到的结果按某种规则进行排序后返回给用户。搜索引擎的重要功能是能够对互联网上的文本信息提供全文检索。如图7.5 所示。图 7.5 SE工作原理搜索引擎详细工作过程主要分为以下五步完成: (1)搜索引擎释放网络蜘蛛spider ,spider先检查开放目录DMOZ 上登录网站网址进行访问,并根据收录的网站的外部链接找到更多的网站。根据网站的更新频率及权重级别,安排 spider的搜索频率。对于新站,Google 进入 sandbox 处理。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心
22、整理 - - - - - - - 第 7 页,共 27 页 - - - - - - - - - 对于站内连接(内连接),Google 根据网站的PR值,计算出搜索深度,检查收录的页面中获取的网址是否更新,有,则收录新的网址,没有,则关闭Spider 。Baidu Yahoo 则根据自己的算法,收录访问深度内的网址。(2) 搜索引擎读取spider收集的网址库, 按照网址收录优先规则,调试反爬虫crawler 。Google 对于提交了sitemap的网站,抓取深层次的页面。(3)搜索引擎释放crawler抓取网址页面。(4)收录网站为中文网站根据健忘技术进行关键字索引,按照页面的权重进行排位(
23、5)进行反作弊spamkill和 dance(Google) 2)搜索引擎分类(1)全文搜索引擎搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google 一般是 28 天) ,搜索引擎主动派出“蜘蛛”程序,对一定IP 地址范围内的互联网站进行检索, 一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2 天到数月不等)定向向你的网站派出“蜘蛛” 程序,扫描你的网站并将有关信息存入数据库,以备用户查询。由于近年来搜索引擎索引规则发生了很大变化,主动提交网址并不保证你的网站能进入搜索引擎
24、数据库, 因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到你并自动将你的网站收录。当用户以关键字查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法通常根据网页中关键字的匹配程度,出现的位置/ 频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。全文搜索引擎的典型例子除了上面介绍的谷歌和百度外,还有中国雅虎( ) ,如图 7.6 所示。图 7.6 中国雅虎主页(2)目录索引名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精
25、心整理 - - - - - - - 第 8 页,共 27 页 - - - - - - - - - 目录索引, 顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键字搜索,也可按分类目录逐层查找。如以关键字搜索,返回的结果跟搜索引擎一样, 也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找, 某一目录中网站的排名则是由标题字母的先后顺序决定。其它典型例子就是前面提到的 DMOZ(www.dmoz.org) ,其中文网站地址是:http:/www.dmoz.org/World/Chinese_Simplified/,如图 7.7 所示。图 7.
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年网站的搜索引擎优化 2022 网站 搜索引擎 优化
限制150内