图解HTTP--完整彩色版.docx
《图解HTTP--完整彩色版.docx》由会员分享,可在线阅读,更多相关《图解HTTP--完整彩色版.docx(234页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、目录版权声明译者序 前言致谢第 1 章 了解 Web 及网络基础1.1 使用 HTTP 协议访问 Web1.2 HTTP 的诞生1.3 网络基础 TCP/IP1.4 与 HTTP 关系密切的协议 : IP、TCP 和 DNS1.5 负责域名解析的 DNS 服务1.6 各种协议与 HTTP 协议的关系1.7 URI 和 URL第 2 章 简单的 HTTP 协议2.1 HTTP 协议用于客户端和服务器端之间的通信2.2 通过请求和响应的交换达成通信2.3 HTTP 是不保存状态的协议2.4 请求 URI 定位资源2.5 告知服务器意图的 HTTP 方法2.6 使用方法下达命令2.7 持久连接节省通
2、信量2.8 使用 Cookie 的状态管理 第 3 章 HTTP 报文内的 HTTP 信息3.1 HTTP 报文3.2 请求报文及响应报文的结构3.3 编码提升传输速率3.4 发送多种数据的多部分对象集合3.5 获取部分内容的范围请求3.6 内容协商返回最合适的内容第 4 章 返回结果的 HTTP 状态码4.1 状态码告知从服务器端返回的请求结果4.2 2XX 成功4.3 3XX 重定向4.4 4XX 客户端错误4.5 5XX 服务器错误第 5 章 与 HTTP 协作的 Web 服务器5.1 用单台虚拟主机实现多个域名2365.2 通信数据转发程序 :代理、网关、隧道5.3 保存资源的缓存第
3、6 章 HTTP 首部6.1 HTTP 报文首部6.2 HTTP 首部字段6.3 HTTP/1.1 通用首部字段6.4 请求首部字段6.5 响应首部字段6.6 实体首部字段6.7 为 Cookie 服务的首部字段6.8 其他首部字段第 7 章 确保 Web 安全的 HTTPS7.1 HTTP 的缺点7.2 HTTP+ 加密 + 认证 + 完整性保护 =HTTPS第 8 章 确认访问用户身份的认证8.1 何为认证8.2 BASIC 认证8.3 DIGEST 认证8.4 SSL 客户端认证8.5 基于表单认证第 9 章 基于 HTTP 的功能追加协议9.1 基于 HTTP 的协议9.2 消除 HT
4、TP 瓶颈的 SPDY9.3 使用浏览器进行全双工通信的 WebSocket9.4 期盼已久的 HTTP/2.09.5 Web 服务器管理文件的 WebDAV第 10 章 构建 Web 内容的技术10.1 HTML10.2 动态 HTML10.3 Web 应用10.4 数据发布的格式及语言第 11 章 Web 的攻击技术11.1 针对 Web 的攻击技术11.2 因输出值转义不完全引发的安全漏洞11.3 因设置或设计上的缺陷引发的安全漏洞11.4 因会话管理疏忽引发的安全漏洞11.5 其他安全漏洞第 1 章 了解 Web 及网络基础本章概述了 Web 是建立在何种技术之上,以及 HTTP 协议
5、是如何诞生并发展的。我们从其背景着手,来深入了解这部分内容。1.1 使用 HTTP 协议访问 Web你知道当我们在网页浏览器(Web browser)的地址栏中输入 URL时,Web 页面是如何呈现的吗?Web 页面当然不能凭空显示出来。根据 Web 浏览器地址栏中指定的 URL,Web 浏览器从 Web 服务器端获取文件资源(resource)等信息,从而显示出 Web 页面。像这种通过发送请求获取服务器资源的 Web 浏览器等,都可称为客户端(client)。Web 使用一种名为 HTTP(HyperText Transfer Protocol,超文本传输协议 1)的协议作为规范,完成从客
6、户端到服务器端等一系列运作流 程。而协议是指规则的约定。可以说,Web 是建立在 HTTP 协议上通信的。1 HTTP 通常被译为超文本传输协议,但这种译法并不严谨。严谨的译名应该 为“超文本转移协议”。但是前一译法已约定俗成,本书将会沿用。有兴趣的读者可参考图灵社区的相关讨论 :1.2 HTTP 的诞生在深入学习 HTTP 之前,我们先来介绍一下 HTTP 诞生的背景。了解背景的同时也能了解当初制定 HTTP 的初衷,这样有助于我们更好地理解。1.2.1 为知识共享而规划 Web1989 年 3 月,互联网还只属于少数人。在这一互联网的黎明期,HTTP 诞生了。CERN(欧洲核子研究组织)的
7、蒂姆 伯纳斯 - 李(Tim BernersLee)博士提出了一种能让远隔两地的研究者们共享知识的设想。最初设想的基本理念是:借助多文档之间相互关联形成的超文本(HyperText),连成可相互参阅的 WWW(World Wide Web,万维网)。现在已提出了 3 项 WWW 构建技术,分别是:把 SGML(Standard Generalized Markup Language,标准通用标记语言)作为页面的文本标记语言的 HTML(HyperText Markup Language,超文本标记语言);作为文档传递协议的 HTTP ;指定文档所在地址的 URL(UniformResource
8、 Locator,统一资源定位符)。WWW 这一名称,是 Web 浏览器当年用来浏览超文本的客户端应用程序时的名称。现在则用来表示这一系列的集合,也可简称为 Web。1.2.2 Web 成长时代1990 年 11 月,CERN 成功研发了世界上第一台 Web 服务器和 Web 浏览器。两年后的 1992 年 9 月,日本第一个网站的主页上线了。 日本第一个主页http:/www.ibarakiken.gr.jp/www/1990 年,大家针对 HTML 1.0 草案进行了讨论,因 HTML 1.0 中存在多处模糊不清的部分,草案被直接废弃了。 HTML1.0http:/www.w3.org/M
9、arkUp/draft-ietf-iiir-html-01.txt1993 年 1 月,现代浏览器的祖先 NCSA(National Center for Supercomputer Applications,美国国家超级计算机应用中心)研发的 Mosaic 问世了。它以 in-line(内联)等形式显示 HTML 的图像,在图像方面出色的表现使它迅速在世界范围内流行开来。同年秋天,Mosaic 的 Windows 版和 Macintosh 版面世。使用 CGI 技术的 NCSA Web 服务器、NCSA HTTPd 1.0 也差不多是在这个时期出现的。 NCSA Mosaic bounce
10、pagehttp:/archive.ncsa.illinois.edu/mosaic.html The NCSA HTTPd Home Page(存档)http:/web.archive.org/web/20090426182129/http:/hoohoo.ncsa.illino(原址已失效)1994 年 的 12 月,网景通信公司发布了 Netscape Navigator 1.0,1995年微软公司发布 Internet Explorer 1.0 和 2.0。紧随其后的是现在已然成为 Web 服务器标准之一的 Apache,当时它以 Apache 0.2 的姿态出现在世人眼前。而 HTM
11、L 也发布了 2.0 版本。那一年,Web 技术的发展突飞猛进。时光流转,从 1995 年左右起,微软公司与网景通信公司之间爆发的浏览器大战愈演愈烈。两家公司都各自对 HTML 做了扩展,于是导致在写 HTML 页面时,必须考虑兼容他们两家公司的浏览器。时至今日,这个问题仍令那些写前端页面的工程师感到棘手。在这场浏览器供应商之间的竞争中,他们不仅对当时发展中的各种 Web 标准化视而不见,还屡次出现新增功能没有对应说明文档的情况。2000 年前后,这场浏览器战争随着网景通信公司的衰落而暂告一段落。但就在 2004 年,Mozilla 基金会发布了 Firefox 浏览器,第二次浏览器大战随即爆
12、发。Internet Explorer 浏览器的版本从 6 升到 7 前后花费了 5 年时间。之后接连不断地发布了 8、9、10 版本。另外,Chrome、Opera、Safari 等浏览器也纷纷抢占市场份额。1.2.3 驻足不前的 HTTPHTTP/0.9HTTP 于 1990 年问世。那时的 HTTP 并没有作为正式的标准被建立。现在的 HTTP 其实含有 HTTP1.0 之前版本的意思,因此被称为 HTTP/0.9。HTTP/1.0HTTP 正式作为标准被公布是在 1996 年的 5 月,版本被命名为 HTTP/1.0,并记载于 RFC1945。虽说是初期标准,但该协议标准至今仍被广泛使
13、用在服务器端。 RFC1945 - Hypertext Transfer Protocol - HTTP/1.0http:/www.ietf.org/rfc/rfc1945.txtHTTP/1.11997 年 1 月公布的 HTTP/1.1 是目前主流的 HTTP 协议版本。当初的标准是 RFC2068,之后发布的修订版 RFC2616 就是当前的最新版 本。 RFC2616 - Hypertext Transfer Protocol - HTTP/1.1http:/www.ietf.org/rfc/rfc2616.txt可见,作为 Web 文档传输协议的 HTTP,它的版本几乎没有更新。新一
14、代 HTTP/2.0 正在制订中,但要达到较高的使用覆盖率,仍需假以时日。当年 HTTP 协议的出现主要是为了解决文本传输的难题。由于协议本身非常简单,于是在此基础上设想了很多应用方法并投入了实际使用。现在 HTTP 协议已经超出了 Web 这个框架的局限,被运用到了各种场景里。1.3 网络基础 TCP/IP为了理解 HTTP,我们有必要事先了解一下 TCP/IP 协议族。通常使用的网络(包括互联网)是在 TCP/IP 协议族的基础上运作的。而 HTTP 属于它内部的一个子集。接下来,我们仅介绍理解 HTTP 所需掌握的 TCP/IP 协议族的概要。若想进一步学习有关 TCP/IP 的知识,请
15、参考其他讲解 TCP/IP 的专业书籍。1.3.1 TCP/IP 协议族计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标、由哪一边先发起通信、使用哪种语言进行通 信、怎样结束通信等规则都需要事先确定。不同的硬件、操作系统之间的通信,所有的这一切都需要一种规则。而我们就把这种规则称为协议(protocol)。图:TCP/IP 是互联网相关的各类协议族的总称协议中存在各式各样的内容。从电缆的规格到 IP 地址的选定方法、寻找异地用户的方法、双方建立通信的顺序,以及 Web 页面显示需要处理的步骤,等等。像这样把与互联网相关联的协议集合起来总称为 TCP/IP。也有说法
16、认为,TCP/IP 是指 TCP 和 IP 这两种协议。还有一种说法认为,TCP/ IP 是在 IP 协议的通信过程中,使用到的协议族的统称。1.3.2 TCP/IP 的分层管理TCP/IP 协议族里重要的一点就是分层。TCP/IP 协议族按层次分别分为以下 4 层:应用层、传输层、网络层和数据链路层。把 TCP/IP 层次化是有好处的。比如,如果互联网只由一个协议统筹,某个地方需要改变设计时,就必须把所有部分整体替换掉。而分层之后只需把变动的层替换掉即可。把各层之间的接口部分规划好之后,每个层次内部的设计就能够自由改动了。值得一提的是,层次化之后,设计也变得相对简单了。处于应用层上的应用可以
17、只考虑分派给自己的任务,而不需要弄清对方在地球上哪个地方、对方的传输路线是怎样的、是否能确保传输送达等问题。TCP/IP 协议族各层的作用如下。应用层应用层决定了向用户提供应用服务时通信的活动。TCP/IP 协议族内预存了各类通用的应用服务。比如,FTP(File Transfer Protocol,文件传输协议)和 DNS(Domain Name System,域名系统)服务就是其中两类。HTTP 协议也处于该层。传输层传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。在传输层有两个性质不同的协议:TCP(Transmission Control Protocol,传输控制协
18、议)和 UDP(User Data Protocol,用户数据报协议)。网络层(又名网络互连层)网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位。该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。与对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。链路层(又名数据链路层,网络接口层)用来处理连接网络的硬件部分。包括控制操作系统、硬件的设备驱 动、NIC(Network Interface Card,网络适配器,即网卡),及光纤等物理可见部分(还包括连接器等一切传输媒介)。硬件上的范畴均在链路层的
19、作用范围之内。1.3.3 TCP/IP 通信传输流利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。我们用 HTTP 举例来说明,首先作为发送端的客户端在应用层(HTTP 协议)发出一个想看某个 Web 页面的 HTTP 请求。接着,为了传输方便,在传输层(TCP 协议)把从应用层处收到的数据(HTTP 请求报文)进行分割,并在各个报文上打上标记序号及端口号后转发给网络层。在网络层(IP 协议),增加作为通信目的地的 MAC 地址后转发给链路层。这样一来,发往网络的通信请求就准备齐全了。接收端的服务器在链路层接收到数据,按序往
20、上层发送,一直到应用层。当传输到应用层,才能算真正接收到由客户端发送过来的 HTTP请求。发送端在层与层之间传输数据时,每经过一层时必定会被打上一个该层所属的首部信息。反之,接收端在层与层传输数据时,每经过一层时会把对应的首部消去。这种把数据信息包装起来的做法称为封装(encapsulate)。1.4 与 HTTP 关系密切的协议 : IP、TCP 和DNS下面我们分别针对在 TCP/IP 协议族中与 HTTP 密不可分的 3 个协议(IP、TCP 和 DNS)进行说明。1.4.1 负责传输的 IP 协议按层次分,IP(Internet Protocol)网际协议位于网络层。Internet
21、Protocol 这个名称可能听起来有点夸张,但事实正是如此,因为几乎所有使用网络的系统都会用到 IP 协议。TCP/IP 协议族中的 IP 指的就是网际协议,协议名称中占据了一半位置,其重要性可见一斑。可能有人会把“IP”和“IP 地址”搞混,“IP”其实是一种协议的名称。IP 协议的作用是把各种数据包传送给对方。而要保证确实传送到对方那里,则需要满足各类条件。其中两个重要的条件是 IP 地址和 MAC地址(Media Access Control Address)。IP 地址指明了节点被分配到的地址,MAC 地址是指网卡所属的固定地址。IP 地址可以和 MAC 地址进行配对。IP 地址可变
22、换,但 MAC地址基本上不会更改。使用 ARP 协议凭借 MAC 地址进行通信IP 间的通信依赖 MAC 地址。在网络上,通信的双方在同一局域网(LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转才能连接到对方。而在进行中转时,会利用下一站中转设备的 MAC地址来搜索下一个中转目标。这时,会采用 ARP 协议(Address Resolution Protocol)。ARP 是一种用以解析地址的协议,根据通信方的 IP 地址就可以反查出对应的 MAC 地址。没有人能够全面掌握互联网中的传输状况在到达通信目标前的中转过程中,那些计算机和路由器等网络设备只能获悉很粗略的传输路线。这种机制
23、称为路由选择(routing),有点像快递公司的送货过程。想要寄快递的人,只要将自己的货物送到集散中心,就可以知道快递公司是否肯收件发货,该快递公司的集散中心检查货物的送达地址,明确下站该送往哪个区域的集散中心。接着,那个区域的集散中心自会判断是否能送到对方的家中。我们是想通过这个比喻说明,无论哪台计算机、哪台网络设备,它们都无法全面掌握互联网中的细节。1.4.2 确保可靠性的 TCP 协议按层次分,TCP 位于传输层,提供可靠的字节流服务。所谓的字节流服务(Byte Stream Service)是指,为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。而可靠的传
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 图解 HTTP 完整 彩色
限制150内