《前端学HTTP之WEB服务器 - WEB服务器.docx》由会员分享,可在线阅读,更多相关《前端学HTTP之WEB服务器 - WEB服务器.docx(21页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、前端学HTTP之WEB服务器-WEB服务器-最新IT资讯_电脑知识大全_网络安全教程-次元立方网前面的话Web服务器天天会分发出数以亿计的Web页面,它是万维网的骨干。本文主要介绍WEB服务器的相关内容Web服务器会对HTTP请求进行处理并提供响应。术语Web服务器能够用来表示Web服务器的软件,可以以用来表示提供Web页面的特定设备或计算机。Web服务器有着不同的风格、形状和尺寸,但不管功能有何差异,所有的Web服务器都能够接收请求资源的HTTP请求,将内容回送给客户端Web服务器逻辑实现了HTTP协议、管理着Web资源,并负责提供Web服务器的管理功能。Web服务器逻辑和操作系统共同负责管
2、理TCP连接。底层操作系统负责管理底层计算机系统的硬件细节,并提供了TCP/IP网络支持、负责装载Web资源的文件系统以及控制当前计算活动的进程管理功能Web服务器有各种不同的形式:能够在标准的计算机系统上安装并运行通用的软件Web服务器;能够是一台Web服务器设备,通常会是一台安装在机架上的计算机,里面的软件会预装并配置好;在少量计算机芯片上可以以实现嵌入式Web服务器【通用软件Web服务器】通用软件Web服务器运行在标准的、有网络功能的计算机系统上。能够选择开源软件(比方Apache)或者商业软件(比方微软和iPlanet的Web服务器)。基本上所有的计算机和操作系统中都有可用的Web服务
3、器软件【Web服务器设备】Web服务器设备(Webserverappliance)是预先打包好的软硬件解决方案。厂商会在他们选择的计算机平台上预先安装好软件服务器,并将软件配置好。应用解决方案不再需要安装及配置软件,通常能够极大地简化管理工作。但是,Web服务器通常不太灵敏,特性不太丰富,而且服务器硬件也不太容易重用或升级【嵌入式Web服务器】嵌入式服务器(embededserver)是要嵌入到消费类产品(比方打印机或家用设备)中去的小型Web服务器。嵌入式Web服务器允许用户通过便捷的Web阅读器接口来管理其消费者设备。有些嵌入式Web服务器甚至能够在小于一平方英寸的空间内实现,但通常只能提
4、供最小特性功能集WEB服务器一般要执行下面任务:1、建立连接接受一个客户端连接,或者假如不希望与这个客户端建立连接,就将其关闭2、接收请求从网络中读取一条HTTP请求报文3、处理请求对请求报文进行解释,并采取行动4、访问资源访问报文中指定的资源5、构建响应创立带有正确首部的HTTP响应报文6、发送响应将响应回送给客户端7、记录事务处理经过将与已完成事务有关的内容记录在一个日志文件中接下来的几个小节重点讲明了Web服务器是如何实现这些基本任务的假如客户端已经打开了一条到服务器的持久连接,能够使用那条连接来发送它的请求。否则,客户端需要打开一条新的到服务器的连接【处理新连接】客户端请求一条到Web
5、服务器的TCP连接时,Web服务器会建立连接,判定连接的另一端是哪个客户端,从TCP连接中将IP地址解析出来。一旦新连接建立起来并被接受,服务器就会将新连接添加到其现存Web服务器连接列表中,做好监视连接上数据传输的准备Web服务器能够随意拒绝或立即关闭任意一条连接。有些Web服务器会由于客户端IP地址或主机名是未认证的,或者由于它是已知的恶意客户端而关闭连接。Web服务器可以以使用其他识别技术【客户端主机名识别】能够用反向DNS对大部分Web服务器进行配置,以便将客户端IP地址转换成客户端主机名。Web服务器能够将客户端主机名用于具体的访问控制和日志记录。但要注意的是,主机名査找可能会花费很
6、长时间,这样会降低Web事务处理的速度。很多大容量Web服务器要么会禁止主机名解析,要么只允许对特定内容进行解析连接上有数据到达时,Web服务器会从网络连接中读取数据,并将请求报文中的内容解析出来解析请求报文时,Web服务器会:解析请求行,查找请求方法、指定的资源标识符(URI)以及版本号,各项之间由一个空格分隔,并以一个回车换行(CRLF)序列作为行的结束;读取以CRLF结尾的报文首部;检测到以CRLF结尾的、标识首部结束的空行(假如有的话);假如有的话(长度由Content-Length首部指定),读取请求主体解析请求报文时,Web服务器会不定期地从网络上接收输入数据。网络连接可能随时都会
7、出现延迟。Web服务器需要从网络中读取数据,将部分报文数据临时存储在内存中,直到收到足以进行解析的数据并理解其意义为止有些Web服务器还会用便于进行报文操作的内部数据构造来存储请求报文。比方,数据构造中可能包含有指向请求报文中各个片段的指针及其长度,这样就能够将这些首部存放在一个快速査询表中,以便快速访问特定首部的详细值【连接的输入/输出处理构造】高性能的Web服务器能够同时支持数千条连接。这些连接使得服务器能够与世界各地的客户端进行通信,每个客户端都向服务器打开了一条或多条连接。某些连接可能在快速地向Web服务器发送请求,而其他一些连接则可能在渐渐发送,或者不经常发送请求,还有一些可能是空闲
8、的,平静地等待着将来可能出现的动作由于请求可能会在任意时刻到达,所以Web服务器会不停地观察有无新的Web请求。不同的Web服务器构造会以不同的方式为请求服务a、单线程Web服务器单线程的Web服务器一次只处理一个请求,直到其完成为止。一个事务处理结束之后,才去处理下一条连接。这种构造易于实现,但在处理经过中,所有其他连接都会被忽略。这样会造成严重的性能问题,只适用于低负荷的服务器b、多进程及多线程Web服务器多进程和多线程Web服务器用多个进程,或更高效的线程同时对请求进行处理。能够根据需要创立,或者预先创立一些线程/进程。有些服务器会为每条连接分配一个线程/进程,但当服务器同时要处理成百、
9、上千,甚至数以万计的连接时,需要的进程或线程数量可能会消耗过多的内存或系统资源。因而,很多多线程Web服务器都会对线程/进程的最大数量进行限制c、复用I/O的服务器为了支持大量的连接,很多Web服务器都采用了复用构造。在复用构造中,要同时监视所有连接上的活动。当连接的状态发生变化时(比方,有数据可用,或出现错误时),就对那条连接进行少量的处理;处理结束之后,将连接返回到开放连接列表中,等待下一次状态变化。只要在有事情可做时才会对连接进行处理,在空闲连接上等待的时候并不会绑定线程和进程d、复用的多线程Web服务器有些系统会将多线程和复用功能结合在一起,以利用计算机平台上的多个CPU。多个线程(通
10、常是一个物理处理器)中的每一个都在观察打开的连接(或打开的连接中的一个子集),并对每条连接执行少量的任务一旦Web服务器收到了请求,就能够根据方法、资源、首部和可选的主体部分来对请求进行处理有些方法(比方POST)要求请求报文中必须带有实体主体部分的数据。其他一些方法(比方OPTIONS)允许有请求的主体部分,也允许没有。少数方法(比方GET)禁止在请求报文中包含实体的主体数据Web服务器是资源服务器。它们负责发送预先创立好的内容,比方HTML页面或JPEG图片,以及运行在服务器上的资源生成程序所产生的动态内容。在Web服务器将内容传送给客户端之前,要将请求报文中的URI映射为Web服务器上适
11、当的内容或内容生成器,以识别出内容的源头【docroot】Web服务器支持各种不同类型的资源映射,但最简单的资源映射形式就是用请求URI作为名字来访问Web服务器文件系统中的文件。通常,Web服务器的文件系统中会有一个特殊的文件夹专门用于存放Web内容。这个文件夹被称为文档的根目录(documentroot,或docroot)。Web服务器从请求报文中获取URI,并将其附加在文档根目录的后面下列图中,有一条对/specials/saw-blade.gif的请求到达。这个例子中Web服务器的文档根目录为/usr/local/d/files。Web服务器会返回文件/usr/local/d/file
12、s/specials/saw-blade.gif在配置文件d.conf中添加一个DocumentRoot行就能够为ApacheWeb服务器设置文档的根目录了:DocumentRoot/usr/local/d/files虚拟托管的Web服务器会在同一台Web服务器上提供多个Web站点,每个站点在服务器上都有本人独有的文档根目录。虚拟托管Web服务器会根据URI或Host首部的IP地址或主机名来识别要使用的正确文档根目录。通过这种方式,即便请求URI完全一样,托管在同一Web服务器上的两个Web站点可以以拥有完全不同的内容下列图中的服务器托管了两个站点:joes-hardware和marys-an
13、tiques。服务器能够通过HTTP的Host首部,或根据不同的IP地址来区分不同的Web站点。当请求A到达时,服务器会获取文件/docs/joe/index.;当请求B到达时,服务器会获取文件/docs/mary/index.对大多数Web服务器来讲,配置虚拟托管的文档根目录是很简单的。对常见的ApacheWeb服务器来讲,需要为每个虚拟Web站点配置一个VirtualHost块,而且每个虚拟服务器都要包含DocumentRootDocroot的另一种常见应用是在Web服务器上为人们提供私有的Web站点。通常会把那些以斜杠和波浪号(/)开场,后面跟着用户名的URI映射为此用户的私有文档根目录
14、。私有docroot通常都是用户主目录下那个名为public_的目录,但可以将其配置为其他值【目录列表】Web服务器能够接收对目录URL的请求,其途径能够解析为一个目录,而不是文件。能够对大多数Web服务器进行配置,使其在客户端请求目录URL时采取不同的动作:返回一个错误;或不返回目录,返回一个特殊的默认索引文件;或扫描目录,返回一个包含目录内容的HTML页面大多数Web服务器都会去査找目录中一个名为index.或index.htm的文件来代表此目录。假如用户请求的是一个目录的URL,而且这个目录中有一个名为index.(或indeX.htm)的文件,服务器就会返回那个文件的内容在Apache
15、Web服务器上,能够用配置指令DirectoryIndex来配置要作为默认目录文件使用的文件名集合。指令DirectoryIndex会根据优先顺序列出所有能够作为目录索引文件使用的文件名。下列配置行会使Apache在收到一个目录URL请求时,在目录中搜索命令中列出来的任意一个文件:DirectoryIndexindex.index.htmhome.home.htmindex.cgi假如用户请求目录URI时,没有提供默认的索引文件,而且没有禁止使用目录索引,很多Web服务器都会自动返回一个HTML文件,此文件中会列出那个目录里的文件名,以及每个文件的大小和修改日期,还包括到每个文件的URI链接。
16、使用这个文件列表可能会很方便,可以以通过它在Web服务器上找到一些通常找不到的东西能够通过下面Apache指令禁止自动生成目录索引文件:Options-Indexes【动态映射】Web服务器能够将URI映射为动态资源也就是讲,映射到按需动态生成内容的程序上去。实际上,有一大类名为应用程序服务器的Web服务器会将Web服务器连接到复杂的后端应用程序上去。Web服务器要能够分辨出资源什么时候是动态的,动态内容生成程序位于何处,以及怎样运行那个程序。大多数Web服务器都提供了一些基本的机制以识别和映射动态资源Apache允许用户将URI途径名组件映射为可执行文件目录。服务器收到一条带有可执行途径组件
17、的对URI的请求时,会试着去执行相应服务器目录中的程序。例如,下列Apache配置指令就表明所有途径以/cgi-bin/开始的URI都应该执行在目录/usr/local/etc/d/cgi-programs/中找到的相应文件:ScriptAlias/cgi-bin/usr/local/etc/d/cgi-programs/Apache还允许用户用一个特殊的文件扩展名来标识可执行文件。通过这种方式就能够将可执行脚本放在任意目录中了。下面的Apache配置指令讲明要执行所有以.cgi结尾的Web资源AddHandlercgi-script.cgiCGI是早期出现的一种简单、流行的服务端应用程序执行
18、接口。当代的应用程序服务器都有更强大更有效的服务端动态内容支持机制,包括微软的动态服务器页面(ActiveServerPage)和Javaservlet很多Web服务器还提供了对服务器端包含项(SSI)的支持。假如某个资源被标识为存在服务器端包含项,服务器就会在将其发送给客户端之前对资源内容进行处理要对内容进行扫描,以査找(通常包含在特定HTML注释中的)特定的模板,这些模板能够是变量名,可以以是嵌入式脚本。能够用变量的值或可执行脚本的输出来取代特定的模板。这是创立动态内容的一种简便方式Web服务器还能够为特定资源进行访问控制。有请求到达,要访问受控资源时,Web服务器能够根据客户端的IP地址
19、进行访问控制,可以以要求输入密码来访问资源一旦Web服务器识别出了资源,就执行请求方法中描绘的动作,并返回响应报文。响应报文中包含有响应状态码、响应首部,假如生成了响应主体的话,还包括响应主体假如事务处理产生了响应主体,就将内容放在响应报文中回送过去。假如有响应主体的话,响应报文中通常包括:描绘了响应主体MIME类型的Content-Type首部;描绘了响应主体长度的Content-Length首部;实际报文的主体内容【MIME类型】Web服务器要负责确定响应主体的MIME类型。有很多配置服务器的方法能够将MIME类型与资源关联起来Web服务器能够用文件的扩展名来讲明MIME类型。Web服务器
20、会为每个资源扫描一个包含了所有扩展名的MIME类型的文件,以确定其MIME类型。这种基于扩展名的类型相关是最常见的a、魔法分类(Magictyping)ApacheWeb服务器能够扫描每个资源的内容,并将其与一个已知形式表(被称为魔法文件)进行匹配,以决定每个文件的MIME类型。这样做可能比拟慢,但很方便,尤其是文件没有标准扩展名的时候b、显式分类(Explicittyping)对Web服务器进行配置,使其不考虑文件的扩展名或内容,强迫特定文件或目录内容拥有某个MIME类型c、类型协商有些Web服务器经过配置,能够以多种文档格式来存储资源。在这种情况下,能够配置Web服务器,使其能够通过与用户
21、的协商来决定使用哪种格式(及相关的MIME类型)最好还能够通过配置Web服务器,将特定的文件与MIME类型相关联【重定向】Web服务器有时会返回重定向响应而不是成功的报文。Web服务器将阅读器重定向到其他地方来执行请求。重定向响应由返回码3XX讲明。Location响应首部包含了内容的新地址或优选地址的URI。重定向用于下列情况a、永久删除的资源资源可能已经被移动到了新的位置,或者被重新命名,有了一个新的URL。Web服务器能够告诉客户端资源已经被重命名了,这样客户端就能够在从新地址获取资源之前,更新书签之类的信息了。状态码301MovedPermanently就用于此类重定向b、临时搬离的资
22、源假如资源被临时移走或重命名了,服务器可能希望将客户端重定向到新的位置上去。但由于重命名是临时的,所以服务器希望客户端将来还能够回头去使用老的URL,不要对书签进行更新。状态码303SeeOther以及状态码307TemporaryRedirect就用于此类重定向c、URL加强服务器通常用重定向来重写URL,往往用于嵌入上下文。当请求到达时,服务器会生成一个新的包含了嵌入式状态信息的URL,并将用户重定向到这个新的URL上去。客户端会跟随这个重定向信息,重新发起请求,但这次的请求会包含完好的、经过状态加强的URL。这是在事务间维护状态的一种有效方式。状态码303SeeOther和307Temp
23、oraryRedirect用于此类重定向 注意有时会将这些经过扩展和状态加强的URL称为胖URLd、负载平衡假如一个超载的服务器收到一条请求,服务器能够将客户端重定向到一个负载不太重的服务器上去。状态码303SeeOther和307TemporaryRedirect可用于此类重定向e、服务器关联Web服务器上可能会有某些用户的本地信息,服务器能够将客户端重定向到包含了那个客户端信息的服务器上去。状态码303SeeOther和307TemporaryRedirect可用于此类重定向f、规范目录名称客户端请求的URI是一个不带尾部斜线的目录名时,大多数Web服务器都会将客户端重定向到一个加了斜线的URI上,这样相对链接就能够正常工作了Web服务器通过连接发送数据时也会面临与接收数据一样的问题。服务器可能有很多条到各个客户端的连接,有些是空闲的,有些在向服务器发送数据,还有一些在向客户端回送响应数据服务器要记录连接的状态,还要十分注意对持久连接的处理。对非持久连接而言,服务器应该在发送了整条报文之后,关闭本人这一端的连接。对持久连接来讲,连接可能仍保持打开状态,在这种情况下,服务器要十分小心,要正确地计算Content-Length首部,不然客户端就无法知道响应什么时候结束最后,当事务结束时,Web服务器会在日志文件中添加一个条目,来描绘已执行的事务
限制150内