了解WWW服务和HTTP协议.docx
《了解WWW服务和HTTP协议.docx》由会员分享,可在线阅读,更多相关《了解WWW服务和HTTP协议.docx(10页珍藏版)》请在三一办公上搜索。
1、了解WWW服务和HTTP协议历史上,先后问世了多个具有重大社会影响的电子通信技术。第一个这样的技术是19 世纪70年代发明的电话。电话使得不在同一物理位置的两人得以实时地口头交流。它对社 会有重大的影响有好的也有坏的。下一个电子通信技术是20世纪20年代及30年代问 世的广播收音机/电视机。广播收音机/电视机使得人们能收听收视大量的音频和视频信息。 它对社会同样有重大的影响一一有好的也有坏的。改变了人们的生活与工作方式的第三个重 大通信技术是web。web最吸引用户的也许是它的随选(on demand)操作性。用户只在想要时 收到所要的东西。这一点不同于广播收音机/电视机。广播收音机/电视机的
2、用户是在其内容 供应商播出内容期间被迫收听收视。除了随选操作性,Web还有许多大家喜爱的其他精彩 特性。任何个人都可以极其容易地在Web上公布任何信息;任何人都可能以极低的成本成为 发行人。超链接和搜索引擎帮助我们在Web站点的海洋中导航。图形和动画刺激着我们的 感官。表单、Java小应用程序、ActiveX控件以及其他许多设备使得我们能与Web页面和站 点交互。Web还越来越普遍地提供存放在因特网中的、可随选访问(即点播)的大量音频和视 频材料的菜单接口。HTTP概貌Web的应用层协议HTTP是Web的核心。HTTP在Web的客户程序和服务器程序中得 以实现。运行在不同端系统上的客户程序和服
3、务器程序通过交换HTTP消息彼此交流。HTTP 定义这些消息的结构以及客户和服务器如何交换这些消息。在详细解释HTTP之前,我们先 来回顾一些web中的术语。Web页面(webpage,也称为文档)由多个对象构成。对象(object)仅仅是可由单个URL 寻址的文件,例如HTML文件、JPG图像、GIF图像、JAVA小应用程序、语音片段等。大 多数Web页面由单个基本HIML文件和若干个所引用的对象构成。例如,如果一个Web页 面包含HTML文本和5个JPEG图像,那么它由6个对象构成,即基本H1ML文件加5个 图像。基本HTML文件使用相应的URL来引用本页面的其他对象。每个URL由存放该对
4、 象的服务器主机名和该对象的路径名两部分构成。例如,在如下的URL中:是一个主机名,/urlpath/picture.qif是一个路径名。浏览器是web的用户 代理,它显示所请求的Web页面,并提供大量的导航与配置特性Web浏览器还实现HTTP 的客户端,因此在web上下文中,我们会从进程意义上互换使用“浏览器”和“客户”两 词。流行的Web浏览器有Netscape Communicator,firefox和微软的IE等。Web服务器存放 可由URL寻址的Web对象。web服务器还实现HTTP的服务器端。流行的Web服务器有 Apache、微软的 IIS 以及 Netscape Enterpr
5、ise Servero Netcraft 提供了 web 服务器的概要剖析 Netcrft 2000 oHTTP定义Web客户(即浏览器)如何从web服务器请求Web页面,以及服务器如何把 Web页面传送给客户。下图展示了这种请求一响应行为。当用户请求一 个Web页面(譬如说 点击某个超链接)时,浏览器把请求该页面中各个对象的HTTP请求消息发送给服务器。服 务器收到请求后,以运送含有这些对象HTTP响应消息作为响应。到1997年底,基本上所 有的浏览器和Web服务器软件都实现了在RFC 1945中定义的HTTP/1.0版本。1998年初, 一些Web服务器软件和浏览器软件开始实现在RFC 2
6、616中定义的HTTP/1.1版本H1TP/1.1 与HTTP/1.0后向兼容;运行1.1版本的web服务器可以与运行1.0版本的浏览器“对话”,运 行1.1版本的浏览器也可以与运行1.0版本的Web服务器“对话”。feff Naviglor的Mae机图1 HTTP请求与响应行为HTTP/1.0和HTTP/1.1都把TCP作为底层的传输协议。HTTP客户首先发起建立与服务 器TCP连接。一旦建立连接,浏览器进程和服务器进程就可以通过各自的套接字来访问TCP。 如前所述,客户端套接字是客户进程和TCP连接之间的“门”,服务器端套接字是服务器进 程和同一 TCP连接之间的“门”。客户往自己的套接字
7、发送HTTP请求消息,也从自己的套 接字接收HTTP响应消息。类似地,服务器从自己的套接字接收HTTP请求消息,也往自己 的套接字发送HTTP响应消息。客户或服务器一旦把某个消息送入各自的套接字,这个消息 就完全落入TCP的控制之中。TCP给HTTP提供一个可靠的数据传输服务;这意味着由客户 发出的每个HTTP请求消息最终将无损地到达服务器,由服务器发出的每个HTTP响应消息 最终也将无损地到达客户。我们可从中看到分层网络体系结构的一个明显优势一一HTTP不 必担心数据会丢失,也无需关心TCP如何从数据的丢失和错序中恢复出来的细节。这些是 TCP和协议栈中更低协议层的任务。TCP还使用一个拥塞
8、控制机制。该机制迫使每个新的TCP连接一开始以相对缓慢的速 率传输数据,然而只要网络不拥塞,每个连接可以迅速上升到相对较高的速率。这个慢速传 输的初始阶段称为缓启动(slow start)。需要注意的是,在向客户发送所请求文件的同时,服务器并没有存储关于该客户的任何 状态信息。即便某个客户在几秒钟内再次请求同一个对象,服务器也不会响应说:自己刚刚 给它发送了这个对象。相反,服务器重新发送这个对象,因为它已经彻底忘记早先做过什么。 既然HTTP服务器不维护客户的状态信息,我们于是说HTTP是一个无状态的协议(stateless protocol) o非持久连接和持久连接HTTP既可以使用非持久连
9、接(nonpersistent connection),也可以使用持久连接(persistent connection)o HTTP/1.0使用非持久连接,HTTP/1.1默认使用持久连接。非持久连接让我们查看一下非持久连接情况下从服务器到客户传送一个Web页面的步骤。假设该贝面由1个基本HTML文件和10个JPEG图像构成,而且所有这些对象都存放在同一台服 务器主机中。再假设该基本HTML文件的URL为:下面是具体步骡:1. HTTP客户初始化一个与服务器主机中的HTTP服务器的TCP连接。 HTTP服务器使用默认端口号80监听来自HTTP客户的连接建立请求。2. HTTP客户经由与TCP连
10、接相关联的本地套接字发出一个HTTP请求消息。这个消息 中包含路径名 /somepath/index.html。3. HTTP服务器经由与TCP连接相关联的本地套接字接收这个请求消息,再从服务器主 机的内存或硬盘中取出对象/somepath/index.html,经由同一个套接字发出包含该对象的响应 消息。4. HTTP服务器告知TCP关闭这个TCP连接(不过TCP要到客户收到刚才这个响应消息 之后才会真正终止这个连接)。5. HTTP客户经由同一个套接字接收这个响应消息。TCP连接随后终止。该消息标明所 封装的对象是一个HTML文件。客户从中取出这个文件,加以分析后发现其中有10个JPEG
11、对象的引用。6. 给每一个引用到的JPEG对象重复步骡1-4。浏览器在接收web页面的同时把它显示给用户。不同的浏览器可能会以略有不同的方 式解释(也就是向用户显示)同一个web页面。HTTP与客户如何解释Web页面没有任何关系, 其规范(RFC 1945和RFC 2616I)仅仅定义HTTP客户程序和服务器程序之间的通信协议。上述步骤之所以称为使用非持久连接,原因是每次服务器发出一个对象后,相应的TCP 连接就被关闭,也就是说每个连接都没有持续到可用于传送其他对象。每个TCP连接只用 于传输一个请求消息和一个响应消息。就上述例子而言,用户每请求一次那个web页面, 就产生11个TCP连接。在
12、上述步骡中,我们有意不说清客户是通过10个串行的TCP连接先后取得所有JPEG 对象,还是通过并行的TCP连接同时取得其中某些JPEG对象。实际上,现今的浏览器允 许用户通过配置来控制并行连接的程度。大多数浏览器默认可以打开5到10个并行的TCP 连接,每个连接处理一个请求一响应事务。用户要是喜欢,可以把最大并行连接数设为l, 那样的话这10个连接是串行地建立的。我们将在第3章看到,使用并行连接可以缩短响应 时间。继续介绍之前,先估算一下从客户请求基本HTML文件到它收到该文件所经历的时间。 为此我们定义往返时间(round trip time,简称RTT),它是一个小分组从客户主机游动到服务
13、 器主机再返回客户主机所花的时间。RTT包括分组传播延迟、在中间路由器和交换机土的 分组排队延迟以及分组处理延迟。下面考虑用户点击某个超链接时会发生什么。用户的点击 导致浏览器发起建立一个与Web服务器的TCP连接;这里涉及一次“三次握手”过程一一 首先是客户向服务器发送一个小的冗余消息,接着是服务器向客户确认并响应以一个小的 TCP消息,最后是客户向服务器回确认。三次握手过程的前两次结束时,流逝的时间为1 个RTT。此时客户把HTTP请求消息发送到TCP连接中,客户接着把三次握手过程最后一 次中的确认捎带在包含这个消息的数据分节中发送以去。服务器收到来自TCP连接的请求 消息后,把相应的HT
14、ML文件发送到TCP连接中,服务器接着把对早先收到的客户请求的 确认捎带在包含该HTML文件的数据分节中发送出去。这个HTTP请求顺应交互也花去1 个RTT时间。因此,总的响应时间粗略地算是2个RTT加上服务器发送这个HTMI文件的 时间。持久连接非持久连接有些缺点。首先,客户得为每个待请求的对象建立并维护一个新的连接。对 于每个这样的连接,TCP得在客户端和服务器端分配TCP缓冲区,并维持TCP变量。对于 有可能同时为来自数百个不同客户的请求提供服务的web服务器来说,这会严重增加其负 担。其次,如前所述,每个对象都有2个RTT的响应延长一个RTT用于建立TCP连接, 另一个RTT用于请求和
15、接收对象。最后,每个对象都遭受TCP缓启动,因为每个TCP连接 都起始于缓启动阶段。不过并行TCP连接的使用能够部分减轻RTT延迟和缓启动延迟的影 响。在持久连接情况下,服务器在发出响应后让TCP连接继续打开着。同一对客户/服务器 之间的后续请求和响应可以通过这个连接发送。整个 Web页面(上例中为包含一个基本 HTMLL文件和10个图像的页面)自不用说可以通过单个持久TCP连接发送:甚至存放在同 一个服务器中的多个web页面也可以通过单个持久TCP连接发送。通常,HTTP服务器在 某个连接闲置一段特定时间后关闭它,而这段时间通常是可以配置的。持久连接分为不带流 水线(without pipe
16、lining)和带流水线(with pipelining )两个版本。如果是不带流水线的版本,那 么客户只在收到前一个请求的响应后才发出新的请求。这种情况下,web页面所引用的每个 对象(上例中的10个图像)都经历1个RTT的延迟,用于请求和接收该对象。与非持久连接 2个RTT的延迟相比,不带流水线的持久连接已有所改善,不过带流水线的持久连接还能 进一步降低响应延迟。不带流水线版本的另一个缺点是,服务器送出一个对象后开始等待下 一个请求,而这个新请求却不能马上到达。这段时间服务器资源便闲置了。HTTP/1.1的默认模式使用带流水线的持久连接。这种情况下,HTTP客户每碰到一个引 用就立即发出一
17、个请求,因而HTTP客户可以一个接一个紧挨着发出各个引用对象的请求。 服务器收到这些请求后,也可以一个接一个紧挨着发出各个对象。如果所有的请求和响应都 是紧挨着发送的,那么所有引用到的对象一共只经历1个RTT的延迟(而不是像不带流水线 的版本那样,每个引用到的对象都各有1个RTT的延迟)。另外,带流水线的持久连接中服 务器空等请求的时间比较少。与非持久连接相比,持久连接(不论是否带流水线)除降低了 1 个RTT的响应延迟外,缓启动延迟也比较小。其原因在于既然各个对象使用同一个TCP连 接,服务器发出第一个对象后就不必再以一开始的缓慢速率发送后续对象。相反,服务器可 以按照第一个对象发送完毕时的
18、速率开始发送下一个对象。HTTP消息格式HTTP规范1.0RPcl945和1.1RFC 2616定义了 HTTP消息的格式。HTTP消息分为请 求消息和响应稍息两类。下面我们分别进行介绍。HTTP请求消息下面是一个典型的HTTP请求消息:GET /somedir/page.html H7TP/1.1Host:Connection:closeUser-agent:Mozilla/4.0Accept-language:zh-cn(额外的回车符和换行符)仔细检查这个简单的请求消息,我们可从中学到不少东西。首先,这个消息是用普通的 ASCII文本书写的。其次,这个消息共有5行(每行以一个回车符和一个换
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 了解 WWW 服务 HTTP 协议
链接地址:https://www.31ppt.com/p-5004062.html