网络程序设计-复习.ppt
1,第1章 网络编程基础,2,1.1.1 网络编程与进程通信1进程与线程的基本概念 进程是处于运行过程中的程序实例,是操作系统调度和分配资源的基本单位。一个进程实体由三部分构成。程序代码:规定进程所做的计算。数据:计算的对象。进程控制块:是操作系统为了控制进程建立的数据结构,用来管理进程的内核对象,系统用来存放关于进程的统计信息。,1.1,网络编程相关的基本概念,3,操作系统给进程分配内存空间:静态分配空间:用来装入进程所有的可执行模块或动态链接库模块的代码及数据。动态分配空间:栈区空间和堆区空间。各种计算机应用程序在运行时,都以进程的形式存在,网络应用程序也不例外。Windows系统不但支持多进程,还支持多线程。进程是分配资源的单位;线程是执行和调度的单位由线程负责执行包含在进程的地址空间中的代码.,1进程与线程的基本概念,4,一个进程可以包含若干个线程,同时执行进程地址空间中的代码。当创建一个进程时,系统会自动创建它的第一个线程,称为主线程。然后,该线程可以创建其他的线程,而这些线程又能创建更多的线程。每个线程拥有自己的一组CPU寄存器和堆栈。进程至少拥有一个线程,否则将被撤销。Windows 2000能在有多个CPU的计算机上运行,每个CPU上运行不同的线程,达到多线程同时运行。,1进程与线程的基本概念,5,1进程与线程的基本概念,图1.1 单CPU分时地运行进程中的各个线程,6,从计算机网络体系结构的角度来看,网络应用进程处于网络层次结构的最上层。从功能上,可以将网络应用程序分为两部分:一部分是专门负责网络通信的模块,它们与网络协议栈相连接,借助网络协议栈提供的服务完成网络上数据信息的交换。另一部分是面向用户或者作其他处理的模块,它们接收用户的命令,或者对借助网络传输过来的数据进行加工。这两部分模块相互配合,来实现网络应用程序的功能。,2网络应用进程在网络体系结构中的位置,7,图1.2 网络应用程序在网络体系结构中的位置,2网络应用进程在网络体系结构中的位置,8,网络应用程序这两部分的关系:通信模块,是网络分布式应用的基础;其他模块,对网络交换的数据进行加工处理。网络应用程序要实现网络资源的共享,共享的基础就是必须能够通过网络轻松地传递各种信息。网络编程首先要解决网间进程通信的问题,然后才能在通信的基础上开发各种应用功能。,2网络应用进程在网络体系结构中的位置,9,3实现网间进程通信必须解决的问题 网间进程通信是指网络中不同主机中的应用进程之间的相互通信问题,必须解决以下问题:网间进程的标识问题(不能只用进程号标识);如何与网络协议栈连接的问题(通过定义套接字网络编程接口来解决);多重协议的识别问题(不同协议工作方式不同);不同通信服务的问题(要求不同,如文件传输要求可靠、无差错、无乱序、无丢失,网络聊天要求不高,可选TCP和UDP服务)。,10,1.1.2 因特网中网间进程的标识,1传输层在网络通信中的地位,TCP/IP协议栈的特点是“两头大、中间小”应用层有多个应用进程,使用不同应用层协议;网络接口层,有多种数据链路层协议,支持不同的物理网络连接;网络层有IP协议,传输层有TCP和UDP协议。按照OSI七层协议的描述,传输层与网络层在功能上的最大区别,是传输层提供进程通信的能力。TCP/IP协议提出了传输层协议端口(简称端口)的概念,成功地解决了通信进程的标识问题。,11,1.1.2 因特网中网间进程的标识,1传输层在网络通信中的地位 传输层是计算机网络中,通信主机内部进行独立操作的第一层,是支持端到端的进程通信的关键的一层。,图1.3 基于TCP/IP协议栈的进程间的通信,12,2端口的概念,端口是TCP/IP协议族中,应用层进程与传输层协议实体间的通信接口在OSI七层协议描述中,将其称为应用层进程与传输层协议实体间的服务访问点(SAP)。应用层进程通过系统调用与某个传输层端口进行绑定,然后通过该端口接收或发送数据。类似于文件描述符,每个端口都拥有一个叫作端口号(port number)的16位整数型标识符。可以用端口标识通信的网络应用程序。,13,2端口的概念,图1.4 UDP与TCP的报文格式,传输层TCP和UDP两个协议是完全独立的软件模块,因此各自的端口号也独立。使用时必须说明是UDP端口还是TCP端口,两种协议的端口间没有任何联系。TCP 和UDP都可以提供65536个端口。端口是操作系统可分配的一种资源。,14,从实现的角度讲,端口是一种抽象的软件机 制,包括一些数据结构和I/O缓冲区。进程通过系统调用与某端口建立绑定关系后,传输层传给该端口的数据都被相应进程接收,相应进程发给传输层的数据都通过该端口输出。在TCP/IP实现中端口操作类似于一般的I/O操作。进程获取一个端口,相当于获取本地唯一的I/O文件,可以用一般的读写原语访问。,2端口的概念,15,3端口号的分配机制网络进程通信前必须获知对方的进程地址。由于网络应用程序大多采用C/S模式开发,通信总是由客户机发起,因此事先只需让客户机知道服务器进程的端口号即可。Internet中众所周知的服务是有限的。TCP/IP协议采用了全局分配(静态分配)和本地分配(动态分配)相结合的分配方法。对于TCP,或者UDP,将它们的全部65536个端口号分为保留端口号和自由端口号两部分。,16,保留端口号:范围是0-1023,又称为众所周知的端口或熟知端口(well-known port),只占少数,采用全局分配或集中控制的方式,由一个公认的中央机构根据需要进行统一分配,静态地分配给因特网上著名的众所周知的服务器进程,并将结果公布于众。,3端口号的分配机制,表1.1 一些典型的应用层协议分配到的保留端口,17,自由端口号:范围是1024-65535,采用本地分配,又称为动态分配的方法。TCP或UDP端口的分配规则是:端口0:不使用,或者作为特殊的用途;端口1-255:保留给特定的服务,TCP和UDP均规定,小于256的端口号才能分配给网上著名的服务;端口256-1023:保留给其他的服务,如路由;端口1024-4999:可以用作任意客户机的端口;端口5000-65535:可以用作用户的服务器端口。,3端口号的分配机制,18,3端口号的分配机制,我们可以描述一下,在这样的端口分配机制下,客户机进程C与服务器进程S第一次通信的情景。,图1.5 客户机与服务器的第一次通信,19,为确保服务器进程为多个客户机进程服务,服务器的保留端口是专门用来监听客户端的连接请求的。当服务器从保留端口接收到一个客户机的请求后,立即创建另外一个线程,并为这个线程分配一个自由端口(在500065535选择分配),然后继续接收新的客户机请求。,3端口号的分配机制,20,4进程的网络地址的概念 在因特网中,用一个三元组可以在全局中唯一地标识一个应用层进程:应用层进程地址=(传输层协议,主机的IP地址,传输层的端口号)这样一个三元组,叫做一个半相关(half-association),它标识了因特网中进程间通信的一个端点,也把它称为进程的网络地址。,21,5网络中进程通信的标识 一个完整的网间通信需要一个五元组在全局中唯一地来标识:(传输层协议,本地机IP地址,本地机传输层端口,远地机IP地址,远地机传输层端口)这个五元组称为一个全相关(association),即两个协议相同的半相关才能组合成一个合适的全相关,或完全指定一对网间通信的进程。,22,1.1.3 网络协议的特征,1面向连接的服务和无连接的服务协议可以提供面向连接的服务,或者提供无连接的服务。面向连接服务是电话系统服务模式的抽象,即每一次完整的数据传输都要经过建立连接,使用连接,终止连接的过程。传输过程中数据分组不携带目的地址;TCP提供面向连接的虚电路服务,建立连接时确定通信路径,并经过协商做好通信准备。连接需要很多开销,如差错控制和流量控制。,23,无连接服务,是邮政系统服务的抽象,每个分组都携带完整的目的地址,各分组在系统中独立传送。不能保证分组按序到达,不能进行分组出错的恢复与重传,不能保证传输的可靠性。通信前不需建立连接,不管接收端是否做好准备接收数据。UDP是无连接协议。,1面向连接的服务和无连接的服务,24,2面向消息的协议与基于流的协议(1)面向消息的协议 面向消息的协议以消息为单位在网上传送数据,在发送端,消息一条一条地发送,在接收端,也只能一条一条地接收,每一条消息是独立的,消息之间存在着边界。,保护消息边界:是指传输协议把数据当作一条独立的消息在网上传输,接收端只能接收独立的消息,即接收端一次只能接收发送端发出的一个数据包。,25,图1.6 保护消息边界的数据报传输服务,UDP就是面向消息的,适合于交换结构化数据。,(1)面向消息的协议,26,(2)基于流的协议,基于流的协议不保护消息边界,将数据当作字节流连续地传输,不管实际消息边界是否存在。,发送端允许系统将原始消息分解成几条小消息分别发送,或把几条消息积累在一起形成大数据包发送,多次发送的数据统一编号。如果发送端连续发送数据,接收端有可能在一次接收动作中接收两个或更多的数据包。只要数据一到达,网络堆栈就开始读取并将其缓存,等待进程处理。,27,(2)基于流的协议,图1.7 无消息边界的流传输服务,TCP是基于流的协议。流传输,把数据当作一串数据流,不认为数据是一个一个的消息,编程时不要忽略这一点。,28,1.1.4 高效的用户数据报协议UDP,用户数据报协议(User Datagram Protocol,UDP),是一种尽力传送的、无连接的、不保障可靠的传输服务,是一种保护消息边界的数据传输。基于UDP的应用程序在高可靠性、低延迟的网络中运行良好;在网络层的基础上只增加了端口号的支持;传输效率高,适用于交易型的应用程序,如TFTP、SNMP、DNS等应用进程。,29,1.1.5 可靠的传输控制协议TCP,1可靠性是很多应用的基础 2TCP为应用层提供的服务 传输控制协议TCP(Transmission Control Protocol,TCP)为应用层进程提供一个面向连接的、端到端的、完全可靠的(无差错、无丢失、无重复或失序)全双工的流传输服务。,IP为TCP提供的是无连接的、尽力传送的、不可靠的传输服务,TCP为了向应用层进程提供可靠的传输服务,采取了一系列保障机制。TCP提供流传输服务,对传输数据的内部结构一无所知,只负责将字节流原封不动的传送到对方的应用进程。,30,3TCP利用IP数据报实现了端对端的传输服务TCP被称作一种端对端(end to end)协议,因为它提供一个直接从一台计算机上的应用进程到另一远程计算机上的应用进程的连接。应用进程能请求TCP构造一个连接,通过这个连 接发送和接收数据,以及关闭连接。由TCP提供的连接叫做虚连接,虚连接是由软件实现的。事实上,底层的因特网系统并不对连接提供硬件或软件支持,只是两台机器上的TCP软件模块通过交换消息来实现连接的虚拟。,31,图1.8 TCP是一个端到端的传输协议,3TCP利用IP数据报实现了端对端的传输服务,从TCP角度来看,整个Internet是一个通信系统,能够接收和传递消息,而不会改变和干预消息的内容。,32,4三次握手为确保连接的建立和终止都是可靠的,TCP使用三次握手(3-way handshake)的方式来建立连接.,图1.9 TCP的三次握手过程,33,已证明:三次握手是在包丢失、重复和延迟的情况下确保非模糊协定的充要条件。如图所示,前两个被称为SYN段。TCP会重发丢失的SYN段。三次握手确保TCP不会打开或关闭一个连接,直到两端达成一致。创建一个连接的三次握手中,要求每一端产生一个随机32位序列号。在计算机重启后,尝试建立一个新的TCP连接时,要选择一个新的随机数,可保证不受老连接的重复或延迟包的影响。,4三次握手,34,1.2.1 基于TCP/IP协议栈的网络编程,最基本的网络编程方式,主要是使用各种编程语言,利用操作系统提供的套接字网络编程接口,直接开发各种网络应用程序。本门课程主要讲解这种网络编程的相关技术。直接利用网络协议栈提供的服务来实现网络应用,层次比较低,编程者自由度比较大,在利用套接字实现了网络进程通信以后,可以编写各种网络应用程序。需掌握套接字网络编程接口及应用层协议。,35,1.2.2 基于WWW应用的网络编程,WWW称为万维网或Web,是因特网上最广泛的应用。基于WWW应用的网络编程技术,包括:所见即所得的静态网页制作;HTML、JavaScript等。动态服务器页面的制作。ASP、PHP、JSP、J2EE、Hibernate、Spring、Struts等技术。,36,本节着重于因特网上的高级服务,以及提供这些服务的应用软件。讨论网络应用软件的客户机服务器交互模式,并说明网络协议操作的方式为什么需要这种模式。这是构筑所有网络应用的基础。,37,1.3.2 客户机服务器模式,网络应用进程通信时,普遍采用客户机服务器交互模式(client-server paradigm of interaction),简称C/S模式.这是因特网上应用程序最常用的通信模式。C/S模式的建立基于以下两点:客户机与服务器之间的关系是非对等的,服务器提供资源,客户机请求共享这些资源;网间进程通信是完全异步的,互相通信的进程间既不存在父子关系,又没有共享内存缓冲区,需要一种机制为二者间的数据交换提供同步.,38,1、服务器的工作过程C/S模式过程中服务器处于被动服务的地位。服务器要先启动,并根据客户机请求提供相应服务:打开一通信通道,并告知服务器所在的主机,并愿意在某一公认的地址上(熟知端口,如FTP为21)接收客户机请求。等待客户机的请求到达该端口。服务器接收到服务请求,处理该请求并发送应答信号。为了能并发地接收多个客户机的服务请求,要激活一个新进程或新线程来处理这个客户机请求(如UNIX系统中用fork、exec)。服务完成后,关闭此新进程与客户机的通信链路并终止.返回第二步,等待并处理另一客户请求。在特定的情况下,关闭服务器。,39,2、客户机的工作过程客户机采取的是主动请求方式:打开一通信通道,并连接到服务器所在主机的特定监听端口。向服务器发送请求报文,等待并接收应答;继续提出请求,与服务器的会话按照应用协议进行。请求结束后,关闭通信通道并终止。,40,1.3.2 客户机服务器模式,表1.2 一些常见的网络应用,41,1.3.3 客户机与服务器的特性,客户机软件的特点服务器软件的特点基于因特网的C/S模式的应用程序的特点,42,1.3.3 客户机与服务器的特性,1客户机软件特点在进行网络通信时临时成为客户机,但它也可在本地进行其他的计算。被用户调用,只为一个会话运行。在打算通信时主动向远地服务器发起通信。能访问所需的多种服务,但在某一时刻只能与一个远程服务器进行主动通信。主动地启动与服务器的通信。在用户的计算机上运行,不需要特殊的硬件和很复杂的操作系统。,43,2服务器软件的特点是一种专门用来提供某种服务的程序,可同时处理多个远端客户机的请求。当系统启动时即自动调用,并且连续运行着,不断地为多个会话服务。接受来自任何客户机的通信请求,但只提供一种服务。被动地等待并接受来自多个远端客户机的通信请求。在共享计算机上运行,一般需要强大的硬件和高级的操作系统支持。,1.3.3 客户机与服务器的特性,44,3基于因特网的C/S模式的应用程序的特点客户机和服务器都是软件进程,C/S模式是网络上通过进程通信建立分布式应用的常用模型。非对称性:服务器通过网络提供服务,客户机通过网络使用服务,这种不对称性体现在软件结构和工作过程上。对等性:客户机和服务器必有一套共识的约定,必与某种应用层协议相联,并且协议必须在通信的两端实现。比如浏览器和3W服务器就都基于HTTP超文本传输协议。,1.3.3 客户机与服务器的特性,45,服务器的被动性:服务器必须先行启动,时刻监听,日夜值守,及时服务,只要有客户机请求,就立即处理并响应,回传信息,但决不主动提供服务。客户机的主动性:客户机可以随时提出请求,通过网络得到服务,也可以关机走人,一次请求与服务的过程是由客户机首先激发的。一对多:一个服务器可以为多个客户机服务,客户机也可以打开多个窗口,连接多个服务器。分布性与共享性:资源在服务器端组织与存储,通过网络为分散的多个客户机使用。,1.3.3 客户机与服务器的特性,3基于因特网的C/S模式的应用程序的特点,46,1.3.4 容易混淆的术语,1服务器程序与服务器类计算机服务器(server)这个术语来指那些运行着的服务器程序。服务器类计算机(server-class computer)这一术语来称呼那些运行服务器软件的强大的计算机。,47,图1.10 用户和客户机、服务器和服务器类计算机,2客户机与用户“客户机”(client)和服务器都指的是应用进程,即计算机软件。“用户”(user)指的是使用计算机的人。,1.3.4 容易混淆的术语,48,1.3.5 客户机与服务器的通信过程,客户机与服务器的通信过程一般是这样的:通信之前,服务器应先行启动,并通知它的下层协议栈做好接收客户机请求的准备,然后被动地等待客户机的通信请求,称服务器处于监听状态。一般是先由客户机向服务器发送请求,服务器向客户机返回应答。客户机随时可以主动启动通信,向服务器发出连接请求,服务器接收这个请求,建立了二者的通信关系。客户机与服务器的通信关系一旦建立,客户机和服务器都可发送和接收信息。信息在客户机与服务器之间可以沿任一方向或两个方向传递。在某些情况下,客户机向服务器发送一系列请求,服务器相应地返回一系列应答。,49,1.3.6 网络协议与C/S模式的关系,客户机与服务器作为两个软件实体,它们之间的通信是虚拟的,是概念上的,实际的通信要借助下层的网络协议栈来进行。网络应用进程与应用层协议间的关系:为了解决具体应用问题而彼此通信的进程,称为网络应用进程;应用层协议并不解决任何具体问题,而是规定了网络应用进程通信时必须遵守的约定。应用层协议在网络应用进程之下,并为网络应用进程服务,帮助应用进程组织数据。,50,1.3.7 错综复杂的C/S交互,在C/S模式中,存在着三种一个与多个的关系:一个服务器同时为多个客户机服务;一个用户的计算机上同时运行多个连接不同服务器的客户机;一个服务器类的计算机同时运行多个服务器。,51,图1.11 一台计算机中的多个服务器被多个计算机的客户机访问,1.3.7 错综复杂的C/S交互,52,1.3.8 服务器如何同时为多个客户机服务,并发性是客户机服务器交互模式的基础,并发允许多个客户机获得同一种服务,而不必等待服务器完成对上一个请求的处理。这样才能很好地同时为多个客户机提供服务。在设计并发服务器时,可以让主服务器线程为每个客户机请求创建一个新的子服务线程。一般服务器程序代码由两部分组成,第一部分代码负责监听并接收客户请求,还为客户机请求创建新的服务线程;另一部分代码负责处理单个客户机请求,如与客户机交换数据,并提供具体的服务。,53,1.3.8 服务器如何同时为多个客户机服务,图1.12 服务器创建多个线程来为多个客户机服务,54,1.3.9 标识一个特定服务,在一台服务器类的计算机中可以并发地运行多个服务器进程。它们都要借助协议栈来交换信息,协议栈就是多个服务器进程传输数据的公用通道,这有了一个问题,既然在一个服务器类计算机中运行着多个服务器,如何能让客户机无二义性地指明所希望的服务?,55,图1.13 沙漏计时器形状的TCP/IP协议族,1.3.9 标识一个特定服务,56,这个问题由传输协议栈提供的一套机制来解决。这种机制必须赋给每个服务一个唯一的标识,并要求服务器和客户机都使用这个标识。当服务器开始执行时,它在本地的协议栈软件中登记,指明它所提供的服务的标识。当客户机与远程服务器通信时,客户机在提出请求时,通过这个标识来指定所希望的服务。客户机端机器的传输协议栈软件将该标识传给服务器端机器。服务器端机器的传输协议栈则根据该标识来决定由哪个服务器程序来处理这个请求。,1.3.9 标识一个特定服务,57,随着应用规模的不断扩大,软件复杂度不断提高,面对巨大的用户群,单服务器成了性能的瓶颈,为了解决这些问题,就出现了P2P技术。,1.4.1 P2P的定义和特征,P2P技术就是一种在计算机之间直接进行资源和服务的共享,不需要服务器介入的网络技术。在P2P网络中,每台计算机同时充当着Server和Client的角色,当需要其他电脑的文件和服务时,两台电脑直接建立连接,本机是Client;而当响应其他电脑的资源要求时,本机又成为提供资源与服务的Server。,58,第2章 UNIX中的套接字网络编程接口,59,2.1.3 套接字编程接口的两种实现方式采用两种实现套接字编程接口的方式:在操作系统的内核中增加相应的软件来实现;通过开发操作系统之外的函数库来实现。在BSD UNIX及起源于它的操作系统中,套接字函数是操作系统本身的功能调用,是操作系统内核的一部分。其他操作系统供应商为了不修改基本操作系统,开发了套接字库(Socket Library)来提供套接字编程接口。套接字库中的每个过程具有与UNIX套接字函数相同的名字与参数,向没有本机套接字的操作系统上的应用程序提供套接字编程接口。,60,2.2.1 什么是套接字(SOCKET),图2.1 电插座与电话插座的作用,套接口是对网络中不同主机上应用进程之间进行双向通信的端点的抽象。一个套接口就是网络上进程通信的一端,提供了应用层进程利用网络协议栈交换数据的机制。,61,图2.2 应用进程、套接口、网络协议栈及操作系统的关系,2.2.1 什么是套接字(SOCKET),两个应用进程只要分别连接到自己的套接字,就可以通过网络进行通信了,不用去管复杂的网络结构及数据传输过程。,62,从多个层面来理解套接字这个概念的内涵从所处的地位来讲,套接字上连应用进程,下连网络协议栈,是应用程序通过网络协议栈进行通信的接口,是应用程序与网络协议栈交互的接口.从实现的角度来讲,非常复杂。套接字是一个复杂的软件机构,包含了一定的数据结构,包含许多选项,由操作系统内核管理。从使用的角度来讲,非常简单。对套接字的操作形成了一种网络应用程序的编程接口(API),提供了一组系统调用或库函数,可以用于构造套接字、安装绑定套接字、连接套接字、通过套接字交换数据、关闭套接字,实现各种分布式应用。套接字编程接口是一套操作套接字的编程接口函数,套接字是它的操作对象。,63,2.2.2 套接字的特点1通信域通信域:是一个计算机网络的范围,在这个范围中,所有的计算机使用同一种网络体系结构及协议栈。套接字存在于通信域中。套接字通常只和同一域中的套接字交换数据。如果数据交换要穿越域的边界,就一定要执行某种解释程序。这里,仅仅针对Internet域,并且使用Internet协议族(即TCP/IP协议族)来通信。,64,2套接字的三种类型每一个正被使用的套接字都有它确定的类型。只有相同类型的套接字才能相互通信。(1)数据报套接字(Datagram SOCKET)数据报套接字提供无连接的、不保证可靠的、独立的数据报传输服务。在Internet通信域中,数据报套接字使用UDP数据报协议形成的进程间通路,具有UDP协议为上层所提供的服务的所有特点。具有多播通信的能力。,65,图2.3 在Internet通信域中,数据报套接字基于UDP协议,(1)数据报套接字,66,流式套接字提供双向的、有序的、无重复的、无记录边界的可靠的数据流传输服务。在Internet通信域中,流式套接字使用TCP协议形成的进程间通路,具有TCP协议为上层所提供的服务的所有特点。在使用流式套接字传输数据之前,必须在数据的发送端和接收端之间建立连接。一般用于交换大批量的数据,或者要求数据按照发送的顺序无重复的到达目的地。,(2)流式套接字(Stream SOCKET),67,图2.4 在Internet通信域中,流式套接字基于TCP协议,(2)流式套接字(Stream SOCKET),68,(3)原始式套接字(RAW SOCKET)原始式套接字允许对较低层次的协议(如IP、ICMP)直接访问,用于检验新协议的实现。原始套接字保存了数据包中的完整IP头;前面两种套接字只能收到用户数据;因此可以通过原始套接字对数据进行分析。,69,3套接字的创建 套接字由应用层的通信进程创建,并为其服务。每一个套接字都有一个相关的应用进程,操作该套接字的代码是该进程的组成部分。4使用确定的IP地址和传输层端口号在生成套接字的描述符后,要将套接字与计算机上的特定的IP地址和传输层端口号相关联,这个过程称为绑定。一个套接口要使用一个确定的三元组网络地址信息,才能使它在网络中唯一地被标识。,70,1表示套接字地址的三种结构在套接字编程接口中,定义了三种结构型的数据类型,用来存储协议相关的网络地址,在套接字编程接口的函数调用中要用到它们。(1)通用套接字地址结构sockaddr 针对各种通信域的套接字,用来表示地址的一般格式,然后要求每个协议族说明其协议地址如何具体使用这个一般格式的,在头文件中定义。struct sockaddr uint8_tsa_len;/地址总长sa_familiy_t sa_family;/地址家族charsa_data14;/特定的协议地址,2.2.4 套接字使用的数据类型及相关问题,71,套接字函数被定义为以指向某个通用套接字地址结构的一个指针作为参数,如bind函数的ANSI C函数原型所示:int bind(int,struct sockaddr*,socklen_t),(1)通用套接字地址结构sockaddr,要求对套接字函数的调用都必须将指向特定协议的套接字地址结构的指针进行类型强制转换,变成指向某个通用套接字地址结构的指针,例如:struct sockaddr_in serv;bind(sockfd,(struct sockaddr*),通用套接字地址结构的唯一用途就是对指向特定协议的套接字地址结构的指针执行类型强制转换。,72,(2)in_addr结构,专门用来存储IP地址。struct in_addr in_addr_t s_addr;,s_addr 是网络字节顺序的32位IPv4地址,in_addr_t一般为uint32_t,即32位无符号整数类型。,73,(3)IPV4套接字地址结构sockaddr_in 也称为“网际套接字地址结构”,存储套接字相关的网络地址信息,定义在头文件中。struct sockaddr_in uint8_t sin_len;/地址长度(无符号的8位整数)sa_family_t sin_family;/地址家族,设定为AF_INET in_port_t sin_port;/端口号(uint16_t)struct in_addr sin_addr;/IP 地址(uint32_t)char sin_zero8;/全为0,未用,在支持长度字段的实现中,sa_family_t 通常是8位的无符号整数类型,而在不支持长度字段的实现中,sa_family_t 通常是16位的无符号整数类型。,74,(4)套接字地址结构的一般用法首先,定义一个sockaddr_in的结构实例,并将它清零。struct sockaddr_in client;memset(,75,2本机字节顺序和网络字节顺序,小端字节序(little-endian):将低序字节存储在起始地址;大端字节序(little-endian):将高序字节存储在起始地址;本机字节顺序(host byte order):在具体计算机中的多字节数据的存储顺序。网络字节顺序(network byte order):多字节数据在网络协议报头中的存储顺序。,(1)基本概念,76,2本机字节顺序和网络字节顺序网络应用程序要在不同的计算机中运行,本机字节顺序是不同的,但网络字节顺序是一定的。所以,在应用程序编程的时候,在把IP地址和端口号装入套接字时,应当把它们从本机字节顺序转换为网络字节顺序;相反,在本机输出时,应将它们从网络字节顺序转换为本机字节顺序。,(1)基本概念,77,#include uint16_t htons(uint16_t host16bitvalue);uint32_t htonl(uint32_t host16bitvalue);uint16_t ntohs(uint16_t net16bitvalue);uint32_t ntohl(uint32_t net32bitvalue);htons():将短整数本机字节顺序转换为网络字节顺序,用于端口号。htonl():将长整数本机顺序转换为网络顺序,用于IP地址。,ntohs():将短整数网络字节顺序转换为本机字节顺序,用于端口号。ntohl():长整数网络字节顺序转化为本机字节顺序,用于IP地址。,(2)字节顺序的转换函数,2本机字节顺序和网络字节顺序,这四个函数将被转换的数值作为函数的参数,函数返回值是转换后的结果。,78,3点分十进制的IP地址的转换,在因特网中,IP地址常常用点分十进制的表示方法,但在套接字中,IP地址是无符号的长整型数,套接字编程接口设置了两个函数,专门用于两种形式的IP地址的转换。,79,unsigned long inet-addr(const char*cp)入口参数cp:点分十进制形式的IP地址。返回值:网络字节顺序的IP地址,是无符号的长整数。,char*inet_ntoa(struct in_addr in)入口参数in:包含长整型IP地址的in_addr结构变量,返回值:指向点分十进制IP地址的字符串的指针。,(2)inet_ntoa函数,(1)inet-addr函数,3点分十进制的IP地址的转换,80,4域名服务通常,我们使用域名来标识站点,可以将文字型的主机域名直接转换成IP地址。struct hostent*gethostbyname(const char*name);入口参数:是站点的主机域名字符串;返回值:是指向hostent 结构的指针。hostent结构包含主机名、主机别名数组、返回地址的类型(一般是AF-INET)、地址长度的字节数、已符合网络字节顺序的主机网络地址等。,81,2.3.1 套接字的工作过程面向连接的通信方式基于TCP,必须借助流式套接字来编程,应用程序分为服务器端和客户机端,双方是不对称的,需要分别编程。双方首先要创建并安装套接字,做好准备;建立连接,采用三次握手的方式;数据交换,称为客户机与服务器的会话期,会话的内容必须遵守一定的格式和顺序;释放连接。下面介绍面向连接的服务器和客户机的编程步骤.,2.3 面向连接的套接字编程,82,2.3.1 套接字的工作过程,图2.5 面向连接的流式套接字编程的基本编程步骤,83,2.3.2 UNIX套接字编程接口的系统调用1创建套接字SOCKET()创建一个套接字,并返回一个整型描述符:int SOCKET(int Protofamily,int Type,int Protocol);入口参数:Protofamily:套接字使用的协议族,例如,AF_INET表示IPv4 协议,AF_INET6表示IPv6协议,AF_LOCAL表示Unix域协议。type:套接字类型,SOCK_STREAM表示创建面向连接的流传输的流式套接字;SOCK_DGRAM表示创建无连接的面向消息的数据报套接字,SOCK_RAW表示创建原始套接字。protocol:套接字使用的传输层网络协议,IPPROTO_TCP 表示使用TCP协议,IPPROTO_UDP表示使用UDP协议。在Internet 通信域中,取值为0,以选择所给定的Protofamily和type组合的系统默认值。,84,返回值:套接字创建成功,返回一个非负整数值,与文件描述符类似,称为套接字描述符(socket descriptor),简称sockfd,指向被维护在操作系统内核里的socket数据结构。套接字创建出错,返回1,表示出错类型的代码保存在全局变量Errno中。举例:int sockfd=SOCKET(AF_INET,SOCK_STREAM,0)创建套接字时,为其分配了内存,并建立了相应的数据结构,用于指定连接的种类和使用的协议,同时还有关于连接队列操作的选项结构字段,创建时设置为默认值。,1创建套接字SOCKET(),85,2值-结果参数当往一个套接字函数传递一个套接字地址结构时,该结构总是以引用形式来传递,即传递的是指向该结构的一个指针。该结构的长度也作为一个参数来传递,不过传递方式取决于该结构的传递方向:是从进程到内核,还是从内核到进程。(1)从进程到内核传递套接字地址结构的函数有3个:bind、connect和sendto.这些函数的一个参数是指向某个套接字地址结构的指针,另一个参数是该结构的长度,例如:struct sockaddr_in serv;connect(sockfd,(struct sockaddr*),86,2值-结果参数,图2.6 从进程到内核传递套接字地址结构,既然指针和指针所指内容的大小都传递给了内核,因此内核知道到底需要从进程复制多少数据进来。,87,(2)从内核到进程传递套接字地址结构的函数有4个:accept、recvfrom、getsockname和getpeername.这些函数的一个参数是指向某个套接字地址结构的指针,另一个参数是指向表示该结构大小的整数变量的指针,例如:,2值-结果参数,struct sockaddr_in cliaddr;len=sizeof(cliaddr);accept(sockfd,(struct sockaddr*),88,把套接字地址结构的大小这个参数从一个整数改为指向某个整数变量的指针,其原因在于:当函数被调用时,结构大小是一个值(value),它告诉内核该结构的大小,这样内核在写结构时不至于越界;当函数返回时,结构大小又是一个结果(result),它告诉进程内核在该结构中究竟存储了多少信息,这种类型的参数称为值-结果参数。,2值-结果参数,图2.7 从内核到进程传递套接字地址结构,89,当使用值-结果参数作为套接字地址结构的长度时,如果套接字地址结构是固定长度,那么从内核返回的值总是那个固定长度,例如IPv4的sockaddr_in长度是16,IPv6的sockaddr_in6长度是28,然而对于可变长度的套接字地址结构(例如Unix域的sockaddr_un),返回值可能小于该结构的最大长度。,2值-结果参数,90,3绑定套接字到指定的地址 BIND()int BIND(int Sockfd,struct sockaddr*My_addr,int Addrlen);入口参数:Sockfd:是由SOCKET()系统调用创建的套接字描述符,要将其绑定到指定的网络地址上;My_addr:指向sockaddr结构变量的指针,所指结构中保存着特定的网络地址,要将套接字绑定到这个网络地址上;Addlen:是sockaddr结构的长度。,91,返回值:如果返回0,表示已经绑定成功。如果返回1,表示有错,出错码在Errno中。举例:Struct sockaddr_in my_addr;if(BIND(sockfd,(struct sockaddr*)&my_addr,sizeof(struct sockaddr_in)0)报错,并退出在服务器端,用作监听客户机端连接请求的套接字一定要绑定,因为大多数服务器进程使用熟知端口,并且服务器有时有多块网卡,会有多个IP地址。客户机一般不用绑定。,3绑定套接字到指定的地址 BIND(),92,服务器调用BIND,来说明它将用来接收通信的协议端口号,同时my_addr 结构中还包含记录IP地址的域,此时如果主机是多宿主机,则in_addr字段取值常量INADDR_ANY,允许服务器在该计算机的任何IP地址上使用一个指定的端口。,3绑定套接字到指定的地址 BI