c语言SOCKET编程指南-.pdf
介绍Socket 编程让你沮丧吗?从man pages 中很难得到有用的信息吗?你想跟上时代去编Internet相关的程序,但是为你在调用connect()前的(bind)的结构而不知所措?等等 好在我已经将这些事完成了,我将和所有人共享我的知识了。如果你了解C 语言并想穿过网络编程的沼泽,那么你来对地方了。-读者对象这个文档是一个指南,而不是参考书。如果你刚开始socket 编程并想找一本入门书,那么你是我的读者。但这不是一本完全的socket 编程书。-平台和编译器这篇文档中的大多数代码都在Linux 平台 PC 上用GNU 的 gcc 成功编译过。而且它们在HPUX 平台 上用gcc 也成功编译过。但是注意,并不是每个代码片段都独立测试过。-目录:1)什么是套接字?2)Internet 套接字的两种类型3)网络理论4)结构体5)本机转换6)IP 地址和如何处理它们7)socket()函数8)bind()函数9)connect()函数10)listen()函数11)accept()函数12)send()和recv()函数13)sendto()和recvfrom()函数14)close()和shutdown()函数15)getpeername()函数16)gethostname()函数17)域名服务(DNS)18)客户-服务器背景知识19)简单的服务器20)简单的客户端21)数据报套接字Socket 22)阻塞23)select()-多路同步 I/O 24)参考资料-什么是socket?你经常听到人们谈论着“socket”,或许你还不知道它的确切含义。现在让我告诉你:它是使用标准 Unix 文件描述符(file descriptor)和其它程序通讯的方式。什么?你也许听到一些 Unix 高手(hacker)这样说过:“呀,Unix 中的一切就是文件!”那个家伙也许正在说到一个事实:Unix 程序在执行任何形式的I/O 的时候,程序是在读或者写一个文件描述符。一个文件描述符只是一个和打开的文件相关联的整数。但是(注意后面的话),这个文件可能是一个网络连接,FIFO,管道,终端,磁盘上的文件或者什么其它的东西。Unix 中所有的东西就是文件!所以,你想和Internet上别的程序通讯的时候,你将要使用到文件描述符。你必须理解刚才的话。现在你脑海中或许冒出这样的念头:“那么我从哪里得到网络通讯的文件描述符呢?”,这个问题无论如何我都要回答:你利用系统调用socket(),它返回套接字描述符(socket descriptor),然后你再通过它来进行send()和 recv()调用。“但是.”,你可能有很大的疑惑,“如果它是个文件描述符,那么为什么不用一般调用read()和write()来进行套接字通讯?”简单的答案是:“你可以使用!”。详细的答案是:“你可以,但是使用send()和recv()让你更好的控制数据传输。”存在这样一个情况:在我们的世界上,有很多种套接字。有DARPA Internet 地址(Internet 套接字),本地节点的路径名(Unix 套接字),CCITT X.25 地址(你可以将 X.25 套接字完全忽略)。也许在你的 Unix 机器上还有其它的。我们在这里只讲第一种:Internet 套接字。-Internet 套接字的两种类型什么意思?有两种类型的Internet 套接字?是的。不,我在撒谎。其实还有很多,但是我可不想吓着你。我们这里只讲两种。除了这些,我打算另外介绍的Raw Sockets 也是非常强大的,很值得查阅。那么这两种类型是什么呢?一种是Stream Sockets(流格式),另外一种是Datagram Sockets(数据 包 格式)。我们 以 后谈 到它 们 的时 候也 会用 到SOCK_STREAM 和SOCK_DGRAM。数据报套接字有时也叫“无连接套接字”(如果你确实要连接的时候可以用 connect()。)流式套接字是可靠的双向通讯的数据流。如果你向套接字按顺序输出“1,2”,那么它们将按顺序“1,2”到达另一边。它们是无错误的传递的,有自己的错误控制,在此不讨论。有什么在使用流式套接字?你可能听说过telnet,不是吗?它就使用流式套接字。你需要你所输入的字符按顺序到达,不是吗?同样,WWW 浏览器使用的HTTP 协议也使用它们来下载页面。实际上,当你通过端口80 telnet 到一个WWW 站点,然后输入“GET pagename”的时候,你也可以得到HTML 的内容。为什么流式套接字可以达到高质量的 数 据 传 输?这 是 因 为 它 使 用 了“传 输 控 制 协 议(The Transmission Control Protocol)”,也叫“TCP”(请参考 RFC-793 获得详细资料。)TCP 控制你的数据按顺序到达并且没有错误。你也许听到“TCP”是因为听到过“TCP/IP”。这里的 IP 是指“Internet 协议”(请参考RFC-791。)IP 只是处理Internet 路由而已。那么数据报套接字呢?为什么它叫无连接呢?为什么它是不可靠的呢?有这样的一些事实:如果你发送一个数据报,它可能会到达,它可能次序颠倒了。如果它到达,那么在这个包的内部是无错误的。数据报也使用IP 作路由,但是它不使用TCP。它使用“用户数据报协议(User Datagram Protocol)”,也叫“UDP”(请参考RFC-768。)为什么它们是无连接的呢?主要是因为它并不象流式套接字那样维持一个连接。你只要建立一个包,构造一个有目标信息的IP 头,然后发出去。无需连接。它们通常使用于传输包-包信息。简单的应用程序有:tftp,bootp等等。你也许会想:“假如数据丢失了这些程序如何正常工作?”我的朋友,每个程序在UDP 上有自己的协议。例如,tftp 协议每发出的一个被接受到包,收到者必须发回一个包来说“我收到了!”(一个“命令正确应答”也叫“ACK”包)。如果在一定时间内(例如 5秒),发送方没有收到应答,它将重新发送,直到得到ACK。这一 ACK过程在实现SOCK_DGRAM 应用程序的时候非常重要。-网络理论既 然 我 刚 才 提 到 了 协 议 层,那 么 现 在 是 讨 论 网 络 究 竟 如 何 工 作 和 一 些关 于SOCK_DGRAM 包是如何建立的例子。当然,你也可以跳过这一段,如果你认为已经熟悉的话。现在是学习数据封装(Data Encapsulation)的时候了!它非常非常重要。它重要性重要到你在网络课程学(图1:数据封装)习中无论如何也得也得掌握它。主要的内容是:一个包,先是被第一个协议(在这里是 TFTP)在它的报头(也许是报尾)包装(“封装”),然后,整个数据(包括TFTP 头)被另外一个协议(在这里是UDP)封装,然后下一个(IP),一直重复下去,直到硬件(物理)层(这里是以太网)。当另外一台机器接收到包,硬件先剥去以太网头,内核剥去IP和UDP 头,TFTP程序再剥去TFTP头,最后得到数据。现在我们终于讲到声名狼藉的网络分层模型(Layered Network Model)。这种网络模型在描述网络系统上相对其它模型有很多优点。例如,你可以写一个套接字程序而不用关心数据的物理传输(串行口,以太网,连接单元接口(AUI)还是其它介质),因为底层的程序会为你处理它们。实际 的网络硬件和拓扑对于程序员来说是透明的。不说其它废话了,我现在列出整个层次模型。如果你要参加网络考试,可一定要记住:应用层(Application)表示层(Presentation)会话层(Session)传输层(Transport)网络层(Network)数据链路层(Data Link)物理层(Physical)物理层是硬件(串口,以太网等等)。应用层是和硬件层相隔最远的-它 是用户和网络交互的地方。这个模型如此通用,如果你想,你可以把它作为修车指南。把它对应到 Unix,结果是:应用层(Application Layer)(telnet,ftp,等等)传输层(Host-to-Host Transport Layer)(TCP,UDP)Internet层(Internet Layer)(IP和路由)网络访问层(Network Access Layer)(网络层,数据链路层和物理层)现在,你可能看到这些层次如何协调来封装原始的数据了。看看建立一个简单的数据包有多少工作?哎呀,你将不得不使用cat 来建立数据包头!这仅仅是个玩笑。对于流式套接字你要作的是send()发 送数据。对于数据报式套接字,你按照你选择的方式封装数据然后使用sendto()。内核将为你建立传输层和Internet 层,硬件完成网络访问层。这就是现代科技。现在结束我们的网络理论速成班。哦,忘记告诉你关于路由的事情了。但是我不准备谈它,如果你真的关心,那么参考IP RFC。-结构体终于谈到编程了。在这章,我将谈到被套接字用到的各种数据类型。因为它们中的一些内容很重要了。首先是简单的一个:socket 描述符。它是下面的类型:int 仅仅是一个常见的int。从现在起,事情变得不可思议了,而你所需做的就是继续看下去。注意这样的事实:有两种字节排列顺序:重要的字节(有时叫octet,即八位位组)在前面,或者不重要的字节在前面。前一种叫“网络字节顺序(Network Byte Order)”。有些机器在内部是按照这个顺序储存数据,而另外一些则不然。当我说某数据必须按照NBO 顺序,那么你要调用函数(例如htons()来将它从本机字节顺序(Host Byte Order)转换过来。如果我没有提到NBO,那么就让它保持本机字节顺序。我的第一个结构(在这个技术手册TM 中)-struct sockaddr.。这个结构为许多类型的套接字储存套接字地址信息:struct sockaddr unsigned short sa_family;/*地址家族,AF_xxx*/char sa_data14;/*14字节协议地址*/;sa_family 能够是各种各样的类型,但是在这篇文章中都是AF_INET。sa_data 包含套接字中的目标地址和端口信息。这好像有点不明智。为了处理 struct sockaddr,程序员创造了一个并列的结构:struct sockaddr_in(in 代表 Internet。)struct sockaddr_in short int sin_family;/*通信类型*/unsigned short int sin_port;/*端口*/struct in_addr sin_addr;/*Internet 地址*/unsigned char sin_zero8;/*与 sockaddr结构的长度相同*/;用这个数据结构可以轻松处理套接字地址的基本元素。注意sin_zero(它被加入到这个结构,并且长度和struct sockaddr 一样)应该使用函数bzero()或 memset()来全部置零。同时,这一重要的字节,一个指向sockaddr_in结构体的指针也可以被指向结构体sockaddr并且代替它。这样的话即使socket()想要的是struct sockaddr*,你仍然可以使用struct sockaddr_in,并且在最后转换。同时,注意sin_family 和 struct sockaddr 中的sa_family 一致并能够设置为AF_INET。最后,sin_port 和 sin_addr 必须是网络字节顺序(Network Byte Order)!你也许会反对道:但是,怎么让整个数据结构struct in_addr sin_addr 按照网络字节顺序呢?要知道这个问题的答案,我们就要仔细的看一看这个数据结构:struct in_addr,有这样一个联合(unions):/*Internet 地址(一个与历史有关的结构)*/struct in_addr unsigned long s_addr;它曾经是个最坏的联合,但是现在那些日子过去了。如果你声明ina 是数据结构struct sockaddr_in 的实例,那么ina.sin_addr.s_addr 就储存4字节的IP 地址(使用网络字节顺序)。如果你不幸的系统使用的还是恐怖的联合struct in_addr,你还是可以放心4字节的IP 地址并且和上面我说的一样(这是因为使用了“#define”。)-本机转换我们现在到了新的章节。我们曾经讲了很多网络到本机字节顺序的转换,现在可以实践了!你能够转换两种类型:short(两个字节)和 long(四个字节)。这个函数对于变量类型unsigned 也适用。假设你想将short 从本机字节顺序转换为网络字节顺序。用h 表示 本机(host),接着是to,然后用n 表 示 网络(network),最后用s 表示short:h-to-n-s,或者htons()(Host to Network Short)。太简单了.如果不是太傻的话,你一定想到了由n,h,s,和l 形成的正确组合,例如这里肯定没有 stolh()(Short to Long Host)函数,不仅在这里没有,所有场合都没有。但是这里有:htons()-Host to Network Short htonl()-Host to Network Long ntohs()-Network to Host Short ntohl()-Network to Host Long 现在,你可能想你已经知道它们了。你也可能想:“如果我想改变char 的顺序要怎么办呢?”但是你也许马上就想到,“用不着考虑的”。你也许会想到:我的68000 机器已经使用了网络字节顺序,我没有必要去调用htonl()转换IP 地址。你可能是对的,但是当你移植你的程序到别的机器上的时候,你的程序将失败。可移植性!这里是Unix 世界!记住:在你将数据放到网络上的时候,确信它们是网络字节顺序的。最后一点:为什么在数据结构struct sockaddr_in 中,sin_addr 和 sin_port 需要转换为网络字节顺序,而sin_family 需不需要呢?答案是:sin_addr 和 sin_port 分别封装在包的IP 和 UDP 层。因此,它们必须要是网络字节顺序。但是sin_family 域只是被内核(kernel)使用来决定在数据结构中包含什么类型的地址,所以它必须是本机字节顺序。同时,sin_family 没有发送到网络上,它们可以是本机字节顺序。-IP 地址和如何处理它们现在我们很幸运,因为我们有很多的函数来方便地操作IP 地址。没有必要用手工计算它们,也没有必要用 操作来储存成长整字型。首先,假设你已经有了一个sockaddr_in结构体 ina,你有一个 IP地址132.241.5.10要储存在其中,你就要用到函数inet_addr(),将IP地址从点数格式转换成无符号长整型。使用方法如下:ina.sin_addr.s_addr=inet_addr(132.241.5.10);注意,inet_addr()返回的地址已经是网络字节格式,所以你无需再调用函数 htonl()。我们现在发现上面的代码片断不是十分完整的,因为它没有错误检查。显而易见,当inet_addr()发生错误时返 回-1。记 住这 些二 进制数 字?(无符号 数)-1 仅仅和 IP地址255.255.255.255相符合!这可是广播地址!大错特错!记住要先进行错误检查。好了,现在你可以将IP地址转换成长整型了。有没有其相反的方法呢?它可以将一个in_addr 结构体输出成点数格式?这样的话,你就要用到函数inet_ntoa()(ntoa的含义是network to ascii),就像这样:printf(%s,inet_ntoa(ina.sin_addr);它将输出 IP地址。需要注意的是inet_ntoa()将结构体 in-addr作为一个参数,不是长整形。同样需要注意的是它返回的是一个指向一个字符的指针。它是一个由inet_ntoa()控制的静态的固定的指针,所以每次调用inet_ntoa(),它就将覆盖上次调用时所得的IP地址。例如:char*a1,*a2;.a1=inet_ntoa(ina1.sin_addr);/*这是 198.92.129.1*/a2=inet_ntoa(ina2.sin_addr);/*这是 132.241.5.10*/printf(address 1:%sn,a1);printf(address 2:%sn,a2);输出如下:address 1:132.241.5.10 address 2:132.241.5.10 假如你需要保存这个IP地址,使用 strcopy()函数来指向你自己的字符指针。上面就是关于这个主题的介绍。稍后,你将学习将一个类似wintehouse.gov的字符串转换成它所对应的IP地址(查阅域名服务,稍 后)。-socket()函数我想我不能再不提这个了下面我将讨论一下socket()系统调用。下面是详细介绍:#include#include int socket(int domain,int type,int protocol);但是它们的参数是什么?首先,domain 应该设置成AF_INET,就象上面的数据结构struct sockaddr_in 中一样。然后,参数type 告诉内核是SOCK_STREAM 类型还是SOCK_DGRAM 类型。最后,把 protocol 设置为0。(注意:有很多种domain、type,我不可能一一列出了,请看socket()的 man 帮助。当然,还有一个更好 的方式去得到protocol。同时请查阅getprotobyname()的 man 帮助。)socket()只是返回你以后在系统调用种可能用到的socket 描述符,或 者在错误的时候返回-1。全局变量errno 中将储存返回的错误值。(请参考perror()的 man 帮助。)-bind()函数一旦你有一个套接字,你可能要将套接字和机器上的一定的端口关联起来。(如果你想用listen()来侦听一定端口的数据,这是必要一步-MUD 告 诉你说用命令telnet x.y.z 6969。)如果你只想用connect(),那么这个步骤没有必要。但是无论如何,请继续读下去。这里是系统调用bind()的大概:#include#include int bind(int sockfd,struct sockaddr*my_addr,int addrlen);sockfd 是调用socket 返回的文件描述符。my_addr 是指向数据结构struct sockaddr 的指针,它保存你的地址(即端口 和IP 地址)信息。addrlen 设置为sizeof(struct sockaddr)。简单得很不是吗?再看看例子:#include#include#include#define MYPORT 3490 main()int sockfd;struct sockaddr_in my_addr;sockfd=socket(AF_INET,SOCK_STREAM,0);/*需要错误检查*/my_addr.sin_family=AF_INET;/*host byte order*/my_addr.sin_port=htons(MYPORT);/*short,network byte order*/my_addr.sin_addr.s_addr=inet_addr(132.241.5.10);bzero(&(my_addr.sin_zero),;/*zero the rest of the struct*/*dont forget your error checking for bind():*/bind(sockfd,(struct sockaddr*)&my_addr,sizeof(struct sockaddr);.这 里 也 有 要 注 意 的 几 件 事 情。my_addr.sin_port 是 网 络 字 节 顺 序,my_addr.sin_addr.s_addr 也是的。另外要注意到的事情是因系统的不同,包含的头文件也不尽相同,请查阅本地的man 帮助文件。在 bind()主题中最后要说的话是,在处理自己的IP 地址和/或端口的时候,有些工作是可以自动处理的。my_addr.sin_port=0;/*随机选择一个没有使用的端口*/my_addr.sin_addr.s_addr=INADDR_ANY;/*使用自己的 IP地址*/通 过 将 0 赋给my_addr.sin_port,你 告 诉bind()自 己选 择合 适的 端口。同样,将my_addr.sin_addr.s_addr 设置为INADDR_ANY,你告诉它自动填上它所运行的机器的IP 地址。如果你一向小心谨慎,那么你可能注意到我没有将INADDR_ANY 转 换为网络字节顺序!这是因为我知道内部的东西:INADDR_ANY 实际上就是 0!即使你改变字节的顺序,0依然是 0。但是完美主义者说应该处处一致,INADDR_ANY或许是 12呢?你的代码就不能工作了,那么就看下面的代码:my_addr.sin_port=htons(0);/*随机选择一个没有使用的端口*/my_addr.sin_addr.s_addr=htonl(INADDR_ANY);/*使用自己的 IP地址*/你或许不相信,上面的代码将可以随便移植。我只是想指出,既然你所遇到的程序不会都运行使用 htonl 的INADDR_ANY。bind()在错误的时候依然是返回-1,并且设置全局错误变量errno。在你调用bind()的时候,你要小心的另一件事情是:不要采用小于1024 的端口号。所有小于 1024 的端口号都被系统保留!你可以选择从1024 到65535 的端口(如果它们没有被别的程序使用的话)。你要注意的另外一件小事是:有时候你根本不需要调用它。如果你使用 connect()来和远程机器进行通讯,你不需要关心你的本地端口号(就象你在使用telnet 的时候),你只要简单的调用connect()就可以了,它会检查套接字是否绑定端口,如果没有,它会自己绑定一个没有使用的本地端口。-connect()程序现在我们假设你是个telnet 程序。你的用户命令你得到套接字的文件描述符。你听从命令调用了socket()。下一步,你的用户告诉你通过端口23(标准telnet 端口)连接到132.241.5.10。你该怎么做呢?幸运的是,你正在阅读connect()-如何连接到远程主机这一章。你可不想让你的用户失望。connect()系统调用是这样的:#include#include int connect(int sockfd,struct sockaddr*serv_addr,int addrlen);sockfd 是系统调用socket()返回的套接字文件描述符。serv_addr 是 保存着目的地端口和 IP 地址的数据结构struct sockaddr。addrlen 设置为 sizeof(struct sockaddr)。想知道得更多吗?让我们来看个例子:#include#include#include#define DEST_IP 132.241.5.10#define DEST_PORT 23 main()int sockfd;struct sockaddr_in dest_addr;/*目的地址*/sockfd=socket(AF_INET,SOCK_STREAM,0);/*错误检查*/dest_addr.sin_family=AF_INET;/*host byte order*/dest_addr.sin_port=htons(DEST_PORT);/*short,network byte order*/dest_addr.sin_addr.s_addr=inet_addr(DEST_IP);bzero(&(dest_addr.sin_zero),;/*zero the rest of the struct*/*dont forget to error check the connect()!*/connect(sockfd,(struct sockaddr*)&dest_addr,sizeof(struct sockaddr);.再一次,你应该检查connect()的返回值-它在错误的时候返回-1,并 设置全局错误变量errno。同时,你可能看到,我没有调用bind()。因为我不在乎本地的端口号。我只关心我要去那。内核将为我选择一个合适的端口号,而我们所连接的地方也自动地获得这些信息。一切都不用担心。-listen()函数是换换内容得时候了。假如你不希望与远程的一个地址相连,或者说,仅仅是将它踢开,那你就需要等待接入请求并且用各种方法处理它们。处理过程分两步:首先,你听-listen(),然后,你接受-accept()(请看下面的内容)。除了要一点解释外,系统调用listen 也相当简单。int listen(int sockfd,int backlog);sockfd 是调用socket()返回的套接字文件描述符。backlog 是在进入队列中允许的连接数目。什么意思呢?进入的连接是在队列中一直等待直到你接受(accept()请看下面的文章)连接。它们的数目限制于队列的允许。大多数系统的允许数目是20,你也可以设置为5到10。和别的函数一样,在发生错误的时候返回-1,并设置全局错误变量errno。你可能想象到了,在你调用listen()前你或者要调用bind()或者让内核随便选择一个端口。如果你想侦听进入的连接,那么系统调用的顺序可能是这样的:socket();bind();listen();/*accept()应该在这*/因为它相当的明了,我将在这里不给出例子了。(在 accept()那一章的代码将更加完全。)真正麻烦的部分在accept()。-accept()函数准备好了,系统调用accept()会有点古怪的地方的!你可以想象发生这样的事情:有人从很远的地方通过一个你在侦听(listen()的端口连接(connect()到你的机器。它的连接将加入到等待接受(accept()的队列中。你调用accept()告诉它你有空闲的连接。它将返回一个新的套接字文件描述符!这样你就有两个套接字了,原来的一个还在侦听你的那个端口,新的在准备发送(send()和接收(recv()数据。这就是这个过程!函数是这样定义的:#include int accept(int sockfd,void*addr,int*addrlen);sockfd 相当简单,是和listen()中一样的套接字描述符。addr 是个指向局部的数据结构 sockaddr_in 的指针。这是要求接入的信息所要去的地方(你可以测定那个地址在那个端口呼叫你)。在它的地址传递给accept 之 前,addrlen 是个局部的整形变量,设置为 sizeof(struct sockaddr_in)。accept 将不会将多余的字节给addr。如果你放入的少些,那么它会通过改变 addrlen 的值反映出来。同样,在错误时返回-1,并设置全局错误变量errno。现在是你应该熟悉的代码片段。#include#include#include#define MYPORT 3490/*用户接入端口*/#define BACKLOG 10/*多少等待连接控制*/main()int sockfd,new_fd;/*listen on sock_fd,new connection on new_fd*/struct sockaddr_in my_addr;/*地址信息*/struct sockaddr_in their_addr;/*connectors address information*/int sin_size;sockfd=socket(AF_INET,SOCK_STREAM,0);/*错误检查*/my_addr.sin_family=AF_INET;/*host byte order*/my_addr.sin_port=htons(MYPORT);/*short,network byte order*/my_addr.sin_addr.s_addr=INADDR_ANY;/*auto-fill with my IP*/bzero(&(my_addr.sin_zero),;/*zero the rest of the struct*/*dont forget your error checking for these calls:*/bind(sockfd,(struct sockaddr*)&my_addr,sizeof(struct sockaddr);listen(sockfd,BACKLOG);sin_size=sizeof(struct sockaddr_in);new_fd=accept(sockfd,&their_addr,&sin_size);.注意,在系统调用send()和 recv()中你应该使用新的套接字描述符new_fd。如果你只想让一个连接进来,那么你可以使用close()去关闭原来的文件描述符sockfd 来避免同一个端口更多的连接。-send()and recv()函数这两个函数用于流式套接字或者数据报套接字的通讯。如果你喜欢使用无连接的数据报套接字,你应该看一看下面关于sendto()和 recvfrom()的章节。send()是这样的:int send(int sockfd,const void*msg,int len,int flags);sockfd 是你想发送数据的套接字描述符(或者是调用socket()或者是accept()返回的。)msg 是指向你想发送的数据的指针。len 是数据的长度。把 flags 设置为0 就可以了。(详细的资料请看send()的 man page)。这里是一些可能的例子:char*msg=Beej was here!;int len,bytes_sent;.len=strlen(msg);bytes_sent=send(sockfd,msg,len,0);.send()返回实际发送的数据的字节数-它可能小于你要求发送的数目!注意,有时候你告诉它要发送一堆数据可是它不能处理成功。它只是发送它可能发送的数据,然后希望你能够发送其它的数据。记住,如果send()返回的数据和len 不匹配,你就应该发送其它的数据。但是这里也有个好消息:如果你要发送的包很小(小于大约1K),它可能处理让数据一次发送完。最后要说得就是,它在错误的时候返回-1,并设置errno。recv()函数很相似:int recv(int sockfd,void*buf,int len,unsigned int flags);sockfd 是要读的套接字描述符。buf 是要读的信息的缓冲。len 是缓冲的最大长度。flags 可以设置为 0。(请参考 recv()的 man page。)recv()返回实际读入缓冲的数据的字节数。或者在错误的时候返回-1,同时设置errno。很简单,不是吗?你现在可以在流式套接字上发送数据和接收数据了。你现在是Unix 网络程序员了!-sendto()和 recvfrom()函数“这很不错啊”,你说,“但是你还没有讲无连接数据报套接字呢?”没问题,现在我们开始这个内容。既然数据报套接字不是连接到远程主机的,那么在我们发送一个包之前需要什么信息呢?不错,是目标地址!看看下面的:int sendto(int sockfd,const void*msg,int len,unsigned int flags,const struct sockaddr*to,int tolen);你已经看到了,除了另外的两个信息外,其余的和函数send()是一样的。to 是个指向数据结构struct sockaddr 的指针,它包含了目的地的IP 地址和端口信息。tolen 可以简单地设置为sizeof(struct sockaddr)。和函数send()类似,sendto()返回实际发送的字节数(它也可能小于你想要发送的字节数!),或者在错误的时候返回-1。相似的还有函数recv()和 recvfrom()。recvfrom()的定义是这样的:int recvfrom(int sockfd,void*buf,int len,unsigned int flags,struct sockaddr*from,int*fromlen);又一次,除了两个增加的参数外,这个函数和recv()也是一样的。from 是一个指向局部数据结构struct sockaddr 的指针,它的内容是源机器的IP 地址和端口信息。fromlen 是个 int 型的局部指针,它的初始值为sizeof(struct sockaddr)。函数调用返回后,fromlen 保存着实际储存在from 中的地址的长度。recvfrom()返回收到的字节长度,或者在发生错误后返回-1。记住,如果你用connect()连接一个数据报套接字,你可以简单的调用 send()和 recv()来满足你的要求。这个时候依然是数据报套接字,依然使用UDP,系统套接字接口会为你自动加上了目标和源的信息。-close()和shutdown()函数你已经整天都在发送(send()和接收(recv()数据了,现在你准备关闭你的套接字描述符了。这很简单,你可以使用一般的Unix 文件描述符的 close()函数:close(sockfd);它将防止套接字上更多的数据的读写。任何在另一端读写套接字的企图都将返回错误信息。如果你想在如何关闭套接字上有多一点的控制,你可以使用函数shutdown()。它允许你将一定方向上的通讯或者双向的通讯(就象 close()一 样)关闭,你可以使用:int shutdown(int sockfd,int how);sockfd 是你想要关闭的套接字文件描述复。how 的值是下面的其中之一:0-不允许接受1-不允许发送2-不允许发送和接受(和 close()一样)shutdown()成功时返回0,失败时返回-1(同时设置errno。)如果在无连接的数据报套接字中使用 shutdown(),那么只不过是让send()和 recv()不能使用(记住你在数据报套接字中使用了connect 后 是可以使用它们的)。-getpeername()函数这个函数太简单了。它太简单了,以至我都不想单列一章。但是我还是这样做了。函数getpeername()告诉你在连接的流式套接字上谁在另外一边。函数是这样的:#include int getpeername(int sockfd,struct sockaddr*addr,int*addrlen);sockfd 是连接的流式套接字的描述符。addr 是一个指向结构struct sockaddr(或者是struct sockaddr_in)的指针,它保存着连接的另一边的信息。addrlen 是一个int 型的指针,它初始化为sizeof(struct sockaddr)。函数在错误的时候返回-1,设置相应的errno。一旦你获得它们的地址,你可以使用inet_ntoa()或者gethostbyaddr()来打印或者获得更多的信息。但是你不能得到它的帐号。(如果它运行着愚蠢的守护进程,这是可能的,但是它的讨论已经超出了本文的范围,请参考 RFC-1413 以获得更多的信息。)-gethostname()函数甚至比getpeername()还简单的函数是gethostname()。它返回你程序所运行的机器的主机名字。然后你可以使用geth