2022年c网络socket编程指南 .pdf
《2022年c网络socket编程指南 .pdf》由会员分享,可在线阅读,更多相关《2022年c网络socket编程指南 .pdf(32页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、网络 socket编程指南- 介绍Socket 编程让你沮丧吗?从man pages 中很难得到有用的信息吗?你想跟上时代去编 Internet 相关的程序,但是为你在调用connect() 前的 bind() 的结构而不知所措?等等 好在我已经将这些事完成了,我将和所有人共享我的知识了。如果你了解C 语言并想穿过网络编程的沼泽,那么你来对地方了。- 读者对象这个文档是一个指南, 而不是参考书。 如果你刚开始socket 编程并想找一本入门书,那么你是我的读者。但这不是一本完全的socket 编程书。- 平台和编译器这篇文档中的大多数代码都在Linux 平台 PC 上用 GNU 的 gcc 成
2、功编译过。而且它们在HPUX平台 上用 gcc 也成功编译过。但是注意,并不是每个代码片段都独立测试过。- 目录:1) 什么是套接字?2) Internet 套接字的两种类型3) 网络理论4) 结构体5) 本机转换6) IP 地址和如何处理它们7) socket() 函数8) bind() 函数9) connect() 函数10) listen() 函数名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 32 页 - - - - - - - - - 11) accept()
3、函数12) send() 和 recv()函数13) sendto() 和 recvfrom() 函数14) close() 和 shutdown() 函数15) getpeername() 函数16) gethostname() 函数17) 域名服务( DNS)18) 客户-服务器背景知识19) 简单的服务器20) 简单的客户端21) 数据报套接字 Socket 22) 阻塞23) select()- 多路同步 I/O 24) 参考资料- 什么是 socket?你经常听到人们谈论着“socket ”,或许你还不知道它的确切含义。现在让我告诉你:它是使用 标准 Unix 文件描述符(file
4、descriptor) 和其它程序通讯的方式。什么?你也许听到一些Unix 高手(hacker) 这样说过: “ 呀,Unix 中的一切就是文件! ” 那个家伙也许正在说到一个事实:Unix 程序在执行任何形式的I/O 的时候,程序是在读或者写一个文件描述符。一个文件描述符只是一个和打开的文件相关联的整数。 但是(注意后面的话 ), 这个文件可能是一个网络连接, FIFO,管道,终端,磁盘上的文件或者什么其它的东西。Unix 中所有的东西就是文件!所以,你想和 Internet 上别的程序通讯的时候, 你将要使用到文件描述符。 你必须理解刚才的话。现在你脑海中或许冒出这样的念头:“ 那么我从哪
5、里得到网络通讯的文件描述符呢? ” ,这个问题无论如何我都要回答:你利用系统调用socket() ,它返回套接字描述符(socket descriptor) ,然后你再通过它来进行send() 和 recv() 调用。 “ 但是.”,你可能有很大的疑惑,“ 如果它是个文件描述符, 那么为什么不用一般调用 read() 和 write() 来进行套接字通讯? ” 简单的答案名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 32 页 - - - - - - - - - 是:“
6、你可以使用! ” 。详细的答案是: “ 你可以,但是使用send()和 recv() 让你更好的控制数据传输。 ” 存在这样一个情况: 在我们的世界上, 有很多种套接字。有 DARPA Internet 地址 (Internet 套接字 ), 本地节点的路径名(Unix 套接字 ),CCITT X.25 地址 (你可以将 X.25 套接字完全忽略 )。 也许在你的 Unix 机器上还有其它的。我们在这里只讲第一种:Internet 套接字。- Internet 套接字的两种类型什么意思?有两种类型的Internet 套接字?是的。不,我在撒谎。其实还有很多,但是我可不想吓着你。我们这里只讲两种
7、。除了这些, 我打算另外介绍的 Raw Sockets 也是非常强大的,很值得查阅。那么这两种类型是什么呢?一种是Stream Sockets (流格式),另外一种是Datagram Sockets (数据包格式)。我们以后谈到它们的时候也会用到SOCK_STREAM 和 SOCK_DGRAM 。数据报套接字有时也叫“ 无连接套接字”(如果你确实要连接的时候可以用connect() 。) 流式套接字是可靠的双向通讯的数据流。如果你向套接字按顺序输出“1 ,2” ,那么它们将按顺序 “1 ,2” 到达另一边。它们是无错误的传递的,有自己的错误控制,在此不讨论。有什么在使用流式套接字?你可能听说过
8、telnet ,不是吗?它就使用流式套接字。你需要你所输入的字符按顺序到达,不是吗?同样, WWW 浏览器使用的HTTP 协议也使用它们来下载页面。实际上,当你通过端口80 telnet 到一个WWW 站点,然后输入“ GET pagename ” 的时候,你也可以得到HTML 的内容。为什么流式套接字可以达到高质量的数据传输?这是因为它使用了“ 传输控制协议 (The Transmission Control Protocol)”, 也叫 “TCP ” (请参考 RFC-793 获得详细资料。 )TCP 控制你的数据按顺序到达并且没有错误。你也许听到“TCP ” 是因为听到过“TCP/IP”
9、。这里的IP 是指“Internet 协议”(请参考 RFC-791。) IP 只是处理Internet 路由而已。那么数据报套接字呢?为什么它叫无连接呢?为什么它是不可靠的呢?有这样的一些事实: 如果你发送一个数据报, 它可能会到达,它可能次序颠倒了。如果它到达, 那么在这个包的内部是无错误的。数据报也使用IP 作路由,但是它不使用 TCP。它使用 “ 用户数据报协议(User Datagram Protocol)”,也叫 “UDP ” 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - -
10、第 3 页,共 32 页 - - - - - - - - - (请参考 RFC-768。) 为什么它们是无连接的呢?主要是因为它并不象流式套接字那样维持一个连接。你只要建立一个包, 构造一个有目标信息的IP 头,然后发出去。无需连接。它们通常使用于传输包 -包信息。简单的应用程序有:tftp, bootp等等。你也许会想: “ 假如数据丢失了这些程序如何正常工作?” 我的朋友,每个程序在 UDP 上有自己的协议。 例如,tftp 协议每发出的一个被接受到包,收到者必须发回一个包来说 “ 我收到了! ” ( 一个 “ 命令正确应答 ” 也叫 “ACK ” 包)。如果在一定时间内 (例如 5 秒)
11、,发送方没有收到应答,它将重新发送,直到得到ACK。这一 ACK过程在实现SOCK_DGRAM 应用程序的时候非常重要。- 网络理论既然我刚才提到了协议层,那么现在是讨论网络究竟如何工作和一些关于SOCK_DGRAM 包是如何建立的例子。当然,你也可以跳过这一段,如果你认为已经熟悉的话。现在是学习数据封装(Data Encapsulation) 的时候了!它非常非常重要。它重要性重要到你在网络课程学(图1:数据封装)习中无论如何也得也得掌握它。 主要 的内容是:一个包,先是被第一个协议 (在这里是 TFTP )在它的报头(也许 是报尾)包装(“ 封装”),然后,整个数据 (包括 TFTP 头)
12、被另外一个协议(在这里是 UDP )封装,然后下一个 ( IP ) ,一直重复下去,直到硬件(物理) 层( 这里是以太网)。当另外一台机器接收到包, 硬件先剥去以太网头, 内核剥去 IP 和 UDP 头,TFTP程序再剥去 TFTP 头,最后得到数据。现在我们终于讲到声名狼藉的网络分层模型 (Layered Network Model) 。这种网络模型在描述网络系统上相对其它模型有很多优点。例如, 你可以写一个套接字程序而不用关心数据的物理传输(串行口,以太网,连接单元接口(AUI) 还是其它介质 ),因为底层的程序会为你处理它们。实际的网络硬件和拓扑对于程序员来说是透明的。不说其它废话了,我
13、现在列出整个层次模型。如果你要参加网络考试,可一定要记住:应用层 (Application) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 32 页 - - - - - - - - - 表示层 (Presentation) 会话层 (Session) 传输层 (Transport) 网络层 (Network) 数据链路层 (Data Link) 物理层 (Physical) 物理层是硬件 (串口,以太网等等 )。应用层是和硬件层相隔最远的-它 是用户和网络交互的地方。这
14、个模型如此通用,如果你想,你可以把它作为修车指南。把它对应到 Unix ,结果是:应用层 (Application Layer) (telnet, ftp,等等) 传输层 (Host-to-Host Transport Layer) (TCP, UDP) Internet 层(Internet Layer) (IP和路由 ) 网络访问层(Network Access Layer) ( 网络层,数据链路层和物理层) 现在,你可能看到这些层次如何协调来封装原始的数据了。看看建立一个简单的数据包有多少工作?哎呀,你将不得不使用cat 来建立数据包头!这仅仅是个玩笑。对于流式套接字你要作的是send(
15、) 发 送数据。对于数据报式套接字,你按照你选择的方式封装数据然后使用sendto() 。内核将为你建立传输层和Internet 层,硬件完成网络访问层。这就是现代科技。现在结束我们的网络理论速成班。哦,忘记告诉你关于路由的事情了。但是我不准备谈它,如果你真的关心,那么参考IP RFC。- 结构体终于谈到编程了。在这章,我将谈到被套接字用到的各种数据类型。因为它们中的一些内容很重要了。首先是简单的一个: socket 描述符。它是下面的类型:int 仅仅是一个常见的int。从现在起,事情变得不可思议了,而你所需做的就是继续看下去。注意这样的名师资料总结 - - -精品资料欢迎下载 - - -
16、- - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 32 页 - - - - - - - - - 事实:有两种字节排列顺序:重要的字节(有时叫 octet ,即八 位位组 ) 在前面,或者不重要的字节在前面。 前一种叫 “ 网络字节顺序(Network Byte Order)”。有些机器在内部是按照这个顺序储存数据,而另外一些则不然。当我说某数据必须按照NBO 顺序,那么你要调用函数 (例如 htons() ) 来将它从本机字节顺序(Host Byte Order) 转换过来。如果我没有提到 NBO, 那么就让它保持本机字节顺序
17、。我的第一个结构 (在这个技术手册 TM 中)-struct sockaddr. 。 这个结构为许多类型的套接字储存套接字地址信息:struct sockaddr unsigned short sa_family; /* 地址家族 , AF_xxx */ char sa_data14; /*14字节协议地址 */ ; sa_family 能够是各种各样的类型,但是在这篇文章中都是AF_INET。sa_data 包含套接字中的目标地址和端口信息。这好像有点不明智。为了处理 struct sockaddr ,程序员创造了一个并列的结构:struct sockaddr_in (in 代表 Inter
18、net 。) struct sockaddr_in short int sin_family; /* 通信类型*/ unsigned short int sin_port; /* 端口 */ struct in_addr sin_addr; /* Internet 地址 */ unsigned char sin_zero8; /* 与 sockaddr 结构的长度相同 */ ; 用这个数据结构可以轻松处理套接字地址的基本元素。注意 sin_zero ( 它被加入到这个结构,并且长度和struct sockaddr 一样) 应该使用函数bzero() 或memset() 来全部置零。同时,这一重
19、要的字节,一个指向sockaddr_in 结构体的指针也可以被指向结构体sockaddr 并且代替它。这样的话即使socket() 想要的是struct sockaddr * ,你仍然可以使用struct sockaddr_in ,并且在最后转换。同时,注意sin_family 和 struct sockaddr 中的 sa_family 一致并能够设置为 AF_INET。 最后,sin_port 和 sin_addr 必须是网络字节顺序(Network 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - -
20、- - - - 第 6 页,共 32 页 - - - - - - - - - Byte Order) !你也许会反对道: 但是,怎么让整个数据结构struct in_addr sin_addr 按照网络字节顺序呢 ? 要知道这个问题的答案, 我们就要仔细的看一看这个数据结构:struct in_addr, 有这样一个联合(unions) :/* Internet 地址 (一个与历史有关的结构 ) */ struct in_addr unsigned long s_addr; ; 它曾经是个最坏的联合,但是现在那些日子过去了。如果你声明ina 是数据结构 struct sockaddr_in 的
21、实例, 那么 ina.sin_addr.s_addr 就储 存 4 字节的IP 地址(使用网络字节顺序 )。如果你不幸的系统使用的还是恐怖的联合 struct in_addr ,你还是可以放心 4 字节的 IP 地址并且和上面我说的一样 (这是因为使用了 “#define ”。) - 本机转换我们现在到了新的章节。我们曾经讲了很多网络到本机字节顺序的转换,现在可以实践了!你能够转换两种类型:short ( 两个字节 )和 long ( 四个字节 )。这个函数对于变量类型 unsigned 也适用。假设你想将short 从本机字节顺序转换为网络字节顺序。用h 表示 本机 (host) ,接着是t
22、o,然后用n 表 示 网络(network) ,最后用s 表示 short : h-to-n-s, 或者 htons() (Host to Network Short) 。太简单了 . 如果不是太傻的话,你一定想到了由n,h,s,和 l形成的正确组合,例如这里肯定没有 stolh() (Short to Long Host) 函数,不仅在这里没有,所有场合都没有。但是这里有:htons()-Host to Network Short htonl()-Host to Network Long ntohs()-Network to Host Short ntohl()-Network to Hos
23、t Long 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 32 页 - - - - - - - - - 现在,你可能想你已经知道它们了。你也可能想:“ 如果我想改变char 的顺序要怎么办呢 ?” 但是你也许马上就想到, “ 用不着考虑的 ” 。你也许会想到:我的68000 机器已经使用了网络字节顺序,我没有必要去调用htonl() 转换 IP 地址。你可能是对的,但是当你移植你的程序到别的机器上的时候,你的程序将失败。可移植性!这里是Unix 世界!记住:在你将数据
24、放到网络上的时候,确信它们是网络字节顺序的。最后一点:为什么在数据结构struct sockaddr_in 中, sin_addr 和 sin_port 需要转换为网络字节顺序,而sin_family 需不需要呢 ? 答案是:sin_addr 和sin_port 分别封装在包的IP 和 UDP 层。 因此,它们必须要是网络字节顺序。但是 sin_family 域只是被内核(kernel) 使用来决定在数据结构中包含什么类型的地址,所以它必须是本机字节顺序。 同时, sin_family 没有发送到网络上,它们可以是本机字节顺序。- IP 地址和如何处理它们现在我们很幸运,因为我们有很多的函数来
25、方便地操作IP 地址。没有必要用手工计算它们,也没有必要用 操作来储存成长整字型。首先,假设你已经有了一个 sockaddr_in 结构体 ina, 你有一个 IP 地 址132.241.5.10 要储存在其中,你就要用到函数inet_addr(), 将 IP 地址从 点数格式转换成无符号长整型。使用方法如下:ina.sin_addr.s_addr = inet_addr(132.241.5.10); 注意, inet_addr() 返回的地址已经是网络字节格式,所以你无需再调用函数htonl() 。我们现在发现上面的代码片断不是十分完整的,因为它没有错误检查。显而易见,当 inet_addr
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2022年c网络socket编程指南 2022 网络 socket 编程 指南
限制150内