Linux C高级编程——网络编程

Posted 2020-07-03 a1314521531

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Linux C高级编程——网络编程相关的知识，希望对你有一定的参考价值。

Linux高级编程——BSD socket的网络编程

宗旨：技术的学习是有限的，分享的精神是无限的。

一网络通信基础

TCP/IP协议簇基础：之所以称TCP/IP是一个协议簇，是因为TCP/IP包含TCP 、IP、UDP、ICMP等多种协议。下图是OSI模型与TCP/IP模型的对比，TCP/IP将网络划分为4层模型：应用层、传输层、网络层和网络接口层（有些书籍将其分为5层，即网络接口层由链路层和物理层组成）

（1）网络接口层：模型的基层，负责数据帧的发送已接收（帧是独立的网络信息传输单元）。网络接口层将帧格式的数据放到网络上，或从网络上把帧取下来。

（2）互联网（网络层）：互联协议将数据包封装成IP数据包，并运行必要的路由算法，有效的找到达到目的主机最优的路径树。这里有四种互联协议：

网际协议IP：负责在主机和网络之间路径寻址和路由数据包。目前主要为IPV4地址，IPV6已经在教育网中广泛使用。

地址解析协议ARP：获得同一物理网络中的主机硬件地址

网际控制消息协议ICMP：发送消息，并报告有关数据包的传送错误

互联组管理协议IGMP：用来实现本地多路组播路由器报告

（3）传输层：传输协议在主机之间提供通信会话。传输协议的选择根据数据传输方式而定

主要有以下两种传输协议：

传输控制协议TCP：为应用程序提供可靠的通信连接。适合于一次传输大批数据的情况，并适用于要求得到响应的应用程序。

影虎数据包协议UDP：提供了无连接通信，且不对传送包进行可靠性确认。适合于一次传送小量数据（一般小于520字节），可靠性则由应用层来完成。

（4）应用层：应用程序通过这一层访问网络，主要包括常见的FTP,HTTP,DNS和TELNET协议

ELNET：提供远程登录服务

FTP：提供应用级的文件传输服务

SMTP：电子邮件协议

SNMP：简单网络管理协议

DNS：域名解析服务，将域名映像成IP地址的协议

HTTP：超文本传输协议，web服务器所采用的协议

二 IPv4协议基础

TCP/IP中，IP地址在逻辑上唯一的标识了网络中的一台主机，连接到公网上的主机地址是唯一的，一个IP地址对应一台主机。

IP地址两种表示形式：二进制表示法和点分十进制表示法。每个IP地址由两部分组成：网络号和主机号。TCP/IP通讯过程：

传输层及其以下的机制由内核提供，应用层由用户进程提供（后面将介绍如何使用socket API编写应用程序），应用程序对通讯数据的含义进行解释，而传输层及其以下处理通讯的细节，将数据从一台计算机通过一定的路径发送到另一台计算机。应用层数据通过协议栈发到网络上时，每层协议都要加上一个数据首部（header），称为封装（Encapsulation），如下图所示TCP/IP数据包的封装

不同的协议层对数据包有不同的称谓，在传输层叫做段（segment），在网络层叫做数据报（datagram），在链路层叫做帧（frame）。数据封装成帧后发到传输介质上，到达目的主机后每层协议再剥掉相应的首部，最后将应用层数据交给应用程序处理。上图对应两台计算机在同一网段中的情况，如果两台计算机在不同的网段中，那么数据从一台计算机到另一台计算机传输过程中要经过一个或多个路由器跨路由器通讯过程：

其实在链路层之下还有物理层，指的是电信号的传递方式，比如现在以太网通用的网线（双绞线）、早期以太网采用的的同轴电缆（现在主要用于有线电视）、光纤等都属于物理层的概念。物理层的能力决定了最大传输速率、传输距离、抗干扰性等。集线器（Hub）是工作在物理层的网络设备，用于双绞线的连接和信号中继（将已衰减的信号再次放大使之传得更远）。

链路层有以太网、令牌环网等标准，链路层负责网卡设备的驱动、帧同步（就是说从网线上检测到什么信号算作新帧的开始）、冲突检测（如果检测到冲突就自动重发）、数据差错校验等工作。交换机是工作在链路层的网络设备，可以在不同的链路层网络之间转发数据帧（比如十兆以太网和百兆以太网之间、以太网和令牌环网之间），由于不同链路层的帧格式不同，交换机要将进来的数据包拆掉链路层首部重新封装之后再转发。

网络层的IP协议是构成Internet的基础。Internet上的主机通过IP地址来标识，Internet上有大量路由器负责根据IP地址选择合适的路径转发数据包，数据包从Internet上的源主机到目的主机往往要经过十多个路由器。路由器是工作在第三层的网络设备，同时兼有交换机的功能，可以在不同的链路层接口之间转发数据包，因此路由器需要将进来的数据包拆掉网络层和链路层两层首部并重新封装。IP协议不保证传输的可靠性，数据包在传输过程中可能丢失，可靠性可以在上层协议或应用程序中提供支持。

网络层负责点到点（point-to-point）的传输（这里的“点”指主机或路由器），而传输层负责端到端（end-to-end）的传输（这里的“端”指源主机和目的主机）。传输层可选择TCP或UDP协议。TCP是一种面向连接的、可靠的协议，有点像打电话，双方拿起电话互通身份之后就建立了连接，然后说话就行了，这边说的话那边保证听得到，并且是按说话的顺序听到的，说完话挂机断开连接。也就是说TCP传输的双方需要首先建立连接，之后由TCP协议保证数据收发的可靠性，丢失的数据包自动重发，上层应用程序收到的总是可靠的数据流，通讯之后关闭连接。UDP协议不面向连接，也不保证可靠性，有点像寄信，写好信放到邮筒里，既不能保证信件在邮递过程中不会丢失，也不能保证信件是按顺序寄到目的地的。使用UDP协议的应用程序需要自己完成丢包重发、消息排序等工作。

目的主机收到数据包后，如何经过各层协议栈最后到达应用程序呢？整个过程如下图所示Multiplexing过程

以太网驱动程序首先根据以太网首部中的“上层协议”字段确定该数据帧的有效载荷（payload，指除去协议首部之外实际传输的数据）是IP、ARP还是RARP协议的数据报，然后交给相应的协议处理。假如是IP数据报，IP协议再根据IP首部中的“上层协议”字段确定该数据报的有效载荷是TCP、UDP、ICMP还是IGMP，然后交给相应的协议处理。假如是TCP段或UDP段，TCP或UDP协议再根据TCP首部或UDP首部的“端口号”字段确定应该将应用层数据交给哪个用户进程。IP地址是标识网络中不同主机的地址，而端口号就是同一台主机上标识不同进程的地址，IP地址和端口号合起来标识网络中唯一的进程。

注意，虽然IP、ARP和RARP数据报都需要以太网驱动程序来封装成帧，但是从功能上划分，ARP和RARP属于链路层，IP属于网络层。虽然ICMP、IGMP、TCP、UDP的数据都需要IP协议来封装成数据报，但是从功能上划分，ICMP、IGMP与IP同属于网络层，TCP和UDP属于传输层。本文对RARP、ICMP、IGMP协议不做进一步介绍。

三 TCP与UDP的区别

中国移动、中国联通推行的GPRS网络、CDMA网络已覆盖大量的区域，通过无线网络实现数据传输成为可能。无线Modem采用GPRS、CDMA模块通过中国移动、中国联通的GPRS、CDMA网络进行数据传输，并通TCP/IP协议进行数据封包，可灵活地实现多种设备接入，工程安装简单，在工业现场数据传输的应用中，能很好的解决偏远无网络无电话线路地区的数据传输的难题。同传统的数传电台想比较，更具有简便性、灵活性、易操作性，同时还降低了成本，无线Modem传输方案是现代化工业现场数据传输最好的选择方案。
目前中国移动、中国联通提供的GPRS网络、CDMA网络的数据传输带宽在40Kbps左右，且受带宽的限制，数据采集方案最好采用于主动告警、数据轮巡采集、告警主动回叫等对传输带宽占用较少的采集方式。同时考虑对前置机实时采集方案的支持，无线Modem传输方案只能作为目前传输方案的补充。随着无线通讯技术的不断发展，无线传输数据带宽将不断提高，采用3G无线网络，数据传输带宽将达到2M，无线传输方案将逐渐成为监控传输组网的主要应用方案。目前，由于GPRS和CDMA固有的特性，在各个领域中GPRS和CDMA的应用也越来越广泛，但是关于传输中使用TCP/IP协议还是UDP协议，却争论很多。

TCP(Transmission Control Protocol)---传输控制协议,提供的是面向连接、可靠的字节流服务。当客户和服务器彼此交换数据前，必须先在双方之间建立一个TCP连接，之后才能传输数据。TCP提供超时重发，丢弃重复数据，检验数据，流量控制等功能，保证数据能从一端传到另一端。

UDP(UserDatagram Protocol)---用户数据报协议，是一个简单的面向数据报的运输层协议。UDP不提供可靠性，它只是把应用程序传给IP层的数据报发送出去，但是并不能保证它们能到达目的地。由于UDP在传输数据报前不用在客户和服务器之间建立一个连接，且没有超时重发等机制，故而传输速度很快。

这里先简单的说一下TCP与UDP的区别：
1。基于连接与无连接
2。对系统资源的要求（TCP较多，UDP少）
3。UDP程序结构较简单
4。流模式与数据报模式
5。TCP保证数据正确性，UDP可能丢包，TCP保证数据顺序，UDP不保证

另外结合GPRS网络的情况具体的谈一下他们的区别：
1。TCP传输存在一定的延时，大概是1600MS（移动提供），UDP响应速度稍微快一些。
2。TCP包头结构
　　源端口16位
　　目标端口 16位
　　序列号 32位
　　回应序号 32位
　　TCP头长度4位
　　reserved6位
　　控制代码6位
　　窗口大小16位
　　偏移量16位
　　校验和16位
　　选项 32位(可选)
　　这样我们得出了TCP包头的最小大小.就是20字节.

　　UDP包头结构
　　源端口16位
　　目的端口16位
　　长度 16位
　　校验和 16位
（UDP的包小很多.确实如此.因为UDP是非可靠连接.设计初衷就是尽可能快的将数据包发送出去.所以UDP协议显得非常精简.）

3。GPRS网络端口资源，UDP十分紧缺，变化很快。

而TCP采用可靠链路传输，不存在端口变化的问题工业场合的应用一般都有以下特点，

1。要求时时传输，但也有一些场合是定时传输，总的来说在整个传输过程中要求服务器中心端和GPRS终端设备能相互的、时时的传输数据。
TCP本身就是可靠链路传输，提供一个时时的双向的传输通道，能很好的满足工业现场传输的要求。但是GPRS网络对TCP链路也存在一个限制：此条链路在长时间（大概20分钟左右，视具体情况而定）没有数据流量，会自动降低此链路的优先级直至强制断开此链路。所以在实际使用中也会采用心跳包（一般是一个字节的数据）来维持此链路。
UDP由于自身特点，以及GPRS网络UDP端口资源的有限性，在一段时间没有数据流量后，端口容易改变，产生的影响就是从服务器中心端向GPRS终端发送数据，GPRS终端接收不到。具体的原因就是移动网关从中作了中转，需要隔一定时间给主机发UDP包来维持这个IP和端口号,这样主机就能主动给GPRS发UDP包了并且我在测试中发现,这个间隔时间很短,我在1多分钟发一次UDP包才能够维持,但是再长可能移动网关那边就要丢失这个端口了,此时如果主机想主动发数据给GPRS,那肯定是不行的了,只有GPRS终端设备再发一个UDP包过去,移动重新给你分配一个中转IP和端口,才能够进行双向通讯。

2。要求数据的丢包率较小。有些工业场合，例如电力、水务抄表，环保监测等等，不容许传输过程中的数据丢失或者最大限度的要求数据的可靠性。从这一点来看，很显然在无线数据传输过程中，TCP比UDP更能保证数据的完整性、可靠性，存在更小的丢包率。在实际测试中也是如此。以厦门桑荣科技有限公司提供的GPRS终端设备为例：TCP的在千分之9，UDP的在千分之17左右。

3。要求降低费用。目前有很大部分GPRS设备的应用都是取代前期无线数传电台，除了使用范围外，其考虑的主要问题就是费用。能降低费用当然都是大家最愿意接受的。和费用直接相关的就是流量了，流量低，费用就低了。虽然TCP本身的包头要比UDP多，但是UDP在实际应用中往往需要维护双向通道，就必须要通过大量的心跳包数据来维护端口资源。总的比较起来，UDP的实际流量要比TCP还要大。很多使用者在初期的时候并不了解UDP需要大量心跳包来维持端口资源这个问题，往往都认为UDP要比TCP更节省流量，实际上这里存在着一个误区。

4。在某些特定的应用场合，例如一些银行的时时交互系统，对响应速度要求很高，此时数据传输频率较快，不需要大量心跳包维持UDP端口资源，采用UDP就比较有利了。

5。在目前的1：N的传输模式中，既有多个GPRS终端设备往一个服务器中心传输数据，此时采用UDP会比TCP要好的多，因为UDP耗用更少的系统资源。但是在实际应用中却发现，很多用户还是采用TCP的传输方式，建立二级中心1：A（1：N），即每一个分中心对应N/A台设备，独立处理数据，再统一将数据传送到主中心。这样既能保证了传输过程中采用了TCP的传输协议，又能很好处理了中心服务器的多链路的系统耗用的问题。

以上是关于Linux C高级编程——网络编程的主要内容，如果未能解决你的问题，请参考以下文章

Linux C高级编程——网络编程基础

Linux C高级编程——文件操作之系统调用

Linux C高级编程——网络编程之以太网

Linux高级网络编程系列教程

c_cpp “Linux的环境高级编程”作业3