Linux编程之UDP SOCKET全攻略

Posted 2020-10-17 镜花水月小朋友

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Linux编程之UDP SOCKET全攻略相关的知识，希望对你有一定的参考价值。

这篇文章将对linux下udp socket编程重要知识点进行总结，无论是开发人员应知应会的，还是说udp socket的一些偏僻知识点，本文都会讲到。尽可能做到，读了一篇文章之后，大家对udp socket有一个比较全面的认识。本文分为两个专题，第一个是常用的upd socket框架，第二个是一些udp socket并不常用但又相当重要的知识点。

一、基本的udp socket编程

1. UDP编程框架
要使用UDP协议进行程序开发，我们必须首先得理解什么是什么是UDP？这里简单概括一下。

UDP（user datagram protocol）的中文叫用户数据报协议，属于传输层。UDP是面向非连接的协议，它不与对方建立连接，而是直接把我要发的数据报发给对方。所以UDP适用于一次传输数据量很少、对可靠性要求不高的或对实时性要求高的应用场景。正因为UDP无需建立类如三次握手的连接，而使得通信效率很高。

UDP的应用非常广泛，比如一些知名的应用层协议（SNMP、DNS）都是基于UDP的，想一想，如果SNMP使用的是TCP的话，每次查询请求都得进行三次握手，这个花费的时间估计是使用者不能忍受的，因为这会产生明显的卡顿。所以UDP就是SNMP的一个很好的选择了，要是查询过程发生丢包错包也没关系的，我们再发起一个查询就好了，因为丢包的情况不多，这样总比每次查询都卡顿一下更容易让人接受吧。

UDP通信的流程比较简单，因此要搭建这么一个常用的UDP通信框架也是比较简单的。以下是UDP的框架图。

由以上框图可以看出，客户端要发起一次请求，仅仅需要两个步骤（socket和sendto），而服务器端也仅仅需要三个步骤即可接收到来自客户端的消息（socket、bind、recvfrom）。

2. UDP程序设计常用函数

#include <sys/types.h>          
#include <sys/socket.h>
int socket(int domain, int type, int protocol);

参数domain:用于设置网络通信的域，socket根据这个参数选择信息协议的族

Name Purpose

AF_UNIX, AF_LOCAL Local communication

AF_INET IPv4 Internet protocols //用于IPV4

AF_INET6 IPv6 Internet protocols //用于IPV6

AF_IPX IPX - Novell protocols

AF_NETLINK Kernel user interface device

AF_X25 ITU-T X.25 / ISO-8208 protocol

AF_AX25 Amateur radio AX.25 protocol

AF_ATMPVC Access to raw ATM PVCs

AF_APPLETALK AppleTalk

AF_PACKET Low level packet interface

AF_ALG Interface to kernel crypto API

对于该参数我们仅需熟记AF_INET和AF_INET6即可

小插曲：PF_XXX和AF_XXX

我们在看Linux网络编程相关代码时会发现PF_XXX和AF_XXX会混着用，他们俩有什么区别呢？以下内容摘自《UNP》。

AF_前缀表示地址族（Address Family），而PF_前缀表示协议族（Protocol Family）。历史上曾有这样的想法：单个协议族可以支持多个地址族，PF_的值可以用来创建套接字，而AF_值用于套接字的地址结构。但实际上，支持多个地址族的协议族从来就没实现过，而头文件<sys/socket.h>中为一给定的协议定义的PF_值总是与此协议的AF_值相同。

所以我在实际编程时还是偏向于使用AF_XXX。

参数type（只列出最重要的三个）:

SOCK_STREAM Provides sequenced, reliable, two-way, connection-based byte streams. //用于TCP

SOCK_DGRAM Supports datagrams (connectionless, unreliable messages ). //用于UDP

SOCK_RAW Provides raw network protocol access. //RAW类型，用于提供原始网络访问

参数protocol：置0即可

返回值：成功：非负的文件描述符

失败：-1

#include <sys/types.h>
#include <sys/socket.h>
ssize_t sendto(int sockfd, const void *buf, size_t len, int flags,
              const struct sockaddr *dest_addr, socklen_t addrlen);

第一个参数sockfd:正在监听端口的套接口文件描述符，通过socket获得

第二个参数buf：发送缓冲区，往往是使用者定义的数组，该数组装有要发送的数据

第三个参数len:发送缓冲区的大小，单位是字节

第四个参数flags:填0即可

第五个参数dest_addr:指向接收数据的主机地址信息的结构体，也就是该参数指定数据要发送到哪个主机哪个进程

第六个参数addrlen:表示第五个参数所指向内容的长度

返回值：成功：返回发送成功的数据长度

失败： -1

#include <sys/types.h>
#include <sys/socket.h>
ssize_t recvfrom(int sockfd, void *buf, size_t len, int flags,
                struct sockaddr *src_addr, socklen_t *addrlen);

第一个参数sockfd:正在监听端口的套接口文件描述符，通过socket获得

第二个参数buf：接收缓冲区，往往是使用者定义的数组，该数组装有接收到的数据

第三个参数len:接收缓冲区的大小，单位是字节

第四个参数flags:填0即可

第五个参数src_addr:指向发送数据的主机地址信息的结构体，也就是我们可以从该参数获取到数据是谁发出的

第六个参数addrlen:表示第五个参数所指向内容的长度

返回值：成功：返回接收成功的数据长度

失败： -1

#include <sys/types.h>
#include <sys/socket.h>
int bind(int sockfd, const struct sockaddr* my_addr, socklen_t addrlen);

第一个参数sockfd:正在监听端口的套接口文件描述符，通过socket获得

第二个参数my_addr:需要绑定的IP和端口

第三个参数addrlen：my_addr的结构体的大小

返回值：成功：0

失败：-1

#include <unistd.h>
int close(int fd);

close函数比较简单，只要填入socket产生的fd即可。

3. 搭建UDP通信框架

server：

 1 #include <stdio.h>
 2 #include <sys/types.h>
 3 #include <sys/socket.h>
 4 #include <netinet/in.h>
 5 #include <string.h>
 6 
 7 #define SERVER_PORT 8888
 8 #define BUFF_LEN 1024
 9 
10 void handle_udp_msg(int fd)
11 {
12     char buf[BUFF_LEN];  //接收缓冲区，1024字节
13     socklen_t len;
14     int count;
15     struct sockaddr_in clent_addr;  //clent_addr用于记录发送方的地址信息
16     while(1)
17     {
18         memset(buf, 0, BUFF_LEN);
19         len = sizeof(clent_addr);
20         count = recvfrom(fd, buf, BUFF_LEN, 0, (struct sockaddr*)&clent_addr, &len);  //recvfrom是拥塞函数，没有数据就一直拥塞
21         if(count == -1)
22         {
23             printf("recieve data fail!\\n");
24             return;
25         }
26         printf("client:%s\\n",buf);  //打印client发过来的信息
27         memset(buf, 0, BUFF_LEN);
28         sprintf(buf, "I have recieved %d bytes data!\\n", count);  //回复client
29         printf("server:%s\\n",buf);  //打印自己发送的信息给
30         sendto(fd, buf, BUFF_LEN, 0, (struct sockaddr*)&clent_addr, len);  //发送信息给client，注意使用了clent_addr结构体指针
31 
32     }
33 }
34 
35 
36 /*
37     server:
38             socket-->bind-->recvfrom-->sendto-->close
39 */
40 
41 int main(int argc, char* argv[])
42 {
43     int server_fd, ret;
44     struct sockaddr_in ser_addr; 
45 
46     server_fd = socket(AF_INET, SOCK_DGRAM, 0); //AF_INET:IPV4;SOCK_DGRAM:UDP
47     if(server_fd < 0)
48     {
49         printf("create socket fail!\\n");
50         return -1;
51     }
52 
53     memset(&ser_addr, 0, sizeof(ser_addr));
54     ser_addr.sin_family = AF_INET;
55     ser_addr.sin_addr.s_addr = htonl(INADDR_ANY); //IP地址，需要进行网络序转换，INADDR_ANY：本地地址
56     ser_addr.sin_port = htons(SERVER_PORT);  //端口号，需要网络序转换
57 
58     ret = bind(server_fd, (struct sockaddr*)&ser_addr, sizeof(ser_addr));
59     if(ret < 0)
60     {
61         printf("socket bind fail!\\n");
62         return -1;
63     }
64 
65     handle_udp_msg(server_fd);   //处理接收到的数据
66 
67     close(server_fd);
68     return 0;
69 }

client：

 1 #include <stdio.h>
 2 #include <sys/types.h>
 3 #include <sys/socket.h>
 4 #include <netinet/in.h>
 5 #include <string.h>
 6 
 7 #define SERVER_PORT 8888
 8 #define BUFF_LEN 512
 9 #define SERVER_IP "172.0.5.182"
10 
11 
12 void udp_msg_sender(int fd, struct sockaddr* dst)
13 {
14 
15     socklen_t len;
16     struct sockaddr_in src;
17     while(1)
18     {
19         char buf[BUFF_LEN] = "TEST UDP MSG!\\n";
20         len = sizeof(*dst);
21         printf("client:%s\\n",buf);  //打印自己发送的信息
22         sendto(fd, buf, BUFF_LEN, 0, dst, len);
23         memset(buf, 0, BUFF_LEN);
24         recvfrom(fd, buf, BUFF_LEN, 0, (struct sockaddr*)&src, &len);  //接收来自server的信息
25         printf("server:%s\\n",buf);
26         sleep(1);  //一秒发送一次消息
27     }
28 }
29 
30 /*
31     client:
32             socket-->sendto-->revcfrom-->close
33 */
34 
35 int main(int argc, char* argv[])
36 {
37     int client_fd;
38     struct sockaddr_in ser_addr;
39 
40     client_fd = socket(AF_INET, SOCK_DGRAM, 0);
41     if(client_fd < 0)
42     {
43         printf("create socket fail!\\n");
44         return -1;
45     }
46 
47     memset(&ser_addr, 0, sizeof(ser_addr));
48     ser_addr.sin_family = AF_INET;
49     //ser_addr.sin_addr.s_addr = inet_addr(SERVER_IP);
50     ser_addr.sin_addr.s_addr = htonl(INADDR_ANY);  //注意网络序转换
51     ser_addr.sin_port = htons(SERVER_PORT);  //注意网络序转换
52 
53     udp_msg_sender(client_fd, (struct sockaddr*)&ser_addr);
54 
55     close(client_fd);
56 
57     return 0;
58 }

以上的框架用于一台主机不同端口的UDP通信，现象如下：

我们先建立server端，等待服务；然后我们建立client端请求服务。

server端：

client端：

自己主机跟自己通信不是很爽，我们想跟其他主机通信怎么搞？很简单，上面client的代码的第49行的注释打开，并注释掉下面那行，在宏定义里填入自己想通信的serverip就可以了。现象如下：

server端：

client端：

这样我们就实现了主机172.0.5.183和172.0.5.182之间的网络通信。

UDP通用框架搭建完成，我们可以利用该框架跟指定主机进行通信了。

如果想学习UDP的基础知识，以上的知识就足够了；如果想继续深入学习一下UDP SOCKET一些高级知识（奇技淫巧），可以花点时间往下看。

二、高级udp socket编程

1. udp的connect函数
什么？UDP也有conenct？connect不是用于TCP编程的吗？
是的，UDP网络编程中的确有connect函数，但它仅仅用于表示确定了另一方的地址，并没有其他含义。
有了以上认识后，我们可以知道UDP套接字有以下区分：
1）未连接的UDP套接字
2）已连接的UDP套接字

对于未连接的套接字，也就是我们常用的的UDP套接字，我们使用的是sendto/recvfrom进行信息的收发，目标主机的IP和端口是在调用sendto/recvfrom时确定的；

在一个未连接的UDP套接字上给两个数据报调用sendto函数内核将执行以下六个步骤：
1）连接套接字
2）输出第一个数据报
3）断开套接字连接
4）连接套接字
5）输出第二个数据报
6）断开套接字连接

对于已连接的UDP套接字，必须先经过connect来向目标服务器进行指定，然后调用read/write进行信息的收发，目标主机的IP和端口是在connect时确定的，也就是说，一旦conenct成功，我们就只能对该主机进行收发信息了。

已连接的UDP套接字给两个数据报调用write函数内核将执行以下三个步骤：
1）连接套接字
2）输出第一个数据报
3）输出第二个数据报

由此可以知道，当应用进程知道给同一个目的地址的端口号发送多个数据报时，显示套接字效率更高。

下面给出带connect函数的UDP通信框架

具体框架代码不再给出了，因为跟上面不带connect的代码大同小异，仅仅多出一个connect函数处理而已，下面给出处理conenct()的基本步骤。

void udp_handler(int s, struct sockaddr* to)
{
    char buf[1024] = "TEST UDP !";
    int n = 0;
    connect(s, to, sizeof(*to);
 
    n = write(s, buf, 1024);
 
    read(s, buf, n);
}

2. udp报文丢失问题
因为UDP自身的特点，决定了UDP会相对于TCP存在一些难以解决的问题。第一个就是UDP报文缺失问题。
在UDP服务器客户端的例子中，如果客户端发送的数据丢失，服务器会一直等待，直到客户端的合法数据过来。如果服务器的响应在中间被路由丢弃，则客户端会一直阻塞，直到服务器数据过来。

防止这样的永久阻塞的一般方法是给客户的recvfrom调用设置一个超时，大概有这么两种方法：
1）使用信号SIGALRM为recvfrom设置超时。首先我们为SIGALARM建立一个信号处理函数，并在每次调用前通过alarm设置一个5秒的超时。如果recvfrom被我们的信号处理函数中断了，那就超时重发信息；若正常读到数据了，就关闭报警时钟并继续进行下去。

2）使用select为recvfrom设置超时
设置select函数的第五个参数即可。

3. udp报文乱序问题
所谓乱序就是发送数据的顺序和接收数据的顺序不一致，例如发送数据的顺序为A、B、C，但是接收到的数据顺序却为：A、C、B。产生这个问题的原因在于，每个数据报走的路由并不一样，有的路由顺畅，有的却拥塞，这导致每个数据报到达目的地的顺序就不一样了。UDP协议并不保证数据报的按序接收。

解决这个问题的方法就是发送端在发送数据时加入数据报序号，这样接收端接收到报文后可以先检查数据报的序号，并将它们按序排队，形成有序的数据报。

4. udp流量控制问题
总所周知，TCP有滑动窗口进行流量控制和拥塞控制，反观UDP因为其特点无法做到。UDP接收数据时直接将数据放进缓冲区内，如果用户没有及时将缓冲区的内容复制出来放好的话，后面的到来的数据会接着往缓冲区放，当缓冲区满时，后来的到的数据就会覆盖先来的数据而造成数据丢失（因为内核使用的UDP缓冲区是环形缓冲区）。因此，一旦发送方在某个时间点爆发性发送消息，接收方将因为来不及接收而发生信息丢失。

解决方法一般采用增大UDP缓冲区，使得接收方的接收能力大于发送方的发送能力。

int n = 220 * 1024; //220kB

setsocketopt(sockfd, SOL_SOCKET, SO_RCVBUF, &n, sizeof(n));

这样我们就把接收方的接收队列扩大了，从而尽量避免丢失数据的发生。

以上是关于Linux编程之UDP SOCKET全攻略的主要内容，如果未能解决你的问题，请参考以下文章

Linux编程之UDP SOCKET全攻略

Python 之 Socket编程(TCP/UDP)

[国嵌攻略][090][linux网络编程模型]

[linux] Linux网络之Socket编程入门

linux--网络编程之socket