Linux 进程间套接字通信（Socket)基础知识

Posted 2023-05-02

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Linux 进程间套接字通信（Socket)基础知识相关的知识，希望对你有一定的参考价值。

参考技术A 姓名：罗学元学号：21181214375 学院：广州研究院

【嵌牛导读】Linux进程间套接字通信基础

【嵌牛鼻子】Linux 进程间套接字及通信介绍

【嵌牛提问】Linux进程间套接字包含哪些内容，如何实现通信

一、套接字（Socket）通信原理

套接字通信允许互联的位于不同计算机上的进程之间实现通信功能。

二、套接字的属性

套接字的特性由3个属性确定，它们分别是：域、类型和协议。

1. 套接字的域

它指定套接字通信中使用的网络介质，最常见的套接字域是AF_INET，它指的是Internet网络。当客户使用套接字进行跨网络的连接时，它就需要用到服务器计算机的IP地址和端口来指定一台联网机器上的某个特定服务，所以在使用socket作为通信的终点，服务器应用程序必须在开始通信之前绑定一个端口，服务器在指定的端口等待客户的连接。

另一个域AF_UNIX表示UNIX文件系统，就是文件输入/输出，它的地址就是文件名。

2. 套接字类型

因特网提供了两种通信机制：流（stream）和数据报（datagram），因而套接字的类型也就分为流套接字和数据报套接字。我们主要看流套接字。

流套接字由类型SOCK_STREAM指定，它们是在AF_INET域中通过TCP/IP连接实现，同时也是AF_UNIX中常用的套接字类型。

流套接字提供的是一个有序、可靠、双向字节流的连接，因此发送的数据可以确保不会丢失、重复或乱序到达，而且它还有一定的出错后重新发送的机制。

与流套接字相对的是由类型SOCK_DGRAM指定的数据报套接字，它不需要建立连接和维持一个连接，它们在AF_INET中通常是通过UDP/IP实现的。它对可以发送的数据的长度有限制，数据报作为一个单独的网络消息被传输，它可能丢失、复制或错乱到达，UDP不是一个可靠的协议，但是它的速度比较高，因为它并不需要总是要建立和维持一个连接。

3.套接字协议

只要底层的传输机制允许不止一个协议来提供要求的套接字类型，我们就可以为套接字选择一个特定的协议。通常只需要使用默认值。

三、套接字地址

每个套接字都有其自己的地址格式，对于AF_UNIX域套接字来说，它的地址由结构sockaddr_un来描述，该结构定义在头文件

struct sockaddr_un

sa_family_t sun_family; //AF_UNIX，它是一个短整型

char sum_path[]; //路径名

;

对于AF_INET域套接字来说，它的地址结构由sockaddr_in来描述，它至少包括以下几个成员：

struct sockaddr_in

short int sin_family; //AN_INET

unsigned short int sin_port; //端口号

struct in_addr sin_addr; //IP地址

而in_addr被定义为：

struct in_addr

unsigned long int s_addr;

四、基于流套接字的客户/服务器的工作流程

使用socket进行进程通信的进程采用的客户/服务器系统是如何工作的呢？

1.服务器端

首先，服务器应用程序用系统调用socket来创建一个套接字，它是系统分配给该服务器进程的类似文件描述符的资源，它不能与其他的进程共享。

接下来，服务器进程会给套接字起个名字，我们使用系统调用bind来给套接字命名。然后服务器进程就开始等待客户连接到这个套接字。

然后，系统调用listen来创建一个队列，并将其用于存放来自客户的进入连接。

最后，服务器通过系统调用accept来接受客户的连接。它会创建一个与原有的命名套接不同的新套接字，这个套接字只用于与这个特定客户端进行通信，而命名套接字（即原先的套接字）则被保留下来继续处理来自其他客户的连接。

2.客户端

基于socket的客户端比服务器端简单。同样，客户应用程序首先调用socket来创建一个未命名的套接字，然后讲服务器的命名套接字作为一个地址来调用connect与服务器建立连接。

一旦连接建立，我们就可以像使用底层的文件描述符那样用套接字来实现双向数据的通信。

Linux进程间通信 -- 数据报套接字 socket()bind()sendto()recvfrom()close()

前一篇文章，Linux进程间通信——使用流套接字介绍了一些有关socket（套接字）的一些基本内容，并讲解了流套接字的使用，这篇文章将会给大家讲讲，数据报套接字的使用。

一、简单回顾——什么是数据报套接字

socket，即套接字是一种通信机制，凭借这种机制，客户/服务器（即要进行通信的进程）系统的开发工作既可以在本地单机上进行，也可以跨网络进行。也就是说它可以让不在同一台计算机但通过网络连接计算机上的进程进行通信。也因为这样，套接字明确地将客户端和服务器区分开来。

相对于流套接字，数据报套接字的使用更为简单，它是由类型SOCK_DGRAM指定的，它不需要建立连接和维持一个连接，它们在AF_INET中通常是通过UDP/IP协议实现的。它对可以发送的数据的长度有限制，数据报作为一个单独的网络消息被传输,它可能会丢失、复制或错乱到达，UDP不是一个可靠的协议，但是它的速度比较高，因为它并一需要总是要建立和维持一个连接。

二、基于流套接字的客户/服务器的工作流程

使用数据报socket进行进程通信的进程采用的客户/服务器系统是如何工作的呢？

1、服务器端

与使用流套接字一样，首先服务器应用程序用系统调用socket()来创建一个套接安，它是系统分配给该服务器进程的类似文件描述符的资源，它不能与其他的进程共享。

接下来，服务器进程会给套接字起个名字（监听），我们使用系统调用bind()来给套接字命名。然后服务器进程就开始等待客户连接到这个套接字。

不同的是，然后系统调用recvfrom()来接收来自客户程序发送过来的数据。服务器程序对数据进行相应的处理，再通过系统调用sendto()把处理后的数据发送回客户程序。

与流套接字程序相比：

在流套接字中的程序中，接收数据是通过系统调用read，而发送数据是通过系统调用write()来实现，而在数据报套接字程序中，这是通过recvfrom()和sendto()调用来实现的。
使用数据报套接字的服务器程序并不需要listen()调用来创建一个队列来存储连接，也不需要accept()调用来接收连接并创建一个新的socket描述符

2、客户端

基于数据报socket的客户端比服务器端简单，同样，客户应用程序首先调用socket来创建一个未命名的套接字，与服务器一样，客户也是通过sendto()和recvfrom()来向服务器发送数据和从服务器程序接收数据。

与流套接字程序相比：

使用数据报套接字的客户程序并不需要使用connect()系统调用来连接服务器程序，它只要在需要时向服务器所监听的IP端口发送信息和接收从服务器发送回来的数据即可。

三、数据报socket的接口及作用

socket的接口函数声明在头文件 sys/types.h 和 sys/socket.h 中。

1、创建套接字——socket()系统调用

该函数用来创建一个套接字，并返回一个描述符，该描述符可以用来访问该套接字，它的原型如下：

int socket(int domain, int type, int protocol);

函数中的三个参数分别对应前面所说的三个套接字属性。protocol参数设置为0表示使用默认协议。

2、命名（绑定）套接字——bind()系统调用

该函数把通过socket()调用创建的套接字命名，从而让它可以被其他进程使用。对于AF_UNIX，调用该函数后套接字就会关联到一个文件系统路径名，对于AF_INET，则会关联到一个IP端口号。函数原型如下：

int bind( int socket, const struct sockaddr *address, size_t address_len);

成功时返回0，失败时返回-1；

3、发送数据——sendto()系统调用

该函数把缓冲区buffer中的信息给送给指定的IP端口的程序，原型如下：

int sendto(int sockfd, void *buffer, size_t len, int flags, struct sockaddr *to, socklen_t tolen);

buffer中储存着将要发送的数据，len是buffer的长度，而flags在应用中通常被设置为0，to是要发送数据到的程序的IP端口，tolen是to参数的长度。

成功时返回发送的数据的字节数，失败时返回-1。

4、接收数据——recvfrom()系统调用

该函数把发送给程序的信息储存在缓冲区buffer中，并记录数据来源的程序IP端口，原型如下：

int recvfrom(int sockfd, void *buffer, size_t len，int flags, struct sockaddr *src_from, socklen_t *src_len);

buffer用于储存接收到的数据，len指定buffer的长度，而flags在应用中通常被设置0，src_from若不为空，则记录数据来源程序的IP端口，若src_len不为空，则其长度信息记录在src_len所指向的变量中。

注意：默认情况下，recvfrom()是一个阻塞的调用，即直到它接收到数据才会返回。

5、关闭socket——close()系统调用

该系统调用用来终止服务器和客户上的套接字连接，我们应该总是在连接的两端（服务器和客户）关闭套接字。

四、进程使用数据报socket进行通信

下面用多个客户程序实例和一个服务器程序来演示多个进程如何通过使用数据报socket来进行通信。

sockserver2.c是一个服务器程序，它接收客户程序发来的数据，并创建一个子进程来处理客户发送过来的数据，处理过程非常简单，就是把大写字母改为小写。然后把处理后的数据（大写字母对应的小写字母）发送回给客户端。

sockclient2.c是一个客户程序，它向服务器程序发送数据，并接收服务器发送过来的处理后的数据（即小写字母），然后把接收到的数据输出到屏幕上。在运行客户程序时，你可以为它提供一个字符作为参数，此时客户程序将把些字符作为要处理的数据发送给服务器，如果不提供一个参数，则默认发送字符A。

sockserver2.c的源代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <signal.h>

int main(int arc, char **argv)
{
	int server_sockfd = -1;
	socklen_t server_len = 0;
	socklen_t client_len = 0;
	char buffer[512];
	ssize_t result = 0;

	struct sockaddr_in server_addr;
	struct sockaddr_in client_addr;

	// 创建数据报套接字
	server_sockfd = socket(AF_INET, SOCK_DGRAM, 0);

	// 设置监听的端口、IP
	server_addr.sin_family = AF_INET;
	server_addr.sin_addr.s_addr = htonl(INADDR_ANY);
	server_addr.sin_port = htons(9739);
	server_len = sizeof(server_addr);

	// 绑定（命名）套接字
	bind(server_sockfd, (struct sockaddr *)&server_addr, server_len);

	// 忽略子进程停止 或 退出 的信息
	signal(SIGCHLD, SIG_IGN);

	while (1)
	{
		// 接收数据，用 client_addr 来储存数据来源程序的IP端口
		result = recvfrom(server_sockfd, buffer, sizeof(buffer), 0,
						  (struct sockaddr *)&client_addr, &client_len);
		if (fork() == 0)
		{
			// 利用子进程来处理数据
			buffer[0] += ‘a‘ - ‘A‘;
			sleep(1);

			// 发送处理后的数据
			sendto(server_sockfd, buffer, sizeof(buffer), 0, (struct sockaddr *)&client_addr, client_len);

			printf("%c\n", buffer[0]);

			// 注意，一定要关闭子进程，否则程序运行会不正常
			exit(0);
		}
	}

	// 关闭套接字
	close(server_sockfd);
}

sockclient2.c的源代码如下：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>

#include <netinet/in.h>
#include <arpa/inet.h>

int main(int argc, char **argv)
{
	struct sockaddr_in server_addr;
	socklen_t server_len = 0;
	int sockfd = -1;
	char c = ‘A‘;

	// 取第一个参数的第一个字符
	if (argc > 1)
	{
		c = argv[1][0];
	}

	// 创建数据报套接字
	sockfd = socket(AF_INET, SOCK_DGRAM, 0);

	// 设置服务器IP、端口
	server_addr.sin_family = AF_INET;
	server_addr.sin_addr.s_addr = inet_addr("127.0.0.1");
	server_addr.sin_port = htons(9739);
	server_len = sizeof(server_addr);

	// 向服务器发送数据
	sendto(sockfd, &c, sizeof(char), 0,
		   (struct sockaddr *)&server_addr, server_len);

	// 接收服务器处理后发送过来的数据，由于不关心数据来源，所以把后两个参数设为0
	recvfrom(sockfd, &c, sizeof(char), 0, 0, 0);

	printf("char from server = %c\n", c);

	// 关闭套接字
	close(sockfd);
	exit(0);
}

运行结果如下：

先运行服务器程序，如下：

技术分享

再运行三个客户端：如下：

技术分享

在本例子中，我们启动了一个服务器程序和三个客户程序，从运行的结果来看，客户端发送给服务器程序的所有请求都得到了处理，即把大写字母变成了小写。recvfrom()调用是阻塞的调用，即只有当接收到数据才会返回。

五、数据报套接字与流套接字的比较

1、从使用的便利和效率来讲

我们可以看到使用数据报套接字的确是比使用流套接字简单，而且快速。

因为使用流套接字的程序，客户程序需要调用connect()来创建一个到服务器程序的连接，并需要维持这个连接，服务器程序也需要调用listen()来创建一个队列来保存未处理的请求，当有数据到达时，服务器也不需要调用accept()来接受连接并创建一个新socket描述符来处理请求。

再来看看使用数据报套接字的程序，服务器程序与客户程序所使用的系统调用大致相同，服务器程序只比客户程序多使用了一个bind()调用。基于数据报套接字的程序，只需要使用sendto()调用来向指定IP端口的程序发送信息，使用recvfrom()调用从指向的IP端口接收信息即可。因为它并不需要建立一个连接，接受连接等，所以省去了很多的功夫。

2、从使用场合来讲

我们知道流套接字是基于TCP/IP协议的，它是一种安全的协议，提供的是一个有序、可靠、双向字节流的连接，发送的数据可以确保不会丢失、重复或乱序到达，而且它还有一定的出错后重新发送的机制。所以它比较适合用来发送信息量大的数据文件，或对数据完整性要求较高的文件，如压缩文件、视频文件等

而数据报套接字是基于UDP/IP协议实现的。它对可以发送的数据的长度有限制，数据报作为一个单独的网络消息被传输,它可能会丢失、复制或错乱到达，UDP不是一个可靠的协议，但是它的速度比较高。所以它比较适合发送一些对实时性要求较高，但是对安全性和完整性要求不太高的数据。如我们熟悉的聊天信息，即使有一点的丢失也不会造成理解上的大的问题。

参考：

http://blog.csdn.net/ljianhui/article/details/10697935

以上是关于Linux 进程间套接字通信（Socket)基础知识的主要内容，如果未能解决你的问题，请参考以下文章

Linux进程间通信 -- 数据报套接字 socket()bind()sendto()recvfrom()close()

进程通信

linux高级编程之socket进程通信

Linux进程间通信详解（最全）

UNIX Domain Socket（UDS）是什么？同一台主机间进程间通信

套接字通信