Linux深入理解TCP协议(connectbindlistenaccept)及其源码
Posted “逛丢一只鞋”
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Linux深入理解TCP协议(connectbindlistenaccept)及其源码相关的知识,希望对你有一定的参考价值。
文章目录
主要探讨的问题就是connect及bind、listen、accept背后的三次握手相关问题
基本知识
TCP/UDP/IP
协议 | 连接 | 可靠 | 服务 |
---|---|---|---|
TCP | 面向连接的 | 可靠的 | 字节流服务 |
UDP | 无连接 | 不可靠的 | 数据报服务 |
IP | 无连接 | 不可靠的 | 无状态的 |
RUDP:介于TCP和UDP中间,两者取其中。
OSI七层模型
TCP/UDP区别
TCP与UDP通信过程建立的区别。除了它们通信过程建立的不同之外,两者还有以下区别:
TCP通信特点
1)可靠性;
通信双方均就位,一方发送数据,另一方收到后会做出回应,如果超时未发送成功,会自动重发,数据不会丢失。
2)顺序性;
既然数据是按顺序走在建立的一条隧道中,那么数据遵循“先走先达到”的规则,并且隧道中的数据以“流”的形式传输,发送方发送的前后两次数据之间没有边界,需要接收方自己根据事先规定好的“协议”去判断数据边界。
3)高损耗。
“高损耗”包括机器性能损耗高、宽带流量损耗高。因为通信双方时刻需要维持着连接的存在,这必然会损耗通信双方主机性能,要想维持隧道的通畅,通信双方必须不断地发送检测包和应答包,同时,它还支持数据重发等数据纠错功能,这些都将导致网络流量的增加。
UDP通信特点
1)不可靠性;
既然无连接,发送方只管发送数据,而不管对方是否能够正确地接收到数据,更不负责数据超时重发等功能。
2)无序性;
数据以“数据报”的形式发送,可以把“数据报”看成是一个“包”。如果把TCP传输数据比如成“河里的流水”,那么UDP传输数据就是‘邮局寄信’。发送方先发送的数据可能后到达,后发送的数据可能先到达,这个跟短消息类似。
3)低损耗。
“低损耗”包括机器性能损耗低、宽带流量损耗低。UDP通信不需要维持一个连接的存在,所以它不需要消耗额外的机器性能。同时它也没有像TCP通信那样为了保持隧道的通畅,而必须不停地发送检测包和应答包,更不会进行一些数据检测纠错、重发等行为。
这次我们只讨论TCP通信。
TCP建立连接的三次握手过程
首先还是老生常谈的三次握手问题,还是照惯例先来再温习一遍
- 第一次握手:客户端尝试连接服务器,向服务器发送syn(全称是同步序列编号)报文,syn=i,客户端进入SYN_SEND状态等待服务器确认
- 第二次握手:服务器接收客户端syn报文并确认(ack=i+1),同时向客户端发送一个新的SYN报文(syn=j),即SYN+ACK报文,此时服务器进入SYN_RECV状态
- 第三次握手:客户端收到服务器的SYN+ACK报文,向服务器发送确认报文ACK(ack=j+1),此报文发送并被客户端接收后,客户端和服务器进入ESTABLISHED状态,完成三次握手
TCP编码流程
服务器
实现TCP需要的头文件:
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#include<arpa/inet.h>
需要的函数原型:
创建socket
① int socket(int domain, int type, int protocol);
//创建socket
- 返回值:-1 出错,只要返回值>=0即正确
返回的值,也是文件描述符 socket文件描述符 - domain:协议簇 一般用AF_INET(TCP/IP)协议簇
- type:在该协议簇下选择的具体的协议 TCP:SOCK_STREAM UDP:SOCK_DGRAM
- pro:具体的协议下更具体的协议:默认给0
bind绑定ip和端口号
② int bind(int sockfd, struct sockaddr *seraddr, socklen_t);
- sockfd:socket返回的文件描述符
- struct sockaddr *seraddr:服务器端的ip地址
- socklen_t:第二个参数的长度
为了了解这个函数我们还需要知道:
TCP如何标识一台主机?
需要知道 IP地址 + 端口号
struct sockaddr_in
{
sa_family_t sin_family;//地址族
u_int16_t sin_port;//端口号
struct in_addr sin_addr;IP地址
}
struct in_addr
{
u_int32_t s_addr;//无符号32位整型值
}
端口号的转化函数:将IP地址转化成整型值
端口号取值范围:0-65535 但0-1024(无法使用,系统预留) 1024-5000保留
一般我们用5000以上端口号
地址转化函数:
主机字节序:
大端模式:高位存低地址
小端模式:高位存高地址
网络字节序:
都用的大端模式(如果主机是小端模式不经过转化在网络中传输数据就会乱套)
listen启动监听
③ int listen(int sockfd, int size);
//给sockfd启动监听
- sockfd:socket返回的socket值监听sockfd套接字。监听:等客户端连接
- size:指定已完成连接队列的大小。一般为:size + 1
两个队列:
已完成连接的队列
正在完成连接的队列
accept接收连接的套接字
④ int accept(int sockfd, struct sockaddr* cliaddr, int len);
- sockfd:接收连接的套接字
- struct coskaddr cliaddr:客户端连接时内核自动填充
- int *len:填充的大小
- 返回值:返回维护本次连接的文件描述符,服务器和客户端通讯时通过accept返回的文件描述符进行通讯
recv获取数据
⑤ int recv(int c, void *buff ,int buffsize, int flag);
//获取数据
- int c:标识从哪个客户端来获取数据
- void *buff:读到的数据存放在哪
- int buffsize:buff缓冲区的大小有多少,一次最多读多少个字节的数据
- int flag:不用默认给0
send发送数据
⑥int send(int c, void *buff,int datasize, int flag);
发送数据
- int c:将数据发送给谁
- void *buff:发送的数据从哪开始
- int datasize:数据的大小
- int flag:不用默认给0
小结
服务器端编码流程:
- 调用socket()创建套接字;
- 定义strcuct sockaddr_in ser,cli;
- 对地址族,端口号,IP地址进行赋值;
- bind()进行命名;
- listen进行启动监听
- while(1)循环
{
int c = accept();获取连接
while(1)//一个客户端与服务器进行多次通讯
{
recv()/send();
}//收发
}//一个服务器可以多次处理不同客户端的连接 - close();
如下图为TCP服务器的创建:
客户端
需要的函数原型:
① int socket(int domain, int type, int protocol);//与前面一样
② int connect(int sockfd, (struct sockaddr*)seraddr, int len);//发起连接
- int sockfd:上面socket返回的文件描述符
- (struct sockaddr*)seraddr:和哪个服务器进行连接,服务器的地址和端口号
- int len:连接的长度
- 返回:-1 连接失败 返回>-1 成功
③ int send(int c, void *buff,int datasize, int flag);//发起连接
④ int recv(int c, void *buff ,int buffsize, int flag);//获取数据
⑤ close();//发送数据
客户端编码流程:
1.socker();创建套接字
2.connect();发起连接和服务器进行连接
3.while(1)//多次接受发送数据
{
send()/recv();多次
}
4.close();
下图为TCP客户端的创建:
客户端和服务器通信
探究使用Linux Socket api建立TCP连接的过程
从创建socket,到建立连接接收数据,最后关闭socket的过程如上图所示。
其中,和建立连接有关系的socket api主要是:connect、bind、listen和accept
为了探究建立连接时发生了什么,和TCP三次握手有什么关系,我们使用之前实验所写的hello/hi程序,用gdb为这四个函数打上断点,并使用wireshark监视相应端口,抓取数据包
bind,listen
当服务端运行bind,listen后,并没有捕获到任何数据包
connect
直到客户端运行connect后,才捕获到TCP三次握手发送的数据包,如下图所示
可以通过抓取的数据包信息看到Socket是如何建立TCP连接的
- 由客户端(44434端口)发送SYN数据报给服务端(65432端口),其中seq=0(这里和后面的seq,都是显示的相对seq,实际并不是0)
- 服务端返回SYN+ACK数据报给客户端,其中ack=1,seq=0
- 客户端返回ACK数据报,其中ack=1
通过这个实践可以推测,TCP的三次握手是在connect和accept之间完成的,bind和listen只是完成绑定和监听的功能
从源码角度分析TCP三次握手的过程
在上一个实验探究Socket底层是如何实现多态机制的时候,我们发现socket结构体中有一个名为ops
的结构体指针,结构体中又通过函数指针绑定了具体的底层函数,完成了connect
、accept
的实现。在struct proto tcp_prot
的初始化中我们可以找到对应的绑定函数。
struct proto tcp_prot = {
.name = "TCP",
.owner = THIS_MODULE,
.close = tcp_close,
.pre_connect = tcp_v4_pre_connect,
.connect = tcp_v4_connect,
.disconnect = tcp_disconnect,
.accept = inet_csk_accept,
...
};
可以看到,socket->ops->connect
绑定了函数tcp_v4_connect
,socket->ops->accept
绑定了inet_csk_accept
对tcp_v4_connect的部分源码分析
...
//设置套接字状态,从CLOSE变为TCP_SYN_SENT,对应客户端从CLOSED->SYN_SENT这一过程
tcp_set_state(sk, TCP_SYN_SENT);
//将套接字sk放入TCP连接管理哈希链表中
err = inet_hash_connect(&tcp_death_row, sk);
if (err)
goto failure;
//为连接分配一个随机的空闲端口
err = ip_route_newports(&rt, IPPROTO_TCP,
inet->inet_sport, inet->inet_dport, sk);
if (err)
goto failure;
...
...
if (!tp->write_seq)
//初始化报文内容
tp->write_seq = secure_tcp_sequence_number(inet->inet_saddr,
inet->inet_daddr,
inet->inet_sport,
usin->sin_port);
inet->inet_id = tp->write_seq ^ jiffies;
//构建并发送SYN数据报
err = tcp_connect(sk);
rt = NULL;
if (err)
goto failure;
...
对inet_csk_accept
的部分源码分析
在分析代码前我们需要了解,套接字有监听套接字和具体通信的套接字(accept
返回的那个)。监听套接字的扩展结构inet_connection_sock
中存在icsk_accept_queue
成员,此成员中有两个队列,一个用于完全建立连接(完成三次握手)的队列,此队列项中会包含新建的
用于通信的sock结构,在进程不在阻塞获得此sock结构后会把此队列项从完全建立连接的队列删除.此队列的最大长度即是listen(int s, int backlog)
中第二个参数指定的;另一个队列是半连接队列,即还没有完成三次握手的队列项会加入到此队列,此队列项中的sock完成三次握手后会从此队列中移除,添加到完全建立连接的队列中
...
//检查套接字是否处于监听状态(应该是在调用listen时设置的)
error = -EINVAL;
if (sk->sk_state != TCP_LISTEN)
goto out_err;
//在监听套接字上的连接队列如果为空(没有任何连接完成)
if (reqsk_queue_empty(&icsk->icsk_accept_queue)) {
//设置接收超时时间,若调用accept的时候设置了O_NONBLOCK,表示马上返回不阻塞进程
long timeo = sock_rcvtimeo(sk, flags & O_NONBLOCK);
error = -EAGAIN;
if (!timeo)//如果是非阻塞模式timeo为0 则马上返回
goto out_err;
//将进程阻塞,等待连接的完成,inet_csk_wait_for_connect核心是一个循环,等待三次握手中,客户端发来的最后一个ACK报文
error = inet_csk_wait_for_connect(sk, timeo);
if (error)
goto out_err;
}
//在监听套接字建立连接的队列中删除此request_sock连接项 并返回建立连接的sock
newsk = reqsk_queue_get_child(&icsk->icsk_accept_queue, sk);
//套接字状态变为TCP_SYN_RECV,对应连接建立完成,服务端进入ESTABLISHED状态
WARN_ON(newsk->sk_state == TCP_SYN_RECV)
分析这两段代码后,我们对TCP连接的建立已经有了一部分认知,tcp_v4_connect()
会发送SYN报文开始三次握手,而inet_csk_accept
接收来自客户端的ACK报文,标志着TCP连接建立完成。
三次握手的分析还并不完整,服务器端是如何接收第一次握手发来的SYN数据报,并返回SYN+ACK
数据报的?实际上服务器端接收到SYN报文后,最终会调用tcp_v4_do_rcv()
进行处理, 和tcp_send_ack()
一起返回第二次握手中的SYN+ACK
报文,客户端则是使用tcp_send_ack()
返回最后的ACK报文。受限于篇幅,不再对这些函数的源码进行分析
以上是关于Linux深入理解TCP协议(connectbindlistenaccept)及其源码的主要内容,如果未能解决你的问题,请参考以下文章