TCP为什么是可靠的（怎么保证有效传输的）？

Posted 2022-12-26 杨戬

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了TCP为什么是可靠的（怎么保证有效传输的）？相关的知识，希望对你有一定的参考价值。

文章目录

TCP为什么是可靠性的？
- 总结：
原理解析

TCP为什么是可靠性的？

可靠传输就是通过TCP连接传送的数据是没有差错、不会丢失、不重复并且按序到达的。TCP是通过序列号、检验和、确认应答信号、重发机制、连接管理、窗口控制、流量控制、拥塞控制一起保证TCP传输的可靠性的。

总结：

TCP保证可靠性一般有以下几种方法：

检验和：在数据传输过程中，吧传输的数据当作一个16位整数。吧所有的数据加起来，最前面的进位补到最后一位，然后取反得到校验和。发送方和接收方验证校验和是否相同。不相同则数据传输有误，相同也可能有问题。
确认应答：ACK和序列号（一应一答）机制保证数据的完整性（三次握手于四次挥手过程中通过比对Seq和ACK来实现）
超时重传：发送数据包在一定的时间周期内没有收到相应的ACK，等待一定的时间，超时之后就认为这个数据包丢失，就会重新发送（也就是发送数据后，长时间没收到回应，会把数据再发一次。）
连接管理：三次握手，四次挥手
最大消息长度：理想的情况下是该长度的数据刚好不被网络层分块。
拥塞控制：控制传输上流量（发送数据时开始是慢启动，先发送一点点数据去探测网络拥塞不拥塞，如果不拥塞了，则大量的发送数据。如果突然拥塞了，则又很慢的发送数据。这样是为了尽可能快的发送数据，避免网络拥塞造成一系列问题）
流量控制：TCP利用滑动窗口实现流量控制，流量控制是为了控制发送方的发送速率，保证接收方来的及时接收

原理解析

一、检验和

检验和：通过检验和的方式，接收端可以检测出来数据是否有差错和异常，假如有差错就会直接丢弃TCP 段，重新发送。

TCP在计算检验和时，会在TCP首部加上一个12字节的伪首部。

检验和总共计算3 部分：

TCP首部
TCP数据
TCP伪首部；

计算方式如下：在数据传输的过程中，将发送的数据段都当做一个16位的整数。将这些整数加起来。并且前面的进位不能丢弃，补在后面，最后取反，得到校验和。

发送方：在发送数据之前计算检验和，并进行校验和的填充。
接收方：收到数据后，对数据以同样的方式进行计算，求出校验和，与发送方的进行比对。

注意：如果接收方比对校验和与发送方不一致，那么数据一定传输有误。但是如果接收方比对校验和与发送方一致，数据不一定传输成功。

二、序列号/确认应答

序列号/确认应答机制过程如下：

发送端每次发送数据时，TCP就给每个数据包分配一个序列号并且在一个特定的时间内等待接收端对分配的这个序列号进行确认，如果发送端在一个特定时间内没有收到接收端的确认，则发送端会重传此数据包。
接收端利用序列号对接收的数据进行确认，以便检测对方发送的数据是否有丢失或者乱序等，接收端一旦收到已经顺序化的数据，它就将这些数据按正确的顺序重组成数据流并传递到高层进行处理。

上述过程中，只要发送端有一个包传输，接收端没有回应确认包（ACK包），发送端就会认为数据丢包，然后进行重发。或者接收端的应答包，发送端没有收到也会重发数据。这就可以保证数据的完整性。

另外：序列号的作用不仅仅是应答的作用，有了序列号能够将接收到的数据根据序列号排序，并且去掉重复序列号的数据。这也是TCP传输可靠性的保证之一。

三、超时重传

首先，TCP可靠性中最重要的一个机制是处理数据超时和重传。正是因为有这样的重传机制作为保障，在我们传输过程发生错误的时候，可以通过重传机制进行收尾。

超时重传原理

TCP协议要求在发送端每发送一个报文段，就启动一个定时器并等待确认信息；接收端成功接收新数据后返回确认信息。若在定时器超时前数据未能被确认，TCP就认为报文段中的数据已丢失或损坏，需要对报文段中的数据重新组织和重传。

导致重传的情况

首先，发送方没有接收到响应的ACK报文原因可能有两点：

数据在传输过程中由于网络原因等直接全体丢包，接收方根本没有接收到。
接收方接收到了响应的数据，但是发送的ACK报文响应却由于网络原因丢包了。

那么发生上述情况，我们的发送方在发送完数据后等待一个时间，时间到达没有接收到ACK报文，那么对刚才发送的数据进行重新发送。

如果是刚才第一个原因，接收方收到二次重发的数据后，便进行ACK应答。
如果是第二个原因，接收方发现接收的数据已存在（判断存在的根据就是序列号，所以上面说序列号还有去除重复数据的作用），那么直接丢弃，仍旧发送ACK应答。

我们知道，一来一回的时间总是差不多的，都会有一个类似于平均值的概念。比如发送一个包到接
收端收到这个包一共是0.5s，然后接收端回发一个确认包给发送端也要0.5s，这样的两个时间就是
RTT（往返时间）。然后可能由于网络原因的问题，时间会有偏差，称为抖动（方差）。

所以，超时重传的时间大概是比往返时间+抖动值还要稍大的时间。

注意：在重发的过程中，假如一个包经过多次的重发也没有收到对端的确认包，那么就会认为接收端异常，强制关闭连接。并且通知应用通信异常强行终止。

四、连接管理

连接管理就是三次握手与四次挥手的过程，过程如下图所示：

五、最大消息长度

在建立TCP连接的时候，双方约定一个最大的长度（MSS）作为发送的单位，重传的时候也是以这个单位来进行重传。

理想的情况下是该长度的数据刚好不被网络层分块。

双方协商最大报文消息长度流程如下所示：

六、拥塞控制

滑动窗口控制解决了两台主机之间因传送速率而可能引起的丢包问题，在一方面保证了TCP数据传送的可靠性。然而如果网络非常拥堵，此时再发送数据就会加重网络负担，那么发送的数据段很可能超过了最大生存时间也没有到达接收方，就会产生丢包问题。为此TCP引入慢启动机制，先发出少量数据，就像探路一样，先摸清当前的网络拥堵状态后，再决定按照多大的速度传送数据。

发送开始时定义拥塞窗口大小为1；每次收到一个ACK应答，拥塞窗口加1；而在每次发送数据时，发送窗口取拥塞窗口与接送段接收窗口最小者。

慢启动：在启动初期以指数增长方式增长；设置一个慢启动的阈值，当以指数增长达到阈值时就停止指数增长，按照线性增长方式增加至拥塞窗口；线性增长达到网络拥塞时立即把拥塞窗口置回 1，进行新一轮的“慢启动”，同时新一轮的阈值变为原来的一半。

拥塞控制算法主要有：慢启动、拥塞避免、快重传和快恢复；

他们的传播过程图如下所示：

1、慢启动

通常在一条TCP连接开始时，cwnd 被设置为 1 个 MSS（最大报文段），也即 cwnd = 1 该阶段，每当TCP发送方将发送窗口的数据发送完，并顺利接收到所有的确认后，就会将拥塞窗口大小翻倍，也即慢启动阶段，cwnd 以指数形式增长，如下图所示；注意这里忽略了接收窗口的影响，拥塞窗口会一直增长直到到达慢开始门限 ssthresh，开始执行拥塞避免算法。