为什么SO_LINGER选项没有0超时或10秒超时没有立即删除套接字或10秒后?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了为什么SO_LINGER选项没有0超时或10秒超时没有立即删除套接字或10秒后?相关的知识,希望对你有一定的参考价值。

我已经阅读了TCP option SO_LINGER (zero) - when it's required和其他几个相关的问题和答案,但我无法重现这些帖子中解释的任何SO_LINGER行为。我将在这里分享我的许多实验之一。

我在以下环境中执行此实验。

$ lsb_release -d
Description:    Debian GNU/Linux 9.0 (stretch)
$ gcc -dumpversion
6.3.0

以下是连接到服务器但行为不正常的客户端的示例,但不会在90秒内收到任何数据。

/* client.c */
#include <stdio.h>
#include <string.h>
#include <unistd.h>

#include <sys/socket.h>
#include <arpa/inet.h>
#include <netdb.h>

int main()
{
    int sockfd;
    int ret;
    struct addrinfo hints, *ai;
    char buffer[256];
    ssize_t bytes;

    memset(&hints, 0, sizeof hints);
    hints.ai_family = AF_INET;
    hints.ai_socktype = SOCK_STREAM;

    if ((ret = getaddrinfo(NULL, "8000", &hints, &ai)) == -1) {
        fprintf(stderr, "client: getaddrinfo: %s
", gai_strerror(ret));
        return 1;
    }

    sockfd = socket(ai->ai_family, ai->ai_socktype, ai->ai_protocol);
    if (sockfd == -1) {
        perror("client: socket");
        return 1;
    }

    if (connect(sockfd, ai->ai_addr, ai->ai_addrlen) == -1) {
        perror("client: connect");
        close(sockfd);
        return -1;
    }

    printf("client: connected
");

    /*
    bytes = recv(sockfd, buffer, sizeof buffer, 0);
    if (recv(sockfd, buffer, sizeof buffer, 0) == -1) {
        perror("client: recv");
        close(sockfd);
        return -1;
    }

    printf("client: received: %.*s
", (int) bytes, buffer);
    */

    sleep(90);
    freeaddrinfo(ai);

    printf("client: closing socket ...
");
    close(sockfd);
    printf("client: closed socket!
");

    return 0;
}

这是我的服务器代码,它将hello发送到连接到服务器的每个客户端,然后立即关闭连接。为简单起见,此服务器不是多线程的。在多线程服务器中,它将接受来自客户端的100个连接的连接,其中许多可能是行为不端,我们的目标是尽快丢弃无用的套接字以释放为这些套接字使用的端口。

为实现这一目标,我们启用了SO_LINGER套接字选项,延迟时间为10秒。

/* server.c */
#include <stdio.h>
#include <string.h>
#include <unistd.h>

#include <sys/socket.h>
#include <arpa/inet.h>
#include <netdb.h>

int main()
{
    int sockfd;
    int ret;
    int yes = 1;

    struct addrinfo hints, *ai;

    memset(&hints, 0, sizeof hints);
    hints.ai_family = AF_INET;
    hints.ai_socktype = SOCK_STREAM;
    hints.ai_flags = AI_PASSIVE;

    if ((ret = getaddrinfo(NULL, "8000", &hints, &ai)) == -1) {
        fprintf(stderr, "getaddrinfo: %s
", gai_strerror(ret));
        return 1;
    }

    sockfd = socket(ai->ai_family, ai->ai_socktype, ai->ai_protocol);
    if (sockfd == -1) {
        perror("server: socket");
        return 1;
    }

    if (setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR, &yes, sizeof yes) == -1) {
        perror("server: setsockopt");
        close(sockfd);
        return 1;
    }

    if (bind(sockfd, ai->ai_addr, ai->ai_addrlen) == -1) {
        perror("server: bind");
        close(sockfd);
        return 1;
    }

    freeaddrinfo(ai);

    if (listen(sockfd, 10) == -1) {
        perror("server: listen");
        close(sockfd);
        return 1;
    }

    printf("server: listening ...
");

    while (1) {
        int client_sockfd;
        struct sockaddr_storage client_addr;
        socklen_t client_addrlen = sizeof client_addr;
        struct linger l_opt;

        printf("server: accepting ...
");
        client_sockfd = accept(sockfd, (struct sockaddr *) &client_addr,
                               &client_addrlen);

        /* Set SO_LINGER opt for the new client socket. */
        l_opt.l_onoff = 1;
        l_opt.l_linger = 10;
        setsockopt(sockfd, SOL_SOCKET, SO_LINGER, &l_opt, sizeof l_opt);

        if (client_sockfd == -1) {
            perror("server: accept");
            continue;
        }

        if (send(client_sockfd, "hello
", 6, 0) == -1) {
            perror("server: send");
            continue;
        }

        printf("server: sent: hello
");
        printf("server: closing client socket ...
");
        close(client_sockfd);
        printf("server: closed client socket!
");
    }

    return 0;
}

这是我的实验跑步者。

# run.sh
gcc -std=c99 -Wall -Wextra -Wpedantic -D_DEFAULT_SOURCE server.c -o server
gcc -std=c99 -Wall -Wextra -Wpedantic -D_DEFAULT_SOURCE client.c -o client
./server &
sleep 1
./client
pkill ^server$

在另一个窗口/终端中,我运行这个小bash脚本来监视每10秒钟的套接字状态。

$ for i in {1..10}; do netstat -nopa 2> /dev/null | grep :8000; echo =====; sleep 10; done
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (59.84/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (49.83/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (39.82/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (29.81/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (19.80/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (9.78/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
tcp        0      0 127.0.0.1:8000          127.0.0.1:35536         FIN_WAIT2   -                    timewait (0.00/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
=====
tcp        0      0 0.0.0.0:8000            0.0.0.0:*               LISTEN      16293/./server       off (0.00/0/0)
tcp        7      0 127.0.0.1:35536         127.0.0.1:8000          CLOSE_WAIT  16295/./client       off (0.00/0/0)
=====
=====

上面的输出显示服务器套接字(输出的每次迭代中的第三行)保持在FIN_WAIT2状态60秒(即默认时间等待)。

为什么SO_LINGER选项超时为10秒并不能确保服务器在10秒后成功关闭其客户端套接字(即本地地址= 127.0.0.1:8000;外部地址= 127.0.0.1:35536)?

注意:即使0超时,我也得到相同的结果,即使用以下代码,本地地址= 127.0.0.1:8000的套接字和外部地址= 127.0.0.1:35536保持在FIN_WAIT2状态60秒。

        /* Set SO_LINGER opt for the new client socket. */
        l_opt.l_onoff = 1;
        l_opt.l_linger = 0;
        setsockopt(sockfd, SOL_SOCKET, SO_LINGER, &l_opt, sizeof l_opt);

如果SO_LINGER对删除套接字或FIN_WAIT2超时没有影响,那么SO_LINGER的目的究竟是什么?

答案

你有一个基本的误解。

使用正超时设置SO_LINGER完全是一件事。它使close()能够阻止该超时,同时还有任何出站待处理数据仍在飞行中。如果你不修改它,默认是close()是异步的,这意味着应用程序无法判断是否有任何数据仍然在飞行中。

因此,这样做的目的是使应用程序能够检测到完全发送最终待处理数据的失败。

它与清理死亡或无用的插座没有任何关系。具体来说,它不会缩短TIME_WAIT或关闭后的TCP超时。

这可以通过使用不同的设置以另一种方式实现,但其效果是重置连接并丢失飞行中的任何数据,并且可能在另一端引起惊愕,因此不建议这样做。至少是我。

您的实际代码表现完全符合预期。服务器已关闭,因此客户端处于CLOSE_WAIT状态90秒,服务器处于FIN_WAIT_2,等待客户端关闭。这里没有任何东西,只是一个行为不端的客户。一旦超时到期,服务器将继续存在。

另一答案

@LoneLearner而不是使用:

l_onoff = 1

l_linger = 0

试试这个:

l_onoff = 0

l_linger = 0

您将看到应用程序的非常不同的行为。在第二种情况下,一旦你关闭()socker你也会立即摆脱它。

这是一个突然关闭连接的极端操作,远程端将看到错误(连接重置),此外,未发送的数据将被丢弃。 so_linger的这种设置的便利性取决于具体的应用程序和情况。许多人认为这不是一个好习惯。

以上是关于为什么SO_LINGER选项没有0超时或10秒超时没有立即删除套接字或10秒后?的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 tls.Dial 添加 10 秒超时? (没有tls.DialTimeout对应net.DialTimeout)

DefaultHttpClient 超时设置为 10 秒,但只需 1 秒即可超时

Fopen 或 File_Put_Contents 超时选项?

如何解决SSH连接Linux超时自动断开

在 Apache JMeter 中配置响应超时

CRT超时断开解决方案