nginx的keepalive源码分析
Posted 代码与远方
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nginx的keepalive源码分析相关的知识,希望对你有一定的参考价值。
http1.1与http1.0最大的区别是什么?
答案是http1.1协议是默认开启keep-alive的,开启后会与服务端保持一定时间的长连接,如图http1.1的请求头:
那什么是keepalive?作用是什么?
TCP层怎么做到保持长连接的呢?
先看keepalive的用法:有三个参数,开放给应用层使用:
1. sk->keepalive_probes:探测重试次数,超过次数则close连接;
2. sk->keepalive_time 探测的心跳间隔,TCP连接在间隔多少秒之后未进行数据传输,则启动探测报文;
3. sk->keepalive_intvl 探测间隔,发送探活报文,未收到回复时,重试的时间间隔;
linux系统对这三个参数有默认配置,查看:
[***@*** ~]$ $ cat/proc/sys/net/ipv4/tcp_keepalive_time
300
[***@*** ~]$ cat /proc/sys/net/ipv4/tcp_keepalive_intvl
75
[***@*** ~]$ cat /proc/sys/net/ipv4/tcp_keepalive_probes
9
应用层使用示例:
-
int keepalive = 1; // 开启keepalive属性 -
int keepidle = 60; // 如该连接在60秒内没有任何数据往来,则进行探测 -
int keepinterval = 5; // 探测时发包的时间间隔为5 秒 -
int keepcount = 3; // 探测尝试的次数。如果第1次探测包就收到响应了,则后2次的不再发。并且清零该计数 -
setsockopt(rs, SOL_SOCKET, SO_KEEPALIVE, (void *)&keepalive , sizeof(keepalive )); -
setsockopt(rs, SOL_TCP, TCP_KEEPIDLE, (void*)&keepidle , sizeof(keepidle )); -
setsockopt(rs, SOL_TCP, TCP_KEEPINTVL, (void *)&keepinterval , sizeof(keepinterval )); -
setsockopt(rs, SOL_TCP, TCP_KEEPCNT, (void *)&keepcount , sizeof(keepcount ));
-
keepcount: 覆盖 tcpkeepaliveprobes -
keepidle: 覆盖 tcpkeepalivetime -
keepinterval: 覆盖 tcpkeepalive_intvl 对于一个经过三次握手已建立好的tcp连接,如果在keepalive_time时间内双方没有任何的数据包传输,则开启keepalive功能,一端将发送keepalive数据心跳包,若没有收到应答,则每隔keepalive_intvl时间间隔再发送该数据包,发送keepalive_probes次,一直没有收到应答,则发送rst包关闭连接,若收到应答,则将计时器清零。
根据抓包继续分析keepalive发送及回复的心跳包内容:
先看tcp头的结构为:
typedef struct _TCP_HEADER
{
short m_sSourPort; // 源端口号16bit
short m_sDestPort; // 目的端口号16bit
unsigned int m_uiSequNum; // req字段 序列号32bit
unsigned int m_uiAcknowledgeNum; //ack字段 确认号32bit
short m_sHeaderLenAndFlag; // 前4位:TCP头长度;中6位:保留;后6位:标志位
short m_sWindowSize; //win字段 窗口大小16bit
short m_sCheckSum; // 检验和16bit
short m_surgentPointer; // 紧急数据偏移量16bit
}__attribute__((packed))TCP_HEADER, *PTCP_HEADER;
看发送的心跳包内容 :
0000 d4 6d 50 f5 02 7f f4 5c 89 cb 35 29 08 00 //mac头 14字节:
45 00 // ip头 20字节 :
0010 00 28 10 f4 00 00 40 06 5b dd ac 19 42 76 0a b3
0020 14 bd
e4 4a 1f 7c 32 7e 7a cb 4c bc 55 08 50 10 // tcp头 20字节
0030 10 00 3f 00 00 00
//分析tcp头部内容
e4 4a //源端口号16bit 10进制为:58442
1f 7c //目的端口号16bit 10进制为 : 8060
32 7e 7a cb // req字段 序列号32bit 10进制为 :
4c bc 55 08 // ack字段 确认号32bit
5 // 前4位:TCP头长度 5*4 =20 字节 没问题
0 10 /// 中6位:保留;后6位:标志位 10 代表倒数第5位为1, 标识改tcp包为 ACK 确认包
0030 10 00 3f 00 00 00
继续看回复的心跳包内容 :
0000 f4 5c 89 cb 35 29 d4 6d 50 f5 02 7f 08 00 45 00
0010 00 34 47 28 40 00 36 06 ef 9c 0a b3 14 bd ac 19
0020 42 76 // 前面数据不解读
1f 7c
e4 4a
4c bc 55 08
32 7e 7a cc
TCP头长度为8 * 4 = 32 除了头部 还有 选项数据 12字节
0 10 // 中6位:保留;后6位:标志位 10 代表倒数第5位为1, 标识该tcp包为 ACK 确认包
0030 01 3f //win字段 窗口大小16bit
4e 0d // 检验和16bit
00 00 // 紧急数据偏移量16bit
01 01 08 0a 00 59 be 1c 39 13
0040 cf 12 // 选项数据 12字节
keepalive与keep-alive区别?
keep-alive是应用层http协议使用,在其头部Connection字段中的一个值,只是代表客户端与服务之间需要保持长连接,可以理解为通过此字段来告诉nginx此连接需要维持长连接,处理完别直接关闭连接。
nginx的keepalive会做哪些事情?
-
client到nginx的连接是长连接 -
nginx到server的连接是长连接
nginx与keepalive相关的配置介绍
场景1,配置TCP层keepalive探活机制的三个参数
case1:
http {
server {
listen 127.0.0.1:3306 so_keepalive=on;//开启keepalive探活,探测策略走系统默认
}
}
case2:
http {
server {
listen 127.0.0.1:3306 so_keepalive=7m:75s:9;//把空闲时长从系统默认的5分钟改为了7分钟
}
}
其中so_keepalive有如下选择配置,官方文档:so_keepalive(http://nginx.org/en/docs/http/ngx_http_core_module.html#listen)
so_keepalive=on|off|[keepidle]:[keepintvl]:[keepcnt]
* on: 开启,探测参数更加系统默认值
* off: 关闭
* keepidle: 连接空闲等待时间
* keepintvl: 发送探测报文间隔时间
* keepcent: 探测报文重试次数
http {
keepalive_timeout 120s 120s;
keepalive_requests 100;
}
客户端请求header头:
GET /uri HTTP/1.1 #版本为1.1及以上,Connection:为空也开启长连接,但Connection:close时不开启
Host: www.baidu.com
Connection: keep-alive #Connection:keep-alive 时均开启长连接,HTTP是否为1.1以上无影响
keepalive_timeout:第一个参数:客户端连接在服务器端空闲状态下保持的超时值(默认75s);值为0会禁用keep-alive,也就是说默认不启用长连接;第二个参数:响应的header域中设置“Keep-Alive: timeout=time”;告知浏览器对长连接的维持时间;官方文档:keepalive_timeout(http://nginx.org/en/docs/http/ngx_http_core_module.html#keepalive_timeout)
keepalive_requests:默认100,某个长连接连续处理请求次数限制,超过次数则该长连接被关闭;如果需要释放某个连接占用的内存,必须关闭该链接,内存不大的情况下,不建议开大该配置;在QPS较高的场景,则有必要加大这个参数;官方文档:keepalive_requests(http://nginx.org/en/docs/http/ngx_http_core_module.html#keepalive_requests)
http {
upstream BACKEND {
server 127.0.0.1:8000;
server 127.0.0.1:8001;
server 127.0.0.1:8002;
keepalive 300; //空闲连接数
keepalive_timeout 120s;//与上游空闲时间
keepalive_requests 100;//与上游请求处理最大次数
}
server{
listen 8080;
location /{
proxy_pass http://BACKEND;
}
}
}
keepalive:限制nginx某个worker最多空闲连接数,此处不会限制worker与上游服务长连接的总数,官方文档:keepalive(http://nginx.org/en/docs/http/ngx_http_upstream_module.html)
keepalive_timeout:nginx与上游长连接最大空闲时间,默认值为60s;官方文档:keepalive_timeout(http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive_timeout)
keepalive_requests:nginx与上游长连接最大交互请求的次数,默认值为100;官方文档:keepalive_requests(http://nginx.org/en/docs/http/ngx_http_upstream_module.html#keepalive_requests)
除此之外,nginx与上游通信,http协议默认是走的http1.0,对客户端header头不会直接转发,且会把头部中Connection字段置为默认的"close",要与上游保持长连接还需要加如下配置:
http {
keepalive_timeout 120s 120s;
keepalive_requests 100;
server {
location / {
proxy_http_version 1.1; //设置与上游通信的
proxy_set_header Connection "";
proxy_pass http://BACKEND;
}
}
}
上述配置在nginx的内部实现
1、so_keepalive 配置后对系统默认的tcp探活策略进行覆盖
第一步:nginx启动阶段,读取配置文件配置,解析listen关键字时执行该关键字对应的回调函数:ngx_http_core_listen函数,ngx_http_core_listen函数中会读取so_keepalive配置项,并赋值:
* lsopt.so_keepalive = 1;//开启长连接探活机制,上文中场景1配置的case1与case2,都会置为1;
* lsopt.tcp_keepidle = ngx_parse_time(&s, 1);//根据场景1配置的case2,此处值为 7*60 = 420
* lsopt.tcp_keepintvl = ngx_parse_time(&s, 1);//根据场景1配置的case2,此处值为 75
* lsopt.tcp_keepcnt = ngx_atoi(s.data, s.len);//根据场景1配置的case2,此处值为 9
第二步:解析配置完成后,会循环监听每个listen对应的端口,产生listen_fd,并把配置文件解析出来的keepalive相关配置,赋值给每个listen_fd对应监听池中的ngx_listening_s 结构体:
ls->keepalive = addr->opt.so_keepalive;
ls->keepidle = addr->opt.tcp_keepidle;
ls->keepintvl = addr->opt.tcp_keepintvl;
ls->keepcnt = addr->opt.tcp_keepcnt;
第三步:监听完所有端口后,还会继续初始化根据listen对应配置设置listen_fd的属性,主要在ngx_configure_listening_sockets函数中进行,与keepalive相关的设置主要如下,具体属性值在前文已介绍,此处不再说明:
if (ls[i].keepalive) {
value = (ls[i].keepalive == 1) ? 1 : 0;
setsockopt(ls[i].fd, SOL_SOCKET, SO_KEEPALIVE,(const void *) &value, sizeof(int);
}
if (ls[i].keepidle) {
value = ls[i].keepidle;
setsockopt(ls[i].fd, IPPROTO_TCP, TCP_KEEPIDLE,(const void *) &value, sizeof(int);
}
if (ls[i].keepintvl) {
value = ls[i].keepintvl;
setsockopt(ls[i].fd, IPPROTO_TCP, TCP_KEEPINTVL,(const void *) &value, sizeof(int));
}
if (ls[i].keepcnt) {
setsockopt(ls[i].fd, IPPROTO_TCP, TCP_KEEPCNT, (const void *) &ls[i].keepcnt, sizeof(int);
}
此时想比大家有一个疑问,为什么设置属性时是对listen_fd进行操作,而不是对客户端与nginx的connect_fd进行设置。
主要原因为:这些属性是sockt继承的,即listen的套接字设置该属性后,后面建连接后调用accept函数获取的connect_fd套接字同样继承该属性(心跳属性)。
通过以上设置之后,nginx与客户端的链接就可以通过tcp探活保持长连接,并且探活策略是可配置的;
2、nginx与客户端什么时候断开长连接?
在nginx通过 setsockopt(ls[i].fd, SOL_SOCKET, SO_KEEPALIVE,(const void *) &value, sizeof(int))开启keepalive后,accept后的connect_fd会始终和客户端保持长连接,如此会出现一个很严峻的问题,每个woker进程能保持的连接数是有限的,见如下代码:
ep = epoll_create(cycle->connection_n / 2); //cycle->connection_n / 2 为epoll能管理的fd上限
注:自从Linux 2.6.8开始,epoll_create(size)的size参数被忽略,但是依然要大于0,也就是不再限制epoll管理的文件句柄数;nginx每个worker对连接数的限制,是通过连接池的大小来控制的,默认大小为connection_n;
如此一来,连接数很快就被耗尽,这时候nginx应该怎么处理 ?
答案显而易见,通过 keepalive_timeout keepalive_requests 来管理长连接,
也就是上文中场景2的配置,实际是nginx与客户端(一般为浏览器、APP等)保持长连接进行的限制配置;
1、当一个客户端的tcp长连接空闲时间超过 keepalive_timeout 时,会被close掉,nginx的具体实现,是通过定时器来触发
2、当一个tcp长连接最大请求数超过 keepalive_requests时,也会被close掉
通过这两个机制来保证每个worker的连接数不会超过epoll所能管理的数目。
对应源码实现:
第一步:解析对应配置赋值
ngx_http_core_keepalive(ngx_conf_t *cf, ngx_command_t *cmd, void *conf)
{
clcf->keepalive_timeout = ngx_parse_time(&value[1], 0);
clcf->keepalive_header = ngx_parse_time(&value[2], 1);
}
conf->keepalive_requests,prev->keepalive_requests, 100);
第二步:根据客户端请求头中的参数,及服务端配置,对客户端的连接存活进行管理:
1、读取客户端Connection: keep-aliveent | close
ngx_http_process_connection(ngx_http_request_t *r, ngx_table_elt_t *h,
ngx_uint_t offset)
{
if (ngx_strcasestrn(h->value.data, "close", 5 - 1)) {
r->headers_in.connection_type = NGX_HTTP_CONNECTION_CLOSE;
} else if (ngx_strcasestrn(h->value.data, "keep-alive", 10 - 1)) {
r->headers_in.connection_type = NGX_HTTP_CONNECTION_KEEP_ALIVE;
}
return NGX_OK;
}
2、根据客户端请求头配置,对request的keepalive进行标识,需要保持长连接则标识为1,否则为0
ngx_http_handler(ngx_http_request_t *r)
{
if (!r->internal) {
switch (r->headers_in.connection_type) {//客户端的Connection: 为空时,只要HTTP协议>1.0,也开启keepalive
case 0:
r->keepalive = (r->http_version > NGX_HTTP_VERSION_10);
break;
case NGX_HTTP_CONNECTION_CLOSE://客户端的Connection: close时
r->keepalive = 0;
break;
case NGX_HTTP_CONNECTION_KEEP_ALIVE://客户端的Connection: keep-alive时
r->keepalive = 1;
break;
}
}
}
3、根据nginx自身对长连接的配置决策是否需要关闭客户端连接;如根据判断keepalive_timeout配置是否为0 或 该连接的请求次数是否已达上限值,决定是否把客户端的keepalive标识改为0
ngx_http_update_location_config(ngx_http_request_t *r)
{
if (r->keepalive) {
if (clcf->keepalive_timeout == 0) {//keepalive_timeout配置关闭了长连接
r->keepalive = 0;
} else if (r->connection->requests >= clcf->keepalive_requests) {//请求次数已达上限,默认为100
r->keepalive = 0;
}
}
}
4、请求处理结束时,根据keepalive标识是否为1,为0则直接关闭与客户端的连接,否则把连接加入到时间事件中,保活该连接,等待下一次请求到来;
ngx_http_finalize_connection(ngx_http_request_t *r)
{
if (!ngx_terminate
&& !ngx_exiting
&& r->keepalive
&& clcf->keepalive_timeout > 0)
{
ngx_http_set_keepalive(r);
return;
}
ngx_http_close_request(r, 0);
}
ngx_http_set_keepalive(r){//下游连接有keepalive机制 直接保活,又重新把下游fd监听起来,保持长连接
if (ngx_handle_read_event(rev, 0)//继续监听读写事件
rev->handler = ngx_http_keepalive_handler;//设置回调函数,如果在keepalive_timeout时间内,有新请求过来,则处理请求,且删除时间事件,继续保活客户端连接
ngx_add_timer(rev, clcf->keepalive_timeout);//添加到时间事件中,在keepalive_timeout时间后如果被时间事件触发,则直接关闭客户端连接
}
3、nginx与上游server开启长连接及上游的长连接管理
第一步:针对场景3中的配置进行解析
ngx_http_upstream_keepalive(ngx_conf_t *cf, ngx_command_t *cmd, void *conf)
{
n = ngx_atoi(value[1].data, value[1].len);//读取keepalive 300的值
kcf->max_cached = n;
}
ngx_http_upstream_init_keepalive(ngx_conf_t *cf,ngx_http_upstream_srv_conf_t *us)
{
ngx_conf_init_msec_value(kcf->timeout, 60000);//初始化kcf->timeout,即keepalive_timeout 120s的值
ngx_conf_init_uint_value(kcf->requests, 100);//初始化kcf->requests,即keepalive_requests 100的值
}
第二步:初始化空闲长连接队列,用于存储空闲的长连接,大小为max_cached,即与场景3中的"keepalive 300;" 配置的值相同
ngx_http_upstream_init_keepalive(ngx_conf_t *cf,ngx_http_upstream_srv_conf_t *us)
{
for (i = 0; i < kcf->max_cached; i++) {
ngx_queue_insert_head(&kcf->free, &cached[i].queue);
cached[i].conf = kcf;
}
}
第三步:根据场景3中配置,初始化connection_close标识,当http协议低于1.1或Connection值配置为"close",则设置上游连接的keepalive值为0,代码如下:
ngx_http_upstream_process_connection(ngx_http_request_t *r, ngx_table_elt_t *h,ngx_uint_t offset)
{
r-->upstream->headers_in.connection = h;
if (ngx_strlcasestrn(h->value.data, h->value.data + h->value.len,(u_char *) "close", 5 - 1)!= NULL)
{
r->upstream->headers_in.connection_close = 1;
}
return NGX_OK;
}
ngx_http_proxy_process_status_line(ngx_http_request_t *r)
{
if (ctx->status.http_version < NGX_HTTP_VERSION_11) {
u->headers_in.connection_close = 1;
}
ngx_http_proxy_process_header(ngx_http_request_t *r)
{
u->keepalive = !u->headers_in.connection_close;//给上游连接的keepalive标记为0;
}
第四步:在上游响应数据接收完后,nginx调用ngx_http_upstream_finalize_request函数释放上、下游的连接,在上游也开启了keepalive的情况下,释放上游连接会执行ngx_http_upstream_free_keepalive_peer函数,此时,若上游连接的keepalive为0 或 上游连接的请求处理次数达到了上限值 或 空闲长连接队列已满,则关闭上游连接,具体代码如下:
ngx_http_upstream_free_keepalive_peer(ngx_peer_connection_t *pc, void *data, ngx_uint_t state)
{
if (c->requests >= kp->conf->requests) {//请求处理次数已达上限值
goto invalid;
}
if (!u->keepalive) {//上游连接未启用keepalive,场景3中proxy_http_version 1.1;proxy_set_header Connection ""; 决定了此值
goto invalid;
}
if (ngx_queue_empty(&kp->conf->free)) {//空闲长连接队列已满,不再保留新的长连接
q = ngx_queue_last(&kp->conf->cache);
ngx_queue_remove(q);
item = ngx_queue_data(q, ngx_http_upstream_keepalive_cache_t, queue);
ngx_http_upstream_keepalive_close(item->connection);//关闭此次请求的上游连接
} else {
q = ngx_queue_head(&kp->conf->free);//
ngx_queue_remove(q);
item = ngx_queue_data(q, ngx_http_upstream_keepalive_cache_t, queue);
}
ngx_add_timer(c->read, kp->conf->;timeout);//添加到时间事件中,在keepalive_timeout时间后如果被时间事件触发,则直接关闭客户端连接
c->;read->handler = ngx_http_upstream_keepalive_close_handler; //设置回调函数,如果在keepalive_timeout时间内,有新请求过来使用了此连接,则删除时间事件,继续保活上游连接,否则该连接被close
}
nginx的开启长连接会带来什么问题?
nginx上下游针对请求处理的超时时间配置不合理,导致报connection reset by peer问题,即低频502,如图:此类问题主要原因为,客户端在对上游长连接fd读写时,正好此fd被上游服务器关闭了,此时会报connection reset by peer,所以需要尽量避免上游服务器主动断开连接;
小结
本文是一篇科普文,写这篇文章的缘由是,因为曾经有朋友去面试的时候被问到keepalive是什么,http1.1有什么特性,然后答不上,被刷了,所以写一篇nginx的keepalive科普文章,通过这篇文章,大家在工作中配置nginx的keepalive时也不会有太多的疑问,后续针对nginx的知识点会陆续出一系列的科普文。
往期精彩推荐
以上是关于nginx的keepalive源码分析的主要内容,如果未能解决你的问题,请参考以下文章
Nginx Upstream Keepalive 分析 保持长连接
深入浅出学习透析Nginx服务器的基本原理和配置指南「Keepalive性能分析实战篇」
Android 插件化VirtualApp 源码分析 ( 目前的 API 现状 | 安装应用源码分析 | 安装按钮执行的操作 | 返回到 HomeActivity 执行的操作 )(代码片段
Android 逆向整体加固脱壳 ( DEX 优化流程分析 | DexPrepare.cpp 中 dvmOptimizeDexFile() 方法分析 | /bin/dexopt 源码分析 )(代码片段
Android 事件分发事件分发源码分析 ( Activity 中各层级的事件传递 | Activity -> PhoneWindow -> DecorView -> ViewGroup )(代码片段