zabbix proxy 服务器 netstat 出现大量Time_Wait连接问题

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了zabbix proxy 服务器 netstat 出现大量Time_Wait连接问题相关的知识,希望对你有一定的参考价值。

监控系统云网关监控几万个TCP port的存活情况, 最近发现有几个端口出现告警闪断情况,怀疑因为运行TCP检查的 zabbix proxy 服务器 tcp参数配置不合理。 

netstat 发现有大量TIME_WAIT t连接。

# netstat -n | awk ‘/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}‘

TIME_WAIT 9584
SYN_SENT 2
FIN_WAIT1 2
FIN_WAIT2 3
ESTABLISHED 28

 

问题1:怎么解决大量Time_Wait

通过调整内核参数:

技术分享
vim /etc/sysctl.conf
#编辑文件,加入以下内容:
net.ipv4.tcp_syncookies = 1
net.ipv4.tcp_tw_reuse = 1
net.ipv4.tcp_tw_recycle = 1
net.ipv4.tcp_fin_timeout = 30
#然后执行 /sbin/sysctl -p 让参数生效。
技术分享

配置说明:

net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;

net.ipv4.tcp_tw_reuse = 1    表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;

net.ipv4.tcp_tw_recycle = 1  表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭;

net.ipv4.tcp_fin_timeout=3修改系統默认的 TIMEOUT 时间。

如果以上配置调优后性能还不理想,可继续修改一下配置:

技术分享
vi /etc/sysctl.conf
net.ipv4.tcp_keepalive_time = 1200 
#表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。
net.ipv4.ip_local_port_range = 1024 65000 
#表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为1024到65000。
net.ipv4.tcp_max_syn_backlog = 8192 
#表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。
net.ipv4.tcp_max_tw_buckets = 5000 
#表示系统同时保持TIME_WAIT套接字的最大数量,如果超过这个数字,TIME_WAIT套接字将立刻被清除并打印警告信息。
默认为180000,改为5000。对于Apache、nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT套接字的最大数量,避免Squid服务器被大量的TIME_WAIT套接字拖死。
技术分享

调优完毕,再看效果吧。

# netstat -n | awk ‘/^tcp/ {++y[$NF]} END {for(w in y) print w, y[w]}‘

TIME_WAIT 5000
SYN_SENT 2
FIN_WAIT2 1
ESTABLISHED 26

以上是关于zabbix proxy 服务器 netstat 出现大量Time_Wait连接问题的主要内容,如果未能解决你的问题,请参考以下文章

新增zabbix proxy

Zabbix 中继模式 Proxy

zabbix监控代理zabbix-proxy

zabbix-proxy编译安装

zabbix的proxy代理

zabbix 分布式zabbix_proxy