如何解决connection reset by peer
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何解决connection reset by peer相关的知识,希望对你有一定的参考价值。
参考技术A 1、问题描述:客户端每隔30秒被服务端断开连接,报错java.io
.IOException: Connection reset by peer,导致短信提交异常,服务端连接数不断增加
2、问题分析:
查看应用程序发现连接无异常程序报错导致连接断开,查看激活测试消息发现,客户端发送激活测试消息,服务端收不到,分析可能存在激活测试消息丢失导致服务端主动断开连接,查看服务器sysctl.conf网络配置无问题,进一步分析使用外网不走lvs集群部署的服务端进行测试,能收到激活测试消息不会断开连接,使用生产lvs集群部署的cmpp服务端应用每隔30秒都会主动断开,分析可能为lvs配置导致激活测试消息收不到,查看lvs配置,发现默认配置了tcp_timeout = 10 tcpfin_timeout = 10,导致每30秒发送的激活测试消息连接超时收不到
3、问题处理:
修改lvs配置tcp_timeout = 10 tcpfin_timeout = 10去掉这2个参数,问题解决
Elasticsearch解决Elasticsearch HTTP方式查询报SocketTimeoutException的问题 Connection reset by peer
1.概述
转载:解决Elasticsearch HTTP方式查询报SocketTimeoutException的问题(待验证)
这个问题,和这个问题很像。参考
【es】ES RestHighLevelClient 请求报错:Connection reset by peer
注意
: 此解决方案,短时间内没有复现,还需要长时间验证是否有效。
2.现象
在使用HTTP方式,Elasticsearch 长时间不查询后,再次查询会出现抛出SocketTimeoutException
的问题。
3.原因
3.1 基本逻辑
Elasticsearch 客户端会根据服务器返回的HTTP报文内容,来决定客户端保持HTTP连接Keep-Alive状态的策略。
如果结果如下,那么保持HTTP连接 Keep-Alive状态为120s
Connection: Keep-Alive
Keep-Alive: max=5, timeout = 120
如果不包含上述内容,那么客户端将保持Keep-Alive状态的时间为永久。
事实上,Elasticsearch服务器返回的报文,并没有上述HTTP头内容,所以客户端所有的HTTP连接都为永久保持Keep-Alive。
如果客户端长时间没有发送请求,服务器或者防火墙已经close了HTTP底层的TCP链接,但是此时客户端并不知道,由于Keep Alive是无限期,那么并不会重新建立连接,而是直接发送请求,此时就会得到SocketTimeout异常。
3.2 阅读源码
我使用的Elasticsearch的客户端下面的版本
<dependency>
<groupId>org.elasticsearch.client</groupId>
<artifactId>rest</artifactId>
<version>5.4.1</version>
</dependency>
其HTTP的发送依赖Maven包httpasyncclient.
这个包中的接口ConnectionKeepAliveStrategy,抽象了处理 HTTP Keepalive 的策略,其默认实现为:
@Contract(threading = ThreadingBehavior.IMMUTABLE)
public class DefaultConnectionKeepAliveStrategy implements ConnectionKeepAliveStrategy {
public static final DefaultConnectionKeepAliveStrategy INSTANCE = new DefaultConnectionKeepAliveStrategy();
@Override
public long getKeepAliveDuration(final HttpResponse response, final HttpContext context) {
Args.notNull(response, "HTTP response");
final HeaderElementIterator it = new BasicHeaderElementIterator(
response.headerIterator(HTTP.CONN_KEEP_ALIVE));
while (it.hasNext()) {
final HeaderElement he = it.nextElement();
final String param = he.getName();
final String value = he.getValue();
if (value != null && param.equalsIgnoreCase("timeout")) {
try {
return Long.parseLong(value) * 1000;
} catch(final NumberFormatException ignore) {
}
}
}
return -1;
}
}
-1
代表多长时间,接口说明不是很清楚。
PoolingNHttpClientConnectionManager 类中的代码,实现了上述对待KeepAlive的逻辑,可以看到-1表示为:无限期
@Override
public void releaseConnection(
final NHttpClientConnection managedConn,
final Object state,
final long keepalive,
final TimeUnit tunit) {
Args.notNull(managedConn, "Managed connection");
synchronized (managedConn) {
final CPoolEntry entry = CPoolProxy.detach(managedConn);
if (entry == null) {
return;
}
if (this.log.isDebugEnabled()) {
this.log.debug("Releasing connection: " + format(entry) + formatStats(entry.getRoute()));
}
final NHttpClientConnection conn = entry.getConnection();
try {
if (conn.isOpen()) {
entry.setState(state);
entry.updateExpiry(keepalive, tunit != null ? tunit : TimeUnit.MILLISECONDS);
if (this.log.isDebugEnabled()) {
final String s;
// keepalive 就是上面接口 ConnectionKeepAliveStrategy.getKeepAliveDuration()的返回值
if (keepalive > 0) {
s = "for " + (double) keepalive / 1000 + " seconds";
} else {
// 如果小于0 ,那么策略为indefinitely:无限期。
s = "indefinitely";
}
this.log.debug("Connection " + format(entry) + " can be kept alive " + s);
}
}
} finally {
this.pool.release(entry, conn.isOpen() && entry.isRouteComplete());
if (this.log.isDebugEnabled()) {
this.log.debug("Connection released: " + format(entry) + formatStats(entry.getRoute()));
}
}
}
}
3.2.1 解决方式
自定义类实现ConnectionKeepAliveStrategy接口:
public class CustomConnectionKeepAliveStrategy extends DefaultConnectionKeepAliveStrategy {
public static final CustomConnectionKeepAliveStrategy INSTANCE = new CustomConnectionKeepAliveStrategy();
private CustomConnectionKeepAliveStrategy() {
super();
}
/**
* 最大keep alive的时间(分钟)
* 这里默认为10分钟,可以根据实际情况设置。可以观察客户端机器状态为TIME_WAIT的TCP连接数,如果太多,可以增大此值。
*/
private final long MAX_KEEP_ALIVE_MINUTES = 10;
@Override
public long getKeepAliveDuration(HttpResponse response, HttpContext context) {
long keepAliveDuration = super.getKeepAliveDuration(response, context);
// <0 为无限期keepalive
// 将无限期替换成一个默认的时间
if(keepAliveDuration < 0){
return TimeUnit.MINUTES.toMillis(MAX_KEEP_ALIVE_MINUTES);
}
return keepAliveDuration;
}
}
在创建Elasticserach Client时,配置
RestClientBuilder builder = RestClient.builder(hosts);
builder.setHttpClientConfigCallback(new RestClientBuilder.HttpClientConfigCallback() {
@Override
public HttpAsyncClientBuilder customizeHttpClient(HttpAsyncClientBuilder httpClientBuilder) {
httpClientBuilder.setKeepAliveStrategy(CustomConnectionKeepAliveStrategy.INSTANCE);
return httpClientBuilder;
}
});
以上是关于如何解决connection reset by peer的主要内容,如果未能解决你的问题,请参考以下文章
Connection reset by peer的常见原因及解决办法
解决 ('Connection aborted.', ConnectionResetError(54, 'Connection reset by peer')) 问题(
解决Elasticsearch Connection reset by peer异常
connection reset by peer问题总结及解决方案
[未解决]报错:ssh_exchange_identification: read: Connection reset by peer
Jmeter遇到线程链接被重置(Connection reset by peer: socket write error)的解决方法