net.tcp 绑定上的线程不足 - TCP 错误代码 10061
Posted
技术标签:
【中文标题】net.tcp 绑定上的线程不足 - TCP 错误代码 10061【英文标题】:Thread starvation on net.tcp binding - TCP error code 10061 【发布时间】:2016-04-13 09:33:12 【问题描述】:我在我的 WCF 服务中遇到了一个非常奇怪的错误,当我使用 NetTcpBinding 时,它似乎以某种方式在套接字级别创建了死锁或线程饥饿。我有一个非常简单的自托管服务:
class Program
static void Main(string[] args)
using (ServiceHost serviceHost = new ServiceHost(typeof(TestService)))
serviceHost.Open();
Console.WriteLine("Press <ENTER> to terminate service.");
Console.ReadLine();
serviceHost.Close();
Uri baseAddress = new Uri("net.tcp://localhost:8014/TestService.svc");
[ServiceContract]
public interface ITestService
[OperationContract]
string GetData(string data);
public class TestService: ITestService
public string GetData(string data)
Console.WriteLine(data);
Thread.Sleep(5000);
return "Ok";
配置部分:
<system.serviceModel>
<bindings>
<basicHttpBinding>
<binding name="basicHttpBinding" closeTimeout="00:02:00" openTimeout="00:02:00"
receiveTimeout="00:02:00" sendTimeout="00:02:00" maxBufferSize="2000000000"
maxReceivedMessageSize="2000000000" />
</basicHttpBinding>
<netTcpBinding>
<binding name="netTcpBinding" closeTimeout="00:02:00" openTimeout="00:02:00"
receiveTimeout="00:02:00" sendTimeout="00:02:00" listenBacklog="2000"
maxBufferSize="2000000000" maxConnections="1000" maxReceivedMessageSize="2000000000">
<security mode="None">
<transport protectionLevel="EncryptAndSign" />
</security>
</binding>
<binding name="TestServiceTcpEndPoint">
<security mode="None" />
</binding>
</netTcpBinding>
</bindings>
<behaviors>
<serviceBehaviors>
<behavior name="CommonServiceBehavior">
<serviceMetadata httpGetEnabled="true" />
<serviceDebug includeExceptionDetailInFaults="true" />
<serviceThrottling maxConcurrentCalls="1000" maxConcurrentSessions="1000" maxConcurrentInstances="1000" />
</behavior>
</serviceBehaviors>
</behaviors>
<services>
<service name="ServiceLauncher.TestService" behaviorConfiguration="CommonServiceBehavior">
<endpoint address="" binding="netTcpBinding" bindingConfiguration="netTcpBinding" name="TestServiceTcpEndPoint" contract="ServiceLauncher.ITestService" />
<endpoint address="" binding="basicHttpBinding" bindingConfiguration="basicHttpBinding" name="TestServiceTcpEndPoint" contract="ServiceLauncher.ITestService" />
<endpoint address="mex" binding="mexHttpBinding" bindingName="mexHttpBinding" contract="IMetadataExchange" />
<host>
<baseAddresses>
<add baseAddress="net.tcp://localhost:8014/TestService.svc"/>
<add baseAddress="http://localhost:1234/TestService.svc"/>
</baseAddresses>
</host>
</service>
</services>
</system.serviceModel>
我有一个客户端,它在许多线程中使用此服务,并为每个线程创建新实例(这是一项要求):
static void Main(string[] args)
for (int i = 0; i < 1000; i++)
Thread tr = new Thread(() =>
using (var service = new Test.TestServiceClient())
var result = service.GetData(i.ToString());
Console.WriteLine(string.Format("0: 1 2",
DateTime.Now,
result,
Thread.CurrentThread.ManagedThreadId));
);
tr.Start();
Console.ReadLine();
这种情况下一些请求客户端引发EndpointNotFoundException,TCP错误码10061,由于目标机器主动拒绝,无法连接。请求的数量一直不一样,而且它不是服务器部分,因为它仍然在正常状态下工作。我看到它不断收到请求,在这种情况下最奇怪的是什么。奇怪的是,它可以在异常之后使您的客户端主机“永生” - 这样您就无法以任何方式杀死它,除非重新启动系统。我很确定问题出在客户端的低套接字级别,并且它以某种方式与如此大量的线程连接,但我没有成功找到可以解释问题的东西。
【问题讨论】:
如果您 enable WPF Performance counters 看到“最大并发调用百分比”、“最大并发实例百分比”和“最大并发会话百分比”是什么。 (有关更多信息,请参阅blogs.msdn.com/b/appfabriccat/archive/2010/10/29/…。) @ScottChamberlain 感谢您的提示,但我怀疑这会给我一些有关服务客户端的有用信息,因为这是源错误并且这部分没有受到限制的地方。即使出现错误,该服务仍能正常工作并正确节流 误解了原始问题。我以为锁定是在服务器端,当时不确定。 服务一直运行良好...好吧,如果您在服务端启用跟踪,您会发现它实际上会抛出大量例外。 @jstreet 是的,它会引发内部异常,但是“服务一直正常工作”意味着它没有处于故障状态并且它一直在响应其他客户端。而且我认为内部异常是由客户端部分的套接字失败引起的,因此服务器只是看不到将他的答案发送到哪里。 【参考方案1】:每次我看到错误“无法建立连接,因为目标计算机主动拒绝它”。问题不在于服务。它通常是到达服务的问题。
几个建议:
Avoid using
with WCF Proxies。您可以选择several reasonable work arounds。
阅读我对WCF performance, latency and scalability 的回复。除了以老式方式启动线程之外,它基本上是相同的测试应用程序。该帖子描述了所有客户端原因(我能找到)导致“无法建立连接,因为目标机器主动拒绝它”,并提供了可以调整的不同 WCF、TCP 和线程池设置。
李>【讨论】:
感谢您的提示,但这并不是我真正想要的。 “使用”的原因只是在实际项目中调用我的代理的另一个部分类的处置,但我怀疑它对这个问题有影响。至于第二部分 - 我尝试了限制更改、tcp maxConnections 和 ListenBacklog 属性,甚至系统注册表中的 tcpIp 参数 - 没有效果。我不能使用线程池(由于请求之间的延迟增加并限制了它们的数量,它解决了这个问题),因为我使用了 TPL,它可能会在某些时候带来死锁问题。【参考方案2】:您可能会达到 Windows 中并发 TCP/IP 连接的内部限制。看看这篇文章,看看它是否有帮助:
http://smallvoid.com/article/winnt-tcpip-max-limit.html
【讨论】:
感谢您的链接,但我之前已经尝试过(请参阅我对 ErnieL 回答的评论)。我已经全部更改了,但没有一个能解决问题。这实际上是我正在寻找的 - WCF、TCP、系统注册表中的设置,这将允许我在这种多线程场景中使用绑定。以上是关于net.tcp 绑定上的线程不足 - TCP 错误代码 10061的主要内容,如果未能解决你的问题,请参考以下文章
在 Rust 项目的 C 绑定上运行 jextract 时出现致命错误“'stdlib.h' 文件未找到”
Powershell - 在 https 绑定上设置 SSL 证书