net.tcp 绑定上的线程不足 - TCP 错误代码 10061

Posted

技术标签:

【中文标题】net.tcp 绑定上的线程不足 - TCP 错误代码 10061【英文标题】:Thread starvation on net.tcp binding - TCP error code 10061 【发布时间】:2016-04-13 09:33:12 【问题描述】:

我在我的 WCF 服务中遇到了一个非常奇怪的错误,当我使用 NetTcpBinding 时,它似乎以某种方式在套接字级别创建了死锁或线程饥饿。我有一个非常简单的自托管服务:

class Program

    static void Main(string[] args)
    
        using (ServiceHost serviceHost = new ServiceHost(typeof(TestService)))
        
            serviceHost.Open();             
            Console.WriteLine("Press <ENTER> to terminate service.");
            Console.ReadLine();
            serviceHost.Close();
        
        Uri baseAddress = new Uri("net.tcp://localhost:8014/TestService.svc");         
    


[ServiceContract]
public interface ITestService

    [OperationContract]
    string GetData(string data);


public class TestService: ITestService

    public string GetData(string data)
    
        Console.WriteLine(data);
        Thread.Sleep(5000);
        return "Ok";
    

配置部分:

<system.serviceModel>
<bindings>
  <basicHttpBinding>
    <binding name="basicHttpBinding" closeTimeout="00:02:00" openTimeout="00:02:00"
      receiveTimeout="00:02:00" sendTimeout="00:02:00" maxBufferSize="2000000000"
      maxReceivedMessageSize="2000000000" />
  </basicHttpBinding>
  <netTcpBinding>
    <binding name="netTcpBinding" closeTimeout="00:02:00" openTimeout="00:02:00"
      receiveTimeout="00:02:00" sendTimeout="00:02:00" listenBacklog="2000"
      maxBufferSize="2000000000" maxConnections="1000" maxReceivedMessageSize="2000000000">
      <security mode="None">
        <transport protectionLevel="EncryptAndSign" />
      </security>
    </binding>
    <binding name="TestServiceTcpEndPoint">
      <security mode="None" />
    </binding>
  </netTcpBinding>      
</bindings>

<behaviors>
  <serviceBehaviors>
    <behavior name="CommonServiceBehavior">
      <serviceMetadata httpGetEnabled="true" />
      <serviceDebug includeExceptionDetailInFaults="true" />
      <serviceThrottling maxConcurrentCalls="1000" maxConcurrentSessions="1000" maxConcurrentInstances="1000" />
    </behavior>
  </serviceBehaviors>
</behaviors>
<services>
  <service name="ServiceLauncher.TestService" behaviorConfiguration="CommonServiceBehavior">
    <endpoint address="" binding="netTcpBinding" bindingConfiguration="netTcpBinding" name="TestServiceTcpEndPoint" contract="ServiceLauncher.ITestService" />
    <endpoint address="" binding="basicHttpBinding" bindingConfiguration="basicHttpBinding" name="TestServiceTcpEndPoint" contract="ServiceLauncher.ITestService" />
    <endpoint address="mex"  binding="mexHttpBinding" bindingName="mexHttpBinding" contract="IMetadataExchange" />
    <host>
      <baseAddresses>
        <add baseAddress="net.tcp://localhost:8014/TestService.svc"/>
        <add baseAddress="http://localhost:1234/TestService.svc"/>
      </baseAddresses>
    </host>
  </service>
</services>
</system.serviceModel>

我有一个客户端,它在许多线程中使用此服务,并为每个线程创建新实例(这是一项要求):

    static void Main(string[] args)
               
        for (int i = 0; i < 1000; i++)
        
            Thread tr = new Thread(() =>
            
                using (var service = new Test.TestServiceClient())
                
                    var result = service.GetData(i.ToString());
                    Console.WriteLine(string.Format("0: 1 2",
                                      DateTime.Now,
                                      result,
                                      Thread.CurrentThread.ManagedThreadId));
                  
            );
            tr.Start();                
        
        Console.ReadLine();       
    

这种情况下一些请求客户端引发EndpointNotFoundException,TCP错误码10061,由于目标机器主动拒绝,无法连接。请求的数量一直不一样,而且它不是服务器部分,因为它仍然在正常状态下工作。我看到它不断收到请求,在这种情况下最奇怪的是什么。奇怪的是,它可以在异常之后使您的客户端主机“永生” - 这样您就无法以任何方式杀死它,除非重新启动系统。我很确定问题出在客户端的低套接字级别,并且它以某种方式与如此大量的线程连接,但我没有成功找到可以解释问题的东西。

【问题讨论】:

如果您 enable WPF Performance counters 看到“最大并发调用百分比”、“最大并发实例百分比”和“最大并发会话百分比”是什么。 (有关更多信息,请参阅blogs.msdn.com/b/appfabriccat/archive/2010/10/29/…。) @ScottChamberlain 感谢您的提示,但我怀疑这会给我一些有关服务客户端的有用信息,因为这是源错误并且这部分没有受到限制的地方。即使出现错误,该服务仍能正常工作并正确节流 误解了原始问题。我以为锁定是在服务器端,当时不确定。 服务一直运行良好...好吧,如果您在服务端启用跟踪,您会发现它实际上会抛出大量例外。 @jstreet 是的,它会引发内部异常,但是“服务一直正常工作”意味着它没有处于故障状态并且它一直在响应其他客户端。而且我认为内部异常是由客户端部分的套接字失败引起的,因此服务器只是看不到将他的答案发送到哪里。 【参考方案1】:

每次我看到错误“无法建立连接,因为目标计算机主动拒绝它”。问题不在于服务。它通常是到达服务的问题。

几个建议:

    Avoid using with WCF Proxies。您可以选择several reasonable work arounds。

    阅读我对WCF performance, latency and scalability 的回复。除了以老式方式启动线程之外,它基本上是相同的测试应用程序。该帖子描述了所有客户端原因(我能找到)导致“无法建立连接,因为目标机器主动拒绝它”,并提供了可以调整的不同 WCF、TCP 和线程池设置。

    李>

【讨论】:

感谢您的提示,但这并不是我真正想要的。 “使用”的原因只是在实际项目中调用我的代理的另一个部分类的处置,但我怀疑它对这个问题有影响。至于第二部分 - 我尝试了限制更改、tcp maxConnections 和 ListenBacklog 属性,甚至系统注册表中的 tcpIp 参数 - 没有效果。我不能使用线程池(由于请求之间的延迟增加并限制了它们的数量,它解决了这个问题),因为我使用了 TPL,它可能会在某些时候带来死锁问题。【参考方案2】:

您可能会达到 Windows 中并发 TCP/IP 连接的内部限制。看看这篇文章,看看它是否有帮助:

http://smallvoid.com/article/winnt-tcpip-max-limit.html

【讨论】:

感谢您的链接,但我之前已经尝试过(请参阅我对 ErnieL 回答的评论)。我已经全部更改了,但没有一个能解决问题。这实际上是我正在寻找的 - WCF、TCP、系统注册表中的设置,这将允许我在这种多线程场景中使用绑定。

以上是关于net.tcp 绑定上的线程不足 - TCP 错误代码 10061的主要内容,如果未能解决你的问题,请参考以下文章

在 Rust 项目的 C 绑定上运行 jextract 时出现致命错误“'stdlib.h' 文件未找到”

Android数据绑定上的字符串比较

Powershell - 在 https 绑定上设置 SSL 证书

在 TreeTable 绑定上添加动态过滤器

mariadb 作为 docker 容器 - 主机挂载绑定上的启动损坏

.NET - Excel ListObject 在数据绑定上自动调整大小