socket.io 的可扩展架构

Posted

技术标签:

【中文标题】socket.io 的可扩展架构【英文标题】:Scalable architecture for socket.io 【发布时间】:2016-12-06 16:46:48 【问题描述】:

我是 socket.io 和 Node JS 的新手,我正在尝试构建一个具有大量同时套接字连接 (10,000+) 的可扩展应用程序。

目前,我开始使用我的服务器创建子进程的模型,并且每个子进程都侦听一个特定的端口,并附加了一个 skint.io 实例。一旦客户端连接,他就会被重定向到一个特定的端口。

最大的问题是:在多个端口上拥有多个 socket.io 实例会增加可能的连接数量吗?

这是我的代码,以防万一:

服务器

var server = http.createServer(app);

server.childList = [];
for (var i = 0; i < app.portList.length; i++) 
  server.childList[i] = require('child_process').fork('child.js');


server.listen(3443, () => 
  for (var i = 0; i < app.portList.length; i++) 
    server.childList[i].send( message: 'createServer', port: app.portList[i] );;
  
);

child.js:

var app = require('./app');
var http = require('http');
var socket_io        = require( "socket.io" );

process.on('message', (m) => 
    if (m.message === 'createServer') 

        var childServ = http.createServer(app);

        childServ.listen(m.port, () => 
            console.log("childServ listening on port "+m.port);
        );

        var io = socket_io();
        io.attach( childServ );

        io.sockets.on('connection', function (socket) 
            console.log("A client just connected to my socket_io server on port "+m.port);
        );
    
);

如果我在那里做了可怕的事情,请随意释放海妖

【问题讨论】:

【参考方案1】:

首先,您需要优化的内容取决于您的 socket.io 连接的繁忙程度以及活动主要是异步 I/O 操作还是 CPU 密集型操作。您可能已经知道,node.js 对于异步 I/O 的扩展已经非常好,但是它需要多个进程才能很好地扩展 CPU 密集型的东西。此外,在某些情况下,垃圾收集器太忙(处理大量小请求),因此您还需要转到多个进程。

更多的服务器实例(至少达到服务器中的 CPU 数量)将为您提供更多的 CPU 处理能力(如果您需要的话)。如果其中大多数是空闲的,它不一定会增加您可以在一个盒子上支持的最大连接数。为此,您必须 custom tune your server 支持大量连接。

通常,您不希望 N 个 socket.io 服务器分别监听不同的端口。这给客户端带来了以某种方式选择端口的负担,并且客户端必须确切地知道要从哪些端口中进行选择(例如,您拥有多少个服务器实例)。

通常,您不会这样做。通常,您有 N 个进程都在侦听同一个端口,并且您使用某种负载均衡器在它们之间分配负载。这使得服务器基础架构对客户端透明,这意味着您可以在不改变客户端行为的情况下向上或向下扩展服务器。事实上,您甚至可以添加多个物理服务器盒,从而进一步增加容量。

这里有一篇来自 socket.io 文档的文章,内容是使用带有负载均衡器的多个节点来增加容量:Socket.io - using multiple nodes (updated link)。 redis for a combination of multiple socket.io instances 和 redis 也明确支持,因此您可以与任何 socket.io 实例进行通信,而不管进程如何。

【讨论】:

【参考方案2】:

在多个端口上拥有多个 socket.io 实例会增加可能的连接数吗?

是的,您已经构建了一个简单的负载均衡器,这是一种非常常见的做法。关于缩放 node.js 的不同方法有几个很好的教程。

Horizontally scale socket.io with redis http://goldfirestudios.com/blog/136/Horizontally-Scaling-Node.js-and-WebSockets-with-Redis

您的负载平衡器将加速您的代码,因为您使用了多个线程,但我不久前在其他线程上读到,经验法则是每个 cpu 核心启动大约 2-3 个进程。更多的是导致更多的开销然后是帮助,但这在很大程度上取决于情况。

【讨论】:

以上是关于socket.io 的可扩展架构的主要内容,如果未能解决你的问题,请参考以下文章

《大型网站技术架构》读书笔记之七:随需应变之网站的可扩展架构

《大型网站技术架构》--第七章:网站的可扩展架构

C#。适用于大数据的可扩展高负载架构

React - 没有 Redux 的可扩展架构(MVC + DDD 方法)

软件的可扩展性与框架的可交互性

可扩展的 Node.js 应用程序架构