Node.js、多线程和 Socket.io

Posted

技术标签:

【中文标题】Node.js、多线程和 Socket.io【英文标题】:Node.js, multi-threading and Socket.io 【发布时间】:2012-01-23 16:55:53 【问题描述】:

我希望 Socket.io 在 Node.js v.0.6.0 及更高版本中使用native load balancing(“集群”)进行多线程工作。

据我了解,Socket.io 使用 Redis 来存储其内部数据。我的理解是:我们不想为每个工作人员生成一个新的 Redis 实例,而是要强制工作人员使用与主服务器相同的 Redis 实例。因此,连接数据将在所有工作人员之间共享。

master 里面是这样的:

RedisInstance = new io.RedisStore;

我们必须以某种方式将RedisInstance 传递给工作人员并执行以下操作:

io.set('store', RedisInstance);

受this implementation 使用旧的第 3 方集群模块的启发,我有以下非工作实现:

var cluster = require('cluster');
var http = require('http');
var numCPUs = require('os').cpus().length;

if (cluster.isMaster) 
  // Fork workers.
  for (var i = 0; i < numCPUs; i++) 
    cluster.fork();
  

  var sio = require('socket.io')
  , RedisStore = sio.RedisStore
  , io = sio.listen(8080, options);

  // Somehow pass this information to the workers
  io.set('store', new RedisStore);

 else 
  // Do the work here
  io.sockets.on('connection', function (socket) 
    socket.on('chat', function (data) 
      socket.broadcast.emit('chat', data);
    )
  );

想法?我可能完全走错了方向,任何人都可以指出一些想法吗?

【问题讨论】:

我想知道你最终使用的是什么方法。 【参考方案1】:

其实你的代码应该是这样的:

var cluster = require('cluster');
var http = require('http');
var numCPUs = require('os').cpus().length;

if (cluster.isMaster) 
  // Fork workers.
  for (var i = 0; i < numCPUs; i++) 
    cluster.fork();
  
 else 
  var sio = require('socket.io')
  , RedisStore = sio.RedisStore
  , io = sio.listen(8080, options);

  // Somehow pass this information to the workers
  io.set('store', new RedisStore);

  // Do the work here
  io.sockets.on('connection', function (socket) 
    socket.on('chat', function (data) 
      socket.broadcast.emit('chat', data);
    )
  );

另一种选择是打开 Socket.IO 以侦听多个端口并拥有类似 HAProxy 负载平衡的东西。 无论如何,您知道最重要的事情:使用 RedisStore 在进程之外进行扩展!

资源:

http://nodejs.org/docs/latest/api/cluster.html How can I scale socket.io? How to reuse redis connection in socket.io? Node: Scale socket.io / nowjs - scale across different instances http://delicious.com/alessioaw/socket.io

【讨论】:

该实现不会为每个工作人员创建一个新的 RedisStore 吗?另外,使用像 HAProxy 这样的东西有什么好处?似乎使用 Node 中原生的功能更好。 HAProxy 的优点:您可以在不同的端口上拥有进程,您可以更仔细地监控它们并在它们死亡时重新启动(使用monit,upstart)。同样是的,您需要为每个工作人员创建一个新的 RedisStore。认为集群是 child_process.fork() 之上的实现,所以你基本上复制了应用程序 N 次(据我所知,进程共享相同的文件描述符)。 我刚刚尝试了您的代码示例,似乎无法正常工作。单线程时,1500 个连接运行高达 50% 的 CPU(每个工作人员的工作量都比示例中的多)。使用您的示例,在 每个 进程运行高达 80-90% 的 CPU 之前,我无法获得多达 500 个连接。很明显,有些地方出了问题,因为这使情况变得更糟。 这里有一个带有 child_process.fork() 的示例应用程序:github.com/dshaw/talks/tree/master/2011-10-jsclub/sample-app 你也可以尝试一下并告诉我它是怎么回事吗?基本上把worker js 代码放在app.js 那里,并尝试遵循相同的结构。 啊,谢谢你的链接。理想情况下,这应该只在一个端口上工作(而不是几个,就像这个 repo 所做的那样)。有什么建议?看来我们可以使用 socket-io-announce 在所有工作人员之间共享 Redis 连接详细信息。

以上是关于Node.js、多线程和 Socket.io的主要内容,如果未能解决你的问题,请参考以下文章

Node.js的线程和进程

Node.js的线程和进程

[转] Node.js的线程和进程

nodejs是单线程还是多线程

如何使用 Node.js 制作多线程应用程序,访问 LevelDB?

nodejs如何开启多线程