ejabberd集群,当master宕机时,Slave不起作用

Posted

技术标签:

【中文标题】ejabberd集群,当master宕机时,Slave不起作用【英文标题】:ejabberd clustering, Slave doesn't work when master goes down 【发布时间】:2016-04-15 09:11:55 【问题描述】:

我已经设置了 ejabberd 集群,一个是主机,另一个是从机,如 here 所述。

我已将 .erlang.cookie 和数据库文件从主机复制到从机。 一切正常。 问题是当我停止主节点时:

    然后没有请求被路由到从站。 尝试重新启动从节点时,它一旦关闭就无法启动。

我在这里卡住了,请帮帮我。 谢谢

【问题讨论】:

【参考方案1】:

这是 Mnesia 的标准行为。如果您启动的节点不是集群中最后一个停止的节点,那么它就无法知道它是否拥有最新、最新的数据。

启动 Mnesia 集群的过程是按照与关闭节点相反的顺序启动节点。

如果最后出现在 Mnesia 集群上的节点无法启动或加入集群,您需要使用 Mnesia 命令强制集群“master”,即告诉它您认为该节点拥有最多迄今为止的内容。这是通过使用 Erlang 命令mnesia:set_master_nodes/1 完成的。

例如,从 ejabberd Erlang 命令行:

mnesia:set_master_nodes([node1@myhost]).

在大多数情况下,Mnesia 集群会自动处理所有事情。当一个节点出现故障时,其他节点会意识到并自动继续透明地工作。您需要将哪个节点设置为参考数据(使用set_master_nodes/1)的唯一情况是,当这对 Mnesia 来说不明确时,即仅启动仍在运行的节点时关闭的节点或存在 netsplit 时.

【讨论】:

谢谢迈克尔,但是当主从都同时运行并且主服务器宕机时会发生什么。在这种情况下,奴隶应该可以正常工作吗? 是的,这就是集群的目的。 Mnesia 是多主控。没有真正的master,但它需要保护数据的一致性,并确保它不会破坏数据。当一个节点宕机时,其余节点不存在一致性问题。 谢谢 Mickael,明白了。当一个节点宕机时,剩余节点需要设置为主节点,因为剩余节点不存在一致性问题。它将独立工作。 不,剩余节点不需要手动设置为主节点。这由 Erlang / Mnesia 自动处理。唯一需要手动设置 master 的情况是,对于哪个节点作为参考数据存在歧义。 前面有负载均衡器吗?当然,您需要正确路由流量。再说一遍:ejabberd 中没有主/从概念。 Mnesia 和这个 ejabberd 是多位大师。【参考方案2】:

按照以下链接中的步骤操作: http://chadillac.tumblr.com/post/35967173942/easy-ejabberd-clustering-guide-mnesia-mysql 并调用easy_cluster模块的join_as_master(NodeName)方法。

【讨论】:

小心。强制主数据集时,你必须确定你做了什么,否则会导致数据丢失。 好的,我使用了这个命令。 mnesia:set_master_nodes([node1@myhost])。非常感谢

以上是关于ejabberd集群,当master宕机时,Slave不起作用的主要内容,如果未能解决你的问题,请参考以下文章

ActiveMQ集群

RocketMQ集群部署

kubernetes的master节点和node节点

是否使用过 Redis 集群,集群的原理是什么?

Redis详解------ 集群模式详解

Redis详解------ 从零开始搭建集群