Linux集群：搭建高可用集群

Posted 2020-10-30

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Linux集群：搭建高可用集群相关的知识，希望对你有一定的参考价值。

一、集群介绍

根据功能划分为两大类：高可用和负载均衡；

高可用集群通常为两台服务器，一台工作，另外一台作为冗余，当提供服务的机器宕机，冗余将接替继续提供服务；

实现高可用的开源软件有：heartbeat、keepalived；

负载均衡集群，需要有一台服务器作为分发器，它负责把用户的请求分发给后端的服务器处理，在这个集群里，除了分发器外，就是给用户提供服务的服务器，这些服务器数量至少为2；

实现负载均衡的开源软件有LVS、keepalived、haproxy、nginx，商业的有F5、Netscaler。

二、用keepalived搭建高可用集群

在这里我们使用keepalived来实现高可用集群，因为heartbeat在centos6上有一个问题，影响实验效果

keepalived通过VRRP（Virtual Router Redundancy Protocl）来实现高可用。

在这个协议里会将多台功能相同的路由器组成一个小组，这个小组里会有1个master角色和N（N>=1）个backup角色。

master会通过组播的形式向各个backup发送VRRP协议的数据包，当backup收不到master发来的VRRP数据包时，就会认为master宕机了。此时就需要根据各个backup的优先级来决定谁成为新的mater。

keepalived要有三个模块，分别是core、check和vrrp。其中core模块为keepalived的核心，负责主进程的启动、维护以及全局配置文件的加载和解析，check模块负责健康检查，vrrp模块是来实现VRRP协议的。

1、安装keepalived

准备两台机器128和129,130作为master，132作为backup

两台机器都执行yum install -y keepalived

两台机器都安装nginx，其中128上已经编译安装过nginx，129上需要yum安装nginx：yum install -y nginx

设定VIP为100（虚拟IP或者叫浮动IP），服务器靠这个VIP对外提供服务

2、配置master

a)编辑keepalived配置

[[email protected] ~]# > /etc/keepalived/keepalived.conf          //清空配置文件内容
[[email protected] ~]# vim /etc/keepalived/keepalived.conf      //添加以下内容

global_defs {
   notification_email {
   [email protected]
   }
 #出现问题时发送邮件
   notification_email_from [email protected]
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}  
#上述自定义参数

vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
#   自定义脚本，该脚本为监控Nginx服务的脚本
    interval 3
}   
#检测脚本，检测时间3s一次

vrrp_instance VI_1 {
    state MASTER
    interface ens33
    virtual_router_id 51
    priority 100
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass zlinux>com
    }   
    virtual_ipaddress {
        192.168.242.100
    }
#   定义VIP
    track_script {
        chk_nginx
    }   
#   定义监控chk_nginx
}

b)定义监控Nginx服务脚本

[[email protected] ~]# vim /usr/local/sbin/check_ng.sh            //增加脚本，添加以下内容

#!/bin/bash
#时间变量，用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0，则启动nginx，并且再次检测nginx进程数量，
#如果还为0，说明nginx无法启动，此时需要关闭keepalived
if [ $n -eq "0" ]; then
        /etc/init.d/nginx start
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

[[email protected] ~]# chmod 755 /usr/local/sbin/check_ng.sh

c)启动 keepalived服务

[[email protected] ~]# systemctl start keepalived
[[email protected] ~]# ps aux | grep keep
root       2739  0.0  0.0 120720  1400 ?        Ss   13:12   0:00 /usr/sbin/keepalived -D
root       2740  0.0  0.1 127460  3260 ?        S    13:12   0:00 /usr/sbin/keepalived -D
root       2748  0.0  0.1 122792  2380 ?        S    13:12   0:00 /usr/sbin/keepalived -D
root       2750  0.0  0.0 112680   976 pts/0    R+   13:12   0:00 grep --color=auto keep
[[email protected] ~]# ps aux | grep nginx
root        865  0.0  0.1  46764  2872 ?        Ss   10:49   0:00 nginx: master process /usr/local/ngin/sbin/nginx -c /usr/local/nginx/conf/nginx.conf
nobody     2606  0.0  0.2  48688  4608 ?        S    12:15   0:00 nginx: worker process
nobody     2607  0.0  0.2  48688  4104 ?        S    12:15   0:00 nginx: worker process
root       2752  0.0  0.0 112680   976 pts/0    R+   13:12   0:00 grep --color=auto nginx
[[email protected] ~]# ip add                //如果没有出现100这个IP，可能是SELinux没有关闭
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN qlen 1
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host 
       valid_lft forever preferred_lft forever
2: ens33: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
    link/ether 00:0c:29:0c:74:aa brd ff:ff:ff:ff:ff:ff
    inet 192.168.242.128/24 brd 192.168.242.255 scope global ens33
       valid_lft forever preferred_lft forever
    inet 192.168.242.100/32 scope global ens33
       valid_lft forever preferred_lft forever
    inet6 fe80::e335:85d4:68d:9b01/64 scope link 
       valid_lft forever preferred_lft forever

到这里说明master上已经大功告成。

2、配置backup

a)修改keepalived配置

[[email protected] ~]# > /etc/keepalived/keepalived.conf          //清空配置文件内容
[[email protected] ~]# vim /etc/keepalived/keepalived.conf      //添加以下内容,内容与master基本一直，state和priority有变化

global_defs {
   notification_email {
   [email protected]
   }
 #出现问题时发送邮件
   notification_email_from [email protected]
   smtp_server 127.0.0.1
   smtp_connect_timeout 30
   router_id LVS_DEVEL
}
#上述自定义参数

vrrp_script chk_nginx {
    script "/usr/local/sbin/check_ng.sh"
#   自定义脚本，该脚本为监控Nginx服务的脚本
    interval 3
}
#检测脚本，检测时间3s一次

vrrp_instance VI_1 {
    state BACKUP
    interface ens33
    virtual_router_id 51
    priority 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass zlinux>com
    }
    virtual_ipaddress {
        192.168.242.100
    }
#   定义VIP
    track_script {
        chk_nginx
    }
#   定义监控chk_nginx
}

b)添加Nginx服务监控脚本

[[email protected] ~]# vim /usr/local/sbin/check_ng.sh             //添加以下内容

#!/bin/bash
#时间变量，用于记录日志
d=`date --date today +%Y%m%d_%H:%M:%S`
#计算nginx进程数量
n=`ps -C nginx --no-heading|wc -l`
#如果进程为0，则启动nginx，并且再次检测nginx进程数量，
#如果还为0，说明nginx无法启动，此时需要关闭keepalived
if [ $n -eq "0" ]; then
        /etc/init.d/nginx start
        n2=`ps -C nginx --no-heading|wc -l`
        if [ $n2 -eq "0"  ]; then
                echo "$d nginx down,keepalived will stop" >> /var/log/check_ng.log
                systemctl stop keepalived
        fi
fi

[[email protected] ~]# chmod 755 /usr/local/sbin/check_ng.sh 
[[email protected] ~]# systemctl start keepalived

3、测试

[[email protected] html]# curl  -I 192.168.242.100
HTTP/1.1 200 OK
Server: nginx/1.12.2
Date: Mon, 09 Apr 2018 07:00:49 GMT
Content-Type: text/html
Content-Length: 13
Last-Modified: Mon, 09 Apr 2018 06:16:24 GMT
Connection: keep-alive
ETag: "5acb0538-d"
Accept-Ranges: bytes

[[email protected] html]# systemctl stop keepalived              
[[email protected] html]# curl  -I 192.168.242.100                //这个就到slave上了
HTTP/1.1 200 OK
Server: nginx/1.12.2
Date: Mon, 09 Apr 2018 07:01:08 GMT
Content-Type: text/html
Content-Length: 15
Last-Modified: Mon, 09 Apr 2018 06:21:29 GMT
Connection: keep-alive
ETag: "5acb0669-f"
Accept-Ranges: bytes

master正常的情况下：
技术分享图片
master出现问题：

以上是关于Linux集群：搭建高可用集群的主要内容，如果未能解决你的问题，请参考以下文章

搭建高可用mongodb集群（转）

Linux运维-集群技术进阶Nginx+Keepalived+Tomcat搭建高可用/负载均衡/动静分离的Webserver集群

搭建高可用mongodb集群—— 分片

keepalived讲解及搭建高可用Nginx热备集群

搭建高可用mongodb集群—— 副本集

搭建高可用mysql集群 - PPT文稿分享