nginx实现高可用

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了nginx实现高可用相关的知识,希望对你有一定的参考价值。

参考技术A 大家知道nginx作为反向代理服务器可以实现负载均衡,同时也可以作为静态文件服务器,它的特点就是并发支持大,单机可同时支持3万并发,现在很多网站都把NGINX作为网关入口来统一调度分配后端资源。但是nginx自身不能成为系统高可用的短板,针对nginx也有一些高可用策略如下:
1、使用keepalived实现主备,该场景下只能有一台nginx对外提供代理服务,当提供服务的主nginx服务宕机后,通过keepalived可以直接切换到备nginx服务,缺点显而易见,只有单机提供服务,流量有限,切换过程中可能导致请求不可用
2、使用f5硬件负载均衡器,可以实现nginx负载均衡,多台nginx同时对流量进行负载,f5硬件负载均衡器也有单节点问题,可以部署多个f5硬件负载均衡器;如果公司是物理机房,服务本地化,使用f5硬件负载均衡器,投入成本比较大,维护难度高,可以服务上云,通过使用云厂商(阿里云、腾讯云等)产品节约成本(基本上f5硬件负载均衡器是免费使用只收取少量流量费)

nginx和keepalived实现nginx高可用

        首先介绍一下Keepalived,它是一个高性能的服务器高可用或热备解决方案,Keepalived主要来防止服务器单点故障的发生问题,可以通过其与Nginx的配合实现web服务端的高可用。

        Keepalived以VRRP协议为实现基础,用VRRP协议来实现高可用性(HA).VRRP (Virtual Router Redundancy Protocol)协议是用于实现路由器冗余的协议,VRRP协议将两台或多台路由器设备虚拟成一个设备,对外提供虚拟路由器IP(一个或多个),如下图所示:

       这张图的意思是,我们使用keepalived来管理两台设备的Nginx,并虚拟出一个IP,我们现在两台装有Nginx的设备分别是192.168.156.11和192.168.156.12,那么我们可以虚拟出一个192.168.156.xx的IP,外界请求直接访问虚拟IP而不是真正的Nginx,让虚拟IP去访问提供服务的Nginx(注意:高可用是指同一时间提供服务的只有一台设备,提供服务的设备挂掉之后,备份服务器便开始提供服务),然后再由Nginx去访问tomcat。


         

     我们拿两台虚拟机来搭建nginx高可用环境,这两台设备分别是192.168.156.11(主机名是nginx1)和192.168.156.12(主机名是nginx2)。

     如果是最小化安装的两台虚拟机,在搭建环境前需要做如下准备操作:

1.给虚拟机配置静态IP并要能上网,大家可以参考:http://blog.csdn.net/u012453843/article/details/52839105这篇博客进行学习

2.安装vim命令,使用命令:yum install vim-enhanced

3.安装gcc,使用命令:yum install make cmake gcc gcc-c++

4.安装依赖,如下所示。

yum install pcre  
yum install pcre-devel  
yum install zlib  
yum install zlib-devel
      做完了以上准备操作,我们可以安装nginx了,关于nginx的安装,大家可以参考:http://blog.csdn.net/u012453843/article/details/69396434这篇博客进行学习。

     下面我们在192.168.156.11和192.168.156.12两台设备上都安装下keepalived。大家可以到http://download.csdn.net/detail/u012453843/9808913这个地址下载keepalived-1.2.18.tar.gz。

1、两台设备都进入到/usr/local/software目录下,方法是在XShell下面的输入框中输入命令cd /usr/local/software,回车,如下图所示。注意:下图输入框左边的图标要是多窗口图标,如果当前不是多窗口图标,可以点击输入框后面的那个图标,选择“全部XShell(X)”。


2、解压,我们在下面的输入框中输入tar -zxvf keepalived-1.2.18.tar.gz -C /usr/local/并按回车即可在两台设备同时进行解压操作。


3、安装一个软件包,在下面的输入框中输入:yum install -y openssl openssl-devel并按回车即可在两台设备同时安装软件包openssl。

  

   解压完之后,我们可以到/usr/local目录下查看一下,发现已经有解压好的keepalived-1.2.18了。


4、对keepalived进行配置,我们在下面的输入框中输入cd keepalived-1.2.18/ && ./configure --prefix=/usr/local/keepalived并按回车即可在两台设备同时进行配置。


5、进行编译安装,我们在下面的输入框中输入make && make install并按回车,即可在两台设备同时进行编译安装。


       安装完nginx之后,我们把keepalived做成一个服务,这样可以做到开机自动启动,步骤如下:

1、创建/etc/keepalived目录,我们在下面的输入框中输入mkdir /etc/keepalived并按回车,即可同时在两台设备上创建/etc/keepalived。


2、复制几个文件到指定目录

      先复制第一个文件,我们在下面的输入框中输入cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/并按回车,即可在两台设备同时完成复制操作。


      下面复制第二个文件,我们在下面的输入框中输入cp /usr/local/keepalived/etc/rc.d/init.d/keepalived /etc/init.d/并按回车,即可同时在两台设备上完成复制该文件操作。


      下面复制第三个文件,我们在输入框中输入cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/并按回车,即可在两台设备同时执行复制文件操作。


3、创建两个软链接

     首先创建第一个软链接,我们在下面的输入框中输入ln -s /usr/local/sbin/keepalived /usr/sbin/并按回车即可完成在两台设备上同时创建软链接。


       下面我们创建第二个软链接,我们在下面的输入框中输入ln -s /usr/local/keepalived/sbin/keepalived /sbin/并按回车即可同时在两台设备上创建该软链接。


4、设置成开机启动,我们在下面的输入框中输入chkconfig keepalived on并按回车即可完成对两台设备同时设置keepalived服务开机启动。


     既然设置成了系统服务,那么我们便尝试使用service keepalived start来启动该服务。如下图所示,发现两台设备都可以正常启动keepalived服务,说明我们设置是成功的。


      我们可以重启服务也可以关闭服务,如下所示。我们先关闭两个节点的keepalived服务。

[root@nginx2 usr]# service keepalived restart
停止 keepalived:                                          [确定]
正在启动 keepalived:                                      [确定]
[root@nginx2 usr]# ps -ef | grep keepalived
root       3131      1  0 00:38 ?        00:00:00 keepalived -D
root       3133   3131  0 00:38 ?        00:00:00 keepalived -D
root       3134   3131  0 00:38 ?        00:00:00 keepalived -D
root       3136   1373  0 00:38 pts/0    00:00:00 grep keepalived
[root@nginx2 usr]# service keepalived stop
停止 keepalived:                                          [确定]
[root@nginx2 usr]# ps -ef | grep keepalived
root       3157   1373  0 00:38 pts/0    00:00:00 grep keepalived
[root@nginx2 usr]# 
        下面我们便使用keepalived来实现nginx的高可用

1、我们需要修改下/etc/keepalived/keepalived.conf文件,首先修改192.168.156.11上的这个文件,修改后的配置内容如下

! Configuration File for keepalived

global_defs {
   router_id nginx1
}

vrrp_script chk_nginx {
   script "/etc/keepalived/nginx_check.sh"
   interval 2
   weight -20
}

vrrp_instance VI_1 {
    state MASTER
    interface eth0
    virtual_router_id 11
    mcast_src_ip 192.168.156.11
    priority 100
    nopreempt
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    track_script {
       chk_nginx
    }
    virtual_ipaddress {
        192.168.156.110
    }
}
      下面我们来具体学习下配置的意思,首先global_defs当中配置的是主机名,我的192.168.156.11的主机名是nginx1,因此这里配置的router_id的值是nginx1。

global_defs {
   router_id nginx1
}
      接着看下面这段配置,这段配置的意思是,每隔2秒中去执行/etc/keepalived/nginx_check.sh脚本一次,这项检查从开始便一直进行,interval表示间隔时间,weight -20的意思是,脚本执行成功后把192.168.156.11这个节点的优先级降低20。

vrrp_script chk_nginx {
   script "/etc/keepalived/nginx_check.sh"
   interval 2
   weight -20
}
      接着看下面这段配置,state MASTER表示该节点角色定义为MASTER,interface eth0是指虚拟机的网卡是eth0。virtual_router_id 11这项配置非常重要,两个节点的这项配置的值必须一样,否则会出现乱七八糟的问题,这里我把virtual_router_id的值设置为11是取自192.168.156.11的最后两位数字。mcast_src_ip 192.168.156.11这项配置是指定当前节点的真实IP。priority 100的意思是优先级,这里暂且设置为100,当然也可以是其它值。优先级在keepalived实现高可用方面起着至关重要的作用,keepalived服务器就是根据优先级来选择当前提供服务的设备的,192.168.156.11刚开始设置的优先级是100,192.168.156.12刚开始设置的优先级是90,这样keepalived一开始去检查优先级,发现192.168.156.11这台设备的优先级高,于是便让该设备对外提供服务,当192.168.156.11这台设备的nginx挂掉后,由于nginx_check.sh脚本每两秒执行一次,发现192.168.156.11这个节点没有nginx进程后便尝试进行重新启动nginx,如果重新启动还是不行的话,就杀掉所有的keepalived进程,并告诉keepalived服务器192.168.156.11这个节点的nginx挂掉了同时会把这个节点的优先级减20,从而优先级变为了80,这样下次keepalived来检查优先级发现192.168.156.12这个节点的优先级比较高(90),于是便让192.168.156.12这个节点对外提供服务,同理,这个节点发生故障的话,也会再去让另外一个节点来提供服务,这就实现了高可用。

vrrp_instance VI_1 {
    state MASTER
    interface eth0
    virtual_router_id 11
    mcast_src_ip 192.168.156.11
    priority 100
    nopreempt
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    track_script {
       chk_nginx
    }
    virtual_ipaddress {
        192.168.156.110
    }
} 

    那么怎么查看虚拟机的网卡是什么呢?我们使用命令ip a来查看,如下图所示,可以看到192.168.156.11这台虚拟机的网卡是eth0。而且现在可以看到这台设备只有一个IP地址,等一会儿配置好之后,会有虚拟IP的信息。


       下面我们来看如下配置,这段配置两个节点要一样,表明它们属于一个组,keepalived会同一组中去做检查并保持高可用。

authentication {
        auth_type PASS
        auth_pass 1111
    }
       下面再看这段配置,这段配置中的"chk_nginx"与我们在上面定义的定时执行脚本配置(vrrp_script chk_nginx)的名称要一样。

track_script {
       chk_nginx
    }
      下面再来看下面这段配置,这段配置的意思是对外提供的虚拟IP,这里可以是一个也可以是多个。

virtual_ipaddress {
        192.168.156.110
    }
       看完了配置文件,我们再来看下定时检查nginx的脚本文件nginx_check.sh(需要确保脚本格式是unix格式,方法是vim进入编辑模式,然后输入:set ff并按回车即可看到格式)。,如下所示( 注意:wc -l的"l"是小写的L而不是1)。

#!/bin/sh
A=`ps -C nginx --no-header |wc -l`
if [ $A -eq 0 ];then
	/usr/local/nginx/sbin/nginx
	sleep 2
	if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
		killall keepalived
	fi
fi

      我们来学习下这个脚本的意思,下面这行的意思是,使用ps -C nginx --no-header |wc -l命令去检查当前nginx的进程数量并把查询到的进程数量赋值给变量A。

A=`ps -C nginx --no-header |wc -l`
     下面这行脚本的意思是,如果查询到的nginx的进程数量是0的话,就执行if条件里的内容。

if [ $A -eq 0 ];then
     下面这行代码的意思是由于检查到当前没有nginx进程,因此尝试去启动nginx。

/usr/local/nginx/sbin/nginx
     下面这行脚本的意思是启动nginx之后休眠2秒。

sleep 2
      下面这段脚本的医生说是如果nginx的进程数还是0的话,就认为nginx已经挂掉了,需要杀掉这个节点上所有的keepalived进程。

if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
		killall keepalived
	fi
      两个文件所在的目录是/etc/keepalived,如下所示。

[root@nginx1 keepalived]# pwd
/etc/keepalived
[root@nginx1 keepalived]# ll
总用量 8
-rw-r--r--. 1 root root 554 4月   9 01:51 keepalived.conf
-rw-r--r--. 1 root root 180 4月   9 03:30 nginx_check.sh
[root@nginx1 keepalived]# 

      以上便是192.168.156.11节点上的配置文件和脚本的内容。我们在192.168.156.12这个节点上也需要有这两个文件,192.168.156.12这个节点上keepalived.conf文件的内容如下:注意virtual_router_id的值要与192.168.156.11这个节点配置的值要一致。

! Configuration File for keepalived

global_defs {
   router_id nginx2
}

vrrp_script chk_nginx {
   script "/etc/keepalived/nginx_check.sh"
   interval 2
   weight -20
}

vrrp_instance VI_1 {
    state BACKUP
    interface eth0
    virtual_router_id 11
    mcast_src_ip 192.168.156.12
    priority 90
    advert_int 1
    authentication {
        auth_type PASS
        auth_pass 1111
    }
    track_script {
       chk_nginx
    }
    virtual_ipaddress {
        192.168.156.110
    }
}
      nginx_check.sh脚本文件在两个节点上内容一样,192.168.156.12节点上两个文件目录与192.168.156.11一样,如下所示。

[root@nginx2 keepalived]# pwd
/etc/keepalived
[root@nginx2 keepalived]# ll
总用量 8
-rw-r--r--. 1 root root 553 4月   9 02:35 keepalived.conf
-rw-r--r--. 1 root root 180 4月   9 02:41 nginx_check.sh
[root@nginx2 keepalived]# 
       由于目前nginx_check.sh脚本只有读权限,因此我们需要把两个节点上这个文件的权限放开,如下图所示。

       上面做好了铺垫之后,我们现在启动nginx,不过在启动nginx之前要保持两个节点nginx.conf配置一致,我们就都采用最原始的配置吧。如下所示。

#user  nobody;
worker_processes  1;

#error_log  logs/error.log;
#error_log  logs/error.log  notice;
#error_log  logs/error.log  info;

#pid        logs/nginx.pid;


events {
    worker_connections  1024;
}


http {
    include       mime.types;
    default_type  application/octet-stream;

    #log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
    #                  '$status $body_bytes_sent "$http_referer" '
    #                  '"$http_user_agent" "$http_x_forwarded_for"';

    #access_log  logs/access.log  main;

    sendfile        on;
    #tcp_nopush     on;

    #keepalive_timeout  0;
    keepalive_timeout  65;

    #gzip  on;

    server {
        listen       80;
        server_name  localhost;

        #charset koi8-r;

        #access_log  logs/host.access.log  main;

        location / {
            root   html;
            index  index.html index.htm;
        }

        #error_page  404              /404.html;

        # redirect server error pages to the static page /50x.html
        #
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }

        # proxy the PHP scripts to Apache listening on 127.0.0.1:80
        #
        #location ~ \\.php$ {
        #    proxy_pass   http://127.0.0.1;
        #}

        # pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
        #
        #location ~ \\.php$ {
        #    root           html;
        #    fastcgi_pass   127.0.0.1:9000;
        #    fastcgi_index  index.php;
        #    fastcgi_param  SCRIPT_FILENAME  /scripts$fastcgi_script_name;
        #    include        fastcgi_params;
        #}

        # deny access to .htaccess files, if Apache's document root
        # concurs with nginx's one
        #
        #location ~ /\\.ht {
        #    deny  all;
        #}
    }


    # another virtual host using mix of IP-, name-, and port-based configuration
    #
    #server {
    #    listen       8000;
    #    listen       somename:8080;
    #    server_name  somename  alias  another.alias;

    #    location / {
    #        root   html;
    #        index  index.html index.htm;
    #    }
    #}


    # HTTPS server
    #
    #server {
    #    listen       443 ssl;
    #    server_name  localhost;

    #    ssl_certificate      cert.pem;
    #    ssl_certificate_key  cert.key;

    #    ssl_session_cache    shared:SSL:1m;
    #    ssl_session_timeout  5m;

    #    ssl_ciphers  HIGH:!aNULL:!MD5;
    #    ssl_prefer_server_ciphers  on;

    #    location / {
    #        root   html;
    #        index  index.html index.htm;
    #    }
    #}

}
      为了能够区分欢迎页是哪个节点的欢迎页,我们修改下欢迎页的信息,如下图所示。

     下面我们来重新启动启动两个节点的nginx,如下所示。

[root@nginx1 html]# /usr/local/nginx/sbin/nginx -s reload
[root@nginx1 html]# 

[root@nginx2 html]# /usr/local/nginx/sbin/nginx -s reload
[root@nginx2 html]#
       启动nginx之后,我们首先直接访问192.168.156.11的nginx首页,如下图所示。

        下面我们再直接访问192.168.156.12的nginx首页,如下图所示

        下面我们启动两个节点上的keepalived,如下图所示。

       启动keepalived之后,我们可以在两个节点上看到共同的虚拟IP192.168.156.110,如下图所示,我们发现在两个节点上都看到了虚拟IP192.168.156.110,这是不合理的,正确情况应该是只在Master角色的节点上有虚拟IP。

       造成上图这种情况的原因是防火墙,为了避免因防火墙引起的各种问题,我们把两个节点的防火墙都关闭,而且可以设置开机也不启动防火墙,关闭防火墙的命令是:service iptables stop,设置不让防火墙开机重启的命令是chkconfig iptables off。关闭防火墙之后,我们再在两个节点查看IP信息,如下图所示,可以看到主节点192.168.156.11上有虚拟IP的信息,而备节点192.168.156.12上没有虚拟IP。这样才是正确的。


       这时我们便可以通过使用虚拟IP:192.168.156.110来访问nginx了,如下图所示,可以看到我们这时访问到的是192.168.156.11这台设备上的nginx。之所以会看到这台设备上的nginx是因为我们给这台设备keepalived赋予的优先级是100,而另一台设备192.168.156.12上keepalived赋予的优先级是90,显然192.168.156.11的优先级要高于192.168.156.12,因此keepalived服务器会选择192.168.156.11这个节点上的nginx对外提供服务。


       既然要达到高可用的目的,我们便来测试一下假如我们把192.168.156.11上的keepalived服务关掉之后,看keepalived服务器会不会自动帮我们切换到另一个节点192.168.156.12让其对外提供服务。

[root@nginx1 keepalived]# service keepalived stop
停止 keepalived:                                          [确定]
[root@nginx1 keepalived]# 
       关闭192.168.156.11的keepalived服务之后,我们再刷新http://192.168.156.110/,等一小会儿便可以看到提供nginx服务的自动变为nginx12了(也就是192.168.156.12),如下图所示。


        等我们的192.168.156.11设备故障修复之后,我们重启keepalived,如下图所示。

[root@nginx1 keepalived]# service keepalived start
正在启动 keepalived:                                      [确定]
[root@nginx1 keepalived]# 
        这时我们再刷新http://192.168.156.110/就会看到如下图所示界面,可以看到这时提供nginx服务的又自动切换为192.168.156.11这个节点了。说明我们已经实现了高可用性。


        由于我们把keepalived配置成了服务,并且设置成了开机自启动,下面我们把两台设备都重启,重启的命令是reboot。

        重启后,我们使用命令service keepalived status查看keepalived是否自己启动了,而且我们在nginx_check.sh脚本中会自动开启nginx,如下所示,发现都自动开启了。

[root@nginx1 ~]# service keepalived status
keepalived (pid  1197) 正在运行...
[root@nginx1 ~]# ps -ef|grep nginx
root       1233      1  0 22:10 ?        00:00:00 nginx: master process /usr/local/nginx/sbin/nginx
nobody     1235   1233  0 22:10 ?        00:00:00 nginx: worker process      
root       1628   1524  0 22:12 pts/0    00:00:00 grep nginx
[root@nginx1 ~]# 
[root@nginx2 ~]# service keepalived status
keepalived (pid  1198) 正在运行...
[root@nginx2 ~]# ps -ef|grep nginx
root       1234      1  0 22:10 ?        00:00:00 nginx: master process /usr/local/nginx/sbin/nginx
nobody     1236   1234  0 22:10 ?        00:00:00 nginx: worker process      
root       1670   1531  0 22:12 pts/0    00:00:00 grep nginx
[root@nginx2 ~]#
       下面我还可以人为让nginx的配置文件出错,这样nginx_check.sh脚本文件在去尝试启动nginx时发现启动不成功,便会将keepalived也都杀掉。比如我们把192.168.156.11这台设备的nginx的配置文件人为修改出错,我们只需少写一个";"即可,如下图所示,我们把"worker_connections  1024"后面的那个";"去掉。

       下面我们重启192.168.156.11这台虚拟机,重启之后,我们查看keepalived的状态,发现keepalived已经被杀掉了,nginx也没启动。出现这种情况的原因是,当192.168.156.11启动后,keepalived会自动启动,启动会每隔2秒去执行nginx_check.sh脚本文件,该脚本文件通过检查nginx的进程数量是0,于是去尝试启动nginx,由于我们把nginx.conf文件人为修改错了,因此无法正常启动脚本,在尝试了无法启动nginx之后,脚本便把keepalived的所有进程都杀掉了,于是便会看到我们下面的结果。

[root@nginx1 ~]# service keepalived status
keepalived 已死,但是 subsys 被锁
[root@nginx1 ~]# ps -ef|grep nginx
root       1430   1398  0 22:27 pts/0    00:00:00 grep nginx
[root@nginx1 ~]#
        我们这时访问虚拟IP的话,便只能看到192.168.156.12对外提供nginx服务了,如下图所示。

       至此,我们使用keepalived搭建nginx高可用便搭建完了。需要说明的是,keepalived不仅可以用于nginx的高可用,还可以用于redis、mysql等等所有服务的高可用。



 













       




以上是关于nginx实现高可用的主要内容,如果未能解决你的问题,请参考以下文章

Nginx高可用

Nginx+Keepalived实现站点高可用

nginx + keepalived 实现高可用性

Nginx+Keepalived实现站点高可用

nginx和keepalived实现nginx高可用

nginx负载均衡nginx的高可用集群利用keepalive实现双vip