ELK5.3+Kafka集群配置

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ELK5.3+Kafka集群配置相关的知识,希望对你有一定的参考价值。

【一】资源准备


# 3台4C*8G, 安装Zookeeper、Kafka、Logstash——Broker(input: filebeat; output: Kafka)

  10.101.2.23 10.101.2.24 10.101.2.25


# 2台4C*8G, 安装Logstash——Indexer(input: Kafaka; output: Elasticsearch)

  10.101.2.26 10.101.2.27


# 3台8C*16G, 安装Elasticsearch

  10.101.2.28 10.101.2.29 10.101.2.30


# 2台2C*4G, 安装Kibana

  10.101.2.31 10.101.2.32

  

# 安装包下载

  elasticsearch-5.3.1.tar.gz

  filebeat-5.3.1-linux-x86_64.tar.gz

  jdk-8u131-linux-x64.tar.gz

  kafka_2.12-0.10.2.0.tgz

  kibana-5.3.1-linux-x86_64.tar.gz

  logstash-5.3.1.tar.gz

  node-v7.9.0-linux-x64.tar.gz

  zookeeper-3.4.10.tar.gz

  nginx-1.12.0.tar.gz

  统一上传至服务器 /usr/local/src 目录下


【二】通用配置


# 配置hosts

vi /etc/hosts 

10.101.2.23     vmserver2x23

10.101.2.24     vmserver2x24

10.101.2.25     vmserver2x25

10.101.2.26     vmserver2x26

10.101.2.27     vmserver2x27

10.101.2.28     vmserver2x28

10.101.2.29     vmserver2x29

10.101.2.30     vmserver2x30

10.101.2.31     vmserver2x31

10.101.2.32     vmserver2x32


# 配置ssh访问限制,假如有必要的话

vi /etc/hosts.allow 



【三】安装Elasticsearch集群


# 系统环境


vi /etc/sysctl.conf 

vm.max_map_count=262144

fs.file-max=65536


执行 sysctl -p  使配置生效


vi /etc/security/limits.conf #打开文件数

* soft nofile 65536

* hard nofile 131072

* soft nproc 2048

* hard nproc 4096

* - memlock unlimited


vi /etc/security/limits.d/90-nproc.conf

* soft nproc 2048


# 配置Java环境变量

cd /usr/local/src/

tar -xvf jdk-8u131-linux-x64.tar.gz

mv jdk1.8.0_131 /usr/share/


vi /etc/profile #在末尾添加下面3行后, 保存退出

export JAVA_HOME=/usr/share/jdk1.8.0_131

export PATH=$JAVA_HOME/bin:$PATH 

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar 


source /etc/profile  使得配置立即生效


# 解压elasticsearch

cd /usr/local/src

tar -xvf elasticsearch-5.3.1.tar.gz

mv elasticsearch-5.3.1 /usr/local 

vi /usr/local/elasticsearch-5.3.1/bin/elasticsearch  #设置ES_JAVA_OPTS参数

ES_JAVA_OPTS="-Xms8g -Xmx8g"  # 去掉该行前的注释后, 一定要删除后面的这一串 ./bin/elasticsearch 


# 新增elastic组及用户, 因为elasticsearch不允许root用户启动

groupadd elastic

useradd elastic -g elastic

passwd elastic  # 设定用户密码

chown -R elastic:elastic /usr/local/elasticsearch-5.3.1/


# 配置elasticsearch.ywl, 主要参数如下

cluster.name: bsd-elk

node.name: elk-2-30      # 每个节点不同

node.master: true

node.data: true

bootstrap.memory_lock: true

bootstrap.system_call_filter: false    # centos7以下版本需要将这个参数设置为false

network.host: 0.0.0.0

http.port: 9200

discovery.zen.ping.unicast.hosts: ["10.101.2.28:9300", "10.101.2.29:9300", "10.101.2.30:9300"]

discovery.zen.minimum_master_nodes: 2

discovery.zen.ping_timeout: 60s        # 网上大部分文章这个参数都写成了discovery.zen.ping.timeout

http.cors.enabled: true

http.cors.allow-origin: "*"


# 下载node-v7.9.0-linux-x64.tar.gz, 解压后mv到/usr/local/nodejs-7.9.0

chown -R elastic:elastic nodejs-7.9.0/

cd /usr/local/nodejs-7.9.0

ln -s /usr/local/nodejs-7.9.0/bin/node /usr/local/bin

ln -s /usr/local/nodejs-7.9.0/bin/npm /usr/local/bin


# 安装head插件, 5.x以上的elasticsearch暂没有找到离线安装的方法, 所以需要服务器开通外网访问权限

# 5.x版本是里程碑式的更新, 网上大部分的文章都是以前版本的插件安装

cd /usr/local/elasticsearch-5.3.1

git clone https://github.com/mobz/elasticsearch-head.git

如果没有git工具先安装, yum install git


cd elasticsearch-head

npm install -g grunt --registry=https://registry.npm.taobao.org    # 安装grunt

npm install                                                        # 安装head

npm install grunt --save   # 如果 node_modules/grunt/bin/目录下没有 grunt文件, 就执行以下该命令

vi Gruntfile.js  修改connect, 在options里添加本机IP hostname: ‘10.101.2.30‘,


cd /usr/local/elasticsearch-5.3.1

bin/elasticsearch -d    # 启动elasticsearch

cd elasticsearch-head

node_modules/grunt/bin/grunt server &   # 启动head插件

访问 http://10.101.2.30:9100 


# 安装bigdesk插件

cd /usr/local/elasticsearch-5.3.1

git clone https://github.com/hlstudio/bigdesk

cd bigdesk/_site

python -m SimpleHTTPServer &   # 启动bigdesk插件

访问 http://10.101.2.30:8000 


另外两台机器(10.101.2.28 10.101.2.29)按此步骤同样配置, master和data节点的选择看实际情况, 我的3台全是混合节点

所有elasticsearch启动后, 访问head如果能看到3个节点的集群信息, 就可以了


【四】安装ZooKeeper集群


# zookeeper依赖java, java环境配置参照上面


# 解压zookeeper-3.4.10.tar.gz

cd /usr/local/src

tar -xvf zookeeper-3.4.10.tar.gz

mv zookeeper-3.4.10 /usr/local

mkdir /usr/local/zookeeper-3.4.10/data     # 每个节点上创建一个数据存放目录


# 创建myid文件

echo 23 >/usr/local/zookeeper-3.4.10/data/myid    # 10.101.2.23、24、25三台机器上myid的值分别放 23 24 25


# 配置zoo.cfg

cd /usr/local/zookeeper-3.4.10/conf/

cp zoo_sample.cfg zoo.cfg

vi zoo.cfg    # 主要参数如下

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/usr/local/zookeeper-3.4.10/data

clientPort=2181

server.23=10.101.2.23:2888:3888

server.24=10.101.2.24:2888:3888

server.25=10.101.2.25:2888:3888


# 复制配置文件到其他节点

scp zoo.cfg [email protected]:/usr/local/zookeeper-3.4.10/conf/


# 启动zookeeper集群

cd /usr/local/zookeeper-3.4.10/

bin/zkServer.sh start

bin/zkServer.sh status   # 主节点会返回 Mode: leader, 从节点返回 Mode: follower


至此zookeeper集群配置完毕


【五】配置kafka集群


# 解压kafka_2.12-0.10.2.0.tgz, 创建数据目录

cd /usr/local

tar -xvf  src/kafka_2.12-0.10.2.0.tgz

mkdir /usr/local/kafka_2.12-0.10.2.0/data


# 配置server.propertites

cd /usr/local/kafka_2.12-0.10.2.0/config

vi server.properties   # 主要参数如下


broker.id=23          # 10.101.2.23、24、25三台机器上id的值分别放 23 24 25

delete.topic.enable=true

num.network.threads=3

num.io.threads=8


socket.send.buffer.bytes=102400

socket.receive.buffer.bytes=102400

socket.request.max.bytes=104857600


log.dirs=/usr/local/kafka_2.12-0.10.2.0/data


num.partitions=6

num.recovery.threads.per.data.dir=1


#log.flush.interval.messages=10000

#log.flush.interval.ms=1000


log.retention.hours=72

#log.retention.bytes=1073741824

log.segment.bytes=1073741824

log.retention.check.interval.ms=300000


zookeeper.connect=10.101.2.23:2181,10.101.2.24:2181,10.101.2.25:2181

zookeeper.connection.timeout.ms=6000


# 复制配置文件到其他节点, 不要忘记修改 broker.id

scp server.properties [email protected]:/usr/local/kafka_2.12-0.10.2.0/config/


# 启动kafka集群

cd /usr/local/kafka_2.12-0.10.2.0/

bin/kafka-server-start.sh config/server.properties > /dev/null &


# 友情赠送几条常用命令

bin/kafka-topics.sh --create --zookeeper localhost:2181 --replication-factor 1 --partitions 1 --topic test  # 创建topic

bin/kafka-topics.sh --list --zookeeper localhost:2181   # 查看已经创建的topic列表

bin/kafka-topics.sh --describe --zookeeper localhost:2181 --topic test  # 查看topic的详细信息

bin/kafka-console-producer.sh --broker-list localhost:9092 --topic test # 发送消息, 回车后模拟输入一下消息

bin/kafka-console-consumer.sh --bootstrap-server localhost:9092 --topic test # 消费消息, 可以换到其他kafka节点, 同步接收生产节点发送的消息

bin/kafka-topics.sh --zookeeper localhost:2181 --alter --topic test --partitions 6  # 给topic增加分区

bin/kafka-topics.sh --delete --zookeeper localhost:2181 --topic test1  # 删除已经创建的topic, 前提是开了delete.topic.enable=true参数

如果还不能删除, 可以到zookeeper中去干掉它

cd /usr/local/zookeeper-3.4.10/

bin/zkCli.sh

ls /brokers/topics            # 查看topic

rmr /brokers/topics/test1     # 删除topic


至此kafka集群配置完毕


【六】logstash——broker集群配置


# java环境配置略


# 解压logstash-5.3.1.tar.gz

cd /usr/local 

tar -xvf src/logstash-5.3.1.tar.gz


# 添加配置文件 beat_to_kafka.conf

cd logstash-5.3.1

vi config/beat_to_kafka.conf   # 输入下面内容后保存

input {

  beats {

    port => 5044

  }

}


filter {

  

}


# topic_id改成按beat中配置的document_type来输出到不同的topic中, 供kibana分组过滤用

output {

  kafka {

    bootstrap_servers => "10.101.2.23:9092,10.101.2.24:9092,10.101.2.25:9092"

    # topic_id => "bsd-log" 

    topic_id => ‘%{[type]}‘

  }

}


# 启动logstash

bin/logstash -f config/beat_to_kafka.conf > /dev/null &


至此logstash-broker集群配置完成


【七】在实际应用服务器上安装filebeat


# 解压filebeat-5.3.1-linux-x86_64.tar.gz

cd /usr/local/

tar -xvf src/filebeat-5.3.1-linux-x86_64.tar.gz

mv filebeat-5.3.1-linux-x86_64 filebeat-5.3.1


# 配置filebeat.yml文件, 先找一台drds试水

cd filebeat-5.3.1

vi filebeat.yml     # 主要参数如下 


#=========================== 文件正文开始 =============================


filebeat.prospectors:


  input_type: log


  paths:

    - /home/admin/drds-server/3306/logs/rms/slow.log

    - /home/admin/drds-server/3306/logs/engineering/slow.log   

    - /home/admin/drds-server/3306/logs/sc_file/slow.log   

    - /home/admin/drds-server/3306/logs/sc_user/slow.log   

    - /home/admin/drds-server/3306/logs/sc_order/slow.log   

    - /home/admin/drds-server/3306/logs/sc_inventory/slow.log   

    - /home/admin/drds-server/3306/logs/sc_marketing/slow.log   

    - /home/admin/drds-server/3306/logs/sc_message/slow.log   

    - /home/admin/drds-server/3306/logs/sc_channel/slow.log   

  

  #exclude_lines: ["^DBG"]

  #include_lines: [‘Exception‘,‘ERR_CODE‘]

  #exclude_files: [".gz$"]


  document_type: drds-slow


  # 设定合并正则

  multiline.pattern: ^[0-9]{4}-[0-9]{2}-[0-9]{2}\s[0-9]{2}:[0-9]{2}:[0-9]{2}.[0-9]{3}

  multiline.negate: true

  multiline.match: after


# 单台机器上配置不同document_type

-

  input_type: log

  paths:

    - /home/admin/drds-server/3306/logs/test/sql.log


  document_type: drds-sql

  

  multiline.pattern: ^[0-9]{4}-[0-9]{2}-[0-9]{2}\s[0-9]{2}:[0-9]{2}:[0-9]{2}.[0-9]{3}

  multiline.negate: true

  multiline.match: after


#----------------------------- Logstash output --------------------------------

output.logstash:

  # The Logstash hosts

  hosts: ["10.101.2.23:5044","10.101.2.24:5044","10.101.2.25:5044"]


#=========================== 文件正文结束 =============================



# 启动filebeat

./filebeat -c filebeat.yml > /dev/null &



【八】配置logstash——indexer集群


# java环境配置略


# 解压logstash-5.3.1.tar.gz

cd /usr/local 

tar -xvf src/logstash-5.3.1.tar.gz


# 添加配置文件 kafka_to_es.conf

cd logstash-5.3.1

vi config/kafka_to_es.conf   # 输入下面内容后保存


# input里关于server以及topic的配置, 5.x和以前版本不同

input {

  kafka {

    bootstrap_servers => "10.101.2.23:9092,10.101.2.24:9092,10.101.2.25:9092"

    group_id => "logstash"

    topics => ["drds-sql","drds-slow","sc_user","sc_channel","sc_order","sc_inventory","sc_message","sc_file","sc_marketing","rms",‘scm‘,‘engineering‘]

    consumer_threads => 50

    decorate_events => true

  }

}


filter {   


}


output {

  elasticsearch {

    hosts => ["10.101.2.28:9200","10.101.2.29:9200","10.101.2.30:9200"]

    index => "logstash-%{+YYYY.MM.dd.hh}"

    manage_template => true

    template_overwrite => true

    template_name => "drdsLogstash"

    flush_size => 50000

    idle_flush_time => 10

  }

}


# 启动logstash

bin/logstash -f config/kafka_to_es.conf > /dev/null &


至此logstash-indexer集群配置完成, 不出意外, elasticsearch-head里应该已经有数据写入了


【九】配置kibana集群


# 解压kibana-5.3.1-linux-x86_64.tar.gz

cd /usr/local

tar -xvf src/kibana-5.3.1-linux-x86_64.tar.gz

mv kibana-5.3.1-linux-x86_64/ kibana-5.3.1 


# 配置kibana.yml文件

cd kibana-5.3.1

vi config/kibana.yml    #主要参数如下

server.port: 5601

server.host: "0.0.0.0"

elasticsearch.url: "http://10.101.2.28:9200"     # 指到es集群master节点


# 启动kibana

bin/kibana > /dev/null &


# kibana对浏览器兼容性不好, 低版本的chrome和ie都不能访问, 显示正在加载

访问 http://ip:5601 


# 另一台kibana节点按相同配置(可以把es.url指到另一个节点), kibana查询支持布尔运算符, 通配符等, 关键字要大些(如AND OR), 具体自行百度



【十】配置nginx代理


# 安装nginx需要的一些依赖包

yum -y install pcre-devel

yum -y install gd-devel


# 解压nginx-1.12.0.tar.gz 

cd /usr/local/

tar -xvf src/nginx-1.12.0.tar.gz


# 安装nginx

cd nginx-1.12.0

./configure --prefix=/usr/local/nginx-1.12.0/ --conf-path=/usr/local/nginx-1.12.0/nginx.conf

make

make install


# 配置 nginx.conf 文件, 我们这边只做负载均衡, 随便设设就好

vi /usr/local/nginx-1.12.0/nginx.conf


worker_processes  1;

error_log  logs/error.log  info;

#pid        logs/nginx.pid;


events {

    worker_connections  1024;

}


http {

    include       mime.types;

    default_type  application/octet-stream;


    log_format  main  ‘$remote_addr - $remote_user [$time_local] "$request" ‘

                      ‘$status $body_bytes_sent "$http_referer" ‘

                      ‘"$http_user_agent" "$http_x_forwarded_for"‘;


    access_log  logs/access.log  main;

    sendfile        on;

    keepalive_timeout  65;


    upstream kibana { 

        server  10.101.2.31:5601; 

        server  10.101.2.32:5601; 

    } 


    server {

        listen       15601;

        server_name  10.101.2.31;


        #charset koi8-r;


        #access_log  logs/host.access.log  main;


        location / {

            root   html;

            index  index.html index.htm;

            proxy_pass http://kibana;

        }


        error_page   500 502 503 504  /50x.html;

        location = /50x.html {

            root   html;

        }

    }

# 启动nginx

sbin/nginx


# 之后在浏览器上访问 http://nginx_ip:15601 即可

至此集群所有组件配置完成

以上是关于ELK5.3+Kafka集群配置的主要内容,如果未能解决你的问题,请参考以下文章

kafka集群配置

Kafka集群数据同步至另一个Kafka集群

Kafka单节点及集群配置安装

Kafka集群配置

Kafka 集群配置SASL+ACL

KafKa集群安装配置