ELK企业级日志分析平台

Posted 2023-03-28 Gong_yz

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了ELK企业级日志分析平台相关的知识，希望对你有一定的参考价值。

文章目录

一、kibana数据可视化
二、ES集群监控

一、kibana数据可视化

ELK中，E最核心，其余均可替代

1.部署

新建虚拟机server5，部署kibana
[root@server5 ~]# rpm -ivh kibana-7.6.1-x86_64.rpm

[root@server5 ~]# cd /etc/kibana/
[root@server5 kibana]# vim kibana.yml

server.host: "0.0.0.0"                    ##所有端口

elasticsearch.hosts: ["http://192.168.56.11:9200"]    ##elasticsearch主机

i18n.locale: "zh-CN"                       ##字体：中文

[root@server5 kibana]# systemctl  enable --now kibana

[root@server5 kibana]# netstat -antlp |grep :5601
tcp        0      0 192.168.56.15:5601     0.0.0.0:*               LISTEN      25385/node

访问web页面: http://192.168.56.15:5601

2.定制数据可视化

L监听文件的变更，格式化后，写入到ES中，最后通过kibana做数据可视化

kibana可以直接连接ES

（1）网站访问量

保存视图

（2）访问量排行榜

x轴填主机ip进行筛选

保存视图

（3）创建dashboard，大屏展示

把上面创建的两个可视化添加到仪表板中

二、ES集群监控

1.启用xpack认证

官网：https://www.elastic.co/guide/en/elasticsearch/reference/7.6/configuring-tls.html#node-certificates

在server1上生成证书
[root@server1 ~]# cd /usr/share/elasticsearch/
[root@server1 elasticsearch]# bin/elasticsearch-certutil ca      ##生成ca.p12
[root@server1 elasticsearch]# bin/elasticsearch-certutil cert --ca elastic-stack-ca.p12
[root@server1 elasticsearch]# cp elastic-certificates.p12 /etc/elasticsearch   ##
[root@server1 elasticsearch]# cd /etc/elasticsearch/
[root@server1 elasticsearch]# chown elasticsearch elastic-certificates.p12     ##该权限

[root@server1 elasticsearch]# vim elasticsearch.yml      ##加到最后即可；及的内容为官方文档得来
...
http.cors.allow-headers: Authorization,X-Requested-With,Content-Length,Content-Type    ##认证；交到Node处

xpack.security.enabled: true
xpack.security.transport.ssl.enabled: true
xpack.security.transport.ssl.verification_mode: certificate
xpack.security.transport.ssl.keystore.path: /etc/elasticsearch/elastic-certificates.p12
xpack.security.transport.ssl.truststore.path: /etc/elasticsearch/elastic-certificates.p12

[root@server1 elasticsearch]# systemctl  restart elasticsearch.service

拷贝证书到其它集群节点
[root@server1 elasticsearch]# scp elastic-certificates.p12 server2:/etc/elasticsearch/
[root@server1 elasticsearch]# scp elastic-certificates.p12 server3:/etc/elasticsearch/

server2配置
[root@server2 ~]# chown elasticsearch /etc/elasticsearch/elastic-certificates.p12
[root@server2 ~]# vim /etc/elasticsearch/elasticsearch.yml
...
xpack.security.enabled: true
xpack.security.transport.ssl.enabled: true
xpack.security.transport.ssl.verification_mode: certificate
xpack.security.transport.ssl.keystore.path: /etc/elasticsearch/elastic-certificates.p12
xpack.security.transport.ssl.truststore.path: /etc/elasticsearch/elastic-certificates.p12

[root@server2 ~]# systemctl  restart elasticsearch.service

server3配置
[root@server3 ~]# chown elasticsearch /etc/elasticsearch/elastic-certificates.p12
[root@server3 ~]# vim /etc/elasticsearch/elasticsearch.yml
...
xpack.security.enabled: true
xpack.security.transport.ssl.enabled: true
xpack.security.transport.ssl.verification_mode: certificate
xpack.security.transport.ssl.keystore.path: /etc/elasticsearch/elastic-certificates.p12
xpack.security.transport.ssl.truststore.path: /etc/elasticsearch/elastic-certificates.p12

[root@server3 ~]# systemctl  restart elasticsearch.service

等待所有集群节点重启成功后，设置认证账户密码
[root@server1 elasticsearch]# cd /usr/share/elasticsearch/
[root@server1 elasticsearch]# bin/elasticsearch-setup-passwords interactive
交互式输入密码
ES启用xpack之后，其它服务都需要配置认证

head插件在访问时，需要在url中输入用户和密码
[root@k8s1 ~]# cd elasticsearch-head-master/
[root@k8s1 elasticsearch-head-master]# npm run start &

访问web1：http://192.168.56.171:9100/?auth_user=elastic&auth_password=westos

cerebro访问：
[root@k8s1 ~]# docker start cerebro ##启动容器

==访问web2：http://192.168.56.171:9000/ ==
并连接ES集群，弹出认证

logstash访问
[root@server4 ~]# vim /etc/logstash/conf.d/grok.conf
input 
        file 
                path => "/var/log/httpd/access_log"
                start_position => "beginning"
        


filter 
        grok 
                match =>  "message" => "%HTTPD_COMBINEDLOG" 
        


output 
        stdout 

        elasticsearch 
                hosts => "192.168.56.11:9200"
                index => "apachelog-%+YYYY.MM.dd"
                user => "elastic"                       ####用户
                password => "westos"                      ###密码

查看是否启动成功：若失败会直接退出
[root@server4 conf.d]# /usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/grok.conf

kibana访问
[root@server5 kibana]# vim kibana.yml
...
elasticsearch.username: "kibana"         ##用户认证选项，打开并修改密码
elasticsearch.password: "westos"

[root@server5 kibana]# systemctl  restart kibana.service
[root@server5 kibana]# netstat -antlp|grep :5601
tcp        1      0 0.0.0.0:5601            0.0.0.0:*               LISTEN      35945/node

访问web3：http://192.168.56.15:5601

2.metricbeat监控

官网：https://www.elastic.co/guide/en/elasticsearch/reference/7.6/configuring-metricbeat.html

首先使用内部检测，然后进入设置模式

选择启动metricbeat的节点，然后根据提示步骤操作

安装软件
[root@server1 ~]# rpm -ivh metricbeat-7.6.1-x86_64.rpm
[root@server1 ~]# cd /etc/metricbeat/modules.d
[root@server1 modules.d]# metricbeat modules enable elasticsearch-xpack
[root@server1 modules.d]# vim elasticsearch-xpack.yml
- module: elasticsearch
  metricsets:
    - ccr
    - cluster_stats
    - enrich
    - index
    - index_recovery
    - index_summary
    - ml_job
    - node_stats
    - shard
  period: 10s
  hosts: ["http://localhost:9200"]
  username: "remote_monitoring_user"
  password: "westos"
  xpack.enabled: true

[root@server1 modules.d]# cd ..
[root@server1 metricbeat]# vim metricbeat.yml
...
output.elasticsearch:
  hosts: ["http://192.168.56.11:9200"]
  username: "elastic"
  password: "westos"

[root@server1 metricbeat]# systemctl enable --now metricbeat.service

其它节点依次类推接口即可，最终效果如下：
完成下图配置后，最后退出设置模式

3.filebeat日志采集

文档：https://www.elastic.co/guide/en/beats/filebeat/7.6/filebeat-module-elasticsearch.html

[root@server1 ~]# rpm -ivh filebeat-7.6.1-x86_64.rpm
[root@server1 ~]# cd /etc/filebeat/modules.d
[root@server1 modules.d]# filebeat modules enable elasticsearch

[root@server1 modules.d]# vim elasticsearch.yml
- module: elasticsearch
  # Server log
  server:
    enabled: true

    # Set custom paths for the log files. If left empty,
    # Filebeat will choose the paths depending on your OS.
    var.paths:
      - /var/log/elasticsearch/*.log          # Plain text logs
      - /var/log/elasticsearch/*_server.json  # JSON logs

  gc:
    enabled: true
    # Set custom paths for the log files. If left empty,
    # Filebeat will choose the paths depending on your OS.
    var.paths:
      - /var/log/elasticsearch/gc.log.[0-9]*
      - /var/log/elasticsearch/gc.log

  audit:
    enabled: true
    # Set custom paths for the log files. If left empty,
    # Filebeat will choose the paths depending on your OS.
    var.paths:
      - /var/log/elasticsearch/*_access.log  # Plain text logs
      - /var/log/elasticsearch/*_audit.json  # JSON logs

  slowlog:
    enabled: true
    # Set custom paths for the log files. If left empty,
    # Filebeat will choose the paths depending on your OS.
    var.paths:
      - /var/log/elasticsearch/*_index_search_slowlog.log     # Plain text logs
      - /var/log/elasticsearch/*_index_indexing_slowlog.log   # Plain text logs
      - /var/log/elasticsearch/*_index_search_slowlog.json    # JSON logs
      - /var/log/elasticsearch/*_index_indexing_slowlog.json  # JSON logs

  deprecation:
    enabled: true
    # Set custom paths for the log files. If left empty,
    # Filebeat will choose the paths depending on your OS.
    var.paths:
      - /var/log/elasticsearch/*_deprecation.log   # Plain text logs
      - /var/log/elasticsearch/*_deprecation.json  # JSON logs

[root@server1 modules.d]# cd ..
[root@server1 filebeat]# vim filebeat.yml
...
output.elasticsearch:
  hosts: ["http://192.168.56.11:9200"]
  username: "elastic"
  password: "westos"

[root@server1 filebeat]# systemctl  enable --now filebeat.service

注意：若偶遇节点在配置后，web页面不显示，可以尝试重启elasticsearch节点服务

其它节点依次类推即可

企业运维之 ELK日志分析平台（Elasticsearch）

ELK日志分析平台--Elasticsearch的介绍与安装

1. ELK介绍

ELK 指的是⼀套完整的⽇志集中处理解决⽅案，将Elasticsearch + Logstash + Kibana 三个开源⼯具配合使⽤，以满足用户对⽇志的查询、排序、统计需求。
当没有ELK 时可以使用shell中的三剑客awk、sed、grep来对日志进行简单的处理。
ELK常见架构：

Elasticsearch + Logstash + Kibana
这是一种最简单的架构。通过 logstash 来收集日志，通过Elasticsearch 对日志进行分析，将所得结果展示用 Kibana(web界面)展示。这种架构也是官网介绍的方式，但是在实际生产中很少使用。
Elasticsearch + Logstash + filebeat + Kibana
相比第一种架构，此架构增加了一个 filebeat 模块。filebeat 是一个轻量的日志收集代理，部署在客户端。优点是相较于logstash消耗更少的资源，但缺点是当 logstash 出现故障时，日志会出现丢失。
Elasticsearch + Logstash + filebeat + redis(中间件(kafka集群化)) + Kibana
这种架构是对于第二种架构的完善，通过增加中间件，来避免数据的丢失。当 Logstash 出现故障，日志还存留在中间件中，当Logstash 再次启动，则会读取中间件中积压的日志。

ELK 的⼯作原理：

（1）在所有需要收集⽇志的服务器上部署Logstash；或者先将⽇志进⾏集中化管理在⽇志服务器上，在⽇志服务器上部署 Logstash。
（2）Logstash收集⽇志，将⽇志格式化并输出到 Elasticsearch 群集中。
（3）Elasticsearch 对格式化后的数据进⾏索引和存储。
（4）Kibana 从 ES群集中查询数据⽣成图表，并进⾏前端数据的展⽰

2. Elasticsearch简介

Elasticsearch 是一个开源的分布式搜索分析引擎，建立在一个全文搜索引擎库 Apache Lucene基础之上。
Elasticsearch 不仅仅是 Lucene，并且也不仅仅只是一个全文搜索引擎：

一个分布式的实时文档存储，每个字段可以被索引与搜索;
一个分布式实时分析搜索引擎;
能胜任上百个服务节点的扩展，并支持 PB 级别的结构化或者非结构化数据 .

基础模块

cluster：管理集群状态，维护集群层面的配置信息。
alloction：封装了分片分配相关的功能和策略。
discovery：发现集群中的节点，以及选举主节点。
gateway：对收到master广播下来的集群状态数据的持久化存储。
indices：管理全局级的索引设置。
http：允许通过JSON over HTTP的方式访问ES的API。
transport：用于集群内节点之间的内部通信。
engine：封装了对Lucene的操作及translog的调用。

elasticsearch应用场景：
信息检索、日志分析、业务数据分析、数据库加速、运维指标监控

官网：https://www.elastic.co/cn/
软件下载：https://elasticsearch.cn/download/

3. Elasticsearch 的部署

三台主机，每一台需要配置 2G 的内存。
在官网下载所需的软件包，此处用的是7.6.1版本的rpm包，不需要额外的jdk包支持，因为该版本集成了jdk。

官方文档：https://www.elastic.co/guide/en/elasticsearch/reference/7.6/index.html

elasticsearch-7.6.1-x86_64.rpm
#安装
[root@server1 ~]# rpm -ivh elasticsearch-7.6.1-x86_64.rpm 
#设置开机自启	
[root@server1 ~]# systemctl daemon-reload
[root@server1 ~]# systemctl enable --now elasticsearch
[root@server1 ~]# cd /etc/elasticsearch/	#数据文件
[root@server1 elasticsearch]# ls
elasticsearch.keystore  jvm.options        role_mapping.yml  users
elasticsearch.yml       log4j2.properties  roles.yml         users_roles
[root@server1 elasticsearch]# ll elasticsearch.yml 	#主配置文件
-rw-rw---- 1 root elasticsearch 2847 Feb 29  2020 elasticsearch.yml
#开启了9200端口,但是只支持本机，外部没有开启监听端口
[root@server1 elasticsearch]# netstat -antlp	
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      3203/sshd           
tcp        0      0 127.0.0.1:25            0.0.0.0:*               LISTEN      3375/master         
tcp        0      0 172.25.25.21:22         172.25.25.250:48426     ESTABLISHED 3896/sshd: root@pts 
tcp6       0      0 127.0.0.1:9200          :::*                    LISTEN      14203/java          
tcp6       0      0 ::1:9200                :::*                    LISTEN      14203/java          
tcp6       0      0 127.0.0.1:9300          :::*                    LISTEN      14203/java          
tcp6       0      0 ::1:9300                :::*                    LISTEN      14203/java          
tcp6       0      0 :::22                   :::*                    LISTEN      3203/sshd           
tcp6       0      0 ::1:25                  :::*                    LISTEN      3375/master

修改主配置文件，让其对外进行监控。此时只能本机访问，curl localhost:9200；需要编辑配置文件然后让其对外开放。

3. 1 单机模式

配置单机模式，编辑主配置文件，设定端口。

[root@server1 elasticsearch]# pwd
/etc/elasticsearch
[root@server1 elasticsearch]# vim elasticsearch.yml 
 55 network.host: 0.0.0.0	
 #监听本机所有端口
 68 discovery.seed_hosts: ["server1"]	
 #必须修改此处否则启动不了，日志在/var/log/elasticsearch中
[root@server1 elasticsearch]# systemctl restart elasticsearch
#重启之后此时便可以访问。 在网页中访问：172.25.25.21:9200
[root@server1 elasticsearch]# netstat -antlp
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      3203/sshd           
tcp        0      0 127.0.0.1:25            0.0.0.0:*               LISTEN      3375/master         
tcp        0      0 172.25.25.21:22         172.25.25.250:48426     ESTABLISHED 3896/sshd: root@pts 
tcp6       0      0 :::9200                 :::*                    LISTEN      14385/java          
tcp6       0      0 :::9300                 :::*                    LISTEN      14385/java          
tcp6       0      0 :::22                   :::*                    LISTEN      3203/sshd           
tcp6       0      0 ::1:25                  :::*                    LISTEN      3375/master

当更改为监听所有端口之后，此时再网页访问时便可顺利访问，还可以看到其中的相应的版本信息。

3. 2 Elasticsearch 集群

集群是一个或多个节点（服务器）的集合，它们共同保存整个数据并提供跨所有节点的联合索引和搜索功能。集群由唯一名称标识，默认情况下为“elasticsearch”，此处修改为“my-es”。

节点是单个服务器，它是集群的一部分，存储数据，并参与集群的索引和搜索功能。就像集群一样，节点由名称标识，默认情况下，该名称是在启动时分配给节点的随机通用唯一标识符 (UUID)。如果不想要默认值，可以定义任何想要的节点名称。此名称对于集群管理比较重要，希望识别网络中的哪些服务器对应于 Elasticsearch 集群中的哪些节点。

可以将节点配置为通过集群名称加入特定集群。默认情况下，每个节点都被设置为加入一个名为elasticsearch的集群，这意味着如果同时启动多个节点，它们都将自动形成并加入一个名为elasticsearch的集群。

Master：主要负责集群中索引的创建、删除以及数据的Rebalance等操作。Master不负责数据的索引和检索，所以负载较轻。当Master节点失联或者挂掉的时候，ES集群会自动从其他Master节点选举出一个Leader。
Data Node：主要负责集群中数据的索引和检索，一般压力比较大。
Coordinating Node：原来的Client node的，主要功能是来分发请求和合并结果的。所有节点默认就是Coordinating node，且不能关闭该属性。
Ingest Node：专门对索引的文档做预处理。
Machine learning node:机器学习节点提供了机器学习功能，该节点运行作业并处理机器学习 API 请求.

集群部署
此处用到3台主机，三台主机名分别为server1、server2、server3；将之前的单机模式进行更改为集群中的一个。

[root@server1 elasticsearch]# vim elasticsearch.yml
 17 cluster.name: my-es					#集群名称
 23 node.name: server1					#主机名需要解析
 33 path.data: /var/lib/elasticsearch	#数据目录
 37 path.logs: /var/log/elasticsearch	#日志目录
 43 bootstrap.memory_lock: true			#锁定内存分配
 55 network.host: 0.0.0.0				#设定访问权限
 59 http.port: 9200						#http服务端口
 68 discovery.seed_hosts: ["server1","server2","server3"]	
 #指定集群中的主节点
 72 cluster.initial_master_nodes: ["server1", "server2","server3"]	
 #指定集群引导时的初始主节点

直接运行内存较大，如果内存不太够，可以将内存锁定打开。如果在配置文件中已经将内存锁定打开，此处需要修改系统的资源限制文件和修改systemd启动文件。

[root@server1 ~]# vim /etc/security/limits.conf 
elasticsearch soft memlock unlimited
elasticsearch hard memlock unlimited
elasticsearch    -      nofile  65535
elasticsearch    -      nproc 4096
[root@server1 ~]# vim /usr/lib/systemd/system/elasticsearch.service
[Service]		#在service语句块下添加
 41 LimitMEMLOCK=infinity

进入配置目录，修改Xmx和Xms;
-Xmx用来设置应用程序(不是JVM)能够使用的最大内存数，如果程序要花很大内存，就需要修改缺省的设置，但是不要超过的机器的内存。
-Xms用来设置程序初始化的时内存栈的大小，增加这个值会提高程序的启动性能。同样不能超过机器内存并且受-Xmx的限制。
Xmx设置不超过物理RAM的50％，以确保有足够的物理RAM留给内核文件系统缓存。但不要超过32G。

[root@server1 elasticsearch]# pwd
/etc/elasticsearch
[root@server1 elasticsearch]# vim jvm.options 
-Xmx1g
-Xms1g

如果电脑性能可以，便可以将swap分区关闭。

[root@server1 ~]# swapoff -a			#禁用swap分区
[root@server1 ~]# vim /etc/fstab 
#/dev/mapper/rhel-swap   swap                    swap    defaults        0 0
[root@server1 ~]# systemctl daemon-reload	#重新加载然后重启服务
[root@server1 elasticsearch]# systemctl restart elasticsearch.service

设置好第一个节点之后，将所要构成集群的主机之间进行免密设置，以确保三个集群节点间互相复制东西。
server2节点：
安装软件，修改三个文件内容，关闭swap分区。开启节点即可。

[root@server2 ~]# rpm -ivh elasticsearch-7.6.1-x86_64.rpm
[root@server2 ~]# vim /etc/security/limits.conf 
[root@server2 ~]# vim /usr/lib/systemd/system/elasticsearch.service 
[root@server2 ~]# vim /etc/elasticsearch/elasticsearch.yml 
[root@server1 ~]# swapoff -a
[root@server1 ~]# vim /etc/fstab 
#/dev/mapper/rhel-swap   swap                    swap    defaults        0 0
[root@server2 ~]# systemctl daemon-reload
[root@server2 ~]# systemctl start elasticsearch.service

server3节点：
安装软件，修改三个文件；内存至少为2G，才可以起来，不然不能作内存锁定；关闭swap分区。开启节点即可。

以上集群便搭建完成。

搭建集群时可能遇到的问题：集群无法加入，原因是 cluster uuid 不同所致
解决方案：重新给定集群名字，删除数据目录
rm -fr /var/lib/elasticsearch/*
重启服务

3. 3 cerebro图形化

在创建好集群之后，还需要一个图形化的方式来显示集群信息，以方便操作。

此处采用 docker 的方式来做，再开一台 server4 主机来做构建 docker 环境。docker仓库的搭建详见 docker 的安装与配置.

cerebro官方：https://github.com/lmenezes/cerebro/

[root@server4 docker]# docker pull lmenezes/cerebro
Using default tag: latest
[root@server4 docker]# docker run -d --name cerebro -p 9000:9000 lmenezes/cerebro
[root@server4 docker]# docker ps
CONTAINER ID        IMAGE               COMMAND                  CREATED             STATUS              PORTS                    NAMES
077a77740261        lmenezes/cerebro    "/opt/cerebro/bin/ce…"   15 seconds ago      Up 14 seconds       0.0.0.0:9000->9000/tcp   cerebro
[root@server4 docker]# netstat -antlp
Active Internet connections (servers and established)
Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    
tcp        0      0 0.0.0.0:22              0.0.0.0:*               LISTEN      3257/sshd           
tcp        0      0 127.0.0.1:25            0.0.0.0:*               LISTEN      3357/master         
tcp        0      0 172.25.25.24:22         172.25.25.250:43076     ESTABLISHED 3949/sshd: root@pts 
tcp6       0      0 :::9000                 :::*                    LISTEN      5784/docker-proxy   
tcp6       0      0 :::22                   :::*                    LISTEN      3257/sshd           
tcp6       0      0 ::1:25

将其运行起来之后，便可进行网页访问测试：http://172.25.25.24:9000

可以看到此时server1是master，此时便可在此来查看节点的一些信息。

3. 4 Elasticsearch-head 图形化

用elasticsearch-head插件来图形化展示.

head 插件本质上是一个nodejs的工程，因此需要安装node.

[root@server4 ~]# ls
elasticsearch-head-master  master.zip  nodejs-9.11.2-1nodesource.x86_64.rpm
[root@server4 ~]# yum install -y unzip bzip2	
#此处的bzip2是为了在后续执行cnmp时自动解压的工具
[root@server4 ~]# rpm -ivh nodejs-9.11.2-1nodesource.x86_64.rpm 
[root@server4 ~]# npm install -g cnpm --registry=https://registry.npm.taobao.org
#解压后进入，更换npm源
[root@server4 ~]# cnpm -v	#查看版本
[root@server4 ~]# unzip master.zip 
[root@server4 elasticsearch-head-master]# pwd
/root/elasticsearch-head-master
[root@server4 elasticsearch-head-master]# cnpm install

在安装完node之后，调用程序没有问题之后再来修改配置文件；

[root@server4 _site]# pwd
/root/elasticsearch-head-master/_site
[root@server4 _site]# vim app.js 编辑配置文件，
#修改ES主机ip和端口
4374                         this.base_uri = this.config.base_uri || this.prefs.get("app-base_uri") || "http://172.25.25.21:9200";

[root@server4 elasticsearch-head-master]# cnpm run start &	
#打入后台运行，此时虽然可以访问，但是不能正常连接。
[1] 7466
[root@server4 elasticsearch-head-master]# 
> elasticsearch-head@0.0.0 start /root/elasticsearch-head-master
> grunt server

(node:7492) ExperimentalWarning: The http2 module is an experimental API.
Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

此时再连接9100时提示连接不到，是因为主节点配置文件中没有开启跨域；此时编辑需要连接的配置文件：

[root@server1 elasticsearch]# pwd
/etc/elasticsearch
[root@server1 elasticsearch]# vim elasticsearch.yml 
 59 http.port: 9200
 60 http.cors.enabled: true            	# 允许跨域
 61 http.cors.allow-origin: "*"			# *表示支持所有域名
[root@server1 elasticsearch]# systemctl restart elasticsearch

此时发现已经发生了变化。

3. 5 索引、分片和副本

索引：

索引是具有某些相似特征的文档的集合。索引由名称（必须全部小写）标识，在对其中的文档执行索引、搜索、更新和删除操作时，该名称用于引用索引。

分片：

索引可能会存储大量数据，这些数据可能会超出单个节点的硬件限制。例如，占用 1TB 磁盘空间的 10 亿个文档的单个索引可能不适合单个节点的磁盘，或者可能太慢而无法单独处理来自单个节点的搜索请求。

Elasticsearch 提供了将索引细分为多个称为分片的功能。
创建索引时，可以简单地定义所需的分片数量。
每个分片本身就是一个功能齐全且独立的“索引”，可以托管在集群中的任何节点上。

分片很重要，主要有两个原因：
1、它允许水平拆分/缩放内容量
2、它允许跨分片（可能在多个节点上）分布和并行化操作，从而提高性能/吞吐量
分片的分布机制以及它的文档如何聚合回搜索请求完全由 Elasticsearch 管理，并且对用户是透明的。

副本：

Elasticsearch 允许将索引分片的一个或多个副本制作成所谓的副本分片，或简称为副本。
复制之所以重要，主要有两个原因：
1、它在分片/节点发生故障时提供高可用性。出于这个原因，重要的是要注意副本分片永远不会与复制它的原始/主分片在同一节点上分配。
2、它允许扩展搜索量/吞吐量，因为搜索可以在所有副本上并行执行。

每个索引都可以拆分为多个分片。索引也可以没有副本，或有多个副本。复制后，每个索引将具有主分片和副本分片。可以在创建索引时为每个索引定义分片和副本的数量。创建索引后，可以随时动态更改副本数，但事后无法更改分片数。

创建索引:

查看索引
查看主分区

查看辅助分区

3. 6 Elasticsearch节点优化

在生产环境下，如果不修改 elasticsearch 节点的角色信息，在高数据量，高并发的场景下集群容易出现脑裂等问题。
默认情况下，elasticsearch 集群中每个节点都有成为主节点的资格，也都存储数据，还可以提供查询服务。

节点角色是由以下属性控制：（以下是默认值）
node.master: true
node.voting_only: false
node.data: true
node.ingest: true
node.ml: true
xpack.ml.enabled: true
search.remote.connect: true

node.master：这个属性表示节点是否具有成为主节点的资格
注意：此属性的值为true，并不意味着这个节点就是主节点。因为真正的主节点，是由多个具有主节点资格的节点进行选举产生的。
node.data：这个属性表示节点是否存储数据。
node.ingest: 是否对文档进行预处理。
search.remote.connect：是否禁用跨集群查询

第一种组合：（默认）
node.master: true
node.data: true
node.ingest: true
search.remote.connect: true
这种组合表示这个节点即有成为主节点的资格，又存储数据。
如果某个节点被选举成为了真正的主节点，那么他还要存储数据，这样对于这个节点的压力就比较大了。
测试环境下这样做没问题，但实际工作中不建议这样设置。

第二种组合：（Data node）
node.master: false
node.data: true
node.ingest: false
search.remote.connect: false
这种组合表示这个节点没有成为主节点的资格，也就不参与选举，只会存储数据。
这个节点称为data(数据)节点。在集群中需要单独设置几个这样的节点负责存储数据。后期提供存储和查询服务。

第三种组合：（master node）
node.master: true
node.data: false
node.ingest: false
search.remote.connect: false
这种组合表示这个节点不会存储数据，有成为主节点的资格，可以参与选举，有可能成为真正的主节点。
这个节点我们称为master节点。

第四种组合：（Coordinating Node）
node.master: false
node.data: false
node.ingest: false
search.remote.connect: false
这种组合表示这个节点即不会成为主节点，也不会存储数据，
这个节点的意义是作为一个协调节点，主要是针对海量请求的时候可以进行负载均衡。

第五种组合：（Ingest Node）
node.master: false
node.data: false
node.ingest: true
search.remote.connect: false
这种组合表示这个节点即不会成为主节点，也不会存储数据，
这个节点的意义是 ingest 节点，对索引的文档做预处理。

生产集群中可以对这些节点的职责进行划分；建议集群中设置3台以上的节点作为master节点，这些节点只负责成为主节点，维护整个集群的状态。
在根据数据量设置一批data节点，这些节点只负责存储数据，后期提供建立索引和查询索引的服务，这样的话如果用户请求比较频繁，这些节点的压力也会比较大。
所以在集群中建议再设置一批协调节点，这些节点只负责处理用户请求，实现请求转发，负载均衡等功能。

节点需求
master节点：普通服务器即可(CPU、内存消耗一般)
data节点：主要消耗磁盘、内存。
path.data: data1,data2,data3 这样的配置可能会导致数据写入不均匀，建议只指定一个数据路径，磁盘可以使用raid0阵列，而不需要成本高的ssd。
Coordinating节点：对cpu、memory要求较高。

让 server1 为 master，只作为 master不存数据:

[root@server1 elasticsearch]# pwd
/etc/elasticsearch
[root@server1 elasticsearch]# vim elasticsearch.yml 

 23 node.name: server1
 24 node.master: true	#master
 25 node.data: false	#不存数据
 26 node.ml: false		#机器学习
 27 node.ingest: true	#预处理
之前加过参数此时需要清理后才能重启成功；
[root@server1 bin]# pwd
/usr/share/elasticsearch/bin
[root@server1 bin]#  ./elasticsearch-node repurpose
------------------------------------------------------------------------

    WARNING: Elasticsearch MUST be stopped before running this tool.

14:35:55.913 [main] WARN  org.elasticsearch.cluster.metadata.MetaData - Adding unknown custom object with type index_lifecycle
14:35:55.920 [main] WARN  org.elasticsearch.cluster.metadata.MetaData - Adding unknown custom object with type licenses
Found 1 shards in 1 indices to clean up
Use -v to see list of paths and indices affected
Node is being re-purposed as master and no-data. Clean-up of shard data will be performed.
Do you want to proceed?
Confirm [y/N] y
Node successfully repurposed to master and no-data.
[root@server1 elasticsearch]# systemctl restart elasticsearch

server2配置：
 22 #
 23 node.name: server2
 24 node.master: true
 25 node.data: true
 26 node.ml: false
 27 node.ingest: false
[root@server2 elasticsearch]# systemctl restart elasticsearch.service

server3配置：
 22 #
 23 node.name: server3
 24 node.master: true
 25 node.data: true
 26 node.ml: false
 27 node.ingest: false
 28 
[root@server3 elasticsearch]# systemctl restart elasticsearch.service

此时访问时便可看到相应的设置。

节点扩容

安装对应的软件包，修改配置文件内容，启动服务之后便可自动加入集群。

删除节点
在删除某一节点前需要先将该节点的分片进行迁移，用以下方法集群会自动把指定节点上的分片迁移到其他数据节点

# curl -X PUT "localhost:9200/_cluster/settings" -H 'Content-Type: application/json' -d'

  "transient" : 
    "cluster.routing.allocation.exclude._ip" : "172.25.0.13"
  
'

《新程序员》：云原生和全面数字化实践

50位技术专家共同创作，文字、视频、音频交互阅读

以上是关于ELK企业级日志分析平台的主要内容，如果未能解决你的问题，请参考以下文章