ELK 中的elasticsearch 集群的部署

Posted 2020-09-20 BigBao的博客

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了ELK 中的elasticsearch 集群的部署相关的知识，希望对你有一定的参考价值。

本文内容

背景
ES集群中第一个master节点
ES slave节点

本文总结 Elasticsearch（以下简称ES）搭建集群的经验。以 Elasticsearch-rtf-2.2.1 版本为例。

我搭过三个集群：研究ELK时搭了一个；测试环境搭了一个；生产环境搭了一个。回想起来，搭建这三个集群时遇到的问题都不一样（我这么说，主要针对集群中节点发现，以及master问题，而不是es启动不起来或报错等问题）~

研究ELK时，搭建ES集群倒是很顺利，原因很简单，先从一台机器开始的；

可是测试环境搭建集群时，遭遇新加入节点一直不能发现 master 节点，或是集群节点出现都选举自己为 master 这两个情况，因为，节点都是陆续启动的，配置不当，是会出问题；

等到在生产环境搭建集群时，遭遇无法选举出 master 节点的情况。ES head 和 kopf 两个插件都不可用，因为，既然集群没有选举出 master 节点，显然，整个集群是用不了的。而前面的情况，head 和 kopf 插件还是能用的，但能用，意义也不大~

总结起来，搭建集群，应该注意两个问题。首先，当然是 Elasticsearch.yml 配置是否正确；再就是你的操作方式。比如节点启动步骤等。

因为，如果搭建一个集群，那么必须保证集群有一个 master 节点，一般来说，第一个启动的节点，一定是 master。然后，分别启动其他节点，这些节点就会找到 master 节点，而 master 节点，也会发现这些节点。

因此，配置集群中的第一个master节点，务必简单（简单到什么程度，后面再说），先启动它，它会立刻成为 master 节点。之后，再配置其他节点，最好直接告诉它们，可能的 master 节点是什么，然后启动他们，它们就会发现 master，而 master 节点，也会发现新加入的节点。

否则，如果第一个启动的节点，配置过于复杂（条件苛刻），造成它不能成为 master 节点，那么，整个集群会失败。

稍后，你再配置节点时，可以采用更高级、复杂点的配置，就不会有什么问题了~

所以，我才强调，ES 集群中第一个 master 节点的配置务必简单，以后再调整。

背景

假设，我们想搭建这样一个名为 myfirstcluster 的ES集群，它有两个节点：

节点	主机名	是否为 master
192.168.1.2	es-01	是
192.168.1.3	es-02	否

ES集群中第一个master节点

最简单的 ES master 节点配置如下。该配置文件，是一个完整的 ES 配置文件，所以很长。我顺便翻译成了中文。

1: # ======================== Elasticsearch Configuration =========================

   3: # 注意: Elasticsearch 大多数设置都有默认值.

   5: #

   7: #

   9: # <http://www.elastic.co/guide/en/elasticsearch/reference/current/setup-configuration.html>

  11: # ---------------------------------- 集群 -----------------------------------

  13: # 集群名称:

  15: cluster.name: mycluster

  17: # ------------------------------------ 节点 ------------------------------------

  19: # 节点名称:

  21: node.name: es-01

  23: node.data: true

  25: # 为节点添加自定义属性，如机架:

  27: # node.rack: r1

  29: # ----------------------------------- 路径 ------------------------------------

  31: # 存放数据的目录 (多个目录用逗号分隔):

  33: # path.data: /path/to/data

  35: # 日志文件目录:

  37: # path.logs: /path/to/logs

  39: # ----------------------------------- 内存 -----------------------------------

  41: # 启动时锁定内存:

  43: # bootstrap.mlockall: true

  45: # 确保设置了 `ES_HEAP_SIZE` 环境变量, 大小为系统内存的一半,

  47: #

  49: #

  51: #

  53: #

  55: #

  57: http.port: 9200

  59: tcp.port: 9300

  61: # 更多信息, 参见如下链接:

http://www.elastic.co/guide/en/elasticsearch/reference/current/modules-network.html>

  64: # --------------------------------- 节点发现 ----------------------------------

  66: # 当新节点加入时，传递一个主机的初始化列表以完成节点发现:

  68: #

  70: #

  72: #

  74: #

  76: # <http://www.elastic.co/guide/en/elasticsearch/reference/current/modules-discovery.html>

  78: # ---------------------------------- 网关 -----------------------------------

  80: # 当整个集群重新启动后, 只有 N 个节点启动了, 集群才会恢复，否则将阻塞:

  82: # gateway.recover_after_nodes: 2

  84: # 更多信息, 参见如下链接:

http://www.elastic.co/guide/en/elasticsearch/reference/current/modules-gateway.html>

  87: # ---------------------------------- 其他 -----------------------------------

  89: # 禁止在一个系统上启动多个节点:

  91: # node.max_local_storage_nodes: 1

  93: # 当删除 index 是必需显式名称:

  95: # action.destructive_requires_name: true

96:

  98:   analysis:

 100:       my_pinyin:

 102:         first_letter: prefix

 104:       pinyin_first_letter:

 106:         first_letter: only

 108:         type: mmseg

 110:       mmseg_complex:

 112:         seg_type: complex

 114:         type: mmseg

 116:       semicolon_spliter:

 118:         pattern: ";"

 120:         type: pattern

 122:       ngram_1_to_2:

 124:         min_gram: 1

 126:       ngram_1_to_3:

 128:         min_gram: 1

 130:     filter:

 132:         max_gram: 10

 134:         type: nGram

 136:         max_gram: 10

 138:         type: nGram

 140:         max_gram: 10

 142:         type: nGram

 144:         min: 2

 146:         type: length

 148:         min: 3

 150:         type: length

 152:         type: pinyin

 154:     analyzer:

 156:         type: custom

 158:         - lowercase

 160:       lowercase_keyword_ngram_min_size1:

 162:         filter:

 164:         - stop

 166:         - unique

 168:       lowercase_keyword_ngram_min_size2:

 170:         filter:

 172:         - min2_length

 174:         - trim

 176:         tokenizer: nGram

 178:         type: custom

 180:         - lowercase

 182:         - stop

 184:         - unique

 186:       lowercase_keyword_ngram:

 188:         filter:

 190:         - stop

 192:         - unique

 194:       lowercase_keyword_without_standard:

 196:         filter:

 198:         tokenizer: keyword

 200:         type: custom

 202:         - lowercase

 204:       ik:

 206:         - ik_analyzer

 208:       ik_max_word:

 210:         use_smart: true

 212:         type: ik

 214:       mmseg:

 216:         - mmseg_analyzer

 218:       mmseg_maxword:

 220:         filter:

 222:         tokenizer: mmseg_maxword

 224:         type: custom

 226:         - lowercase

 228:       mmseg_simple:

 230:         filter:

 232:         tokenizer: mmseg_simple

 234:         type: pattern

 236:       pct_spliter:

 238:         pattern: "[%]+"

 240:         type: snowball

 242:       simple_english_analyzer:

 244:         tokenizer: whitespace

 246:         - standard

 248:         - snowball

 250:         type: custom

 252:         filter:

 254:       pinyin_ngram_analyzer:

 256:         tokenizer: my_pinyin

 258:         - lowercase

 260:         - trim

 262:       pinyin_first_letter_analyzer:

 264:         tokenizer: pinyin_first_letter

 266:         - standard

 268:       pinyin_first_letter_keyword_analyzer:

 270:         - pinyin_first_letter_analyzer_keyword

 272:         tokenizer: keyword

 274:         - pinyin_first_letter

 276:       path_analyzer: #used for tokenize :/something/something/else

 278:         tokenizer: path_hierarchy

 279:

 281: index.analysis.analyzer.default.type: ik

 282:

 284: # rtf.filter.redis.port: 6379

说明：

第15行，指定集群名称 myfirstcluster；

第21行，指定节点名称，最好写主机名；

第22和23行，指定该是否可能为master节点，以及是否为数据节点。ES的所说master节点，其实弱化了很多，仅仅就是为了节点发现和选举master节点而已，它甚至都可以不用来保存数据。

因此，看你的规划，完全可以让一个 master 节点，不保存任何数据；

第54行，指定节点IP地址，192.168.1.2；

第57行，指定HTTP端口，比如，head、kopf插件等插件，都使用该端口。事实上，你可以指定从 92开头的任何端口；

第59行，指定集群内部通信的端口，比如，节点发现都使用该端口。事实上，你可以指定93开头的任何端口，该行也可以写成“transport.tcp.port: 9300”；

这7行配置，在我看来，针对集群中第一个master节点，必须配置正确的。其他配置，可以暂时不用。

其中，第57行和第59行，实际上，一台物理机，是可以运行多个 ES，只需要指定不同的配置文件即可。

第69行，指定节点初始化列表，因为该节点是集群第一台机器，并且要当 master，所以写”127.0.0.1:9300”，端口号，就是你在第59行指定的端口。相关资料显示，也可以不指定端口，那是不是会93开头的所有端口扫描一下呢？；

从97行开始，是配置ES的分词。

slave 节点

Slave 节点配置如下。该配置文件内容只列出了配置项，但是是完整的。

1: # ======================== Elasticsearch Configuration =========================

   3: # ---------------------------------- Cluster -----------------------------------

   5: # Use a descriptive name for your cluster:

   7: cluster.name: myfirstcluster

   9: # ------------------------------------ Node ------------------------------------

  11: # Use a descriptive name for the node:

  13: node.name: es-02

  15: node.data: true

  17: # ----------------------------------- Paths ------------------------------------

  19: # Path to directory where to store the data (separate multiple locations by comma):

  21: # path.data: /path/to/data

  23: # Path to log files:

  25: # path.logs: /path/to/logs

  27: # ----------------------------------- Memory -----------------------------------

  29: # ...

  31: # ---------------------------------- Network -----------------------------------

  33: # Set the bind address to a specific IP (IPv4 or IPv6):

  35: network.host: 192.168.1.3

  37: # Set a custom port for HTTP:

  39: http.port: 9200

  41: #

  43: #

  45: # The default list of hosts is ["127.0.0.1", "[::1]"]

  47: discovery.zen.ping.unicast.hosts: ["192.168.1.2:9300"]

  49: # ---------------------------------- Gateway -----------------------------------

  51: # ...

  53: # ---------------------------------- Various -----------------------------------

55:

  57:   analysis:

  59:       my_pinyin:

  61:         first_letter: prefix

  63:       pinyin_first_letter:

  65:         first_letter: only

  67:         type: mmseg

  69:       mmseg_complex:

  71:         seg_type: complex

  73:         type: mmseg

  75:       semicolon_spliter:

  77:         pattern: ";"

  79:         type: pattern

  81:       ngram_1_to_2:

  83:         min_gram: 1

  85:       ngram_1_to_3:

  87:         min_gram: 1

  89:     filter:

  91:         max_gram: 10

  93:         type: nGram

  95:         max_gram: 10

  97:         type: nGram

  99:         max_gram: 10

 101:         type: nGram

 103:         min: 2

 105:         type: length

 107:         min: 3

 109:         type: length

 111:         type: pinyin

 113:     analyzer:

 115:         type: custom

 117:         - lowercase

 119:       lowercase_keyword_ngram_min_size1:

 121:         filter:

 123:         - stop

 125:         - unique

 127:       lowercase_keyword_ngram_min_size2:

 129:         filter:

 131:         - min2_length

 133:         - trim

 135:         tokenizer: nGram

 137:         type: custom

 139:         - lowercase

 141:         - stop

 143:         - unique

 145:       lowercase_keyword_ngram:

 147:         filter:

 149:         - stop

 151:         - unique

 153:       lowercase_keyword_without_standard:

 155:         filter:

 157:         tokenizer: keyword

 159:         type: custom

 161:         - lowercase

 163:       ik:

 165:         - ik_analyzer

 167:       ik_max_word:

 169:         use_smart: false

 171:         type: ik

 173:       mmseg:

 175:         - mmseg_analyzer

 177:       mmseg_maxword:

 179:         filter:

 181:         tokenizer: mmseg_maxword

 183:         type: custom

 185:         - lowercase

 187:       mmseg_simple:

 189:         filter:

 191:         tokenizer: mmseg_simple

 193:         type: pattern

 195:       pct_spliter:

 197:         pattern: "[%]+"

 199:         type: snowball

 201:       simple_english_analyzer:

 203:         tokenizer: whitespace

 205:         - standard

 207:         - snowball

 209:         type: custom

 211:         filter:

 213:       pinyin_ngram_analyzer:

 215:         tokenizer: my_pinyin

 217:         - lowercase

 219:         - trim

 221:       pinyin_first_letter_analyzer:

 223:         tokenizer: pinyin_first_letter

 225:         - standard

 227:       pinyin_first_letter_keyword_analyzer:

 229:         - pinyin_first_letter_analyzer_keyword

 231:         tokenizer: keyword

 233:         - pinyin_first_letter

 235:       path_analyzer: #used for tokenize :/something/something/else

 237:         tokenizer: path_hierarchy

 238:

 240: index.analysis.analyzer.default.type: ik

说明：

第7行，也是指定了集群名称；

第13行，指定了节点名称为 es-02（主机名）

第14和15行，指定了该节点可能成为 master 节点，还可以是数据节点；

第35行，指定节点IP地址为 192.168.1.3；

第39行，指定http端口，你使用head、kopf等相关插件使用的端口；

第40行，集群内部通信端口，用于节点发现等；

上面的配置master也是这么配置的。

第47行，跟master节点配置不一样了。这里直接告诉该的节点，可能的master节点是什么。

文章摘自：http://www.cnblogs.com/liuning8023/p/5454696.html

以上是关于ELK 中的elasticsearch 集群的部署的主要内容，如果未能解决你的问题，请参考以下文章

Elasticsearch（ELK）集群环境部署

日志分析系统ELK之Elasticsearch

ELK开发部署：安装Elasticsearch组建单服务器多节点集群

ELK集群部署

在 K8S 上部署 ELK 7.14 集群实现采集容器日志