ElasticSearch实战-ElasticSearch集群环境搭建
Posted 张志翔ۤ
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearch实战-ElasticSearch集群环境搭建相关的知识,希望对你有一定的参考价值。
ElasticSearch,这个熟悉又陌生的名词是从三年前开始听到的,刚接触的时候是用ElasticSearch 与 Logstash、Kibana 做了一个服务器日志收集和可视化界面,对于其他用途并不是非常了解,直到再有一次面试一家做支付行业的公司的时候,据说他们公司日订单量达到了千万级别,他们的订单就是存储在ElasticSearch集群中的,这一次面试让我重新认识到了ElasticSearch的用途远远不只是作为一个服务器日志存储工具的,从那一次开始,我就渴望能够对ElasticSearch能够有更多的深入了解。
随着知识的日益丰富,我对ElasticSearch也达到了一个新的高度,我想通过写这个专栏文章,把我对 ElasticSearch 的所有知识都存放到这里,也希望通过这个专栏文章,能够帮助到更多需要入门或者深入使用ElasticSearch的人。ElasticSearch 的用处很多,在监控领域(服务器监控,设备监控,APM监控,中间件监控等)具有非常全面的功能,几乎涵盖了多有监控细分领域的存储地位,比如平时我们需要使用Prometheus和ClickHouse来作为Metric指标监控数据收集和存储工具,其实ElasticSearch是可以取代ClickHouse的,因为他们底层算法类似,都是基于倒排索引进行的日志检索。在大数据领域,ElasticSearch表现的异常优秀,例如在日数据量在20TB,周数据量在140TB的某车联网企业(某越速运),他们存储如此大数据量的方式就是选择的 HBase 与 ElasticSearch 的组合方式,ElasticSearch 通常是和三方存储系统一起配合使用可以达到最大威力,因为他的定位并不是取代其他存储系统的地位,而是配合他们发挥更大的查询与聚合优势。
目前最好的大数据存储与查询组合方式是 Cassandra 与 ElasticSearch,Cassandra也是被视为比 HBase 性能优秀的数据存储系统,目前它的查询速度在排行榜第一位。ElasticSearch的语法异常丰富,它的理念是基于自由模式(Free Schema)的用户角度出发,让用户能够在使用ElasticSearch过程中可以得心应手应对各种大数据场景,相比较于 Flink 的反人性语法,它目前才是大数据查询和聚合场景的终极解决方案。
本专栏将带领大家对 ElasticSearch 从底层原理到应用的全方位深入实战,目的是解决大家在实际工作场景中遇到的各种疑难杂症,希望我在写完这个专栏的时候,我们能够一起在 ElasticSearch 领域有更加透彻的领悟和技术方面的提升。
注:本文作为专栏的第一篇文章,首先将带领大家搭建起来 ElasticSearch 集群实战环境,我们后面所有的操作都将会在这个集群上进行展开。
一、ElasticSearch简介
ElasticSearch是什么?
Elasticsearch 是一个分布式的免费开源搜索和分析引擎,适用于包括文本、数字、地理空间、结构化和非结构化数据等在内的所有类型的数据。Elasticsearch 在 Apache Lucene 的基础上开发而成,由 Elasticsearch N.V.(即现在的 Elastic)于 2010 年首次发布。Elasticsearch 以其简单的 REST 风格 API、分布式特性、速度和可扩展性而闻名,是 Elastic Stack 的核心组件;Elastic Stack 是一套适用于数据采集、扩充、存储、分析和可视化的免费开源工具。人们通常将 Elastic Stack 称为 ELK Stack(代指 Elasticsearch、Logstash 和 Kibana),目前 Elastic Stack 包括一系列丰富的轻量型数据采集代理,这些代理统称为 Beats,可用来向 Elasticsearch 发送数据。
Elasticsearch 的用途是什么?
Elasticsearch 在速度和可扩展性方面都表现出色,而且还能够索引多种类型的内容,这意味着其可用于多种用例:应用程序搜索、网站搜索、企业搜索、日志处理和分析、基础设施指标和容器监测、应用程序性能监测、地理空间数据分析和可视化、安全分析、业务分析等。
为何使用 Elasticsearch?
Elasticsearch 很快。由于 Elasticsearch 是在 Lucene 基础上构建而成的,所以在全文本搜索方面表现十分出色。Elasticsearch 同时还是一个近实时的搜索平台,这意味着从文档索引操作到文档变为可搜索状态之间的延时很短,一般只有一秒。因此,Elasticsearch 非常适用于对时间有严苛要求的用例,例如安全分析和基础设施监测。
Elasticsearch 具有分布式的本质特征。Elasticsearch 中存储的文档分布在不同的容器中,这些容器称为分片,可以进行复制以提供数据冗余副本,以防发生硬件故障。Elasticsearch 的分布式特性使得它可以扩展至数百台(甚至数千台)服务器,并处理 PB 量级的数据。
Elasticsearch 包含一系列广泛的功能。除了速度、可扩展性和弹性等优势以外,Elasticsearch 还有大量强大的内置功能(例如数据汇总和索引生命周期管理),可以方便用户更加高效地存储和搜索数据。
Elastic Stack 简化了数据采集、可视化和报告过程。通过与 Beats 和 Logstash 进行集成,用户能够在向 Elasticsearch 中索引数据之前轻松地处理数据。同时,Kibana 不仅可针对 Elasticsearch 数据提供实时可视化,同时还提供 UI 以便用户快速访问应用程序性能监测 (APM)、日志和基础设施指标等数据。
因此,ElasticSearch是一个成熟的大数据分布式存储解决方案,并且可以作为完备的分布式系统开发和支撑平台的存储系统。
二、准备工作
本专栏是基于Centos7环境的基础上搭建的,Centos 也是官方推荐的操作系统,我这边由于资金问题所以三台服务器以虚拟机的方式进行创建,三台服务器配置信息,如下所示:
主机名称 | IP地址 | 硬盘容量 | 内存容量 |
es-01 | 192.168.3.1 | 100GB | 8GB |
es-02 | 192.168.3.2 | 100GB | 8GB |
es-03 | 192.168.3.3 | 100GB | 8GB |
然后我们需要修改三台服务器相关配置文件,以满足 ElasticSearch 集群运行前置条件。
以上是关于ElasticSearch实战-ElasticSearch集群环境搭建的主要内容,如果未能解决你的问题,请参考以下文章