ElasticSearch实战-索引优化建议与原则

Posted 张志翔ۤ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearch实战-索引优化建议与原则相关的知识,希望对你有一定的参考价值。

        在设计 Elasticsearch 索引之前,首先要合理地估算自己的物理需求,物理需求指数据本身的物理特性,包括如下几方面。     

  • 数据总量

        业务所涉及的领域对象预期有多少条记录,对 Elasticsearch 来说就是有多少 documents 需要索引到集群中。

  • 单条数据大小

        每条数据的各个属性的物理大小是多少,比如 1k 还是 10k。

  • 长文本

        明确数据集中是否有长文本,明确长文本是否需要检索,是否可以启用压缩。Elasticsearch 建索引的过程是极其消耗 CPU 的,尤其对长文本更是如此。

        明确了长文本的用途并合理地进行相关设置可以提高 CPU、磁盘、内存利用率。我们曾遇见过不合理的长文本处理方式导致的问题,此处在 mapping 设计时会专门讨论。

  • 物理总大小

        根据上面估算的数据总量和单条数据大小,就可以估算出预期的存储空间大小。

  • 数据增量方式

        这里主要明确数据是以何种方式纳入 Elasticsearch 的管理,比如平稳增加、定期全量索引、周期性批量导入。针对不同的数据增量方式,结合 Elasticsearch 提供的灵活设置,可以最大化地提高系统的性能。

  • 数据生命周期

        数据生命周期指进入到系统的数据保留周期,是永久保留、还是随着时间推移进行老化处理?老化的周期是多久?既

以上是关于ElasticSearch实战-索引优化建议与原则的主要内容,如果未能解决你的问题,请参考以下文章

《Elasticsearch 源码解析与优化实战》第21章:综合应用实践

《Elasticsearch 源码解析与优化实战》第21章:综合应用实践

《Elasticsearch 源码解析与优化实战》第10章:索引恢复流程分析

《Elasticsearch 源码解析与优化实战》第10章:索引恢复流程分析

《Elasticsearch 源码解析与优化实战》第1章 走进Elasticsearch

《Elasticsearch 源码解析与优化实战》第1章 走进Elasticsearch