Elasticsearch估算在 Elasticsearch 中存储文档的成本
Posted 九师兄
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elasticsearch估算在 Elasticsearch 中存储文档的成本相关的知识,希望对你有一定的参考价值。
1.概述
AppDynamics 一直在增加使用 ElasticSearch 来实现对大量数据点的实时分析。其中,我们记录了最终用户对我们产品监控的每个网站的每次访问。每个这样的记录都包含一个 URL、一个服务器响应时间、一个页面呈现时间、浏览器类型、大致的用户位置等。对真实和合成数据进行了大量实验,以提出更好的磁盘使用指南。我们得出的结论是,保持字符串值尽可能短是有帮助的。即使列中值的基数很低,这也是一个好主意。低基数并不能可靠地导致低磁盘使用率
。
2.存储成本的长期趋势
在衡量 ElasticSearch (ES) 存储使用情况时,重要的是要意识到短期趋势并不代表长期平均值
。事实上,每条记录成本(写入 100 万条或更少的记录)的短期趋势可能是长期成本(1000 万条记录)的 3 倍
。我们的实验表明,要获得长期趋势的良好近似,应该查看至少 10M-20M
记录的写入。
发生这种情况是因为 ES 时不
以上是关于Elasticsearch估算在 Elasticsearch 中存储文档的成本的主要内容,如果未能解决你的问题,请参考以下文章