Elastic data stream 命名方案介绍
Posted Elastic 中国社区官方博客
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Elastic data stream 命名方案介绍相关的知识,希望对你有一定的参考价值。
在 Elastic 7.9 中,发布了 Elastic Agent 和 Fleet,以及一种在 Elasticsearch 中为时间序列数据构建索引和数据流的新方法。 在这篇博文中,我们将概述 Elastic data stream 命名方案及其工作原理。 这是围绕 Elastic data stream 命名方案的一系列博客文章中的第一篇。
Elastic data stream 的命名方案
Elastic data stream 的命名方案是由时间序列数据,由数据集分割成不同的数据。它使用以下命名约定。
- type(类型):通用类型描述数据,比如 logs, metrics, traces ...
- dataset(数据集):描述摄入的数据和它的结构,比如 nginx.access
- namespace(命名空间):用户可配置的任意分组,比如 production, testing
各个部分由 “-” 结合在一起,这样就会导致像 logs-nginx.access-production 这样名称的数据流。在所有三个部分中,“-” 字符是不允许的。这意味着所有的数据流通过以下方式命名:
{type}-{dataset}-{namespace}
对于数据集和命名空间,都有一个默认值,即 dataset=generic 和 namespace=default。在 Elastic Agent 的情况下,如果用户刚刚开始摄人日志文件,最后的数据流是 logs-generic-default。
要获得 Elastic 数据流命名方案的所有优势,每个文档必须包含以下三个字段:
- data_stream.type
- data_stream.dataset
- data_stream.namespace
可以在 Elastic Common Schema(ECS)中找到有关这些字段的更多细节。上述字段被映射为 constant keyword 字段,这使得他们查询效率更高,这是因为减少了必须被查询碎片的数目。
Elastic data stream 命名方案的好处
与 Beats 和 Logstash 以前使用的索引策略相比,Elastic data stream 命名方案有一些优势。使用了许多更小但更密集的数据流,而不是很少的大索引。好处的简短摘要:
- 减少每个索引的字段数:由于数据被拆分为跨多个数据流的单个数据集,因此每个数据流包含最少的字段集。这会带来更好的空间效率和更快的查询。
- 对数据进行更精细的控制:通过数据集和命名空间拆分数据允许对翻转、保留和安全权限进行精细控制。
- 灵活性:用户可以使用命名空间以任何他们想要的方式划分和组织数据。
- 更好的策划体验:由于 Elastic 数据流命名方案的通用结构,可以在数据流之上构建更好的策划体验。
- 需要更少的摄入权限:以前,模板和摄入管道的设置是由 Elastic Agent 执行的。由于这现在以集中方式发生,因此摄入工具只需要附加数据的权限。
Elastic data stream 命名方案的使用
Elastic Stack 7.9 及更高版本支持 Elastic 数据流命名方案,因为它需要支持数据流、新的 Elasticsearch 组件模板和常量关键字。 logs-*-* 和 metrics-*-* 的索引模板随 Elasticsearch >=7.9 一起提供。 Elastic Agent 附带的所有数据都使用 Elastic data stream 命名方案。 要将它用于任何其他数据传送器,只需遵循命名结构并添加 data_stream 字段以使其工作。
概括
这是 Elastic data stream 命名方案的简短摘要。 在后续的博客文章中,我们将深入探讨它在幕后如何工作的技术细节,Elastic Agent 如何详细使用它,以及如何使用它来为自己谋取更多的好处。 如需更多见解,请观看 Elastic Community YouTube 频道上对新的 Elastic 索引策略的深入了解。
以上是关于Elastic data stream 命名方案介绍的主要内容,如果未能解决你的问题,请参考以下文章
.Spark Streaming(上)--实时流计算Spark Streaming原理介
用C#的编程,老是提示:命名空间“System”中不存在类型或命名空间名称“Stream”。请问哪里错了?