ElasticSearch实战(三十五)-Ingest Pipeline 数据预处理(轻量级ETL)

Posted 张志翔ۤ

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ElasticSearch实战(三十五)-Ingest Pipeline 数据预处理(轻量级ETL)相关的知识,希望对你有一定的参考价值。

        在Elasticsearch 5.0版本以后引入了 Ingest Pipeline,用于在文档被索引之前进行预处理。Pipeline 定义了一系列按顺序执行的 processors, 一个 pipeline 由 description 和 processors两部分组成:

PUT _ingest/pipeline/my-pipeline-id
{
  "description" : "...",
  "processors" : [ ... ]
}

       主要应用场景:

  1. 预处理原数据
  2. 写入数据、更新数据
  3. 重建索引数据
  4. 通用共用函数功能模块

        注:Ingest Pipeline 非常强大,他通过 Painless 脚本能修改所有数据,包括原始数据和元数据。

一、Processors类型详解

        processors 类型比较多,我们工作中常用的应该是三种类型,使用好这三种类型就能应对工作中大部分场景了:Script Processor、Set Processor、Remove Processor 。

        1、Script Processor

        该 Processor 是 Ingest 中功能最强大的Processor,利用Elasticsearch提供的脚本能力。

{
  "script": {
    "lang&#

以上是关于ElasticSearch实战(三十五)-Ingest Pipeline 数据预处理(轻量级ETL)的主要内容,如果未能解决你的问题,请参考以下文章

Android项目实战(三十五):多渠道打包

SpringBoot--实战开发--commons-lang3(三十五)

机器学习实战基础(三十五):随机森林 之 RandomForestClassi?er 之重要参数

机器学习实战基础(三十五):随机森林 之 RandomForestClassi?er 之重要参数

MySQL实战第三十五讲- join语句怎么优化?

ElasticSearch实战(十五)-辅助型数据字段类型