弹性只保留logstash的最后一条记录

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了弹性只保留logstash的最后一条记录相关的知识,希望对你有一定的参考价值。

这是select语句,它是一个事务数据,每次将数据插入UserProfile时,旧的索引值都会从弹性中删除

  jdbc {
    statement => "SELECT userId,salesTeam FROM UserProfile with (nolock)"
}
output {
    elasticsearch {
    hosts => ["localhost:9200"]
    index => "q_d"
    document_type => "cd"
    document_id => "%{userId}%"
  }
  stdout { codec => rubydebug }
}

如果有任何更改,我想更新现有文档,否则索引新文档。 我在这做错了什么?

答案
input {
    jdbc {
        # Postgres jdbc connection string to our database, mydb
        jdbc_connection_string => "jdbc:postgresql://localhost:5432/bhavya"
        # The user we wish to execute our statement as
        jdbc_user => "postgres"
        # The path to our downloaded jdbc driver
        jdbc_driver_library => "/root/postgresql-42.2.2.jar"
        # The name of the driver class for Postgresql
        jdbc_driver_class => "org.postgresql.Driver"
        jdbc_password => "postgres"
        jdbc_validate_connection => true
        #You can schedule input from this plugin,the following uses cron syntax
        schedule => "* * * * *"
        # our query
        statement => "SELECT uid,email,first_name,last_name FROM contacts"
    }
}

output {
    elasticsearch {
    hosts => ["localhost:9200"]
    index => "contacts"
    document_type => "record"
    document_id => "%{uid}"
  }
  stdout { codec => rubydebug }
}

首先,您应该根据您的数据库添加我在输入插件中指定的上述选项。我使用Postgresql作为数据库。因此,您需要为该数据库下载相应的驱动程序库jar并指定与之对应的路径。

其次,您应该在“jdbc”插件中使用schedule选项,以便它定期从数据库中读取数据。

第三,你应该从“output”插件部分的“document_id”部分中删除一个额外的'%'。

您应该参考此页面将数据从数据库导入logstash: - >

https://www.elastic.co/blog/logstash-jdbc-input-plugin

以上是关于弹性只保留logstash的最后一条记录的主要内容,如果未能解决你的问题,请参考以下文章

mysql删除重复数据,保留一条

怎么删除ACCESS中的重复记录 只保留一条

一条SQL删除重复记录,重复的只保留一条

一条SQL删除重复记录,重复的只保留一条

oracle删除重复记录保留一条

MySQL删除重复记录只保留一条