记一次ES日志系统的接入
Posted 架构师学习路线
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了记一次ES日志系统的接入相关的知识,希望对你有一定的参考价值。
0 - 前言
近期接了一个新项目,某部门的日志要从HDFS迁移到ES中,每天15T,保留15天,每天有150亿条数据写入,这对于我们现有集群吞吐量是一个很大的挑战。
1 - 现状
目前默认ES集群采用3 master、3 data的结构。数据节点服务器:
CPU: 24 核、Intel(R) Xeon(R) CPU E5-2620 v3 @ 2.40GHz
MEM:128G
Disk: Intel 4510 * 4 单盘挂载
默认集群可承载25w/s的请求,index速度可以达到120w/s,吞吐量最大可到25MB/s。如果每天有150亿的写入,QPS在20w左右,默认的集群配置可以接受,但是,问题出在了Logstash上。
Log file -> Flume -> Kafka -> Logstash -> ES
pipeline.workers: 40
pipeline.batch.size: 500
pipeline.batch.delay: 10
-
日志数据允许丢失,我们关掉了副本,只保留主分片; -
为了增加吞吐量,刷新间隔增加到了100s; -
为了降低translog占用的资源,增大了缓存的日志大小、调整了刷新间隔和方法;
"index.refresh_interval":"100s",
"number_of_replicas": 0,
"translog.flush_threshold_size": "1024mb",
"translog.sync_interval": "100s",
"translog.durability": "async",
"merge.scheduler.max_thread_count": "1",
"merge.policy.max_merged_segment": "2gb"
原文:https://www.jianshu.com/p/03512da5aa19?utm_campaign=hugo
想要获取学习实战、高并发、架构 、笔试面试资料 请扫码咨询+薇薇微信
以上是关于记一次ES日志系统的接入的主要内容,如果未能解决你的问题,请参考以下文章