Flink性能问题定位

Posted zgq25302111

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Flink性能问题定位相关的知识,希望对你有一定的参考价值。

看反压

通常最后一个被压高的subTask的下游就是job的瓶颈之一

看checkpoint时长

checkpoint时长能在一定程度影响job的整体吞吐

看核心指标

延迟和吞吐是最重要的指标

资源使用率

提高资源利用率是最终目的。排查首先看GC

常见性能问题

  • JSON序列化和反序列化
  • MAP和Set的Hash冲突
  • 和低速系统交互 如mysql,HBASE
  • 数据倾斜
  • 频繁GC 甚至TM失联
  • 大窗口 窗口size大、数据量大,或者滑动窗口size和step比值比较大如size=5min,step=1s

以上是关于Flink性能问题定位的主要内容,如果未能解决你的问题,请参考以下文章

Flink性能调优(一)

大数据Flink性能优化

Flink 1.13.0 反压监控的优化

Flink 大规模作业调度性能优化

flink任务性能优化

Flink性能调优总结