SparkStreaming性能调优大全!

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SparkStreaming性能调优大全!相关的知识,希望对你有一定的参考价值。

SparkStreaming性能调优大全!


一、日志已满:

 spark.executor.logs.rolling.maxSize 


下面三个日志rolling参数记得设置: 

spark.executor.logs.rolling.strategy size 

spark.executor.logs.rolling.maxSize 134217728 #default byte 

spark.executor.logs.rolling.maxRetainedFiles 


二、Spark Streamingz对Kafka的Offset进行管理

zookeeper.session.timeout.ms

一般跳大3~5倍。

http://geeks.aretotally.in/spark-streaming-kafka-direct-api-store-offsets-in-zk/

http://www.tuicool.com/articles/vaUzquJ


技术分享

三、 spark.task.maxFailures 


技术分享默认4,调整10左右


四、spark.streaming.kafka.maxRetries

默认1,调成3或者5


五、Spark Streaming连接Kafka用Direct方式。



以上是关于SparkStreaming性能调优大全!的主要内容,如果未能解决你的问题,请参考以下文章

SparkStreaming 性能调优

[Spark]-Streaming-调优

Linux性能调优工具大全,强烈建议收藏

数据库性能调优大全(附某大型医院真实案例)

Spark Streaming 2.2.0 性能调优

Spark Streaming 2.2.0 性能调优