SparkStreaming性能调优大全!
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了SparkStreaming性能调优大全!相关的知识,希望对你有一定的参考价值。
SparkStreaming性能调优大全!
一、日志已满:
spark.executor.logs.rolling.maxSize
下面三个日志rolling参数记得设置:
spark.executor.logs.rolling.strategy size
spark.executor.logs.rolling.maxSize 134217728 #default byte
spark.executor.logs.rolling.maxRetainedFiles
二、Spark Streamingz对Kafka的Offset进行管理
zookeeper.session.timeout.ms
一般跳大3~5倍。
http://geeks.aretotally.in/spark-streaming-kafka-direct-api-store-offsets-in-zk/
http://www.tuicool.com/articles/vaUzquJ
三、 spark.task.maxFailures
默认4,调整10左右
四、spark.streaming.kafka.maxRetries
默认1,调成3或者5
五、Spark Streaming连接Kafka用Direct方式。
以上是关于SparkStreaming性能调优大全!的主要内容,如果未能解决你的问题,请参考以下文章