spark常用参数

Posted moonlightml

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了spark常用参数相关的知识,希望对你有一定的参考价值。

 val conf = new SparkConf().setAppName("WordCount_groupBy").setMaster("local")
      // .set("spark.default.parallelism", "100") //  1. 调节并行度
      .set("spark.executor.memory ","4g")
      .set("spark.executor.cores","5")
      .set("spark.executor.nums","4")//1
      //静态内存机制
      .set("spark.memory.useLegacyMode","false")
      .set("spark.storage.memoryFraction", "0.3")// 5.cache占用的内存占比,default=0.6
      //统一内存机制
      .set("spark.memory.Fraction","0.3")//default=0.6
      .set("spark.storage.storageFraction","0.9")//default=0.5
      .set("spark.shuffle.consolidateFiles", "false")

 

以上是关于spark常用参数的主要内容,如果未能解决你的问题,请参考以下文章

python+spark程序代码片段

提效小技巧——记录那些不常用的代码片段

python常用代码

spark常用参数

Spark 常用参数及调优

spark关于join后有重复列的问题(org.apache.spark.sql.AnalysisException: Reference '*' is ambiguous)(代码片段