Spark 参数配置的几种方法

Posted 2022-08-05 格格巫 MMQ!!

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Spark 参数配置的几种方法相关的知识，希望对你有一定的参考价值。

1.Spark 属性
Spark应用程序的运行是通过外部参数来控制的，参数的设置正确与否，好与坏会直接影响应用程序的性能，也就影响我们整个集群的性能。参数控制有以下方式：
（1）直接设置在SparkConf，通过参数的形式传递给SparkContext，达到控制目的。（通过set()方法传入key-value对）比如：

val conf = new SparkConf()
　　　　.setMaster(”local[2]“) #注意1
　　　　.setAppName(”test“)
　　　　.set(“spark.cores.max”, “10”) ######set()方法传入属性参数
val sc = new SparkContext(conf)
#注意1 本地开启2个线程来工作，注意了，本地工作方式除了集合生成RDD、读取本地文件和hdfs文件能开启一个线程就可以工作外，其他情况都开启至少两条线程才能正常工作。这是由于除以上情况，Spark会开启一个reciver来接受数据，若只有一条线程，reciver就占用唯一线程的资源，而数据处理等操作将没有资源可执行。

（2）动态加载Spark属性。为了应用程序名字和集群方式等属性不硬编码，灵活应用。可以这样处理：val sc = new SparkContext(new SparkConf())。通过 spark-submit 时添加必要的参数。如：

./bin/spark-submit --name “My app” --master local[4] --conf spark.eventLog.enabled=false
–conf “spark.executor.extraJavaOptions=-XX:&#

以上是关于Spark 参数配置的几种方法的主要内容，如果未能解决你的问题，请参考以下文章

Spark读取Hbase数据的几种方法

yarn查看日志的几种方法

loadsave方法spark sql的几种数据源

hive使用spark引擎的几种情况

spark连接关系型数据库的几种方法

flask配置文件的几种方法