spark 通过远程submit提交任务后怎么获取数据

Posted 2023-03-27

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了spark 通过远程submit提交任务后怎么获取数据相关的知识，希望对你有一定的参考价值。

参考技术A spark 通过远程submit提交任务后怎么获取数据
在百度地图的右上角，点击“地图API”。
在地图API页面，把鼠标移动到“工具”菜单项，在下拉菜单中选择“坐标拾取工具”。
比如在搜索栏输入“百度大厦”点击搜索，就会在地图上出现相应的标记，点击你要找的某一个，就能看到相应的坐标。
同理，把找到的坐标输入到搜索栏，把后面“坐标反查”给勾上，点击搜索，就会对应的坐标打上标记，同时会有相应地址在最右边。
同时，把鼠标在地图上滑行，就可以看到，鼠标滑到每一个地方，都会对应显示坐标。本回答被提问者采纳

[转] spark-submit 提交任务及参数说明

【From】 https://www.cnblogs.com/weiweifeng/p/8073553.html#undefined

spark-submit 可以提交任务到 spark 集群执行，也可以提交到 hadoop 的 yarn 集群执行。

1. 例子

一个最简单的例子，部署 spark standalone 模式后，提交到本地执行。

./bin/spark-submit --master spark://localhost:7077 examples/src/main/python/pi.py

如果部署 hadoop，并且启动 yarn 后，spark 提交到 yarn 执行的例子如下。

注意，spark 必须编译成支持 yarn 模式，编译 spark 的命令为：

build/mvn -Pyarn -Phadoop-2.x -Dhadoop.version=2.x.x -DskipTests clean package

其中, 2.x 为 hadoop 的版本号。编译完成后，可执行下面的命令，提交任务到 hadoop yarn 集群执行。

./bin/spark-submit --class org.apache.spark.examples.SparkPi 
--master yarn 
--deploy-mode cluster 
--driver-memory 1g 
--executor-memory 1g 
--executor-cores 1 
--queue thequeue 
examples/target/scala-2.11/jars/spark-examples*.jar 10

2. spark-submit 详细参数说明

参数名	参数说明
--master	master 的地址，提交任务到哪里执行，例如 spark://host:port, yarn, local
--deploy-mode	在本地 (client) 启动 driver 或在 cluster 上启动，默认是 client
--class	应用程序的主类，仅针对 java 或 scala 应用
--name	应用程序的名称
--jars	用逗号分隔的本地 jar 包，设置后，这些 jar 将包含在 driver 和 executor 的 classpath 下
--packages	包含在driver 和executor 的 classpath 中的 jar 的 maven 坐标
--exclude-packages	为了避免冲突而指定不包含的 package
--repositories	远程 repository
--conf PROP=VALUE	指定 spark 配置属性的值，例如 -conf spark.executor.extraJavaOptions="-XX:MaxPermSize=256m"
--properties-file	加载的配置文件，默认为 conf/spark-defaults.conf
--driver-memory	Driver内存，默认 1G
--driver-java-options	传给 driver 的额外的 Java 选项
--driver-library-path	传给 driver 的额外的库路径
--driver-class-path	传给 driver 的额外的类路径
--driver-cores	Driver 的核数，默认是1。在 yarn 或者 standalone 下使用
--executor-memory	每个 executor 的内存，默认是1G
--total-executor-cores	所有 executor 总共的核数。仅仅在 mesos 或者 standalone 下使用
--num-executors	启动的 executor 数量。默认为2。在 yarn 下使用
--executor-core	每个 executor 的核数。在yarn或者standalone下使用

以上是关于spark 通过远程submit提交任务后怎么获取数据的主要内容，如果未能解决你的问题，请参考以下文章

spark-submit提交程序，找不到类名

Spark集群任务提交流程----2.1.0源码解析

Spark Launcher简记

Spark-submit 测试任务提交

Spark学习之路（十六）SparkCore的源码解读spark-submit提交脚本

spark-submit参数