使用spark-submit部署程序时的java.lang.NoSuchMethodError

Question

我正在编写一个程序来将数据上传到某个s3a：//链接。该计划是通过mvn install编制的。在本地运行程序（如使用java -jar jarfile.jar）没有返回任何错误。但是，当我使用spark-submit（如使用spark-submit jarfile.jar）时，它返回了这样的错误：

线程“main”中的异常java.lang.NoSuchMethodError：org.apache.hadoop.conf.Configuration.reloadExistingConfigurations（）V org.apache.hadoop.fs.s3a.S3AFileSystem.addDeprecatedKeys（S3AFileSystem.java:181）at org。 java.lang.Class.forName（java.Lava：。

错误日志跟踪到我的源代码的这部分：

sparkDataset
        .write()
        .format("parquet")
        .mode(SaveMode.Overwrite)
        .save("some s3a:// link");

其中sparkDataset是org.apache.spark.sql.Dataset的一个例子。

尝试How to access s3a:// files from Apache Spark?不成功，并返回另一个错误：

线程“main”中的异常java.lang.NoClassDefFoundError：org / apache / hadoop / fs / GlobalStorageStatistics $ StorageStatisticsProvider

来自java.lang.NoSuchMethodError: org.apache.hadoop.conf.Configuration.reloadExistingConfigurations()V的问题也不太可能，因为我可以在本地运行，其中兼容性不是问题。

另外，这些是我使用的相关库的版本：

AWS-Java的SDK-包：1.11.199
Hadoop的AWS：3.0.0

我期待通过s3a：//链接编写的文件。我认为依赖不是问题，因为我可以在本地运行。我在使用spark-submit运行这个程序时只遇到这个问题。任何人有任何想法如何解决这个问题？

编辑：此外，我已经检查过spark提交的spark版本据说是为hadoop 2.7及以上版本构建的。我严格使用hadoop 3.0.0。这可能是我的程序中发生此类错误的原因吗？