尝试在 Windows 上运行 Apache Spark 示例时出错

Posted

技术标签:

【中文标题】尝试在 Windows 上运行 Apache Spark 示例时出错【英文标题】:Getting an error while trying to run an Apache Spark example on Windows 【发布时间】:2021-07-26 08:32:32 【问题描述】:

我的设置:

火花版本 3.1.2

hadoop 3.2 版(为 apache hadoop 3.2 及更高版本预构建)

scala 版本 2.12.10

java 1.8 版

将 Apache Spark 存档文件安装到 C:\Users\anime\ApacheSpark\spark。

SPARK_HOME C:\Users\anime\ApacheSpark\spark

HADOOP_HOME C:\Users\anime\ApacheSpark\hadoop

将 Hadoop.dll 和 winutils.exe 从 here 复制到 %HADOOP_HOME%/bin

我从命令行开始运行以下几行代码作为示例 C:\Users\anime\ApacheSpark

`

val textFile = sc.textFile("spark/README.md")

val tokens = textFile.flatMap(l=>l.split(" "))

val cp = tokens.map(word=>(word, 1))

val counts = cp.reduceByKey((a, n)=>a+n)

val sortedCounts = counts.sortBy(kvpair=>kvpair._2, false)

sortedCounts.saveAsTextFile("NewFolder")

`

我得到一个很长的错误日志

错误 SparkHadoopWriter:正在中止作业 job_202107261357425367869624572589035_0010。 java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z..

我尝试过的事情:

    将 hadoop.dll 复制到 C:\Windows\System32 在this 之后运行 winutils.exe chmod 777 NewFolder

谁能帮助我完成我的第一个示例?非常感谢。

【问题讨论】:

【参考方案1】:

我刚刚遇到了同样的问题。仔细检查您的环境变量和 winutils 版本。

Docs

HADOOP_HOME=<your local hadoop-ver folder>
PATH=%PATH%;%HADOOP_HOME%\bin

【讨论】:

以上是关于尝试在 Windows 上运行 Apache Spark 示例时出错的主要内容,如果未能解决你的问题,请参考以下文章

在适用于 Linux 的 Windows 子系统上安装 Apache

Apache (WAMP) 问题:“AH00404: Child: Unable to read socket data from parent”

安装成功但无法在我的 Windows 7 系统上启动 apache 2.4

xampp apache服务器错误403在windows10上禁止访问

要从XP SP3中卸载IE8吗?

Windows 上的 Apache Pig 设置错误