Pyspark Zeppelin - 无法打开 PythonInterpreter
Posted
技术标签:
【中文标题】Pyspark Zeppelin - 无法打开 PythonInterpreter【英文标题】:Pyspark Zeppelin - Fail to open PythonInterpreter 【发布时间】:2021-07-15 20:26:32 【问题描述】:我是 Zeppelin 和 Pyspark 的新手。
我试图让 Zeppelin 与 Pyspark 一起运行,但徒劳无功。
我的设置:
4 x 覆盆子 4(8GB) Ubuntu 服务器 64 位 20.04 Hadoop:3.2.2 纱线 Spark 3.1.1 和 Hadoop 集成 齐柏林飞艇 0.9Pi01 作为 Master Pi02-04 作为 Worker。 Spark 安装在所有 Pi 上。
Hadoop 和 Yarn 运行没有任何问题。 Pyspark shell 运行,我可以执行命令。
但 zeppelin 中的相同命令失败..
java.io.IOException:无法运行程序“python”:错误=2,没有这样的文件或目录
但是,Zeppelin %Pyspark 和 %python 不起作用。我现在已经搜索了很多小时,但没有找到解决方案(从 Debian 切换到 Ubuntu 并再次返回)。
我也尝试使用 Jupyter Notebook 从我的 Win10 PC 访问 Spark Master,但我不知道该怎么做,最后放弃了。
有什么想法吗?
感谢您的帮助。
【问题讨论】:
【参考方案1】:最后,我得到了它的工作。我使用了 Spark 2.4.7 版,现在它可以工作了。我不知道这是巧合还是真的有必要。
【讨论】:
以上是关于Pyspark Zeppelin - 无法打开 PythonInterpreter的主要内容,如果未能解决你的问题,请参考以下文章
在 zeppelin 中使用从 %pyspark 到 %python 的 Dataframe
如何在 Zeppelin notebook 和 pyspark 中导入 Delta Lake 模块?
apache zeppelin 使用 pyspark 读取 csv 失败
PySpark MLLib Zeppelin Logistic回归度量标准错误:AssertionError:维度不匹配