如何在 Windows 的虚拟环境中让 pyspark 在 Jupyter Notebook 中工作?

Posted

技术标签:

【中文标题】如何在 Windows 的虚拟环境中让 pyspark 在 Jupyter Notebook 中工作?【英文标题】:How do I get pyspark working in Jupyter Notebook in a virtual environment on Windows? 【发布时间】:2020-12-03 16:11:51 【问题描述】:

我收到可怕的“异常:Java 网关进程在发送其端口号之前退出”错误,但我已经按照我能找到的所有内容进行操作,但它仍然无法正常工作。最糟糕的是,我发誓这个设置上周奏效了,但不知何故不再奏效了。

我可以从命令行和虚拟环境之外(我正在使用 Pipenv)在虚拟环境中完美地运行 pyspark,所以它一定与 Jupyter Notebook 有关。有没有人在 Windows 上解决了这个问题,可以帮助我?

【问题讨论】:

【参考方案1】:

在你的 python 脚本中设置 JAVA_HOME 环境变量:

os.environ['JAVA_HOME'] = '/path/to/your/java/exe/'

如果这不起作用,请尝试设置 PATH:

os.environ["PATH"] = os.environ["JAVA_HOME"] + "/bin:" + os.environ["PATH"]

【讨论】:

我的 Java 环境变量都配置正确,遗憾的是,它一定是别的东西。谢谢。【参考方案2】:

我从here 中找到了解决办法。我的 JAVA、SPARK_HOME 和 HADOOP_HOME 环境变量配置正确,但我添加了

PYSPARK_DRIVER_PYTHON = jupyter PYSPARK_DRIVER_PYTHON_OPTS = 笔记本

它现在正在工作。

【讨论】:

以上是关于如何在 Windows 的虚拟环境中让 pyspark 在 Jupyter Notebook 中工作?的主要内容,如果未能解决你的问题,请参考以下文章

LINUX中,如何查看CPU,MEM,DISK,主板的相关信息?

如何在windows下安装python虚拟环境

在Windows下如何创建指定的虚拟环境

在Windows下如何创建指定的虚拟环境

在Windows下如何创建虚拟环境(默认情况下)

在Windows下如何创建虚拟环境(默认情况下)