如何在 apache toree pyspark notebook 中更改 python 版本?

Posted

技术标签:

【中文标题】如何在 apache toree pyspark notebook 中更改 python 版本?【英文标题】:How to change python version in apache toree pyspark notebook? 【发布时间】:2017-07-01 19:56:47 【问题描述】:

我正在为 Pyspark Notebook 运行 Apache Toree。我在 unix 机器上安装了 anaconda 3.5 和 jupyter hub。当我从 Jupyter notebook 调用 pyspark 时,它从 Python 2.7 而不是 Anaconda 3.5 开始。

请求您帮助更改 python 版本。

请参阅我已经尝试通过 os.environ 更改 python 版本,但没有成功。

【问题讨论】:

您是如何安装 Toree 的?设置时指定 Python 环境 首先通过 pip 安装。它安装在 anaconda 中。然后安装 jupyter toree。 谢谢。安装了带有 spark home 和 python 路径的新内核。 jupyter toree install --spark_home="spark_path" --kernel_name=tanveer_kernel1 --interpreters=PySpark,SQL --python="python_path" 【参考方案1】:

按照以下步骤使用 Python-3 配置 Toree:

    安装了带有 spark home 和 python 路径的新内核。

    jupyter toree install --spark_home="spark_path" --kernel_name=tanveer_kernel1 --interpreters=PySpark,SQL --python="python_path"

      执行上述操作后,Driver Python 版本和 Executor Python 版本出现问题。通过添加 更正了 spark-env.sh 中的 Python 版本

    导出 PYSPARK_PYTHON="/usr/lib/anaconda3/bin/python" 导出 PYSPARK_DRIVER_PYTHON="/usr/lib/anaconda3/bin/python"

      已重新启动 spark 服务。

【讨论】:

以上是关于如何在 apache toree pyspark notebook 中更改 python 版本?的主要内容,如果未能解决你的问题,请参考以下文章

为 Jupyter 创建 pyspark 内核

Apache Spark:如何在Python 3中使用pyspark

如何在 Pyspark 中启用 Apache Arrow

如何在 Apache livy 中提交 pyspark 作业?

如何在 Apache Spark (pyspark) 中使用自定义类?

如何在 Apache Spark (PySpark 1.4.1) 中可视化/绘制决策树?