无法使用Pyspark从EMR群集连接到Snowflake

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了无法使用Pyspark从EMR群集连接到Snowflake相关的知识,希望对你有一定的参考价值。

我正在尝试使用pyspark从EMR群集连接到Snowflake。

我正在火花提交中使用这两个罐子。

  • snowflake-jdbc-3.5.2.jar
  • spark-snowflake_2.11-2.7.0-spark_2.4.jar

但是它因连接超时错误而失败。我为EMR群集配置了正确的代理。来自同一EC2(EMR主服务器)我可以使用snowsql和python连接器连接到Snowflake。

我不确定为什么pyspark超时。

答案

您可以使用我们的SnowCD工具来检查连接诊断。这与网络问题有关。https://docs.snowflake.com/en/user-guide/snowcd.html

下面是我尝试通过EMR Shell运行时的命令。

pyspark --packages net.snowflake:snowflake-jdbc:3.6.27,net.snowflake:spark-snowflake_2.12:2.4.14-spark_2.4

spark-submit-打包net.snowflake:snowflake-jdbc:3.8.0,net.snowflake:spark-snowflake_2.11:2.4.14-spark_2.4 SparkConnPythonWithCert.py

Spark-shell --packages net.snowflake:snowflake-jdbc:3.8.0,net.snowflake:spark-snowflake_2.11:2.4.14-spark_2.4

以上是关于无法使用Pyspark从EMR群集连接到Snowflake的主要内容,如果未能解决你的问题,请参考以下文章

Jupyter + EMR + Spark - 从本地机器上的 Jupyter notebook 连接到 EMR 集群

无法使用 Jupyter 笔记本上的 pyspark 从 Apache Spark 连接到 MS SQL

无法从连接到 Azure *** 的本地计算机(在家庭网络上)访问专用 AKS 群集

从 EMR spark 连接到 EMR presto - 连接失败

获取VS代码Python扩展以连接到远程AWS EMR主节点上运行的Jupyter。

Azure Devops 无法连接到 Service Fabric 群集