如何从 pandas 数据框创建数据块表?

Posted

技术标签:

【中文标题】如何从 pandas 数据框创建数据块表?【英文标题】:How do I create a databricks table from a pandas dataframe? 【发布时间】:2020-09-11 04:59:40 【问题描述】:

我创建了一个 pandas 数据框。这打印得很好,但是我需要在 SQL 中进行操作。

我已经运行了以下内容:

spark_df = spark.createDataFrame(df)

spark_df.write.mode("overwrite").saveAsTable("temp.testa")

pd_df = spark.sql('select * from temp.testa').toPandas()

但是得到一个错误:

AnalysisException: Database 'temp' not found;

显然我还没有创建数据库,但不知道该怎么做。

任何人都可以建议我如何实现我所需要的吗?

【问题讨论】:

【参考方案1】:

错误消息清楚地显示“AnalysisException: Database 'temp' not found;”数据库临时未找到。创建数据库后,您可以毫无问题地运行查询。

要创建数据库,可以使用以下命令:

在 SQL 中创建数据库:

CREATE DATABASE <database-name>

参考:Azure Databricks - SQL

【讨论】:

以上是关于如何从 pandas 数据框创建数据块表?的主要内容,如果未能解决你的问题,请参考以下文章

pandas:从字典创建数据框

从 pandas 数据框创建单个列

从 Pandas 多索引数据框创建等高线图

如何从Twitter Search API创建pandas数据框?

如何从 Pandas 数据框对象显示 X 轴到 Matplotlib 条形图

如何在 Pandas 中的超大数据框上创建数据透视表