如何使用配置单元外部配置单元表创建一个空数据框?

Posted

技术标签:

【中文标题】如何使用配置单元外部配置单元表创建一个空数据框?【英文标题】:How to create an empty dataframe using hive external hive table? 【发布时间】:2019-10-15 18:21:39 【问题描述】:

我正在使用以下内容创建一个使用 hive 外部表的数据框 (spark scala)。但是数据框也在其中加载了数据。我需要一个使用 hive 外部表的架构创建的空 DF。我正在为此使用 spark scala。

val table1 = sqlContext.table("db.table")

如何使用 hive 外部 hive 表创建空数据框?

【问题讨论】:

添加什么都找不到的 where 子句,不优雅的方法 【参考方案1】:

你可以这样做:

val table1 = sqlContext.table("db.table").limit(0)

这将为您提供仅包含架构的空 df。由于延迟评估,它也不会比加载架构花费更长的时间。

【讨论】:

以上是关于如何使用配置单元外部配置单元表创建一个空数据框?的主要内容,如果未能解决你的问题,请参考以下文章

spark - scala - 如何检查配置单元中是不是存在表

无法指向使用来自 spark 的配置单元创建的外部表

镶木地板上的配置单元外部表未获取数据

找不到pyspark数据框保存到配置单元表

在 spark 中创建带有模式的配置单元外部表

如何在 pyspark 中加入带有熊猫数据框的配置单元表?