如何使用 pyspark 将 null 分配给配置单元表列

Posted

技术标签:

【中文标题】如何使用 pyspark 将 null 分配给配置单元表列【英文标题】:How to assign null to a hive table column using pyspark 【发布时间】:2020-05-05 14:12:19 【问题描述】:

我的 pyspark 脚本正在填充一个 hive 表,并且需要将一列初始化为 null,以便使用代码可以在 select 语句期间检查 when(df.columname.isNull()), 请告知如何在写入 hive 表时将列名设置为 null。

【问题讨论】:

请提供更多信息 我有 hive 表,hive 表中的一列需要用空值初始化。如何使用 pyspark 实现这一目标? 【参考方案1】:

lit(None).alias(Column_name) 将给出结果 在 hive 或 beeline Column_name 为 null 将返回 true

【讨论】:

以上是关于如何使用 pyspark 将 null 分配给配置单元表列的主要内容,如果未能解决你的问题,请参考以下文章

如何使用 pyspark 并行插入 Hive

打字稿如何将ajax对象分配给属性? [复制]

如何在 MapReduce 程序中将空格分配给分隔符,同时将键设置为 null 和 setNumReduceTasks(0)

pyspark 使用名称中的变量将数据框保存到配置单元表

使用 NULL 数组将内存分配给二维数组 (c)

TypeScript——不能将类型“HTMLElement | null”分配给类型“HTMLElement”