如何从结构类型数组的列中删除特定元素

Posted

技术标签:

【中文标题】如何从结构类型数组的列中删除特定元素【英文标题】:How to remove specific element from a column which is struct type array 【发布时间】:2021-11-15 18:28:35 【问题描述】:

有一个表有 10 列。 列类型之一是 struct 并假设列名是 xyz。 xyz 包含元素数组。

例如, xyz 列包含 [a:值 1,b:值 2,c:值 3...] 现在我想从这个数组中删除 c 元素。

我该怎么做?

这段代码需要在pyspark/python中完成。

【问题讨论】:

请提供示例代码以及在这种情况下您的数据结构以供其他人帮助。 你可以在这里查看 - ***.com/questions/57758729/… 【参考方案1】:

您必须使用df.select('xyz.*') 之类的东西来展平您的结构,然后根据需要使用array function、struct function 对其进行重组。

【讨论】:

以上是关于如何从结构类型数组的列中删除特定元素的主要内容,如果未能解决你的问题,请参考以下文章

单击元素时从 mongodb 中删除特定的数组元素

查询 JSON 列中的数组元素

如何在 DolphinDB 表的列中选择唯一元素?

PHP:如何从数组中删除特定元素?

如何从熊猫数据框中的列中删除字符串值

从 XLS 导出的列中删除 <span>