在火花中读取 json [重复]

Posted

技术标签:

【中文标题】在火花中读取 json [重复]【英文标题】:reading a json in spark [duplicate] 【发布时间】:2016-06-17 04:41:54 【问题描述】:

我在 cassandra 中有一个表,其中有一列类型为“文本”。 它保存的值是json类型的数据。

因此,在每条记录中,该列的值都类似于。

"a":"1", "b":"5", "c":"3", "d":"12"

类似地,在下一条记录中,它将具有类似

的值

"a":"12", "b":"52", "c":"13", "d":"3",

所以我能说的是这个列在每条记录中都有一个 json 值。

我的要求是使用 spark/sparksql 检索每条记录的“b”和“d”的值。

【问题讨论】:

【参考方案1】:

阅读 Cassandra 表后,您可以在文本列上执行用户定义函数 (UDF),在该 udf 中,您可以将字符串转换为 JSON 对象并返回您需要的字段。

【讨论】:

以上是关于在火花中读取 json [重复]的主要内容,如果未能解决你的问题,请参考以下文章

如何在火花中将数据帧转换为csv [重复]

纱线上的火花任务太多[重复]

在火花中压缩 2 列 [重复]

如何在python中读取json对象[重复]

火花数据框删除重复并保留第一

在火花数据框中使用案例类的好处[重复]