从 Presto 中的 JSON 数组中提取值

Posted

技术标签:

【中文标题】从 Presto 中的 JSON 数组中提取值【英文标题】:Extract values from a JSON Array in Presto 【发布时间】:2021-05-06 23:43:46 【问题描述】:

我有一列包含如下 JSON 数组:

data=["name":"col1","min":0,"max":32,"avg":29,
"name":"col2","min":1,"max":35,"avg":21,
"name":"col3","min":4,"max":56,"avg":34]

我正在尝试解析数组并根据条件提取特定值。例如

"min" 的值,其中"name"="col1":0

"avg" 的值,其中"name"="col3":34

有没有人可以解决这个问题?

【问题讨论】:

【参考方案1】:

您的 JSON 无效。应该是"data":[ 而不是data = [

如果 JSON 有效(您可以在子查询中轻松修复它),提取数据,将其转换为数组(行)并使用 CASE 表达式获取值。我在此处添加了 max() 聚合以删除 NULL 记录并在单行中获取所有必需的值,您可以使用过滤器代替(例如 where x.name = 'col1'),具体取决于您的需要:

with mydata as (
select '"data":["name":"col1","min":0,"max":32,"avg":29,
"name":"col2","min":1,"max":35,"avg":21,
"name":"col3","min":4,"max":56,"avg":34]' json
)

select max(case when x.name = 'col1' then x.min end) min_col1,
       max(case when x.name = 'col3' then x.avg end) avg_col3
from mydata
CROSS JOIN
    UNNEST(
            CAST(
                JSON_EXTRACT(json,'$.data')
                    as ARRAY(ROW(name VARCHAR, min INTEGER, max INTEGER, avg INTEGER))
                 )
          ) as x(name, min, max, avg) --column aliases

结果:

min_col1    avg_col3
0           34

【讨论】:

以上是关于从 Presto 中的 JSON 数组中提取值的主要内容,如果未能解决你的问题,请参考以下文章