如何使用jq根据内部数组中的值过滤对象数组?

Posted

技术标签:

【中文标题】如何使用jq根据内部数组中的值过滤对象数组?【英文标题】:How to filter an array of objects based on values in an inner array with jq? 【发布时间】:2014-12-29 08:37:32 【问题描述】:

鉴于此输入:

[
  
    "Id": "cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b",
    "Names": [
      "condescending_jones",
      "loving_hoover"
    ]
  ,
  
    "Id": "186db739b7509eb0114a09e14bcd16bf637019860d23c4fc20e98cbe068b55aa",
    "Names": [
      "foo_data"
    ]
  ,
  
    "Id": "a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19",
    "Names": [
      "jovial_wozniak"
    ]
  ,
  
    "Id": "76b71c496556912012c20dc3cbd37a54a1f05bffad3d5e92466900a003fbb623",
    "Names": [
      "bar_data"
    ]
  
]

我正在尝试使用jq 构造一个过滤器,它返回所有带有Ids 且在内部Names 数组中包含“数据”的对象,输出为换行符分隔。对于以上数据,我想要的输出是:

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19

我想我有点接近这个:

(. - select(.Names[] contains("data"))) | .[] .Id

select 过滤器不正确,无法编译(获取error: syntax error, unexpected IDENT)。

【问题讨论】:

【参考方案1】:

非常接近!在您的 select 表达式中,您必须在 contains 之前使用管道 (|)。

这个过滤器产生预期的输出。

. - map(select(.Names[] | contains ("data"))) | .[] .Id

jq Cookbook 有一个语法示例。

根据键的内容过滤对象

例如,我只想要类型键包含“house”的对象。

$ json='["genre":"deep house", "genre": "progressive house", "genre": "dubstep"]'
$ echo "$json" | jq -c '.[] | select(.genre | contains("house"))'
"genre":"deep house"
"genre":"progressive house"

Colin D 询问如何保留数组的 JSON 结构,以便最终输出是单个 JSON 数组而不是 JSON 对象流。

最简单的方法是将整个表达式包装在一个数组构造函数中:

$ echo "$json" | jq -c '[ .[] | select( .genre | contains("house")) ]'
["genre":"deep house","genre":"progressive house"]

你也可以使用地图功能:

$ echo "$json" | jq -c 'map(select(.genre | contains("house")))'
["genre":"deep house","genre":"progressive house"]

map 解包输入数组,将过滤器应用于每个元素,并创建一个新数组。换句话说,map(f) 等价于[.[]|f]

【讨论】:

谢谢,效果很好!我确实看到了那个例子,我只是没能适应我的场景:-) 到底有没有“保留数组的json结构”?我喜欢流派示例,但它输出两个“json 行”。我不一定能弄清楚地图部分 @ColinD 我对reduce 解决方案不是很满意,所以我用map 函数的解释代替了它。这有帮助吗? @IainElder - 当搜索词的一部分(在本例中为 house)是一个变量时会发生什么?所以说使用--args term se。所以 contains("hou$term") @Chris 变量$term 将被视为字符串,因此您应该使用字符串连接:contains("hou" + $term)【参考方案2】:

这是另一个使用any/2的解决方案

map(select(any(.Names[]; contains("data"))|not)|.Id)[]

使用示例数据和它产生的-r 选项:

cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19

【讨论】:

正是我要找的东西 - 为什么这适用于分号 .Names[] ; contains() 而不是管道 .Names[] | contains() 啊,这是any(generator; condition) 表单。我发现如果不使用any(),如果select() 在同一个对象上多次匹配,我的结果会出现重复。

以上是关于如何使用jq根据内部数组中的值过滤对象数组?的主要内容,如果未能解决你的问题,请参考以下文章

JQ 过滤嵌套对象中的字段

如何根据javascript中的键合并和替换两个数组中的对象?

jq 过滤内部数组元素但返回整个 JSON

Mongoose:如果值存在于对象数组中的数组中,则过滤数据

使用 jq 和 bash 为数组中的每个对象运行命令

如何根据 JavaScript 中的值检查对象是不是在数组中?