如何使用jq根据内部数组中的值过滤对象数组?
Posted
技术标签:
【中文标题】如何使用jq根据内部数组中的值过滤对象数组?【英文标题】:How to filter an array of objects based on values in an inner array with jq? 【发布时间】:2014-12-29 08:37:32 【问题描述】:鉴于此输入:
[
"Id": "cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b",
"Names": [
"condescending_jones",
"loving_hoover"
]
,
"Id": "186db739b7509eb0114a09e14bcd16bf637019860d23c4fc20e98cbe068b55aa",
"Names": [
"foo_data"
]
,
"Id": "a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19",
"Names": [
"jovial_wozniak"
]
,
"Id": "76b71c496556912012c20dc3cbd37a54a1f05bffad3d5e92466900a003fbb623",
"Names": [
"bar_data"
]
]
我正在尝试使用jq 构造一个过滤器,它返回所有带有Id
s 且不在内部Names
数组中包含“数据”的对象,输出为换行符分隔。对于以上数据,我想要的输出是:
cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19
我想我有点接近这个:
(. - select(.Names[] contains("data"))) | .[] .Id
但select
过滤器不正确,无法编译(获取error: syntax error, unexpected IDENT
)。
【问题讨论】:
【参考方案1】:非常接近!在您的 select
表达式中,您必须在 contains
之前使用管道 (|
)。
这个过滤器产生预期的输出。
. - map(select(.Names[] | contains ("data"))) | .[] .Id
jq Cookbook 有一个语法示例。
根据键的内容过滤对象
例如,我只想要类型键包含“house”的对象。
$ json='["genre":"deep house", "genre": "progressive house", "genre": "dubstep"]' $ echo "$json" | jq -c '.[] | select(.genre | contains("house"))' "genre":"deep house" "genre":"progressive house"
Colin D 询问如何保留数组的 JSON 结构,以便最终输出是单个 JSON 数组而不是 JSON 对象流。
最简单的方法是将整个表达式包装在一个数组构造函数中:
$ echo "$json" | jq -c '[ .[] | select( .genre | contains("house")) ]'
["genre":"deep house","genre":"progressive house"]
你也可以使用地图功能:
$ echo "$json" | jq -c 'map(select(.genre | contains("house")))'
["genre":"deep house","genre":"progressive house"]
map 解包输入数组,将过滤器应用于每个元素,并创建一个新数组。换句话说,map(f)
等价于[.[]|f]
。
【讨论】:
谢谢,效果很好!我确实看到了那个例子,我只是没能适应我的场景:-) 到底有没有“保留数组的json结构”?我喜欢流派示例,但它输出两个“json 行”。我不一定能弄清楚地图部分 @ColinD 我对reduce 解决方案不是很满意,所以我用map 函数的解释代替了它。这有帮助吗? @IainElder - 当搜索词的一部分(在本例中为 house)是一个变量时会发生什么?所以说使用--args term se。所以 contains("hou$term") @Chris 变量$term
将被视为字符串,因此您应该使用字符串连接:contains("hou" + $term)
【参考方案2】:
这是另一个使用any/2的解决方案
map(select(any(.Names[]; contains("data"))|not)|.Id)[]
使用示例数据和它产生的-r
选项:
cb94e7a42732b598ad18a8f27454a886c1aa8bbba6167646d8f064cd86191e2b
a4b7e6f5752d8dcb906a5901f7ab82e403b9dff4eaaeebea767a04bac4aada19
【讨论】:
正是我要找的东西 - 为什么这适用于分号.Names[] ; contains()
而不是管道 .Names[] | contains()
?
啊,这是any(generator; condition)
表单。我发现如果不使用any()
,如果select()
在同一个对象上多次匹配,我的结果会出现重复。以上是关于如何使用jq根据内部数组中的值过滤对象数组?的主要内容,如果未能解决你的问题,请参考以下文章
如何根据javascript中的键合并和替换两个数组中的对象?