无法使用 jq 将 JSON 输出转换为 CSV 格式

Posted

技术标签:

【中文标题】无法使用 jq 将 JSON 输出转换为 CSV 格式【英文标题】:Can't put JSON output into CSV format with jq 【发布时间】:2019-05-14 05:56:28 【问题描述】:

我正在构建 AWS EBS 卷属性列表,以便可以使用 jq 将其作为 CSV 存储在变量中。我要将变量输出到电子表格。

第一个命令给出了我使用 jq 寻找的值:

aws ec2 describe-volumes | jq -r '.Volumes[] | .VolumeId, .AvailabilityZone, .Attachments[].InstanceId, .Attachments[].State, (.Tags // [] | from_entries.Name)'

像这样给出我想要的输出:

MIAPRBcdm0002_test_instance
vol-0105a1678373ae440
us-east-1c
i-0403bef9c0f6062e6
attached
MIAPRBcdwb00000_app1_vpc
vol-0d6048ec6b2b6f1a4
us-east-1c
MIAPRBcdwb00001 /carbon
vol-0cfcc6e164d91f42f
us-east-1c
i-0403bef9c0f6062e6
attached

但是,如果我将其转换为 CSV 格式,以便将变量输出到电子表格中,则该命令会崩溃并且不起作用:

aws ec2 describe-volumes | jq -r '.Volumes[] | .VolumeId, .AvailabilityZone, .Attachments[].InstanceId, .Attachments[].State, (.Tags // [] | from_entries.Name)| @csv'
jq: error (at <stdin>:4418): string ("vol-743d1234") cannot be csv-formatted, only array

对于 EBS 卷,即使将 JSON 的顶层转换为 CSV 格式也会失败:

aws ec2 describe-volumes | jq -r '.Volumes[].VolumeId | @csv'
jq: error (at <stdin>:4418): string ("vol-743d1234") cannot be csv-formatted, only array

这是我正在使用的AWS EBS Volumes JSON FILE,使用这些命令(该文件已清除公司标识符,但它是有效的 json)。

如何使用 jq 将此 json 转换为 CSV 格式?

【问题讨论】:

【参考方案1】:

您只能将@csv 应用于数组内容,只需将您的过滤器包含在[..] 中,如下所示

jq -r '[.Volumes[] | .VolumeId, .AvailabilityZone, .Attachments[].InstanceId, .Attachments[].State, (.Tags // [] | from_entries.Name)]|@csv'

使用上述可能仍会保留引号,因此在此处使用join() 也是合适的

jq -r '[.Volumes[] | .VolumeId, .AvailabilityZone, .Attachments[].InstanceId, .Attachments[].State, (.Tags // [] | from_entries.Name)] | join(",")'

【讨论】:

【参考方案2】:

accepted Answer 解决了另一个不起眼的 jq 错误:

字符串 ("xxx") 不能是 csv 格式,只能是数组

在我的情况下,我不想打印 jq 的 整个 输出,而是打印我提供给 jq 的每个 Elastic Search document作为单独一行的 CSV 字符串。为了做到这一点,我只是移动了括号以仅将要包含在每行中的项目括起来

首先,通过仅将括号放在要包含在每行输出中的项目周围,我产生了:

jq -r '.hits.hits[]._source | [.syscheck.path, .syscheck.size_after]'
[
  "/etc/group-",
  "783"
]
[
  "/etc/gshadow-",
  "640"
]
[
  "/etc/group",
  "795"
]
[
  "/etc/gshadow",
  "652"
]
[
  "/etc/ssh/sshd_config",
  "3940"
]

将此传递到| @csv 会在单独的行上打印每个文档的 .syscheck.path 和 .syscheck.size_after 值,并以引号和逗号分隔:

$ jq -r '.hits.hits[]._source | [.syscheck.path, .syscheck.size_after] | @csv'
"/etc/group-","783"
"/etc/gshadow-","640"
"/etc/group","795"
"/etc/gshadow","652"
"/etc/ssh/sshd_config","3940"

或者省略引号,遵循接受的答案中指出的模式:

$ jq -r '.hits.hits[]._source | [.syscheck.path, .syscheck.size_after] | join(",")'
/etc/group-,783
/etc/gshadow-,640
/etc/group,795
/etc/gshadow,652
/etc/ssh/sshd_config,3940

【讨论】:

以上是关于无法使用 jq 将 JSON 输出转换为 CSV 格式的主要内容,如果未能解决你的问题,请参考以下文章

为啥 jq --raw-output 参数无法从 @csv 输出中删除引号?

无法将 .json 文件从 CSV 下载到 JSON 转换并且无法将 JSON 转换为 CSV

AWS CLI / jq - 使用标签转换 JSON,甚至显示未定义标签的信息

使用 python 将 CSV 转换为所需格式的 JSON

csv格式的JQ查询输出

无法使用 Python 将 JSON 文件转换为 CSV