通过正则表达式 logql 提取 loki ingress-nginx 标签

Posted

技术标签:

【中文标题】通过正则表达式 logql 提取 loki ingress-nginx 标签【英文标题】:loki ingress-nginx label extraction via regexp logql 【发布时间】:2021-10-27 01:04:28 【问题描述】:
namespace="ingress-nginx" |= "gymauto-frontend" |~ "GET (/main)" | json 

我收到了这些条目

现在我需要从“日志”标签中提取请求的持续时间,但我不确定如何构建 logql 查询,所以我可以做这样的事情

namespace="ingress-nginx" |= "gymauto-frontend" |~ "GET (/main)" | json | ...regexp () | duration > 10s

所以我只能过滤超过 10 秒的查询 GET /main*。

日志示例:

10.110.1.132 - - [27/Aug/2021:02:37:06 +0000] "GET /main.d8e010115d6aba1bd049.js.map HTTP/2.0" 200 10842370 "https://gym.com/students/edit/173" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (Khtml, like Gecko) Version/14.1.1 Safari/605.1.15" 34 20.031 [gymauto-gymauto-frontend-service-v1-8080] [] 10.110.5.217:8080 10842370 20.035 200 a7c4299aaa7ea674e91d13315

【问题讨论】:

【参考方案1】:

如果您可以使用 Loki v2.3,您应该可以使用 newly introduced pattern 解析器表达式。

使用它而不是旧的regexp 解析器会更容易。在您的示例中,模式如下:

<_> - - <_> "<method> <path> <_>" <status> <_> "<_>" "<_>" <_> <duration> [<service>] [<_>] <_> <_> <_> <_> <_>

应该可以。在这种情况下,我们从日志中提取我们想要使用的部分:methodpathserviceduration 等。用于过滤GET 请求到/main.* 的查询gymauto-frontend 服务上的路径可能如下所示:

namespace="ingress-nginx" 
| pattern `<_> - - <_> "<method> <path> <_>" <status> <_> "<_>" "<_>" <_> <duration> [<service>] [<_>] <_> <_> <_> <_> <_>` 

如果您检查(在 Grafana 中)提取的日志字段,您应该会看到如下内容:

您可以注意到,只有命名字段被提取,日志行的其余部分被忽略。现在我们可以过滤您感兴趣的特定条目:

namespace="ingress-nginx" 
| pattern `<_> - - <_> "<method> <path> <_>" <status> <_> "<_>" "<_>" <_> <duration> [<service>] [<_>] <_> <_> <_> <_> <_>` 
| service=~".*gymauto-frontend.*"
| method="GET"
| path=~"/main.*" 
| duration > 10

如果您使用的是旧版本的 Loki,则需要将 pattern 解析器表达式替换为 regexp,并定义一个与您的日志条目匹配的正则表达式。

【讨论】:

以上是关于通过正则表达式 logql 提取 loki ingress-nginx 标签的主要内容,如果未能解决你的问题,请参考以下文章

FurionLoki查询之LogQL语句

Grafana Loki LogQL:过滤图例值

如何在 Grafana 上使用 LogQL 将 Loki 解析的字段绘制为数值?

LogQL - label_format 有条件地格式化标签

LogQL 中的正则表达式 JSON 过滤

安全Loki 查询