通过正则表达式 logql 提取 loki ingress-nginx 标签
Posted
技术标签:
【中文标题】通过正则表达式 logql 提取 loki ingress-nginx 标签【英文标题】:loki ingress-nginx label extraction via regexp logql 【发布时间】:2021-10-27 01:04:28 【问题描述】:namespace="ingress-nginx" |= "gymauto-frontend" |~ "GET (/main)" | json
我收到了这些条目
现在我需要从“日志”标签中提取请求的持续时间,但我不确定如何构建 logql 查询,所以我可以做这样的事情
namespace="ingress-nginx" |= "gymauto-frontend" |~ "GET (/main)" | json | ...regexp () | duration > 10s
所以我只能过滤超过 10 秒的查询 GET /main*。
日志示例:
10.110.1.132 - - [27/Aug/2021:02:37:06 +0000] "GET /main.d8e010115d6aba1bd049.js.map HTTP/2.0" 200 10842370 "https://gym.com/students/edit/173" "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (Khtml, like Gecko) Version/14.1.1 Safari/605.1.15" 34 20.031 [gymauto-gymauto-frontend-service-v1-8080] [] 10.110.5.217:8080 10842370 20.035 200 a7c4299aaa7ea674e91d13315
【问题讨论】:
【参考方案1】:如果您可以使用 Loki v2.3,您应该可以使用 newly introduced pattern
解析器表达式。
使用它而不是旧的regexp
解析器会更容易。在您的示例中,模式如下:
<_> - - <_> "<method> <path> <_>" <status> <_> "<_>" "<_>" <_> <duration> [<service>] [<_>] <_> <_> <_> <_> <_>
应该可以。在这种情况下,我们从日志中提取我们想要使用的部分:method
、path
、service
、duration
等。用于过滤GET
请求到/main.*
的查询gymauto-frontend
服务上的路径可能如下所示:
namespace="ingress-nginx"
| pattern `<_> - - <_> "<method> <path> <_>" <status> <_> "<_>" "<_>" <_> <duration> [<service>] [<_>] <_> <_> <_> <_> <_>`
如果您检查(在 Grafana 中)提取的日志字段,您应该会看到如下内容:
您可以注意到,只有命名字段被提取,日志行的其余部分被忽略。现在我们可以过滤您感兴趣的特定条目:
namespace="ingress-nginx"
| pattern `<_> - - <_> "<method> <path> <_>" <status> <_> "<_>" "<_>" <_> <duration> [<service>] [<_>] <_> <_> <_> <_> <_>`
| service=~".*gymauto-frontend.*"
| method="GET"
| path=~"/main.*"
| duration > 10
如果您使用的是旧版本的 Loki,则需要将 pattern
解析器表达式替换为 regexp
,并定义一个与您的日志条目匹配的正则表达式。
【讨论】:
以上是关于通过正则表达式 logql 提取 loki ingress-nginx 标签的主要内容,如果未能解决你的问题,请参考以下文章
如何在 Grafana 上使用 LogQL 将 Loki 解析的字段绘制为数值?