Fluentd 日志源格式 RegEX

Posted 2023-02-15

技术标签:

【中文标题】Fluentd 日志源格式 RegEX【英文标题】：Fluentd log source format RegEX 【发布时间】：2015-04-28 02:57:15 【问题描述】：

我有这种格式的日志：

2015-02-25 18:33:06,975 INFO c.a.p.c.b.s.Monitor akka://application/user/daemons/monitor : 91 active threads, 4175691776 bytes used

我想出了这个正则表达式：

(?<time>[^ ]* [^ ]*) (?<method>[^ ]*) (?<path>[^ ]*) (?<message>[^ ].*$)

当我在Fluentular 中测试时（我将使用它作为 fluentd 日志输入的格式）我明白了字段：

time  =>    2015/02/25 18:33:06 +0000
method  =>    INFO
PATH    =>  <empty>
message => c.a.p.c.b.s.Monitor akka://application/user/daemons/monitor : 91 active threads, 4175691776 bytes used

我无法破坏消息字符串。我希望匹配的组是：

time  =>    2015/02/25 18:33:06 +0000
method  =>    INFO
PATH  =>    c.a.p.c.b.s.Monitor
message =>    akka://application/user/daemons/monitor : 91 active threads, 4175691776 bytes used

什么是正确的正则表达式

【问题讨论】：

【参考方案1】：

问题是您的输入字符串中INFO 和c.a.p.c.b.s.Monitor 之间有两个空格。添加+ 以允许在该位置有一个或多个空格，您会得到：

(?<time>[^ ]* [^ ]*) (?<method>[^ ]*) +(?<path>[^ ]*) (?<message>[^ ].*$)

您可能希望也可能不希望将这些添加到其余组件中，例如：

(?<time>[^ ]* [^ ]*) +(?<method>[^ ]*) +(?<path>[^ ]*) +(?<message>[^ ].*$)

【讨论】：

以上是关于Fluentd 日志源格式 RegEX的主要内容，如果未能解决你的问题，请参考以下文章