正则表达式选择多个字段

regex selecting multiple field

从下面的示例模式中,我想 select 行中的前 3 个条目。

说:

  1. 时间戳
  2. 主机名
  3. 主机名后的第一个词

示例模式:

2017-04-24T09:20:01.687387+00:00 aabvabcw74.def.co.uk hostd-probe: lacp: DEBUG]:147, Recv signal 15, LACP service is about to stop

2017-04-24T09:20:01.687387+00:00 aacdefabcw74.def.co.uk hostd-probe: lacp: DEBUG]:147, Recv signal 15, LACP service is about to stop

我使用了以下正则表达式,它运行良好。

REGEX 1 - ^(?:[^\s]\s){1}([^\s]) - select 时间戳和主机名。 正则表达式 2 - ^(?:[^\s]*\s){2}([^\s]\w+) - select 主机名后的单词。

2017-04-24T09:20:01.687387+00:00 hostd probing is done Fdm: sslThumbprint>95:43:64:71:A3:60:D8:17:C8:6F:68:83:92:CE:E4:3B:53:4E:1D:AD10.199.6.5a2:0e:09:01:0a:00a2:0e:09:01:0b:01/vmfs/volumes/b01f388c-aaa4889f/vmfs/volumes/6ad2d8d7-86746df14435.5.03568722host-619286aabvabcs16.def.co.uk

但是上面的日志产生了问题,因为它不是标准的系统日志格式,它选择了 "hostd" 作为主机名。

我想要正则表达式,它需要 select 日志,其中时间戳作为第一个条目,主机名作为第二个条目(它总是以 with.def.co.uk 结尾),如果它同时满足 with.def.co.uk,那么 select第三条.

我怎样才能做到这一点?

^(\S+[^\s])\s(\w+\.def.co.uk)\s(.+?)\s Demo

细分:

  1. (\S+[^\s])\s 抓取日期和时间戳,并省略后面的 space
  2. (\w+\.def.co.uk)\s 仅当它包含 something.def.co.uk 时才捕获,并再次将 space 排除在外
  3. (.+)? 非贪婪地捕获第一个单词(假设 word 表示中间没有 space

编辑:

除非你也希望日期和时间在自己的捕获组中,那么它应该是like this:

^(\S+)(T\S+)\s(\w+\.def.co.uk)\s(.+?)\s

希望对您有所帮助!