使用正则表达式从邮件中提取句子

Extract a sentence from mail with Regex

我需要用 Regex 提取一个没有标签 <br> 的句子,但这给我带来了问题。

 (?<=Status:) (.*)[^<br>]

状态:i3 Naviera表示容器已经发布<br>

这句话来自邮件

 "<html>\r\n<head>\r\n<meta http-equiv=\"Content-Type\"
 content=\"text/html; charset=utf-8\">\r\n</head>\r\n<body>\r\nStatus:
 i3 Naviera indicates that the container is already
 released<br>\r\nObservations:  data requested.<br>\r\n<br>\r\n<img
 src=\"http://test/logo/Logo2.png\">\r\n</body>\r\n</html>\r\n"

我只需要提取:

i3 Naviera 表示容器已经发布

此正则表达式适用于您的内容:

(?<=Status: )(.*?)(?=<br>)

匹配 Status: 和 space,并在第一个 <br> 处停止,不将其包含在匹配中。

请注意,使用正则表达式进行html解析需要html内容变化不大。