用于匹配标签最后一次出现的正则表达式

RegEx for matching the last occurrence of a tag

我正在尝试从下面的 HTML 代码中提取联系人 link。我已经试过了,但似乎没有用:

\"([^\"]*)\"(.*?)?\>(Kontakt)

和部分 HTML-代码:

<li id="cc-nav-view-2315645627" class="jmd-nav__list-item-0">
    <a href="/" data-link-title="Start" class="cc-nav-current j-nav-current jmd-nav__link--current">Start</a>
</li>
<li id="cc-nav-view-2315645625" class="jmd-nav__list-item-0">
    <a href="/öffnungszeiten-schließzeiten/" data-link-title="Öffnungszeiten &amp; Schließzeiten">Öffnungszeiten &amp; Schließzeiten</a>
</li>
<li id="cc-nav-view-2316315025" class="jmd-nav__list-item-0">
   <a href="/flyer/" data-link-title="Flyer">Flyer</a>
</li>
<li id="cc-nav-view-2315732425" class="jmd-nav__list-item-0">
    <a href="/anfahrt/" data-link-title="Anfahrt">Anfahrt</a></li>
<li id="cc-nav-view-2315645825" class="jmd-nav__list-item-0">
    <a href="/kontakt-termin-verbeinaren/" data-link-title="Kontakt / Termin verbeinaren">Kontakt / Termin verbeinaren</a>
</li>

我需要获取联系人 link 的最后 a href 次出现,但正则表达式 returns 完整字符串。

检查此 link

This expression 可能会帮助您设计一个想要的:

(.*)(<a href=")([A-z0-9-\/]+)(".*)

它从开始使用 (.*) 滑动到最后一个 href,然后您可以添加您希望捕获该目标的任何边界 URL。

图表

这张图显示了它是如何工作的:

我不太确定,如果您只想要 URL 或整个标签。如果你想得到整个标签,那么表达式可以简单地修改为 similar to:

(.*)((<a href=")(.*)(\<\/a\>))