Apache 正则表达式 -301 重定向以消除 url 路径中的重复项

Apache regex -301 redirects to eradicate duplicates in url path

我们使用的 CMS 生成 URL 格式 www.domain.com/home/help/contact/contact。这里第一次出现的联系人是目录,第二次出现的是 HTML 页面本身。这些 url 导致 SEO space.

出现问题

我们已经实施了规范标签,但企业希望确保他们不会在搜索引擎和 Google 分析中遇到这些重复项,并要求我们在我们的网络上实施 301 解决方案服务器。

我的问题是我们有一个正则表达式来查找这些匹配,但我还需要匹配前的 URL 部分。我们的正则表达式是 .*?([\w]+)\/+ 而这个 returns contact/home/help/contact/contact 中。我怎样才能获得 /home/help/ 路径,以便我可以重定向到正确的页面?有人可以帮忙吗,因为我是正则表达式的初学者?

由于您可以使用匹配组获得 contact,因此也请将之前的所有内容包含在匹配组中:

(.*?)(/[\w]+)+

我也将 / 放入匹配组中,这样您就不会得到

的误报
    /home/some/app/page
this would be  ^ ^ found repetition (character p would be matched)