preg_match_all 'OR' 运算符

preg_match_all 'OR' operator

我无法从字符串中获取 'today' 值。模式是获取放在双花括号内的字符串和放在双花括号外的字符串。

我只得到 'inside' 个值。模式是:

/({{(?P<inside>[^}{]+)}}|}}(?P<outside>[^}{]+){{)/

字符串是

{{Friday}}today{{Sunday}}

php代码是:

$returnValue = preg_match_all('/({{(?P<inside>[^}{]+)}}|}}(?P<outside>[^}{]+){{)/', '{{Friday}}today{{Sunday}}', $matches);

这个 returns 只有那个:

    array (
  0 => 
  array (
    0 => '{{Friday}}',
    1 => '{{Sunday}}',
  ),
  1 => 
  array (
    0 => '{{Friday}}',
    1 => '{{Sunday}}',
  ),
  'inside' => 
  array (
    0 => 'Friday',
    1 => 'Sunday',
  ),
  2 => 
  array (
    0 => 'Friday',
    1 => 'Sunday',
  ),
  'outside' => 
  array (
    0 => '',
    1 => '',
  ),
  3 => 
  array (
    0 => '',
    1 => '',
  ),
)

上面的数组中没有关于'today'的内容。

有趣的是,当模式的各个部分相互替换时,结果中既没有 'Sunday' 也没有 'Suterday' 值,但是 'today'.

看来只考虑模式的第一部分。

获取所有值的模式是什么? 谢谢。

已编辑:

1. 感谢真正伟大的答案。但我必须稍微扩展一下这个问题。我测试了你的所有命题,它们对字符串

很有用
    {{Friday}}today{{Sunday}}

但它们不适用于这样的字符串:

    {{Friday}}t{od{a}y{{Sunday}}

结果中应该是这样的值

t{od{a}y

因为只有双花括号应该是定界符。

我试图使你的伟大模式适应那个要求,但没有成功。子字符串 '}}' 和 '{{' 应该取反。不仅是单个'{'或'}'。

如何获取?

2. 另一个不那么重要的问题是 'inner' 和 'outer' 结果数组不应该有空字符串。在图片上看到我的意思: enter image description here

(?<=\{\{)(?<inside>[^\}\{ $]+)|(?<=\}\})(?<outside>[^\{\} $]+)

DEMO

如果这对你有用,请告诉我。

我做到了。空字符串的问题仍然存在。单大括号没有问题。

(?<={{)(?P<THINGS>((?<!}}).)+)(?=}})|((?<=}})(?P<AREA>((?<!{{).)+)(?={{))|(?P<AREA2>^((?<!{{).)+)(?={{)|(?<=}})(?P<AREA3>((.)+$))

Debuggex Demo

结果数组:

array (
  0 => 
  array (
    0 => 'Fo{rest',
    1 => 'Go{l}d',
    2 => 'Beach',
    3 => 'Monay',
    4 => 'Grass',
    5 => 'Diamond',
    6 => 'S{ea',
  ),
  'THINGS' => 
  array (
    0 => '',
    1 => 'Go{l}d',
    2 => '',
    3 => 'Monay',
    4 => '',
    5 => 'Diamond',
    6 => '',
  ),
  1 => 
  array (
    0 => '',
    1 => 'Go{l}d',
    2 => '',
    3 => 'Monay',
    4 => '',
    5 => 'Diamond',
    6 => '',
  ),
  2 => 
  array (
    0 => '',
    1 => 'd',
    2 => '',
    3 => 'y',
    4 => '',
    5 => 'd',
    6 => '',
  ),
  3 => 
  array (
    0 => '',
    1 => '',
    2 => 'Beach',
    3 => '',
    4 => 'Grass',
    5 => '',
    6 => '',
  ),
  'AREA' => 
  array (
    0 => '',
    1 => '',
    2 => 'Beach',
    3 => '',
    4 => 'Grass',
    5 => '',
    6 => '',
  ),
  4 => 
  array (
    0 => '',
    1 => '',
    2 => 'Beach',
    3 => '',
    4 => 'Grass',
    5 => '',
    6 => '',
  ),
  5 => 
  array (
    0 => '',
    1 => '',
    2 => 'h',
    3 => '',
    4 => 's',
    5 => '',
    6 => '',
  ),
  'AREA2' => 
  array (
    0 => 'Fo{rest',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => '',
  ),
  6 => 
  array (
    0 => 'Fo{rest',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => '',
  ),
  7 => 
  array (
    0 => 't',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => '',
  ),
  'AREA3' => 
  array (
    0 => '',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => 'S{ea',
  ),
  8 => 
  array (
    0 => '',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => 'S{ea',
  ),
  9 => 
  array (
    0 => '',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => 'S{ea',
  ),
  10 => 
  array (
    0 => '',
    1 => '',
    2 => '',
    3 => '',
    4 => '',
    5 => '',
    6 => 'a',
  ),
)

php代码:

$returnValue = preg_match_all('/(?<={{)(?P<THINGS>((?<!}}).)+)(?=}})|((?<=}})(?P<AREA>((?<!{{).)+)(?={{))|(?P<AREA2>^((?<!{{).)+)(?={{)|(?<=}})(?P<AREA3>((.)+$))/', 'Fo{rest{{Go{l}d}}Beach{{Monay}}Grass{{Diamond}}S{ea', $matches);

这里是my solution:

$re = "/{{(?<inner>.*?)}}|(?<outer>[^{}]*(?:{(?!{)[^{}]*|}(?!})[^{}]*)*)/"; 
$str = "{{Friday}}today{{Sunday}}"; 
preg_match_all($re, $str, $matches);
print_r(array_filter($matches["outer"]));
print_r(array_filter($matches["inner"]));

为什么看起来这么复杂?

正则表达式包含2种选择,一种是将{{}}内的所有子串捕获到"inner"组中,而"outer"组捕获除{{}} 内的那些。让我解释一下这些模式:

第 1 部分:
{{(?<inner>.*?)}}
这会查找并使用 {{ 子字符串,后跟除换行符以外的零个或多个字符(在正则表达式末尾使用 /s dotall 修饰符也匹配换行符),零次或多次出现(使用 .+? 以匹配一个或多个),尽可能少(意味着我们在第一个 }} 处停止)。然后,匹配}}

第 2 部分:
(?<outer>[^{}]*(?:{(?!{)[^{}]*|}(?!})[^{}]*)*)
此子模式等于 (?<outer>(?:(?!{{(?!{)|}}(?!})).)*),但它是此 tempered greedy token 的展开版本(因此比具有 2 个备选方案的缓和贪婪标记更有效)。它只匹配非大括号 [^{}]* (零个或多个)后跟 { 的零个或多个序列(=可选匹配)而不是另一个 {} 不接着是另一个 },然后是零个或多个非大括号。

array_filter 从结果数组中删除空元素。

这里是 regex demo