preg_match_all 'OR' 运算符
preg_match_all 'OR' operator
我无法从字符串中获取 'today' 值。模式是获取放在双花括号内的字符串和放在双花括号外的字符串。
我只得到 'inside' 个值。模式是:
/({{(?P<inside>[^}{]+)}}|}}(?P<outside>[^}{]+){{)/
字符串是
{{Friday}}today{{Sunday}}
php代码是:
$returnValue = preg_match_all('/({{(?P<inside>[^}{]+)}}|}}(?P<outside>[^}{]+){{)/', '{{Friday}}today{{Sunday}}', $matches);
这个 returns 只有那个:
array (
0 =>
array (
0 => '{{Friday}}',
1 => '{{Sunday}}',
),
1 =>
array (
0 => '{{Friday}}',
1 => '{{Sunday}}',
),
'inside' =>
array (
0 => 'Friday',
1 => 'Sunday',
),
2 =>
array (
0 => 'Friday',
1 => 'Sunday',
),
'outside' =>
array (
0 => '',
1 => '',
),
3 =>
array (
0 => '',
1 => '',
),
)
上面的数组中没有关于'today'的内容。
有趣的是,当模式的各个部分相互替换时,结果中既没有 'Sunday' 也没有 'Suterday' 值,但是 'today'.
看来只考虑模式的第一部分。
获取所有值的模式是什么?
谢谢。
已编辑:
1.
感谢真正伟大的答案。但我必须稍微扩展一下这个问题。我测试了你的所有命题,它们对字符串
很有用
{{Friday}}today{{Sunday}}
但它们不适用于这样的字符串:
{{Friday}}t{od{a}y{{Sunday}}
结果中应该是这样的值
t{od{a}y
因为只有双花括号应该是定界符。
我试图使你的伟大模式适应那个要求,但没有成功。子字符串 '}}' 和 '{{' 应该取反。不仅是单个'{'或'}'。
如何获取?
2.
另一个不那么重要的问题是 'inner' 和 'outer' 结果数组不应该有空字符串。在图片上看到我的意思:
enter image description here
(?<=\{\{)(?<inside>[^\}\{ $]+)|(?<=\}\})(?<outside>[^\{\} $]+)
如果这对你有用,请告诉我。
我做到了。空字符串的问题仍然存在。单大括号没有问题。
(?<={{)(?P<THINGS>((?<!}}).)+)(?=}})|((?<=}})(?P<AREA>((?<!{{).)+)(?={{))|(?P<AREA2>^((?<!{{).)+)(?={{)|(?<=}})(?P<AREA3>((.)+$))
结果数组:
array (
0 =>
array (
0 => 'Fo{rest',
1 => 'Go{l}d',
2 => 'Beach',
3 => 'Monay',
4 => 'Grass',
5 => 'Diamond',
6 => 'S{ea',
),
'THINGS' =>
array (
0 => '',
1 => 'Go{l}d',
2 => '',
3 => 'Monay',
4 => '',
5 => 'Diamond',
6 => '',
),
1 =>
array (
0 => '',
1 => 'Go{l}d',
2 => '',
3 => 'Monay',
4 => '',
5 => 'Diamond',
6 => '',
),
2 =>
array (
0 => '',
1 => 'd',
2 => '',
3 => 'y',
4 => '',
5 => 'd',
6 => '',
),
3 =>
array (
0 => '',
1 => '',
2 => 'Beach',
3 => '',
4 => 'Grass',
5 => '',
6 => '',
),
'AREA' =>
array (
0 => '',
1 => '',
2 => 'Beach',
3 => '',
4 => 'Grass',
5 => '',
6 => '',
),
4 =>
array (
0 => '',
1 => '',
2 => 'Beach',
3 => '',
4 => 'Grass',
5 => '',
6 => '',
),
5 =>
array (
0 => '',
1 => '',
2 => 'h',
3 => '',
4 => 's',
5 => '',
6 => '',
),
'AREA2' =>
array (
0 => 'Fo{rest',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => '',
),
6 =>
array (
0 => 'Fo{rest',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => '',
),
7 =>
array (
0 => 't',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => '',
),
'AREA3' =>
array (
0 => '',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => 'S{ea',
),
8 =>
array (
0 => '',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => 'S{ea',
),
9 =>
array (
0 => '',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => 'S{ea',
),
10 =>
array (
0 => '',
1 => '',
2 => '',
3 => '',
4 => '',
5 => '',
6 => 'a',
),
)
php代码:
$returnValue = preg_match_all('/(?<={{)(?P<THINGS>((?<!}}).)+)(?=}})|((?<=}})(?P<AREA>((?<!{{).)+)(?={{))|(?P<AREA2>^((?<!{{).)+)(?={{)|(?<=}})(?P<AREA3>((.)+$))/', 'Fo{rest{{Go{l}d}}Beach{{Monay}}Grass{{Diamond}}S{ea', $matches);
这里是my solution:
$re = "/{{(?<inner>.*?)}}|(?<outer>[^{}]*(?:{(?!{)[^{}]*|}(?!})[^{}]*)*)/";
$str = "{{Friday}}today{{Sunday}}";
preg_match_all($re, $str, $matches);
print_r(array_filter($matches["outer"]));
print_r(array_filter($matches["inner"]));
为什么看起来这么复杂?
正则表达式包含2种选择,一种是将{{
和}}
内的所有子串捕获到"inner"组中,而"outer"组捕获除{{
和 }}
内的那些。让我解释一下这些模式:
第 1 部分:
{{(?<inner>.*?)}}
这会查找并使用 {{
子字符串,后跟除换行符以外的零个或多个字符(在正则表达式末尾使用 /s
dotall 修饰符也匹配换行符),零次或多次出现(使用 .+?
以匹配一个或多个),尽可能少(意味着我们在第一个 }}
处停止)。然后,匹配}}
。
第 2 部分:
(?<outer>[^{}]*(?:{(?!{)[^{}]*|}(?!})[^{}]*)*)
此子模式等于 (?<outer>(?:(?!{{(?!{)|}}(?!})).)*)
,但它是此 tempered greedy token 的展开版本(因此比具有 2 个备选方案的缓和贪婪标记更有效)。它只匹配非大括号 [^{}]*
(零个或多个)后跟 {
的零个或多个序列(=可选匹配)而不是另一个 {
或 }
不接着是另一个 }
,然后是零个或多个非大括号。
array_filter
从结果数组中删除空元素。
这里是 regex demo
我无法从字符串中获取 'today' 值。模式是获取放在双花括号内的字符串和放在双花括号外的字符串。
我只得到 'inside' 个值。模式是:
/({{(?P<inside>[^}{]+)}}|}}(?P<outside>[^}{]+){{)/
字符串是
{{Friday}}today{{Sunday}}
php代码是:
$returnValue = preg_match_all('/({{(?P<inside>[^}{]+)}}|}}(?P<outside>[^}{]+){{)/', '{{Friday}}today{{Sunday}}', $matches);
这个 returns 只有那个:
array (
0 =>
array (
0 => '{{Friday}}',
1 => '{{Sunday}}',
),
1 =>
array (
0 => '{{Friday}}',
1 => '{{Sunday}}',
),
'inside' =>
array (
0 => 'Friday',
1 => 'Sunday',
),
2 =>
array (
0 => 'Friday',
1 => 'Sunday',
),
'outside' =>
array (
0 => '',
1 => '',
),
3 =>
array (
0 => '',
1 => '',
),
)
上面的数组中没有关于'today'的内容。
有趣的是,当模式的各个部分相互替换时,结果中既没有 'Sunday' 也没有 'Suterday' 值,但是 'today'.
看来只考虑模式的第一部分。
获取所有值的模式是什么? 谢谢。
已编辑:
1. 感谢真正伟大的答案。但我必须稍微扩展一下这个问题。我测试了你的所有命题,它们对字符串
很有用 {{Friday}}today{{Sunday}}
但它们不适用于这样的字符串:
{{Friday}}t{od{a}y{{Sunday}}
结果中应该是这样的值
t{od{a}y
因为只有双花括号应该是定界符。
我试图使你的伟大模式适应那个要求,但没有成功。子字符串 '}}' 和 '{{' 应该取反。不仅是单个'{'或'}'。
如何获取?
2. 另一个不那么重要的问题是 'inner' 和 'outer' 结果数组不应该有空字符串。在图片上看到我的意思: enter image description here
(?<=\{\{)(?<inside>[^\}\{ $]+)|(?<=\}\})(?<outside>[^\{\} $]+)
如果这对你有用,请告诉我。
我做到了。空字符串的问题仍然存在。单大括号没有问题。
(?<={{)(?P<THINGS>((?<!}}).)+)(?=}})|((?<=}})(?P<AREA>((?<!{{).)+)(?={{))|(?P<AREA2>^((?<!{{).)+)(?={{)|(?<=}})(?P<AREA3>((.)+$))
结果数组:
array ( 0 => array ( 0 => 'Fo{rest', 1 => 'Go{l}d', 2 => 'Beach', 3 => 'Monay', 4 => 'Grass', 5 => 'Diamond', 6 => 'S{ea', ), 'THINGS' => array ( 0 => '', 1 => 'Go{l}d', 2 => '', 3 => 'Monay', 4 => '', 5 => 'Diamond', 6 => '', ), 1 => array ( 0 => '', 1 => 'Go{l}d', 2 => '', 3 => 'Monay', 4 => '', 5 => 'Diamond', 6 => '', ), 2 => array ( 0 => '', 1 => 'd', 2 => '', 3 => 'y', 4 => '', 5 => 'd', 6 => '', ), 3 => array ( 0 => '', 1 => '', 2 => 'Beach', 3 => '', 4 => 'Grass', 5 => '', 6 => '', ), 'AREA' => array ( 0 => '', 1 => '', 2 => 'Beach', 3 => '', 4 => 'Grass', 5 => '', 6 => '', ), 4 => array ( 0 => '', 1 => '', 2 => 'Beach', 3 => '', 4 => 'Grass', 5 => '', 6 => '', ), 5 => array ( 0 => '', 1 => '', 2 => 'h', 3 => '', 4 => 's', 5 => '', 6 => '', ), 'AREA2' => array ( 0 => 'Fo{rest', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => '', ), 6 => array ( 0 => 'Fo{rest', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => '', ), 7 => array ( 0 => 't', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => '', ), 'AREA3' => array ( 0 => '', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => 'S{ea', ), 8 => array ( 0 => '', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => 'S{ea', ), 9 => array ( 0 => '', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => 'S{ea', ), 10 => array ( 0 => '', 1 => '', 2 => '', 3 => '', 4 => '', 5 => '', 6 => 'a', ), )
php代码:
$returnValue = preg_match_all('/(?<={{)(?P<THINGS>((?<!}}).)+)(?=}})|((?<=}})(?P<AREA>((?<!{{).)+)(?={{))|(?P<AREA2>^((?<!{{).)+)(?={{)|(?<=}})(?P<AREA3>((.)+$))/', 'Fo{rest{{Go{l}d}}Beach{{Monay}}Grass{{Diamond}}S{ea', $matches);
这里是my solution:
$re = "/{{(?<inner>.*?)}}|(?<outer>[^{}]*(?:{(?!{)[^{}]*|}(?!})[^{}]*)*)/";
$str = "{{Friday}}today{{Sunday}}";
preg_match_all($re, $str, $matches);
print_r(array_filter($matches["outer"]));
print_r(array_filter($matches["inner"]));
为什么看起来这么复杂?
正则表达式包含2种选择,一种是将{{
和}}
内的所有子串捕获到"inner"组中,而"outer"组捕获除{{
和 }}
内的那些。让我解释一下这些模式:
第 1 部分:
{{(?<inner>.*?)}}
这会查找并使用 {{
子字符串,后跟除换行符以外的零个或多个字符(在正则表达式末尾使用 /s
dotall 修饰符也匹配换行符),零次或多次出现(使用 .+?
以匹配一个或多个),尽可能少(意味着我们在第一个 }}
处停止)。然后,匹配}}
。
第 2 部分:
(?<outer>[^{}]*(?:{(?!{)[^{}]*|}(?!})[^{}]*)*)
此子模式等于 (?<outer>(?:(?!{{(?!{)|}}(?!})).)*)
,但它是此 tempered greedy token 的展开版本(因此比具有 2 个备选方案的缓和贪婪标记更有效)。它只匹配非大括号 [^{}]*
(零个或多个)后跟 {
的零个或多个序列(=可选匹配)而不是另一个 {
或 }
不接着是另一个 }
,然后是零个或多个非大括号。
array_filter
从结果数组中删除空元素。
这里是 regex demo