多个正则表达式否定匹配
Multiple RegEx negation matching
我有以下 RegEx 模式:
"[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]"
===> 匹配 8411.T 或 JNID8
"[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]"
==> 匹配 9345.HK 或 HCEIU9-A9
".*\.SI|SFC[A-Z][0-9]"
==> 匹配 8345.SI 或 SFCX8
如何从这些模式的否定中获得正则表达式?
我想匹配不匹配这三种模式的字符串:
例如我想匹配 8411.ABC,但不匹配上述任何字符串(8411.T、HCEIU-A9、8345.SI 等)。
我试过了(例如只是排除了 2 和 3,但它没有 work):
^(?!((.*\.SI|SFC[A-Z][0-9])|([0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9])))
这里的主要思想是将模式放入锚定在字符串开头的 (?!.*<pattern>)
负前瞻 (^
) 中。这里的困难在于你的模式包含未锚定的交替,如果没有分组,模式之前的 .*
将只引用第一个替代(即所有后续替代只会在字符串的开头被否定。
因此,您的模式公式为^(?!.*(?:<PATTERN1>))(?!.*(?:<PATTERN2>))(?!.*(?:<PATTERN3>))
。请注意,如果您只需要获得布尔结果,最后的 .+
或 .*
是可选的。请注意,在最后一个模式中,您需要删除第一个备选方案中的 .*
,使用 .*.*
.
没有任何意义
使用
^(?!.*(?:[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]))(?!.*(?:[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]))(?!.*(?:\.SI|SFC[A-Z][0-9])).+
参见regex demo。
您也可以将公式收缩为^(?!.*(?:<PATTERN1>|<PATTERN2>|<PATTERN3>))
:
^(?!.*(?:[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]|[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]|\.SI|SFC[A-Z][0-9])).+
我有以下 RegEx 模式:
"[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]"
===> 匹配 8411.T 或 JNID8"[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]"
==> 匹配 9345.HK 或 HCEIU9-A9".*\.SI|SFC[A-Z][0-9]"
==> 匹配 8345.SI 或 SFCX8
如何从这些模式的否定中获得正则表达式? 我想匹配不匹配这三种模式的字符串: 例如我想匹配 8411.ABC,但不匹配上述任何字符串(8411.T、HCEIU-A9、8345.SI 等)。
我试过了(例如只是排除了 2 和 3,但它没有 work):
^(?!((.*\.SI|SFC[A-Z][0-9])|([0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9])))
这里的主要思想是将模式放入锚定在字符串开头的 (?!.*<pattern>)
负前瞻 (^
) 中。这里的困难在于你的模式包含未锚定的交替,如果没有分组,模式之前的 .*
将只引用第一个替代(即所有后续替代只会在字符串的开头被否定。
因此,您的模式公式为^(?!.*(?:<PATTERN1>))(?!.*(?:<PATTERN2>))(?!.*(?:<PATTERN3>))
。请注意,如果您只需要获得布尔结果,最后的 .+
或 .*
是可选的。请注意,在最后一个模式中,您需要删除第一个备选方案中的 .*
,使用 .*.*
.
使用
^(?!.*(?:[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]))(?!.*(?:[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]))(?!.*(?:\.SI|SFC[A-Z][0-9])).+
参见regex demo。
您也可以将公式收缩为^(?!.*(?:<PATTERN1>|<PATTERN2>|<PATTERN3>))
:
^(?!.*(?:[0-9]{4,5}\.FU|[0-9]{4,5}\.NG|[0-9]{4,5}\.SP|[0-9]{4,5}\.T|JGB[A-Z][0-9]|JNI[A-Z][0-9]|JN4F[A-Z][0-9]|JNM[A-Z][0-9]|JTI[A-Z][0-9]|JTM[A-Z][0-9]|NIY[A-Z][0-9]|SSI[A-Z][0-9]|JNI[A-Z][0-9]-[A-Z][0-9]|JTI[A-Z][0-9]-[A-Z][0-9]|[0-9]{4,5}\.HK|HSI[A-Z][0-9]|HMH[A-Z][0-9]|HCEI[A-Z][0-9]|HCEI[A-Z][0-9]-[A-Z][0-9]|\.SI|SFC[A-Z][0-9])).+