用于在多个条件下匹配假名 + 汉字的正则表达式
Regex for matching on multiple conditions for kana + kanji
我正在尝试编写一个基于汉字字符串匹配所有单词的正则表达式。
例如,匹配 文学生高
可以 return 选项,例如 文学、学生、高い,etc
目前,我只能return输入完全匹配的汉字:
/^[学生文高]+$/
但我想包括具有这些字符 ([ぁ-んァ-ン]
) 的记录。
当我尝试结合这两个条件时,我最终匹配了所有内容。
/^[学生文高][ぁ-んァ-ン]+$/
<-- 这是理想的,因为它符合这两个条件。
基本上,“必须包含 学生文高
但也可以包含 ぁ-んァ-ン
而不必仅包含 ぁ-んァ-ン
.
的内容
对于那些不太熟悉日语的人,一个更英语的例子可能是:搜索所有包含 test
的单词,我想在结果中包含数字,但不允许只匹配数字。
例如,test
匹配可以 return test1,test2
但绝不会只是 1
或 2
.
这应该有效:/^[あ-んア-ン]*([学生文高][あ-んア-ン]*)+$/
它在开头匹配零个或多个假名,然后匹配一个或多个包含一个汉字和零个或多个假名的组。
我正在尝试编写一个基于汉字字符串匹配所有单词的正则表达式。
例如,匹配 文学生高
可以 return 选项,例如 文学、学生、高い,etc
目前,我只能return输入完全匹配的汉字:
/^[学生文高]+$/
但我想包括具有这些字符 ([ぁ-んァ-ン]
) 的记录。
当我尝试结合这两个条件时,我最终匹配了所有内容。
/^[学生文高][ぁ-んァ-ン]+$/
<-- 这是理想的,因为它符合这两个条件。
基本上,“必须包含 学生文高
但也可以包含 ぁ-んァ-ン
而不必仅包含 ぁ-んァ-ン
.
对于那些不太熟悉日语的人,一个更英语的例子可能是:搜索所有包含 test
的单词,我想在结果中包含数字,但不允许只匹配数字。
例如,test
匹配可以 return test1,test2
但绝不会只是 1
或 2
.
这应该有效:/^[あ-んア-ン]*([学生文高][あ-んア-ン]*)+$/
它在开头匹配零个或多个假名,然后匹配一个或多个包含一个汉字和零个或多个假名的组。