用于在多个条件下匹配假名 + 汉字的正则表达式

Regex for matching on multiple conditions for kana + kanji

我正在尝试编写一个基于汉字字符串匹配所有单词的正则表达式。

例如,匹配 文学生高 可以 return 选项,例如 文学、学生、高い,etc

目前,我只能return输入完全匹配的汉字:

/^[学生文高]+$/ 但我想包括具有这些字符 ([ぁ-んァ-ン]) 的记录。

当我尝试结合这两个条件时,我最终匹配了所有内容。

/^[学生文高][ぁ-んァ-ン]+$/ <-- 这是理想的,因为它符合这两个条件。

基本上,“必须包含 学生文高 但也可以包含 ぁ-んァ-ン 而不必仅包含 ぁ-んァ-ン.

的内容

对于那些不太熟悉日语的人,一个更英语的例子可能是:搜索所有包含 test 的单词,我想在结果中包含数字,但不允许只匹配数字。

例如,test 匹配可以 return test1,test2 但绝不会只是 12.

这应该有效:/^[あ-んア-ン]*([学生文高][あ-んア-ン]*)+$/

它在开头匹配零个或多个假名,然后匹配一个或多个包含一个汉字和零个或多个假名的组。