Stanford Parser:获取 CARD 的整数值?
Stanford Parser: Get Integer value for CARD?
我是运行一个使用 Stanford Parser 的小型测试应用程序。
解析器正确识别基数,例如“1990”、"one"、"two"、"three"。我正在寻找一种方法来检索带注释的文本的整数值。显然,这对于最初不包含 "one"、"two" 等
等数字的文本尤其有用
是否有内置功能?
解析器不包含类似的东西,但 CoreNLP 实际上有这样的功能。
您可以将以下函数应用于每个句子的 CoreMap
对象,将 NumerizedTokensAnnotation
添加到句子,将 NumericValueAnnotation
添加到每个标记。
NumberNormalizer.findAndAnnotateNumericExpressions(sentence);
不幸的是,没有关于此功能的任何文档,但您可以查看 NumberNormalizer
的源代码,其中至少包含一些评论和解释。
我是运行一个使用 Stanford Parser 的小型测试应用程序。
解析器正确识别基数,例如“1990”、"one"、"two"、"three"。我正在寻找一种方法来检索带注释的文本的整数值。显然,这对于最初不包含 "one"、"two" 等
等数字的文本尤其有用是否有内置功能?
解析器不包含类似的东西,但 CoreNLP 实际上有这样的功能。
您可以将以下函数应用于每个句子的 CoreMap
对象,将 NumerizedTokensAnnotation
添加到句子,将 NumericValueAnnotation
添加到每个标记。
NumberNormalizer.findAndAnnotateNumericExpressions(sentence);
不幸的是,没有关于此功能的任何文档,但您可以查看 NumberNormalizer
的源代码,其中至少包含一些评论和解释。