Stanford Parser：获取 CARD 的整数值？

Question

我是运行一个使用 Stanford Parser 的小型测试应用程序。

解析器正确识别基数，例如“1990”、"one"、"two"、"three"。我正在寻找一种方法来检索带注释的文本的整数值。显然，这对于最初不包含 "one"、"two" 等

等数字的文本尤其有用

是否有内置功能？

Answer 1

解析器不包含类似的东西，但 CoreNLP 实际上有这样的功能。

您可以将以下函数应用于每个句子的 CoreMap 对象，将 NumerizedTokensAnnotation 添加到句子，将 NumericValueAnnotation 添加到每个标记。

NumberNormalizer.findAndAnnotateNumericExpressions(sentence);

不幸的是，没有关于此功能的任何文档，但您可以查看 NumberNormalizer 的源代码，其中至少包含一些评论和解释。

Stanford Parser: Get Integer value for CARD?