Stanford CoreNLP 错误的共指解析

Question

我仍在使用斯坦福大学的 CoreNLP，并且在一项非常简单的共指解析测试中遇到了奇怪的结果。

给定两个句子：

The hotel had a big bathroom. It was very clean.

我希望句子 2 中的 "It" 被句子 1 的 "bathroom" 或至少 "a big bathroom" 共同引用。

不幸的是，它指向 "The hotel"，我认为这是错误的。

有没有办法解决这个问题？我需要训练任何东西还是应该开箱即用？

    Annotation a = getPipeline().getAnnotation("The hotel had a big bathroom. It was very clean.");

    System.out.println(a.get(CorefChainAnnotation.class));

输出：

{1=CHAIN1-["The hotel" in sentence 1, "It" in sentence 2], 2=CHAIN2-["a big bathroom" in sentence 1]}

非常感谢您的帮助。

Answer 1

与 AI 中的许多组件一样，斯坦福共指系统仅在一定程度上正确。在共指的情况下，这个准确度实际上相对较低（在 0-100 范围内的标准基准测试中约为 60）。为了说明问题的难度，请考虑以下具有不同共指判断的看似相似的句子：

The hotel had a big bathtub. It was very expensive.

Stanford CoreNLP 错误的共指解析

Stanford CoreNLP wrong coreference resolution

nlp

stanford-nlp