Stanford CoreNLP 错误的共指解析
Stanford CoreNLP wrong coreference resolution
我仍在使用斯坦福大学的 CoreNLP,并且在一项非常简单的共指解析测试中遇到了奇怪的结果。
给定两个句子:
The hotel had a big bathroom. It was very clean.
我希望句子 2 中的 "It" 被句子 1 的 "bathroom" 或至少 "a big bathroom" 共同引用。
不幸的是,它指向 "The hotel",我认为这是错误的。
有没有办法解决这个问题?我需要训练任何东西还是应该开箱即用?
Annotation a = getPipeline().getAnnotation("The hotel had a big bathroom. It was very clean.");
System.out.println(a.get(CorefChainAnnotation.class));
输出:
{1=CHAIN1-["The hotel" in sentence 1, "It" in sentence 2], 2=CHAIN2-["a big bathroom" in sentence 1]}
非常感谢您的帮助。
与 AI 中的许多组件一样,斯坦福共指系统仅在一定程度上正确。在共指的情况下,这个准确度实际上相对较低(在 0-100 范围内的标准基准测试中约为 60)。为了说明问题的难度,请考虑以下具有不同共指判断的看似相似的句子:
The hotel had a big bathtub. It was very expensive.
我仍在使用斯坦福大学的 CoreNLP,并且在一项非常简单的共指解析测试中遇到了奇怪的结果。
给定两个句子:
The hotel had a big bathroom. It was very clean.
我希望句子 2 中的 "It" 被句子 1 的 "bathroom" 或至少 "a big bathroom" 共同引用。
不幸的是,它指向 "The hotel",我认为这是错误的。
有没有办法解决这个问题?我需要训练任何东西还是应该开箱即用?
Annotation a = getPipeline().getAnnotation("The hotel had a big bathroom. It was very clean.");
System.out.println(a.get(CorefChainAnnotation.class));
输出:
{1=CHAIN1-["The hotel" in sentence 1, "It" in sentence 2], 2=CHAIN2-["a big bathroom" in sentence 1]}
非常感谢您的帮助。
与 AI 中的许多组件一样,斯坦福共指系统仅在一定程度上正确。在共指的情况下,这个准确度实际上相对较低(在 0-100 范围内的标准基准测试中约为 60)。为了说明问题的难度,请考虑以下具有不同共指判断的看似相似的句子:
The hotel had a big bathtub. It was very expensive.