CoreNLP 路线图
CoreNLP Road Map
CoreNLP 的路线图不明确。是否处于维护模式?我很高兴看到对 StanfordNLP 的重视,但缺乏对方向的了解令人担忧。如果新的神经模型更好,我们会看到它们包含在 Java CoreNLP API 中吗?
CoreNLP 尚未处于维护模式。我们将在夏季进行一些非常重要的(和 compatibility-breaking)更改。除其他事项外,我们将转换为使用 UDv2(从当前的 UDv1),我们将对英语和其他语言进行标记化更改,以更好地与 UD 和 "new"(自 2004 年左右起)保持一致!) Penn Treebank 标记化,我们将有更一致的可用性和词向量的使用。这些更改应该会增加 Java 和 Python 包之间的兼容性,并且随着时间的推移,我们也可以使用更多数据来训练 Python stanfordnlp 模型。现在 Python stanfordnlp v0.2 已经发布,CoreNLP 的工作应该开始了。
另一方面,斯坦福 NLP 小组的大部分研究精力现在已经转移到探索在主要深度学习框架之上构建在 Python 中的神经模型。 (希望听到这个消息不会感到意外!)因此,主要的新组件不太可能被添加到 CoreNLP 中。很难预测未来,但可以合理地预期 CoreNLP 将更多地朝着稳定的方向发展,efficient-on-CPU NLP 包,而不是实现最新神经模型的东西。
CoreNLP 的路线图不明确。是否处于维护模式?我很高兴看到对 StanfordNLP 的重视,但缺乏对方向的了解令人担忧。如果新的神经模型更好,我们会看到它们包含在 Java CoreNLP API 中吗?
CoreNLP 尚未处于维护模式。我们将在夏季进行一些非常重要的(和 compatibility-breaking)更改。除其他事项外,我们将转换为使用 UDv2(从当前的 UDv1),我们将对英语和其他语言进行标记化更改,以更好地与 UD 和 "new"(自 2004 年左右起)保持一致!) Penn Treebank 标记化,我们将有更一致的可用性和词向量的使用。这些更改应该会增加 Java 和 Python 包之间的兼容性,并且随着时间的推移,我们也可以使用更多数据来训练 Python stanfordnlp 模型。现在 Python stanfordnlp v0.2 已经发布,CoreNLP 的工作应该开始了。
另一方面,斯坦福 NLP 小组的大部分研究精力现在已经转移到探索在主要深度学习框架之上构建在 Python 中的神经模型。 (希望听到这个消息不会感到意外!)因此,主要的新组件不太可能被添加到 CoreNLP 中。很难预测未来,但可以合理地预期 CoreNLP 将更多地朝着稳定的方向发展,efficient-on-CPU NLP 包,而不是实现最新神经模型的东西。