我需要了解 NLP 的哪些知识才能使用和训练 Stanford NLP 进行意图分析?

What do I need to know on NLP to be able to use and train Stanford NLP for intent analysis?

任何书籍、教程、课程推荐都将不胜感激。

我需要知道在 NLP 方面我需要达到什么水平才能理解 Stanford NLP 并训练它为我的商业情绪分析应用程序定制它。

我的目标不是从事 NLP 职业或成为 NLP 专家,而是尽可能精通,以便能够正确理解和使用开源 NLP 框架,并为我的应用程序训练它们。

对于这个级别,需要什么 NLP study/training?

我也在学习 c# 和 .net。

第一:简单地使用情感模型或在现有数据上训练,没有太多的背景需要学习:

  • 代币化
  • 选区解析、解析树等
  • 基本的机器学习概念(分类、成本函数、训练/开发集等)

这些都是有据可查的想法,而且都是 Google 的距离。对于上述想法,浏览 Coursera Natural Language Processing course(由斯坦福大学的人制作!)可能是值得的。

之后,重要的任务是了解 CoreNLP 中的 RNTN 情感模型是如何工作的。我想你不需要完全掌握数学,但理解算法的基本递归性质很重要。最好的资源当然是 original paper(老实说,没有其他资源了)。


要训练您自己的情绪模型,您需要自己的情绪数据。生成这些数据并非易事。斯坦福情绪模型的数据是众包的,如果你想收集接近相同规模的任何东西,你可能需要做类似的事情。

RNTN 情感论文(上面链接)提供了有关数据格式的一些详细信息。如果您确实希望创建自己的数据,我很乐意对此进行进一步扩展。

我认为你应该简单地理解监督学习、无监督学习的概念。此外,一些 Java 知识可能会有用。