训练文本模型以预测真假
Train a text model to predict true or false
所以我是整个机器学习主题的新手,但我认为我有一个有趣的问题需要解决。我基本上只想知道一个句子是否符合 TRUE 或 FALSE
这里是一些例句:
- 是的,这就是我 -> 正确
- 这是我 -> 正确
- 是的 -> 是的
- 这不是我 -> FALSE
.....
现在我需要一些提示如何成功训练模型,例如Keras、Caffe 或其他工具以及我应该遵循什么样的原则。
感谢任何提示
更新
据我了解,我需要进行自然语言分类。我需要创建 2 类 并获得每个 类 返回的概率。
https://github.com/Russell91/nlpcaffe 之类的东西有用吗?
如果我的理解是正确的,你想将各种回复分类为true
/false
,这可能是作为对话的一部分对问题的回复。
对于这种情况,您应该 creating/having 一个包含 true
和 false
类 大量示例的数据集,并训练一个二进制文本分类器。您可以阅读 SVM 和朴素贝叶斯,它们非常适合文本分类,并且可以使用 Scikit-Learn 轻松实现。
所以我是整个机器学习主题的新手,但我认为我有一个有趣的问题需要解决。我基本上只想知道一个句子是否符合 TRUE 或 FALSE
这里是一些例句:
- 是的,这就是我 -> 正确
- 这是我 -> 正确
- 是的 -> 是的
- 这不是我 -> FALSE
.....
现在我需要一些提示如何成功训练模型,例如Keras、Caffe 或其他工具以及我应该遵循什么样的原则。
感谢任何提示
更新
据我了解,我需要进行自然语言分类。我需要创建 2 类 并获得每个 类 返回的概率。
https://github.com/Russell91/nlpcaffe 之类的东西有用吗?
如果我的理解是正确的,你想将各种回复分类为true
/false
,这可能是作为对话的一部分对问题的回复。
对于这种情况,您应该 creating/having 一个包含 true
和 false
类 大量示例的数据集,并训练一个二进制文本分类器。您可以阅读 SVM 和朴素贝叶斯,它们非常适合文本分类,并且可以使用 Scikit-Learn 轻松实现。