如何使用 DeepPavlov 进行文本分类
How to do text classification with DeepPavlov
我有兴趣使用 DeepPavlov 聊天机器人框架进行文本 class 化。
问题是我没有足够的训练数据。理想情况下,我想用每个 class.
的几个样本进行文本 classification
你应该看看 DeepPavlov's autoFAQ models。当训练数据有限时,有专门开发的模型有效。
可供您使用的模型很少
基于 tf-idf 的模型
fastText 模型
以及两者的混合
更改配置文件中的数据集源,按运行
训练模型
python -m deeppavlov train tfidf_logreg_en_faq
您可以通过命令行与经过训练的模型进行交互
python -m deeppavlov interact tfidf_logreg_en_faq -d
或通过Python代码
from deeppavlov.core.commands.infer import build_model
faq = build_model("tfidf_logreg_en_faq", load_trained = True, download = True)
a = faq(["I need help"])
a
您可以在 colab notebook
中找到所有必需的代码片段
我有兴趣使用 DeepPavlov 聊天机器人框架进行文本 class 化。
问题是我没有足够的训练数据。理想情况下,我想用每个 class.
的几个样本进行文本 classification你应该看看 DeepPavlov's autoFAQ models。当训练数据有限时,有专门开发的模型有效。
可供您使用的模型很少
基于 tf-idf 的模型
fastText 模型
以及两者的混合
更改配置文件中的数据集源,按运行
训练模型python -m deeppavlov train tfidf_logreg_en_faq
您可以通过命令行与经过训练的模型进行交互
python -m deeppavlov interact tfidf_logreg_en_faq -d
或通过Python代码
from deeppavlov.core.commands.infer import build_model
faq = build_model("tfidf_logreg_en_faq", load_trained = True, download = True)
a = faq(["I need help"])
a
您可以在 colab notebook
中找到所有必需的代码片段