大数据语料库上的文本蕴涵

Textual Entailment on large data corpus

我最近在研究文本蕴涵,我想知道当前关于大型数据集文本蕴涵的研究项目。

我已经阅读了相同的研究论文,想探索是否有可能应用数据增强来使有限的数据集变得健壮,甚至应用分层注意机制?

非常感谢您的宝贵意见和参考

您可以查看 https://nlpprogress.com/english/semantic_textual_similarity.html 以获得最先进的模型

迁移学习和预训练语言模型是去年以来的一个大主题,所以你可以看看https://github.com/huggingface/pytorch-transformers而不是数据扩充