用于文本摘要的序列到序列模型的细节是什么?
What are the details of Sequence-to-sequence model for text summarization?
很清楚如何训练用于翻译的编码器-解码器模型:每个源序列都有其对应的目标序列(翻译)。但是在文本摘要的情况下,摘要比它的文章短得多。根据 Urvashi Khandelwal, Neural Text Summarization 每个源句子都有其摘要(更短或更长)。但我几乎不相信存在任何这样的数据集,每个句子都有相应的摘要。那么,如果我是对的,训练 sunch 模型的可能方法有哪些?不然有免费的文本摘要数据集吗?
你说得对,很少有大型数据集是专门为训练文本摘要模型而创建的。人们倾向于使用其他现有数据,并想方设法将其转化为汇总问题。您可以阅读其他文本摘要论文以了解它们的作用。
研究倾向于使用像
这样的数据集
- 对产品的评论,例如 amazon product 秒
的数据集
- 以标题作为摘要的新闻,如 CNN/Daily Mail dataset and Newsroom dataset
如果您需要了解更多有关如何有效使用这些模型的信息,请在线 blog series goes into details on how to train text summarization model using the newest approaches, it also collects multiple implementations 并在 google colab 中实现它们,因此无论您的计算机性能如何,您都可以随时尝试在 google colab
上免费提供这些数据集
很清楚如何训练用于翻译的编码器-解码器模型:每个源序列都有其对应的目标序列(翻译)。但是在文本摘要的情况下,摘要比它的文章短得多。根据 Urvashi Khandelwal, Neural Text Summarization 每个源句子都有其摘要(更短或更长)。但我几乎不相信存在任何这样的数据集,每个句子都有相应的摘要。那么,如果我是对的,训练 sunch 模型的可能方法有哪些?不然有免费的文本摘要数据集吗?
你说得对,很少有大型数据集是专门为训练文本摘要模型而创建的。人们倾向于使用其他现有数据,并想方设法将其转化为汇总问题。您可以阅读其他文本摘要论文以了解它们的作用。
研究倾向于使用像
这样的数据集- 对产品的评论,例如 amazon product 秒 的数据集
- 以标题作为摘要的新闻,如 CNN/Daily Mail dataset and Newsroom dataset
如果您需要了解更多有关如何有效使用这些模型的信息,请在线 blog series goes into details on how to train text summarization model using the newest approaches, it also collects multiple implementations 并在 google colab 中实现它们,因此无论您的计算机性能如何,您都可以随时尝试在 google colab
上免费提供这些数据集