可比语料库和平行语料库有什么区别?

What is the difference between comparable corpus and parallel corpus?

它们有什么区别,分别有什么用途?

可比语料库 是一对来自同一领域的两种不同语言的语料库,如 Statistical Machine Translation Survey Wiki.

中所定义

平行语料库 是一种特定类型的可比较语料库,其中将文本与其翻译成第二语言的内容配对。有许多机器翻译论文采用了这个定义。比如主论文来自Europarl Project.