在哪种情况下您使用分块而不是完整解析?
In which scenario do you use chunking instead of full parsing?
分块或浅层解析将句子分割成一系列句法成分或块,即根据语言属性分组的相邻单词序列。它通常被称为解析自然语言的有效且稳健的方法,并且是完整解析的流行替代方法,但在这种情况下分块将是更合适的技术
完全解析。
这只不过是我个人的偏见,但如果出于某种原因你只需要检测名词 and/or 动词短语,那么分块通常可能会更好。例如,对于文档聚类、主题标记或简单地识别关键字,NP 或 VP 分块可能绰绰有余。此外,如果您需要使用一种不存在树库的语言,您可能希望退回到分块。
分块通常具有比深度解析快几个数量级的优势,但现代 (perceptron/neural) 解析器比五年或十年前的深度解析器快得多。然而,即使是迄今为止,深度解析也会因长句而窒息。而且,显然,注释树库以训练深度解析器比注释 NP/VP 短语或什至只是构建基于规则的词块分析器成本更高 - 特别是如果您需要检测非英语文本中的短语。
分块或浅层解析将句子分割成一系列句法成分或块,即根据语言属性分组的相邻单词序列。它通常被称为解析自然语言的有效且稳健的方法,并且是完整解析的流行替代方法,但在这种情况下分块将是更合适的技术 完全解析。
这只不过是我个人的偏见,但如果出于某种原因你只需要检测名词 and/or 动词短语,那么分块通常可能会更好。例如,对于文档聚类、主题标记或简单地识别关键字,NP 或 VP 分块可能绰绰有余。此外,如果您需要使用一种不存在树库的语言,您可能希望退回到分块。
分块通常具有比深度解析快几个数量级的优势,但现代 (perceptron/neural) 解析器比五年或十年前的深度解析器快得多。然而,即使是迄今为止,深度解析也会因长句而窒息。而且,显然,注释树库以训练深度解析器比注释 NP/VP 短语或什至只是构建基于规则的词块分析器成本更高 - 特别是如果您需要检测非英语文本中的短语。