如何访问 UIMA 中的文档元数据?
How to access document metadata in UIMA?
如何使用 UIMA 和 JCas 访问文档元数据,例如创建和修改日期或标题等?
默认情况下,此类信息在 UIMA 中不可用。
一些 collection reader 实现可能将此类信息存储在 DocumentAnnotation 或其他专用注释的子类型中。例如。 DKPro Core 定义了一个 DocumentMetaData 类型,它派生自 DocumentAnnotation 和 DKPro Core reader 组件存储文档的原始 path/URI 并且可以存储标题(如果可用)。
其他组件 collection 或 collection reader 实现可能会做类似的事情。
披露:我正在研究 DKPro Core 和 Apache UIMA
如何使用 UIMA 和 JCas 访问文档元数据,例如创建和修改日期或标题等?
默认情况下,此类信息在 UIMA 中不可用。
一些 collection reader 实现可能将此类信息存储在 DocumentAnnotation 或其他专用注释的子类型中。例如。 DKPro Core 定义了一个 DocumentMetaData 类型,它派生自 DocumentAnnotation 和 DKPro Core reader 组件存储文档的原始 path/URI 并且可以存储标题(如果可用)。
其他组件 collection 或 collection reader 实现可能会做类似的事情。
披露:我正在研究 DKPro Core 和 Apache UIMA