如何使用 Jena 从 HDFS 读取文件并将其转换为 Rdf?

How can using Jena read file from HDFS and convert it to Rdf?

我正在使用 Apache Jena 将 .csv 文件转换为 .rdf。我使用 model.read(pathFile),但它只从本地文件系统读取文件。我想从hdfs读取,比如model.read(hdfs://....),但是报错。

错误是:

Exception in thread "main" org.apache.jena.riot.RiotNotFoundException: Not found: hdfs://localhost:54310/user/hduser/demo/departments/part-00000.csv

我该怎么做?

您需要将 Locator 添加到 StreamManager 以处理 "hdfs://"。

Jena 不附带读取 HDFS URL 的代码。