如何使用 Jena 从 HDFS 读取文件并将其转换为 Rdf?
How can using Jena read file from HDFS and convert it to Rdf?
我正在使用 Apache Jena 将 .csv 文件转换为 .rdf。我使用 model.read(pathFile)
,但它只从本地文件系统读取文件。我想从hdfs读取,比如model.read(hdfs://....)
,但是报错。
错误是:
Exception in thread "main" org.apache.jena.riot.RiotNotFoundException: Not found: hdfs://localhost:54310/user/hduser/demo/departments/part-00000.csv
我该怎么做?
您需要将 Locator
添加到 StreamManager
以处理 "hdfs://"。
Jena 不附带读取 HDFS URL 的代码。
我正在使用 Apache Jena 将 .csv 文件转换为 .rdf。我使用 model.read(pathFile)
,但它只从本地文件系统读取文件。我想从hdfs读取,比如model.read(hdfs://....)
,但是报错。
错误是:
Exception in thread "main" org.apache.jena.riot.RiotNotFoundException: Not found: hdfs://localhost:54310/user/hduser/demo/departments/part-00000.csv
我该怎么做?
您需要将 Locator
添加到 StreamManager
以处理 "hdfs://"。
Jena 不附带读取 HDFS URL 的代码。