如何将数据从 Azure Blob 存储导入 Neo4j?

How to import data into Neo4j from Azure Blob Storage?

有没有办法将数据从 Azure Blob 存储导入到 Neo4j 中?

我认为没有任何免费工具。

在商业方面,GraphAware Hume Orchestra 有 Azure BlobStorage 连接器

也可以为 Neo4j LOAD CSV(例如 s3、azure 等)创建您自己的协议。

我在这里写了一个例子:https://github.com/ikwattro/neo4j-load-csv-s3-protocol

我使用 python azure-blob-storage 和 py2neo 库完成了它。它就像一个魅力。

有几个选项:

  1. https://docs.microsoft.com/en-us/azure/storage/common/storage-sas-overview - 创建一个带有签名的 URL,允许您直接通过 https 访问文件。然后,您可以 LOAD CSV WITH HEADERS FROM "<url>" AS row CREATE...,等等...这样做的好处是不需要任何额外的软件、自定义代码等...

  2. https://docs.microsoft.com/en-us/azure/storage/blobs/storage-how-to-mount-container-linux - 可用于将 Azure 存储容器装载到 Neo4j 实例中的文件夹(例如 /var/lib/neo4j/import/myazurecontainer)。然后可以使用此文件夹访问 blob 存储中的文件,就好像它们是本地文件一样。

如果您只想从 Azure 存储加载一些数据,我会犹豫是否安装编排框架(例如 GraphAware 的 Hume Orchestra)或 ETL 工具。