如何使用 Neo4jImport 工具在 neo4j v2.2.0-RC01 上导入数百个文件?
how to use Neo4jImport tool to import hundred of files, on neo4j v2.2.0-RC01?
我从 Hive 下载了数百个文件,它们的架构是一致的。我尝试导入一个文件,其中包含3M个节点,使用v2.2.0的新功能Neo4j-import工具导入它。它非常快。
这是我的命令
Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:[=10=]0023_1-hearder.csv,c:[=10=]0023_1.csv" --delimiter "TAB"
按照命令用法,如果我需要导入多个同构模式文件,我应该使用这个:
Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:-hearder.csv,c:.csv,c:.csv,c:.csv,c:.csv..." --delimiter "TAB"
如果我有成百上千个小分区文件要导入,我应该将它们的文件名级联吗?还是有什么错误发生?
如果文件都具有相同的结构,您可以将它们拼接起来。然后拉上它们,使它们更小。这就是我会做的。
否则,是的,有一个带有递增编号的文件名。
您可以使用带有 for 循环的 powershell/cmd 脚本将文件名连接成一个字符串。尽管这可能会给命令行长度带来问题。
我从 Hive 下载了数百个文件,它们的架构是一致的。我尝试导入一个文件,其中包含3M个节点,使用v2.2.0的新功能Neo4j-import工具导入它。它非常快。
这是我的命令
Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:[=10=]0023_1-hearder.csv,c:[=10=]0023_1.csv" --delimiter "TAB"
按照命令用法,如果我需要导入多个同构模式文件,我应该使用这个:
Neo4jImport.bat --into ../data/weibo.db --nodes:User "c:-hearder.csv,c:.csv,c:.csv,c:.csv,c:.csv..." --delimiter "TAB"
如果我有成百上千个小分区文件要导入,我应该将它们的文件名级联吗?还是有什么错误发生?
如果文件都具有相同的结构,您可以将它们拼接起来。然后拉上它们,使它们更小。这就是我会做的。
否则,是的,有一个带有递增编号的文件名。
您可以使用带有 for 循环的 powershell/cmd 脚本将文件名连接成一个字符串。尽管这可能会给命令行长度带来问题。