当我们从 HDFS 将数据加载到 Hive table 时,它会从源目录 (HDFS) 中删除文件
When we Load data into Hive table from HDFS, it deletes the file from source directory(HDFS)
当我们从 HDFS 将数据加载到 Hive table 时,它会从源目录 (HDFS) 中删除文件,有没有一种方法可以将文件保留在源目录中并将数据加载到 hive table 还有。
我使用了以下查询;
LOAD DATA INPATH 'source_file_path' insert INTO TABLE TABLENAME;
Hive 在将数据加载到 table 时不进行任何转换。 Load operations 目前是纯 copy/move 操作,将数据文件移动到对应于 Hive tables 的位置。
使用hadoop fs cp
或hdfs dfs cp
命令复制(不是移动)文件:
hadoop fs -cp [source_file_path] [table_location_path]
或
hdfs dfs cp [source_file_path] [table_location_path]
使用decribe formatted tablename
命令检查table 位置路径。
当我们从 HDFS 将数据加载到 Hive table 时,它会从源目录 (HDFS) 中删除文件,有没有一种方法可以将文件保留在源目录中并将数据加载到 hive table 还有。
我使用了以下查询;
LOAD DATA INPATH 'source_file_path' insert INTO TABLE TABLENAME;
Hive 在将数据加载到 table 时不进行任何转换。 Load operations 目前是纯 copy/move 操作,将数据文件移动到对应于 Hive tables 的位置。
使用hadoop fs cp
或hdfs dfs cp
命令复制(不是移动)文件:
hadoop fs -cp [source_file_path] [table_location_path]
或
hdfs dfs cp [source_file_path] [table_location_path]
使用decribe formatted tablename
命令检查table 位置路径。