当我们从 HDFS 将数据加载到 Hive table 时,它会从源目录 (HDFS) 中删除文件

When we Load data into Hive table from HDFS, it deletes the file from source directory(HDFS)

当我们从 HDFS 将数据加载到 Hive table 时,它会从源目录 (HDFS) 中删除文件,有没有一种方法可以将文件保留在源目录中并将数据加载到 hive table 还有。

我使用了以下查询;

LOAD DATA INPATH 'source_file_path' insert INTO TABLE TABLENAME;

Hive 在将数据加载到 table 时不进行任何转换。 Load operations 目前是纯 copy/move 操作,将数据文件移动到对应于 Hive tables 的位置。

使用hadoop fs cphdfs dfs cp命令复制(不是移动)文件:

hadoop fs -cp [source_file_path] [table_location_path]

hdfs  dfs cp [source_file_path] [table_location_path]

使用decribe formatted tablename 命令检查table 位置路径。