在实际应用程序中使用 Hive?

Using Hive in real world applications?

我是Hadoop的新手,学过map-reduce,现在学hive。

但是我不确定蜂巢的使用?

在 map-R 中,我们有一个或多个输出文件 n 这是我们的最终结果,但在 hive 中,我们可以 select 使用 SQL 的记录,如查询,即 HQL,但我们没有得到任何最终输出文件。结果将仅显示在终端上。

现在我的问题是我们如何使用这个 select HQL 以便它可以被其他分析团队使用?

外面有很多方法extract/export hive查询结果

如果您想要将结果存储在任何 RDBMS 存储中,您可以使用 Sqoop。 我建议您了解一下 Sqoop 是什么以及它的作用。

如果您希望将查询结果保存在一个文件中,那么有很多方法。 Hive 支持从表中导出数据。

INSERT OVERWRITE LOCAL DIRECTORY '/home/lvermeer/temp' 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY ',' 
select * from table;

另一种简单的方法是将您的配置单元查询输出简单地重定向到一个文件,而 运行 您的配置单元查询在 CLI 中。

hive -e "select * from table" > output.txt