Hive 查询结果到新 table
Hive query results to new table
我在下面有一个非常简单的查询,它计算我们平台上每小时发生的交易数量。
数量以十亿为单位,因此查询需要一些时间。
因此,我希望能够每小时 运行 查询一次,将结果附加到另一个 table - 这样我们就可以减少延迟并减少集群上的负载。
我可以访问 Hue 来执行此操作 - 我正在使用 Hive。以下是执行此操作的正确方法吗?
INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions, 'dpi_datasum' as feed, 'FULL' as environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as
environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
或
INSERT overwrite table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as
environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
我在下面有一个非常简单的查询,它计算我们平台上每小时发生的交易数量。
数量以十亿为单位,因此查询需要一些时间。
因此,我希望能够每小时 运行 查询一次,将结果附加到另一个 table - 这样我们就可以减少延迟并减少集群上的负载。
我可以访问 Hue 来执行此操作 - 我正在使用 Hive。以下是执行此操作的正确方法吗?
INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions, 'dpi_datasum' as feed, 'FULL' as environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
INSERT INTO table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as
environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour
或
INSERT overwrite table udsuser.healthcheck
SELECT dt, hour, count(*)as transactions,'dpi_datasum' as feed,'FULL' as
environment
FROM dpi_datasum
WHERE hour=hour(from_unixtime(unix_timestamp()))-2
Group by dt, hour