Hadoop Impala:将数据类型整数格式化为 date/timestamp 以使用 addtime 函数

Hadoop Impala: Format datatype integer to date/timestamp to use addtime function

我在 Impala 与以下 table 一起工作:

customer_id | day_id    | return_day_id
ABC           20170830    20170923
BCD           20170830    20170901

不幸的是,day_id 和 return_day_id 字段都是 INT 而不是日期。

如何将它们的数据类型更改为日期,以便我可以在 day_id 后的 4 天内仅使用 return_day_id 计算不同的 customer_ids。我是否需要将其转换为日期,然后转换为时间戳,以便我可以使用 adddate 函数?

其中一条评论正确指出,您需要使用 unix_timestampfrom_unixtime,但您不需要使用强制转换。 Whosebug 上的许多其他问题遇到了类似的问题,每个问题都尝试使用强制转换,但在许多情况下最终返回 NULL 值或不起作用。

下面应该以 YYYY-MM-dd 的格式为您提供所需的时间对象,您也可以选择向其中添加 hh-mm-ss。

SELECT TBL.day_id, from_unixtime(unix_timestamp(cast (TBL.day_id as string), "yyyyMMdd"))

FROM yourTable as TBL

LIMIT 10 

要记住的一个小注意事项是,这会将字符串转换为日期,因此我们将其转换为 cast (TBL.day_id as string), "yyyyMMdd"))

处的字符串

示例:

20160220 -> 2016-02-20 00:00:00

您可以在文档 here 中找到更多信息。

希望对您有所帮助, 朱利安