Hive:查询以获取每个日期每个单词的最大计数
Hive: Query to get max count per word per date
这是我的数据:
date | word | count
01/01/2020 #abc 1
01/01/2020 #xyz 2
02/05/2020 #ghi 2
02/05/2020 #def 1
02/04/2020 #pqr 4
02/04/2020 #cde 3
01/01/2020 #lmn 1
这是我想要的结果:
date | word | count
01/01/2020 #xyz 2
02/04/2020 #pqr 4
02/05/2020 #ghi 2
所以基本上,我想要在每个特定日期具有最大计数的词。
有人可以帮我查询一下吗?
使用 row_number
window 函数与 partition by and order by
子句和 select只有分区的最大计数!
SELECT date,word,count
FROM (
SELECT date,word,count,row_number() over (partition by date order by count desc) as rn
from <table_name>) sq
WHERE sq.rn = 1;
这是我的数据:
date | word | count
01/01/2020 #abc 1
01/01/2020 #xyz 2
02/05/2020 #ghi 2
02/05/2020 #def 1
02/04/2020 #pqr 4
02/04/2020 #cde 3
01/01/2020 #lmn 1
这是我想要的结果:
date | word | count
01/01/2020 #xyz 2
02/04/2020 #pqr 4
02/05/2020 #ghi 2
所以基本上,我想要在每个特定日期具有最大计数的词。 有人可以帮我查询一下吗?
使用 row_number
window 函数与 partition by and order by
子句和 select只有分区的最大计数!
SELECT date,word,count
FROM (
SELECT date,word,count,row_number() over (partition by date order by count desc) as rn
from <table_name>) sq
WHERE sq.rn = 1;