在 Pig/Hive 中操作数据结构

Manipulating a data structure in Pig/Hive

我不太确定如何表达这个问题,所以如果有更好的地方可以解决这个问题,请重定向我。

现在我有一个数据结构,大致是这样组织的:

我希望我的数据如下所示:

对不起图片,apparently I can't use markdown to make these!

我意识到我的问题类似于 this one,但理想情况下我希望能够在 Pig 中执行此操作,但知道如何在 Hive、R、Python 中执行此操作,或者Excel/LibreCalc 也会是 useful/interesting。

我什至不确定这种数据操作叫什么,所以将我引导到某种通用的 wiki 页面会有所帮助。

我不确定这是否适用于 Hive。我知道它与 SQL 非常相似。试一试。

select item, year,
'Jan' as Month,
Jan as value
from yourtable
UNION
select item, year,
'Feb' as Month,
Feb as value
from yourtable
UNION
select item, year,
'Mar' as Month,
Mar as value
from yourtable    

@vkp 让我开始了正确的方向,但我必须添加一些调整才能让它在 Hive 上工作:

CREATE TABLE myDatabase.newTable STORED AS TEXTFILE AS 
SELECT item, year, 'jan' AS Month, jan AS Value FROM myDatabase.myTable UNION ALL
SELECT item, year, 'feb' AS Month, feb AS Value FROM myDatabase.myTable UNION ALL
SELECT item, year, 'mar' AS Month, mar AS Value FROM myDatabase.myTable;

仍然对适用于 Pig 的解决方案感兴趣。