如何在 Pig 中计算一列的总和?
How to do sum of a column in Pig?
我有:
姓名 |没有
一个 10
b 20
30
我要加号,也就是说我要x=60
我怎样才能在 PIG 中做到这一点。
考虑到您的数据集在 'data' 变量中,这里是代码:
DESCRIBE data
data: (name, no)
data_grp = GROUP data ALL;
result = FOREACH data_grp GENERATE SUM(data.no);
我有:
姓名 |没有
一个 10
b 20
30
我要加号,也就是说我要x=60
我怎样才能在 PIG 中做到这一点。
考虑到您的数据集在 'data' 变量中,这里是代码:
DESCRIBE data
data: (name, no)
data_grp = GROUP data ALL;
result = FOREACH data_grp GENERATE SUM(data.no);