用于分组和聚合数据的 PIG 脚本

PIG Script to group and aggregate data

我有一个文件,其中的数据类似于以下文件

(1,11)
(1,111)
(2,22)
(2,222)

如何生成下面的输出?

(1,11,111)
(2,22,222)

提前致谢!!!

BagToString() 函数将有助于您的用例。

参考:http://pig.apache.org/docs/r0.11.0/api/org/apache/pig/builtin/BagToString.html

输入:

1,11
1,111
2,22
2,222

猪脚本:

inp_data = LOAD 'input_data.csv' USING PigStorage(',') AS (id:long,value:long);
inp_grp_id = GROUP inp_data BY  id;
req_stats = FOREACH inp_grp_id GENERATE group AS id, BagToString(inp_data.value,',') AS values;

输出:

(1,11,111)
(2,22,222)