如何从猪中的单个元组创建多个元组?
How to create multiple tuples from single tuple in pig?
我在 pig 中有像“5060-5070”这样的列,我想写一个 udf 到 return 元组,如下所示:
col1 和 col2 在所有元组中都相同。
col1,col2,5060,....
col1,col2,5061,..
col1,col2,5062,..
或者如果有任何替代方法(而不是使用 udf)从单个元组创建多个元组。
您应该创建一个 returns 数据包的 UDF。数据包可以包含任意数量的元组。然后使用展平来扩展这个数据包。使用BagFactory创建DataBag,使用TupleFactory创建元组并添加到其中。
我在 pig 中有像“5060-5070”这样的列,我想写一个 udf 到 return 元组,如下所示:
col1 和 col2 在所有元组中都相同。
col1,col2,5060,....
col1,col2,5061,..
col1,col2,5062,..
或者如果有任何替代方法(而不是使用 udf)从单个元组创建多个元组。
您应该创建一个 returns 数据包的 UDF。数据包可以包含任意数量的元组。然后使用展平来扩展这个数据包。使用BagFactory创建DataBag,使用TupleFactory创建元组并添加到其中。