Pig 将关系作为参数传递给 UDF
Pig pass relation as argument to UDF
我需要将关系传递给 PIG 中的 UDF
articles = load x using ...;
groupedArticles = udfs.MyUDF(articles);
这样的事情可能吗?任何解决方法?
谢谢
我猜你的意思是将关系的所有字段传递给 UDF?传递关系是没有意义的。无论如何,这取决于您的加载语句的外观。如果您将每个条目作为一个元组 load x using ... as (entry:(a:int, b:chararray, ...))
加载,那么您可以将其传递给 UDF,例如 groupedArticles = foreach articles generate udfs.MyUDF(entry)
将整行作为一个元组传递可能是最通用的方式,您必须处理一个通用元组不过你的 UDF。
我需要将关系传递给 PIG 中的 UDF
articles = load x using ...;
groupedArticles = udfs.MyUDF(articles);
这样的事情可能吗?任何解决方法?
谢谢
我猜你的意思是将关系的所有字段传递给 UDF?传递关系是没有意义的。无论如何,这取决于您的加载语句的外观。如果您将每个条目作为一个元组 load x using ... as (entry:(a:int, b:chararray, ...))
加载,那么您可以将其传递给 UDF,例如 groupedArticles = foreach articles generate udfs.MyUDF(entry)
将整行作为一个元组传递可能是最通用的方式,您必须处理一个通用元组不过你的 UDF。