有条件地打印数据集的猪脚本
pig script to print dataset conditionally
我们有两个数据集:
学生:此数据集包含 class 中学生的姓名和学号
结果:此数据集包含学生
的卷号和结果(失败或通过)
编写一个 Pig 脚本来分析给定的数据集并打印成功通过考试的学生姓名。
输入 1- result.dat 文件(id,状态)
输入 2- student.dat file(name,id)
re = load 'results.dat' as (id:int,status:chararray);
st = load 'student.dat' as (name:chararray,id:int);
join_re_st = join re by [=10=],st by ;
fil = filter join_re_st by != 'fail';
result = foreach fil generate [=10=],,;
Dump result;
我们有两个数据集: 学生:此数据集包含 class 中学生的姓名和学号 结果:此数据集包含学生
的卷号和结果(失败或通过)编写一个 Pig 脚本来分析给定的数据集并打印成功通过考试的学生姓名。
输入 1- result.dat 文件(id,状态)
输入 2- student.dat file(name,id)
re = load 'results.dat' as (id:int,status:chararray);
st = load 'student.dat' as (name:chararray,id:int);
join_re_st = join re by [=10=],st by ;
fil = filter join_re_st by != 'fail';
result = foreach fil generate [=10=],,;
Dump result;