阿帕奇猪。获取一条特定记录

Apache Pig. Get one particular record

给定这 9 个记录文件:

START-OF-FIELDS
FUND_TAX_STATUS
EQY_SH_OUT
FUND_REDEMP_DT
FUND_MIN_INVEST_CRNCY
ID_EXCH_SYMBOL
FUNDSERV_IDENTIFIER
TIMESTARTED=Wed Apr 13 02:01:27 JST 2016
START-OF-DATA

我只想获取 TIMESTARTED 记录。

我怎样才能做到这一点?

非常感谢!

将记录加载为数据类型 chararray 的一个字段并对其进行过滤。

A = LOAD 'data.txt' USING PigStorage(' ') as (f1:chararray);
B = FILTER A BY (f1 matches '.*TIMESTARTED.*');
DUMP B;