apache pig 中的正则表达式提取

Regular Expression extract in apache pig

我有这样的数据

A8
SS4
M9

我需要使用

从该数据中提取所有字母表
REGEX_EXTRACT

我的猪语如下

A = load 'data';
B = foreach A generate REGEX_EXTRACT([=12=],'\*[^0-9]',1);
dump B;

但是我的输出为 null。

你能试试这个吗?

选项 1:

A = load 'input' AS (line:chararray);
B = FOREACH A GENERATE REGEX_EXTRACT(line,'(.*[^0-9])',1);
DUMP B;

选项2:

A = load 'input' AS (line:chararray);
B = FOREACH A GENERATE REGEX_EXTRACT(line,'(^[A-Za-z]+).*',1);
DUMP B;