Pig 0.12.0 - 从字符串中提取最后两个字符
Pig 0.12.0 - extracting last two characters from a string
我正在使用 CDH 5.5
、Pig 0.12.0
。我有一个像这样的 chararray
:25 - 45
我想从这个字符串中提取 25 和 45。
所以,我这样做了:
minValue = (int)SUBSTRING(value,0,2);
maxValue = ((int)SUBSTRING(value,6,2);
我能够提取 minValue
但无法提取 maxValue
即给定字符串的最后两个字符。
即使我试过了,但这个也不起作用。:
maxValue = ((int)SUBSTRING(value,-2,2);
请告诉我如何进行这项工作。
您必须在SUBSTRING 函数中使用特定字符的索引。
这是您需要的。
maxValue = (int)SUBSTRING(value,5,7);
如果分隔符始终是冒号 (-),那么我们可以拆分和展平字符数组以提取最小值和最大值。
A = LOAD 'input.csv' USING PigStorage(',') AS (min_max:chararray);
B = FOREACH A GENERATE FLATTEN(STRSPLIT(min_max,' - ',0)) AS (min_val:chararray, max_val:chararray);
DUMP B;
输入:
25 - 45
35 - 65
45 - 85
输出:
(25,45)
(35,65)
(45,85)
我正在使用 CDH 5.5
、Pig 0.12.0
。我有一个像这样的 chararray
:25 - 45
我想从这个字符串中提取 25 和 45。
所以,我这样做了:
minValue = (int)SUBSTRING(value,0,2);
maxValue = ((int)SUBSTRING(value,6,2);
我能够提取 minValue
但无法提取 maxValue
即给定字符串的最后两个字符。
即使我试过了,但这个也不起作用。:
maxValue = ((int)SUBSTRING(value,-2,2);
请告诉我如何进行这项工作。
您必须在SUBSTRING 函数中使用特定字符的索引。
这是您需要的。
maxValue = (int)SUBSTRING(value,5,7);
如果分隔符始终是冒号 (-),那么我们可以拆分和展平字符数组以提取最小值和最大值。
A = LOAD 'input.csv' USING PigStorage(',') AS (min_max:chararray);
B = FOREACH A GENERATE FLATTEN(STRSPLIT(min_max,' - ',0)) AS (min_val:chararray, max_val:chararray);
DUMP B;
输入:
25 - 45
35 - 65
45 - 85
输出:
(25,45)
(35,65)
(45,85)