从文件名中有选择地提取数字

Question

我有一个文件列表，格式如下：AA13_11BB、CC290_23DD、EE92_34RR。我只需要提取 _ 字符之后的数字，而不是之前的数字。对于这三个文件名，我想得到 11、23、34 作为输出，并在每次提取后将数字存储到一个变量中。

我对 bash 和正则表达式还很陌生。目前，从 AA13_11BB，我可以得到 13_11:

for imgs in $DIR; do
LEVEL=$(echo $imgs | egrep -o [_0-9]+);
done

或两个单独的数字 13 和 11:

LEVEL=$(echo $imgs | egrep -o [0-9]+)

请问如何获得我想要的输出？谢谢！

Answer 1

将 egrep 与 sed 一起使用：

LEVEL=$(echo $imgs | egrep -o '_[0-9]+' | sed 's/_//' )

Answer 2

将 grep 与 -P 标志一起使用

for imgs in $DIR
do 
    LEVEL=$(echo $imgs |  grep -Po '(?<=_)[0-9]{2}')
    echo $LEVEL
done

Answer 3

您可以使用正则表达式 .*_([0-9]+).* 在一个 sed 中完成（为 sed 正确转义）：

sed "s/.*_\([0-9]\+\).*//" <<< "AA13_11BB"

它用第一个 captured group 替换行（() 内的子正则表达式），输出：

在您的脚本中：

LEVEL=$(sed "s/.*_\([0-9]\+\).*//" <<< $imgs)

更新： 如 @mklement0 所建议，在 BSD sed 和 GNU sed 您可以使用 -E 参数缩短命令：

LEVEL=$(sed -E "s/.*_([0-9]+).*//" <<< $imgs)

Answer 4

为了补充现有的有用答案，使用的核心：

以下在单个命令中处理$DIR中的所有个文件名并且将所有提取的标记读入 array:

IFS=$'\n' read -d '' -ra levels < \
  <(printf '%s\n' "$DIR"/* | egrep -o '_[0-9]+' | sed 's/_//')

要稍后处理提取的标记，请使用：

for level in "${levels[@]}"; do
  echo "$level" # work with $level
done

Seletively extract number from file name