使用 posix awk 或 sed 将段落条目转换为列?
Turn paragraph entries into columns with posix awk or sed?
我正在解析一个如下所示的文件:
Al Bronson
Bud Collins
Yousef Zane
2020-03-04
2020-04-04
2018-05-14
Actor 8
Stage 3
Producer 2
我希望将它们格式化为:
Al Bronson,2020-03-04,Actor 8
Bud Collins,2020-04-04,Stage 3
Yousef Zane,2018-05-14,Producer 2
我试过了
awk 'BEGIN {
FS = "\n"
RS = ""
OFS = ","
ORS = "\n"
}
{
for (i=1; i<=NF; i++) {
arr[$i] = $i
}
}
END {
for (i=1; i<=NF; i++)
print arr[$i]
}' \
"$FILE"
但它只是输出
Actor 8
Stage 3
Producer 2
奇怪的是:
awk 'BEGIN {
FS = "\n"
RS = ""
OFS = ","
ORS = "\n"
}
{
print
}' \
"$FILE"
输出接近我想要的东西:
Al Bronson
2020-03-04
Actor 8
我无计可施b/c 这看起来很容易而且——我想——我很接近了!
谁能解释一下这是怎么回事?
i
是一个数字,而 $i
是 i-th 字段的内容,所以 arr[i]
而不是 arr[$i]
是您想要的语法.您还必须附加新字段,而不是分配和覆盖现有内容。所以你的脚本应该是:
BEGIN {
FS = "\n"
RS = ""
OFS = ","
ORS = "\n"
}
{
for (i=1; i<=NF; i++) {
arr[i] = (arr[i]? arr[i] OFS $i: $i)
}
}
END {
for (i=1; i<=NF; i++)
print arr[i]
}
我假设输入由三个记录组成,并且每个记录具有相同数量的字段(行)。下面的脚本读取这三个记录并在换行符上拆分每个记录。
awk -F'\n' -v RS= -v OFS=, '
NR == 1 { n = split([=10=], names) }
NR == 2 { split([=10=], dates) }
NR == 3 { split([=10=], info) }
END { for (i = 1; i <= n; ++i) print names[i], dates[i], info[i] }
' file
我正在解析一个如下所示的文件:
Al Bronson
Bud Collins
Yousef Zane
2020-03-04
2020-04-04
2018-05-14
Actor 8
Stage 3
Producer 2
我希望将它们格式化为:
Al Bronson,2020-03-04,Actor 8
Bud Collins,2020-04-04,Stage 3
Yousef Zane,2018-05-14,Producer 2
我试过了
awk 'BEGIN {
FS = "\n"
RS = ""
OFS = ","
ORS = "\n"
}
{
for (i=1; i<=NF; i++) {
arr[$i] = $i
}
}
END {
for (i=1; i<=NF; i++)
print arr[$i]
}' \
"$FILE"
但它只是输出
Actor 8
Stage 3
Producer 2
奇怪的是:
awk 'BEGIN {
FS = "\n"
RS = ""
OFS = ","
ORS = "\n"
}
{
print
}' \
"$FILE"
输出接近我想要的东西:
Al Bronson
2020-03-04
Actor 8
我无计可施b/c 这看起来很容易而且——我想——我很接近了!
谁能解释一下这是怎么回事?
i
是一个数字,而 $i
是 i-th 字段的内容,所以 arr[i]
而不是 arr[$i]
是您想要的语法.您还必须附加新字段,而不是分配和覆盖现有内容。所以你的脚本应该是:
BEGIN {
FS = "\n"
RS = ""
OFS = ","
ORS = "\n"
}
{
for (i=1; i<=NF; i++) {
arr[i] = (arr[i]? arr[i] OFS $i: $i)
}
}
END {
for (i=1; i<=NF; i++)
print arr[i]
}
我假设输入由三个记录组成,并且每个记录具有相同数量的字段(行)。下面的脚本读取这三个记录并在换行符上拆分每个记录。
awk -F'\n' -v RS= -v OFS=, '
NR == 1 { n = split([=10=], names) }
NR == 2 { split([=10=], dates) }
NR == 3 { split([=10=], info) }
END { for (i = 1; i <= n; ++i) print names[i], dates[i], info[i] }
' file