按姓氏对 Awk 数组进行排序

Sorting Awk array by last name

在我的脚本中,我从一份竞选捐助者的文件开始,任何人只要集体捐出 500 美元就有资格参加比赛。任何满足该条件的人我都会添加到一个数组中,索引递增以根据需要调整大小。每个索引的格式如下所示,其中 X 是一个 phone 数字。在脚本的 END 部分,我需要按姓氏 ($2) 对这个数组进行排序以便打印。我做了一些搜索,但空手而归。我不是要别人帮我打字,只是为了给我指明更好的搜索方向或提供建议。我需要帮助对数组参赛者进行排序,因为目前它将按照我需要它们进行分配的方式正确填充字符串值。

其中 v1、2 和 3 是竞选捐款,我在我的命令中使用 -F'[ :]' 来获取空格和冒号作为字段分隔符。

输入文件lab4.data

Fname Lname:Phone__Number:v1:v2:v3   
Mike Harrington:(510) 548-1278:250:100:175 
Christian Dobbins:(408) 538-2358:155:90:201 
Susan Dalsass:(206) 654-6279:250:60:50 
Archie McNichol:(206) 548-1348:250:100:175 
Jody Savage:(206) 548-1278:15:188:150 
Guy Quigley:(916) 343-6410:250:100:175 
Dan Savage:(406) 298-7744:450:300:275 
Nancy McNeil:(206) 548-1278:250:80:75 
John Goldenrod:(916) 348-4278:250:100:175 
Chet Main:(510) 548-5258:50:95:135   
Tom Savage:(408) 926-3456:250:168:200  
Elizabeth Stachelin:(916) 440-1763:175:75:300 

用于保存任何人 > $500 的数组,已创建 $8 并保存值 $5+$6+$7: 该数组已初始化并填充了下面给出的循环

 = ++;

contestants[len++]

循环检查将人员添加到参赛者数组。 name 和 number 是保存各自值以备后用的数组。

for(i=0;i<=NR;i++)if(contrib[i]>500){contestants[len++]= name[i]"   "number[i] }

索引格式(参赛者[len++]所需的数组值):

[0]   Mike Harrington (510) 548-1278
[1]   Archie McNichol (206) 548-1348 
[2]   Guy Quigley (916) 343-6410
[3]   Dan Savage (406) 298-7744
[4]   John Goldenrod (916) 348-4278
[5]   Tom Savage (408) 926-3456
[6]   Elizabeth Stachelin (916) 440-1763

循环到 print/check 数组已正确填充(它是)

for (i=0; i <len; i++) {print contestants[i]}

输出:

Mike Harrington (510) 548-1278
Archie McNichol (206) 548-1348
Guy Quigley (916) 343-6410
Dan Savage (406) 298-7744
John Goldenrod (916) 348-4278
Tom Savage (408) 926-3456
Elizabeth Stachelin (916) 440-1763

期望的最终输出:忽略格式,因为它在我的终端中正确显示我只是很难在这里得到它。

               ***FIRST QUARTERLY REPORT***                          
            ***CAMPAIGN 2004 CONTRIBUTIONS***                       

   Name            Phone             Jan  |  Feb  |  Mar  |  Total Donated 
Mike Harrington     (510)548-1278   $ 250   $ 100   $ 175   $ 525
Christian Dobbins   (408)538-2358   $ 155   $ 90    $ 201   $ 446
Susan Dalsass       (206)654-6279   $ 250   $ 60    $ 50    $ 360
Archie McNichol     (206)548-1348   $ 250   $ 100   $ 175   $ 525
Jody Savage         (206)548-1278   $ 15    $ 188   $ 150   $ 353
Guy Quigley         (916)343-6410   $ 250   $ 100   $ 175   $ 525
Dan Savage          (406)298-7744   $ 450   $ 300   $ 275   $ 1025
Nancy McNeil        (206)548-1278   $ 250   $ 80    $ 75    $ 405
John Goldenrod      (916)348-4278   $ 250   $ 100   $ 175   $ 525
Chet Main           (510)548-5258   $ 50    $ 95    $ 135   $ 280
Tom Savage          (408)926-3456   $ 250   $ 168   $ 200   $ 618
Elizabeth Stachelin (916)440-1763   $ 175   $ 75    $ 300   $ 550
-----------------------------------------------------------------------------
SUMMARY
-----------------------------------------------------------------------------
The campaign received a total of 37.00 for this quarter.
The average donation for the 12 contributors was 1.42.
The highest total contribution was 25.00 made by Dan Savage.
                ***Thank you Dan Savage***                           
The following people donated over 0 to the campaign.
They are eligible for the quarterly drawing!!
Listed are their names(sorted by last names) and phone numbers.

John Goldenrod (916) 348-4278
Mike Harrington (510) 548-1278
Archie McNichol (206) 548-1348
Guy Quigley (916) 343-6410
Dan Savage (406) 298-7744
Tom Savage (408) 926-3456
Elizabeth Stachelin (916) 440-1763

Thank you all for your continued support!!

使用gawk,使用内置排序函数很简单,例如

BEGIN {
    data["Jane Doe (123) 456-7890"] = 600;
    data["Fred Adams (123) 456-7891"] = 800;
    data["John Smith (123) 456-7892"] = 900;
    exit;
    }

END {
    for (i in data) {
        split(i,x," ")
        data1[x[2] " " x[1] " " x[3] " " x[4]] = i;
        }
    asorti(data1,sdata1);
    for (i in sdata1) {
        print data1[sdata1[i]],"\t",data[data1[sdata1[i]]];
    }
}

... 产生:

Fred Adams (123) 456-7891        800
Jane Doe (123) 456-7890          600
John Smith (123) 456-7892        900

在普通的 awk 中,可以通过将数组索引写入文件、对该文件排序然后使用 getline.

读回文件来实现相同的结果。

解决这个问题的方法是在读取数据时生成预汇总输出,这样您就不需要将所有数据存储在一个数组中,只需将捐款超过 500 美元的人插入即可使用插入排序算法将它们按所需顺序放入数组中。

你会这样做:

awk -F':' '
NR==1 {
    print "header stuff"
    next
}
{
    tot =  +  + 
    printf "%-20s%10s $%5s $%5s $%5s $%5s\n", , , , , , tot
}
tot > 500 {
    split(,name,/ /)
    surname = name[2]
    numContribs++
    # insertion sort, check the algorithm:
    for (i=1; i<=numContribs; i++) {
        if (surname > surnames[i]) {
            for (j=numContribs; j>i; j--) {
                surnames[j+1] = surnames[j]
                contribs[j+1] = contribs[j]
            }
            surnames[i] = surname
            contribs[i] =  " " 
            break
        }
    }
}
END {
    print "SUMMARY and text below it and then the list of 0+ contributors:"
    for (i=1; i<=numContribs; i++) {
        print contribs[i]
    }
}
' lab4.data

以上不是一个功能齐全的程序。它只是为了根据您的要求向您展示正确的方法。