Hadoop Pig Max 命令
Hadoop Pig Max Command
我有一个文件,里面包含了全世界所有国家的数据。
我想找出机场最大的国家。
我写了下面的代码:
A = load 'airports.dat' USING PigStorage (',') AS(AirportID:int,Name:chararray,City:chararray,Country:chararray,IATA:chararray,IATAothers:chararray,Latitude:float,Longitude:float,Altitude:float,Timezone:float,DST:chararray,Zone:chararray);
B= GROUP A BY Country;
C= FOREACH B GENERATE A.Country, COUNT(A) AS Count;
但在这之后我不知道如何找到最大值。
谁能帮忙。
您已经创建了每个国家/地区的机场数量。您现在需要做的是,取数字最高的行:
D = order C by DESC;
E = limit D 1;
dump E;
我有一个文件,里面包含了全世界所有国家的数据。
我想找出机场最大的国家。
我写了下面的代码:
A = load 'airports.dat' USING PigStorage (',') AS(AirportID:int,Name:chararray,City:chararray,Country:chararray,IATA:chararray,IATAothers:chararray,Latitude:float,Longitude:float,Altitude:float,Timezone:float,DST:chararray,Zone:chararray);
B= GROUP A BY Country;
C= FOREACH B GENERATE A.Country, COUNT(A) AS Count;
但在这之后我不知道如何找到最大值。
谁能帮忙。
您已经创建了每个国家/地区的机场数量。您现在需要做的是,取数字最高的行:
D = order C by DESC;
E = limit D 1;
dump E;