根据其他列查找最大值

Finding the max value in accordance with other columns

我有学生姓名,不同科目的分数,科目名称。我想在数据框中添加一列,其中包含每个学生得分最高的科目。 这是数据:

输入数据为:

输出数据(结果数据框)为:

我的尝试(显然没有奏效):

Data['Subject with highest score'] = Data.groupby(['Names','Subject'])[['Scores']].transform(lambda x: x.max())

Scores 对值进行排序,然后按 Namestransform 对数据帧进行分组 Subjectlast

df['S(max)'] = df.sort_values('Scores').groupby('Names')['Subject'].transform('last')

或者,我们可以按 Names 对数据帧进行分组,然后将 Scores 转换为 idxmax 以广播对应于具有最大分数的行的索引,然后使用这些索引来获取相应的来自 Subject 列的行

df['S(max)'] = df.loc[df.groupby('Names')['Scores'].transform('idxmax'), 'Subject'].tolist()

      Names  Scores    Subject     S(max)
0       Dan      98       Math       Math
1       Dan      88    English       Math
2       Dan      90    Biology       Math
3       Bob      80       Math  Chemistry
4       Bob      93  Chemistry  Chemistry
5       Bob      70     Sports  Chemistry
6       Bob      85     French  Chemistry
7   Michael     100    History    History
8    Sandra      67     French     French
9   Michael      89       Math    History
10  Michael      74     Sports    History
11    Jacky      65    Biology    Physics
12    Jacky     100    Physics    Physics
13    Jacky      90   Geometry    Physics
14    Jacky      87  Geography    Physics
15    Jacky      69       Math    Physics
16      Dan      73     Sports       Math
17   Sandra      50    History     French