如何在 pandas 数据框的多列中 min/max 值?
How to min/max value in multiple columns of a pandas dataframe?
如何从一个数据框中获取多个列的一个 min/max 值?我找不到获取这些值的简单方法,只能通过循环遍历列或多次转换数据帧。我认为一定有更好的方法来解决这个问题。
例如,这里有一些代码...
import pandas as pd
df = pd.DataFrame([[0,1,2,3],
[6,5,None,pd.NaT],
[8,None,9,None],
[None,12,7,14]], columns=list('ABCD'))
...这就是数据框的样子,我想要 'C' 列的 min/max 和 'D'.
A B C D
0 0.0 1.0 2.0 3
1 6.0 5.0 NaN NaT
2 8.0 NaN 9.0 None
3 NaN 12.0 7.0 14
执行此操作的好方法是什么?
补充说明:['C','D'] 两列的结果应该是一个最小值 (2) 和一个最大值 (14)
对列表中选定的列使用 DataFrame.agg
- ['C','D']
:
df1 = df[['C','D']].agg(['min','max'])
print (df1)
C D
min 2.0 3
max 9.0 14
编辑:对于 2 个标量,您可以使用:
s = df[['C','D']].stack()
print (s)
0 C 2
D 3
2 C 9
3 C 7
D 14
dtype: object
a = s.max()
print (a)
14
b = s.min()
print (b)
2
如果您不确定列名,并想在最后 2 列上这样做,您可以这样做:
In [2138]: df.iloc[:, -2:].agg(['max', 'min'])
Out[2138]:
C D
max 9.0 14
min 2.0 3
可以使用,
df[['C','D']].min().min()
2.0
和
df[['C', 'D']].max().max()
14.0
如何从一个数据框中获取多个列的一个 min/max 值?我找不到获取这些值的简单方法,只能通过循环遍历列或多次转换数据帧。我认为一定有更好的方法来解决这个问题。
例如,这里有一些代码...
import pandas as pd
df = pd.DataFrame([[0,1,2,3],
[6,5,None,pd.NaT],
[8,None,9,None],
[None,12,7,14]], columns=list('ABCD'))
...这就是数据框的样子,我想要 'C' 列的 min/max 和 'D'.
A B C D
0 0.0 1.0 2.0 3
1 6.0 5.0 NaN NaT
2 8.0 NaN 9.0 None
3 NaN 12.0 7.0 14
执行此操作的好方法是什么?
补充说明:['C','D'] 两列的结果应该是一个最小值 (2) 和一个最大值 (14)
对列表中选定的列使用 DataFrame.agg
- ['C','D']
:
df1 = df[['C','D']].agg(['min','max'])
print (df1)
C D
min 2.0 3
max 9.0 14
编辑:对于 2 个标量,您可以使用:
s = df[['C','D']].stack()
print (s)
0 C 2
D 3
2 C 9
3 C 7
D 14
dtype: object
a = s.max()
print (a)
14
b = s.min()
print (b)
2
如果您不确定列名,并想在最后 2 列上这样做,您可以这样做:
In [2138]: df.iloc[:, -2:].agg(['max', 'min'])
Out[2138]:
C D
max 9.0 14
min 2.0 3
可以使用,
df[['C','D']].min().min()
2.0
和
df[['C', 'D']].max().max()
14.0