我可以在没有 for 循环的情况下将函数应用于 Pandas 数据框中的多个列吗?
Can I apply a function to multiple columns in Pandas dataframe without a for loop?
有没有一种方法可以在不循环的情况下将函数应用于 Pandas 数据框中的多个列?例如,给这个数据框:
df = pd.DataFrame({'id': [1,2,3,4,5,6,7,8,9,10],
'val1': [2,2,np.nan,np.nan,4,1,np.nan,np.nan,np.nan,2],
'val2': [7,0.2,5,8,np.nan,1,0,np.nan,1,1],
})
display(df)
如果我想同时对val1
和val2
列进行操作,我可以执行以下操作。有没有一行代码来代替for循环?
f = lambda x: 'ERR' if x < 5 else x
cols = ['val1', 'val2']
for c in cols:
df[c] = df[c].apply(f)
display(df)
applymap
df.assign(**df[cols].applymap(f))
id val1 val2
0 1 ERR 7.0
1 2 ERR ERR
2 3 NaN 5.0
3 4 NaN 8.0
4 5 ERR NaN
5 6 ERR ERR
6 7 NaN ERR
7 8 NaN NaN
8 9 NaN ERR
9 10 ERR ERR
mask
df.assign(**df[cols].mask(df[cols] < 5, 'ERR'))
id val1 val2
0 1 ERR 7.0
1 2 ERR ERR
2 3 NaN 5.0
3 4 NaN 8.0
4 5 ERR NaN
5 6 ERR ERR
6 7 NaN ERR
7 8 NaN NaN
8 9 NaN ERR
9 10 ERR ERR
有没有一种方法可以在不循环的情况下将函数应用于 Pandas 数据框中的多个列?例如,给这个数据框:
df = pd.DataFrame({'id': [1,2,3,4,5,6,7,8,9,10],
'val1': [2,2,np.nan,np.nan,4,1,np.nan,np.nan,np.nan,2],
'val2': [7,0.2,5,8,np.nan,1,0,np.nan,1,1],
})
display(df)
如果我想同时对val1
和val2
列进行操作,我可以执行以下操作。有没有一行代码来代替for循环?
f = lambda x: 'ERR' if x < 5 else x
cols = ['val1', 'val2']
for c in cols:
df[c] = df[c].apply(f)
display(df)
applymap
df.assign(**df[cols].applymap(f))
id val1 val2
0 1 ERR 7.0
1 2 ERR ERR
2 3 NaN 5.0
3 4 NaN 8.0
4 5 ERR NaN
5 6 ERR ERR
6 7 NaN ERR
7 8 NaN NaN
8 9 NaN ERR
9 10 ERR ERR
mask
df.assign(**df[cols].mask(df[cols] < 5, 'ERR'))
id val1 val2
0 1 ERR 7.0
1 2 ERR ERR
2 3 NaN 5.0
3 4 NaN 8.0
4 5 ERR NaN
5 6 ERR ERR
6 7 NaN ERR
7 8 NaN NaN
8 9 NaN ERR
9 10 ERR ERR