Python、pandas 个数据帧。 pd.fillna() 用于具有特定值的特定列

Python, pandas dataframes. pd.fillna() for specific columns with specific values

例如这样的数据框:

| 1  6   nan ... |
| 1  nan 5   ... |
|nan 2   4   ... |
|... ... ... ....

我想使用列表 [11, 12, 13 ...] 中的值来用列表中的值填充 nan。因此,第一列的 nans 为 10,第二列为 12,依此类推。 有没有办法在不使用 .hstack()df[column].fillna(value) 的情况下做到这一点?

解决方案

from itertools import cycle
import pandas as pd

c = cycle([11, 12, 13])

df.applymap(lambda x: next(c) if pd.isnull(x) else x)

循环函数 returns 可以从中获取下一个值的对象。然后使用 applymap 访问 DataFrame 的每个单元格。如果为空,则填充循环中的下一项。

您可以将 Series 传递给 DataFrame.fillna; DataFrame 的列与 Series:

的索引对齐
import numpy as np
import pandas as pd
nan = np.nan

df = pd.DataFrame({'A':[1,1,nan],'B':[6,nan,2],'C':[nan,5,4]})
ser = pd.Series([11,12,13], index=list('ABC'))
print(df.fillna(ser))

产量

      A     B     C
0   1.0   6.0  13.0
1   1.0  12.0   5.0
2  11.0   2.0   4.0