处理 Python 中具有布尔值 (1,0) 的列中的缺失数据
Handling Missing data in column with Boolean Values(1,0) in Python
我正在使用 Python 执行数据清理工作,其中我遇到了包含缺失数据(布尔值)的列的数据
示例:df=[1,0,1,0,NaN,1,0,NaN)
我试过 df.fillna(df.mean()) 但这会给我 1 和 0 的平均值代替 "NaN" .
不处理这个,分析将无法完成。
请指教
我认为滚动可能会解决这个问题,它将在 window 中取最大值 2 :
df=pd.DataFrame([1,0,1,0,np.nan,1,0,np.nan])
df.fillna(0).rolling(window=2,min_periods=1).max()
我正在使用 Python 执行数据清理工作,其中我遇到了包含缺失数据(布尔值)的列的数据
示例:df=[1,0,1,0,NaN,1,0,NaN)
我试过 df.fillna(df.mean()) 但这会给我 1 和 0 的平均值代替 "NaN" . 不处理这个,分析将无法完成。 请指教
我认为滚动可能会解决这个问题,它将在 window 中取最大值 2 :
df=pd.DataFrame([1,0,1,0,np.nan,1,0,np.nan])
df.fillna(0).rolling(window=2,min_periods=1).max()