Pandas concat 结果与 NaN 不一致
Pandas concat results are misaligned with NaNs
我有一个数据框,用于拟合具有分类和数值特征的 ML 算法。
所以我拆分了这个 df 并使用单热编码转换了分类特征,现在我有了 numpy 矩阵,我必须将它与数字特征连接回 df,因此数字数据帧的第一行将获得第一矩阵行作为新特征。
根据谷歌搜索 'join dataframes' 命令的文档和结果
pd.concat([X_numerical, pd.DataFrame(numpy_matrix)], axis=1)
但我得到这个 - 比如 'axis' 参数被忽略(我清理了 np.nan 中的所有原始数据):
我做错了什么?我希望在没有这些 NaN 的情况下得到结果数据帧,df 行与矩阵行一一连接
我发现索引未对齐可能存在问题。最好的办法是重置索引:
df = pd.concat([
X_numerical.reset_index(),
pd.DataFrame(numpy_matrix)
], axis=1)
我有一个数据框,用于拟合具有分类和数值特征的 ML 算法。 所以我拆分了这个 df 并使用单热编码转换了分类特征,现在我有了 numpy 矩阵,我必须将它与数字特征连接回 df,因此数字数据帧的第一行将获得第一矩阵行作为新特征。
根据谷歌搜索 'join dataframes' 命令的文档和结果
pd.concat([X_numerical, pd.DataFrame(numpy_matrix)], axis=1)
但我得到这个 - 比如 'axis' 参数被忽略(我清理了 np.nan 中的所有原始数据):
我做错了什么?我希望在没有这些 NaN 的情况下得到结果数据帧,df 行与矩阵行一一连接
我发现索引未对齐可能存在问题。最好的办法是重置索引:
df = pd.concat([
X_numerical.reset_index(),
pd.DataFrame(numpy_matrix)
], axis=1)