使用 Ipython 和 pandas 合并和分组多个 csv 文件
Merging and grouping multiple csv files with Ipython and pandas
我想要这样的东西:
Column A Column B Column C
100 200 No Value
400 No value 500
当 CSV 文件如下所示时:
CSV 文件 1
Column A Column B
100 200
CSV 文件 2
Column A Column C
400 500
我已经开始导入类似这样的东西:
file_list = [CSV File 1, CSV File 2]
#Empty list
list = []
for n in range(len(file_list)):
g = pd.read_csv(file_list[n], delimiter = "\;")
list.append(g)
#Data frame for all the values
real_list = pd.concat(list, axis = 1)
这给出了类似的结果。
Column A Column B Column A Column B
100 200 400 500
这是错误的。
非常感谢任何想法=)
只需执行一个外merge
:
In [8]:
df.merge(df1, how='outer')
Out[8]:
Column A Column B Column C
0 100 200 NaN
1 400 NaN 500
使用 concat
时得到该结果的原因是您按列连接并且它在公共索引值上对齐
我想要这样的东西:
Column A Column B Column C
100 200 No Value
400 No value 500
当 CSV 文件如下所示时:
CSV 文件 1
Column A Column B
100 200
CSV 文件 2
Column A Column C
400 500
我已经开始导入类似这样的东西:
file_list = [CSV File 1, CSV File 2]
#Empty list
list = []
for n in range(len(file_list)):
g = pd.read_csv(file_list[n], delimiter = "\;")
list.append(g)
#Data frame for all the values
real_list = pd.concat(list, axis = 1)
这给出了类似的结果。
Column A Column B Column A Column B
100 200 400 500
这是错误的。
非常感谢任何想法=)
只需执行一个外merge
:
In [8]:
df.merge(df1, how='outer')
Out[8]:
Column A Column B Column C
0 100 200 NaN
1 400 NaN 500
使用 concat
时得到该结果的原因是您按列连接并且它在公共索引值上对齐