如何连接两个具有不同长度的单列数据帧以便更新 DateTime 索引?
How to concatenate two single column dataframes with different lengths so that DateTime index gets updated?
我有两个不同长度的单列数据帧,我想使用类似于以下内容的方式逐列连接:
df = pd.concat([df, df_add], axis = 1, join = 'outer')
我想更新 df,使其具有来自 df 的第一列和来自 df_add 的列在它旁边。并非所有 DateTime 索引都匹配(两个数据框中的几行已被删除)。
我的数据框是:
df:
col 1
TimeStamp
2012-09-20 00:00:00 -11.280400
2012-09-20 00:10:00 -11.945430
2012-09-20 00:20:00 -11.962580
2012-09-20 00:30:00 -12.074700
2012-09-20 00:40:00 -11.923750
...
2019-05-09 23:40:00 690.570129
2019-05-10 00:00:00 565.838928
2019-05-10 02:00:00 1154.415039
2019-05-10 22:00:00 347.493195
2019-05-12 07:20:00 NaN
[345850 rows x 1 columns]
和df_add:
col 2
TimeStamp
2012-09-20 00:00:00 -12.037120
2012-09-20 00:10:00 -12.575330
2012-09-20 00:20:00 -12.821350
2012-09-20 00:30:00 -11.959330
2012-09-20 00:40:00 -12.103370
...
2019-05-31 23:20:00 1876.394043
2019-05-31 23:30:00 1783.564941
2019-05-31 23:40:00 1554.718994
2019-05-31 23:50:00 1558.073975
2019-06-01 00:00:00 1597.640991
[343128 rows x 1 columns]
我想获得这样的东西,用 NaN 填充与索引不匹配的单元格。
不幸的是,当我尝试上面的代码行时,出现了以下错误:
Shape of passed values is (952153, 2), indices imply (355645, 2)
如有任何帮助,我将不胜感激!
问候!
您正在寻找 pd.DataFrame.join - 无法尝试,我会说
df_added = df.join(df_add, how='outer')
会给你你想要的。
我有两个不同长度的单列数据帧,我想使用类似于以下内容的方式逐列连接:
df = pd.concat([df, df_add], axis = 1, join = 'outer')
我想更新 df,使其具有来自 df 的第一列和来自 df_add 的列在它旁边。并非所有 DateTime 索引都匹配(两个数据框中的几行已被删除)。
我的数据框是:
df:
col 1
TimeStamp
2012-09-20 00:00:00 -11.280400
2012-09-20 00:10:00 -11.945430
2012-09-20 00:20:00 -11.962580
2012-09-20 00:30:00 -12.074700
2012-09-20 00:40:00 -11.923750
...
2019-05-09 23:40:00 690.570129
2019-05-10 00:00:00 565.838928
2019-05-10 02:00:00 1154.415039
2019-05-10 22:00:00 347.493195
2019-05-12 07:20:00 NaN
[345850 rows x 1 columns]
和df_add:
col 2
TimeStamp
2012-09-20 00:00:00 -12.037120
2012-09-20 00:10:00 -12.575330
2012-09-20 00:20:00 -12.821350
2012-09-20 00:30:00 -11.959330
2012-09-20 00:40:00 -12.103370
...
2019-05-31 23:20:00 1876.394043
2019-05-31 23:30:00 1783.564941
2019-05-31 23:40:00 1554.718994
2019-05-31 23:50:00 1558.073975
2019-06-01 00:00:00 1597.640991
[343128 rows x 1 columns]
我想获得这样的东西,用 NaN 填充与索引不匹配的单元格。
不幸的是,当我尝试上面的代码行时,出现了以下错误:
Shape of passed values is (952153, 2), indices imply (355645, 2)
如有任何帮助,我将不胜感激! 问候!
您正在寻找 pd.DataFrame.join - 无法尝试,我会说
df_added = df.join(df_add, how='outer')
会给你你想要的。