将输出保存在 CSV 中,而不会丢失 pandas 数据框中该 CSV 上的先前数据
Save output in CSV without losing previous data on that CSV in pandas dataframe
我正在对 Tweeter 数据进行情绪分析。对于这项工作,我制作了一些 CSV 格式的数据集,其中不同的月份在不同的数据集中。当我单独对每个数据集进行预处理时,我想将所有数据集保存在 1 个 CSV 文件中。但是当我使用 pandas 数据框编写下面的代码时:
df.to_csv('dataset.csv', index=False)
它删除了该数据集的先前数据(行)。有什么办法可以将以前的数据也保存在该文件中吗?这样我就可以将所有数据合并在一起。谢谢…………
目前还不完全清楚你想从你的问题中得到什么,所以这只是一个猜测,但你可能正在寻找这样的东西。如果您继续将数据帧分配给 df
,那么新数据将覆盖旧数据。尝试将它们重新分配给不同名称的数据帧,例如 df1
和 `df21。然后就可以合并了。
# vertically merge the multiple dataframes and reassign to new variable
df = pd.concat([df1, df2])
# save the dataframe
df.to_csv('my_dataset.csv', index=False)
我正在对 Tweeter 数据进行情绪分析。对于这项工作,我制作了一些 CSV 格式的数据集,其中不同的月份在不同的数据集中。当我单独对每个数据集进行预处理时,我想将所有数据集保存在 1 个 CSV 文件中。但是当我使用 pandas 数据框编写下面的代码时:
df.to_csv('dataset.csv', index=False)
它删除了该数据集的先前数据(行)。有什么办法可以将以前的数据也保存在该文件中吗?这样我就可以将所有数据合并在一起。谢谢…………
目前还不完全清楚你想从你的问题中得到什么,所以这只是一个猜测,但你可能正在寻找这样的东西。如果您继续将数据帧分配给 df
,那么新数据将覆盖旧数据。尝试将它们重新分配给不同名称的数据帧,例如 df1
和 `df21。然后就可以合并了。
# vertically merge the multiple dataframes and reassign to new variable
df = pd.concat([df1, df2])
# save the dataframe
df.to_csv('my_dataset.csv', index=False)