Pandas 突然更改日期格式

Pandas changes the date format abruptly

我想导入一个 csv 文件并绘制它,但令我惊讶的是,该图看起来很奇怪,因为日期格式在第 11 个值之后发生变化。 Pandas 将日期格式解释为不正确。

我的数据集从 2016 年 4 月 2 日开始。 csv 文件是这个

df.head 显示了这个

[]

从第 11 个数据点开始,head() 给出一种格式,然后从第 12 个数据点开始,格式发生变化。 这让我感到困惑,因为 plot 函数也给出了这样的奇怪情节

[]

谁能指导我我哪里出错了。 我想绘制一系列 2016 年 4 月 2 日至 2019 年 2 月 15 日的销售数据。 仅供参考:excel 工作表看起来像这样

[]

当第一个数字无法解析为月份数字 (13) 时,问题就开始了。这实际上不是问题,它在 12 之后开始按预期工作,因此默认情况下第一个数字被视为月份。我假设您正在解析 .csv 或类似的东西,所以 dayfirst 标志会有所帮助: pd.read_csv('data.csv', dayfirst=True, parse_dates=True, index_col=[0])(就像这个答案

或参考Pandas timeseries