Pandas 突然更改日期格式
Pandas changes the date format abruptly
我想导入一个 csv 文件并绘制它,但令我惊讶的是,该图看起来很奇怪,因为日期格式在第 11 个值之后发生变化。 Pandas 将日期格式解释为不正确。
我的数据集从 2016 年 4 月 2 日开始。
csv 文件是这个
df.head 显示了这个
[]
从第 11 个数据点开始,head() 给出一种格式,然后从第 12 个数据点开始,格式发生变化。
这让我感到困惑,因为 plot 函数也给出了这样的奇怪情节
[]
谁能指导我我哪里出错了。
我想绘制一系列 2016 年 4 月 2 日至 2019 年 2 月 15 日的销售数据。
仅供参考:excel 工作表看起来像这样
[]
当第一个数字无法解析为月份数字 (13) 时,问题就开始了。这实际上不是问题,它在 12 之后开始按预期工作,因此默认情况下第一个数字被视为月份。我假设您正在解析 .csv 或类似的东西,所以 dayfirst
标志会有所帮助:
pd.read_csv('data.csv', dayfirst=True, parse_dates=True, index_col=[0])
(就像这个答案)
我想导入一个 csv 文件并绘制它,但令我惊讶的是,该图看起来很奇怪,因为日期格式在第 11 个值之后发生变化。 Pandas 将日期格式解释为不正确。
我的数据集从 2016 年 4 月 2 日开始。 csv 文件是这个
df.head 显示了这个
[
从第 11 个数据点开始,head() 给出一种格式,然后从第 12 个数据点开始,格式发生变化。 这让我感到困惑,因为 plot 函数也给出了这样的奇怪情节
[
谁能指导我我哪里出错了。 我想绘制一系列 2016 年 4 月 2 日至 2019 年 2 月 15 日的销售数据。 仅供参考:excel 工作表看起来像这样
[
当第一个数字无法解析为月份数字 (13) 时,问题就开始了。这实际上不是问题,它在 12 之后开始按预期工作,因此默认情况下第一个数字被视为月份。我假设您正在解析 .csv 或类似的东西,所以 dayfirst
标志会有所帮助:
pd.read_csv('data.csv', dayfirst=True, parse_dates=True, index_col=[0])
(就像这个答案