无需转换即可读取日期时间 pandas

Reading in datetime pandas without having to convert

我有一个非常大的文件,我想知道是否可以读入 CSV(它在写入时有一个日期时间列)以便日期时间列作为日期时间读入,而不是细绳。问题是读入后使用pd.to_datetime转换需要4个小时左右。

假设 df 是 df。该文件是 df.csv

日期列是df.date

是的,看看docs中的parse_dates选项。例如:

import pandas as pd
from StringIO import StringIO

data = """
date,   c1
2012-07-31 02:00, 1.1
2012-07-31 02:15, 2.2
2012-07-31 02:30, 3.3
"""

df = pd.read_csv(StringIO(data), parse_dates=['date'])

检查:

>>> df.dtypes
date    datetime64[ns]
 c1            float64
dtype: object