如何在 read_csv 中指定日期时间格式
how to specify the datetime format in read_csv
我有一个文件,其中每一行的格式如下:
YYYY-MM-DD-HH-MM-SS uint64 float64 float64 uint64
我读过:
pd.read_csv('file.txt', sep=' ', header=None, index_col=0, names= ('C1', 'C2', 'C3', 'C4'), use_unsigned=True, parse_dates=True, infer_datetime_format=True)
构造的日期时间不正确。
我可以指定确切的格式吗?
我找到了这个方法
f = lambda s: datetime.datetime.strptime(s,'%Y-%m-%d-%H-%M-%S')
pd.read_csv('file.txt', sep=' ', header=None, index_col=0, names= ('C1', 'C2', 'C3', 'C4'), use_unsigned=True, date_parser=f)
有效
您可以将解析正确格式的函数传递给 read_csv
的 date_parser
kwarg,但另一种选择是在读取时不解析日期,但之后使用 to_datetime
(此函数允许指定格式,并且比自定义 date_parser
函数更快):
df = pd.read_csv('file.txt', sep=' ', header=None, index_col=0, names= ('C1', 'C2', 'C3', 'C4'), use_unsigned=True)
df.index = pd.to_datetime(df.index, format="%Y-%m-%d-%H-%M-%S")
我有一个文件,其中每一行的格式如下:
YYYY-MM-DD-HH-MM-SS uint64 float64 float64 uint64
我读过:
pd.read_csv('file.txt', sep=' ', header=None, index_col=0, names= ('C1', 'C2', 'C3', 'C4'), use_unsigned=True, parse_dates=True, infer_datetime_format=True)
构造的日期时间不正确。 我可以指定确切的格式吗?
我找到了这个方法
f = lambda s: datetime.datetime.strptime(s,'%Y-%m-%d-%H-%M-%S')
pd.read_csv('file.txt', sep=' ', header=None, index_col=0, names= ('C1', 'C2', 'C3', 'C4'), use_unsigned=True, date_parser=f)
有效
您可以将解析正确格式的函数传递给 read_csv
的 date_parser
kwarg,但另一种选择是在读取时不解析日期,但之后使用 to_datetime
(此函数允许指定格式,并且比自定义 date_parser
函数更快):
df = pd.read_csv('file.txt', sep=' ', header=None, index_col=0, names= ('C1', 'C2', 'C3', 'C4'), use_unsigned=True)
df.index = pd.to_datetime(df.index, format="%Y-%m-%d-%H-%M-%S")