加快日期列从字符串到日期时间的转换 (pandas)
Speed up date columns conversion (pandas) from string to datetime
我正在 python 中处理一个大型 .csv 文件,它的日期列是 'str'。
我正在使用以下代码将此列中的记录转换为日期时间。
df[date_column].fillna('1900-01-01',inplace=True)
df[date_column] = df[date_column].apply(lambda x : pd.to_datetime(x, format = datetime_format))
但这似乎需要很长时间才能执行。欢迎任何有关如何处理此问题的建议。谢谢
当您阅读 csv 时,您可以使用 parse_dates
df = pd.read_csv('yourcsv.csv',parse_dates = date_column)
那么让我们用converters
pd.read_csv('yourcsv.csv', converters={'date_column':lambda x : pd.to_datetime(x,errors = 'coerce')})
我正在 python 中处理一个大型 .csv 文件,它的日期列是 'str'。 我正在使用以下代码将此列中的记录转换为日期时间。
df[date_column].fillna('1900-01-01',inplace=True)
df[date_column] = df[date_column].apply(lambda x : pd.to_datetime(x, format = datetime_format))
但这似乎需要很长时间才能执行。欢迎任何有关如何处理此问题的建议。谢谢
当您阅读 csv 时,您可以使用 parse_dates
df = pd.read_csv('yourcsv.csv',parse_dates = date_column)
那么让我们用converters
pd.read_csv('yourcsv.csv', converters={'date_column':lambda x : pd.to_datetime(x,errors = 'coerce')})