将日期时间字符串解析为 class 日期的最快方法
Fastest way to parse a date-time string to class Date
我有一个日期作为字符的列,格式为 10/17/2017 12:00:00 AM
。我想解析字符串并仅将日期部分保留为 class Date
,即 2017-10-17
。我正在使用 -
df$ReportDate = as.Date(df$ReportDate, format = "%m/%d/%Y %I:%M:%S %p")
df$ReportDate = as.Date(format(df$ReportDate, "%Y-%m-%d"))
这可行,但数据框有超过 500 万行,因此这需要将近两分钟。
user system elapsed
104.73 0.55 105.46
有没有更快更有效的方法?
从 Date
转换为 character
可能更有效:
# Create dummy data
date_from <- as.Date('01/01/1999 12:00:00 AM',
format = "%m/%d/%Y %I:%M:%S %p")
date_to <- as.Date('01/01/2017 12:00:00 AM',
format = "%m/%d/%Y %I:%M:%S %p")
df <- data.frame(ReportDate = sample(seq(from = date_from,
to = date_to, by = "day"), 5000000, T))
# Convert to char
start <- Sys.time()
df$ReportDate <- as.character(df$ReportDate)
Sys.time() - start
Time difference of 12.37254 secs
head(df)
ReportDate
1 2011-08-04
2 2013-11-15
3 2002-09-08
4 2011-07-01
5 2011-01-22
6 2001-01-04
请注意,as.Date
将忽略日期后的垃圾,因此在我速度不是特别快的笔记本电脑上,这需要不到 10 秒的时间:
xx <- rep("10/17/2017 12:00:00 AM", 5000000) # test input
system.time(as.Date(xx, "%m/%d/%Y"))
## user system elapsed
## 9.57 0.20 9.82
我有一个日期作为字符的列,格式为 10/17/2017 12:00:00 AM
。我想解析字符串并仅将日期部分保留为 class Date
,即 2017-10-17
。我正在使用 -
df$ReportDate = as.Date(df$ReportDate, format = "%m/%d/%Y %I:%M:%S %p")
df$ReportDate = as.Date(format(df$ReportDate, "%Y-%m-%d"))
这可行,但数据框有超过 500 万行,因此这需要将近两分钟。
user system elapsed
104.73 0.55 105.46
有没有更快更有效的方法?
从 Date
转换为 character
可能更有效:
# Create dummy data
date_from <- as.Date('01/01/1999 12:00:00 AM',
format = "%m/%d/%Y %I:%M:%S %p")
date_to <- as.Date('01/01/2017 12:00:00 AM',
format = "%m/%d/%Y %I:%M:%S %p")
df <- data.frame(ReportDate = sample(seq(from = date_from,
to = date_to, by = "day"), 5000000, T))
# Convert to char
start <- Sys.time()
df$ReportDate <- as.character(df$ReportDate)
Sys.time() - start
Time difference of 12.37254 secs
head(df)
ReportDate
1 2011-08-04
2 2013-11-15
3 2002-09-08
4 2011-07-01
5 2011-01-22
6 2001-01-04
请注意,as.Date
将忽略日期后的垃圾,因此在我速度不是特别快的笔记本电脑上,这需要不到 10 秒的时间:
xx <- rep("10/17/2017 12:00:00 AM", 5000000) # test input
system.time(as.Date(xx, "%m/%d/%Y"))
## user system elapsed
## 9.57 0.20 9.82