R 中的向量化函数 data.table

Vectorized functions in R's data.table

问题: 我尝试向下面的 data.table 对象添加一列,其中每一行将显示一个周列表。 IE。如果 START = "2020-01-01" 和 END = "2020-01-15",则周列应包含此时间间隔(2020 W01、2020 W02、2020 W03)的相应周列表。由于代码结构,我想保留单独准备数据的功能。但是,当前函数会导致错误。

问题: 有没有办法让它保持这么简单,即 w/o 在函数调用 get_weeks 中引用 data.table 对象?修改后的函数会是什么样子?干杯!

dt <- data.table(
  ID = c(1, 2, 3),
  START = c("2020-01-01", "2020-03-01", "2020-03-14"),
  END = c("2020-01-15", "2020-03-12", "2020-03-26")
)


get_weeks <- function(start_date, end_date){

  date_range <- c(start_date, end_date)
  date_range <- ymd(date_range)

  dt_range <- seq.Date(date_range[1], date_range[2], "day")

  dt_range_week <- list(unique(format(as.Date(dt_range), "%G W%V")))

  dt_range_week
}


dt[, weeks_for_filter_table := get_weeks("START", "END")]

您可以使用 Map/mapply :

library(data.table)
dt[, weeks_for_filter_table := mapply(get_weeks, START, END)]
dt

#   ID      START        END     weeks_for_filter_table
#1:  1 2020-01-01 2020-01-15 2020 W01,2020 W02,2020 W03
#2:  2 2020-03-01 2020-03-12 2020 W09,2020 W10,2020 W11
#3:  3 2020-03-14 2020-03-26 2020 W11,2020 W12,2020 W13