如何让人们每 5 分钟进店一次？

Question

我有一个数据 table 如下所示：

library(data.table)
DT1<-data.table(
  id=c(1,2,3,4,3,2),
  in_time=c("2017-11-01 08:37:35","2017-11-01 09:07:44","2017-11-01 09:46:16","2017-11-01 10:32:29","2017-11-01 10:59:25","2017-11-01 13:24:12"),
  out_time=c("2017-11-01 08:45:35","2017-11-01 09:15:30","2017-11-01 10:11:16","2017-11-01 10:37:05","2017-11-01 11:45:25","2017-11-01 14:10:09")
  )

它包含了一个人什么时候进店和出店的每一个信息。

现在我想每 5 分钟（标准 5 分钟，如第 0、5、10、15 分钟 ...60 分钟）带人 在店里 。如果没有人，我需要一个 0 值。

所以我尝试了

library(lubridate)
DT1[,time:=ymd_hms(in_time)]
DT1[,time:=ceiling_date(time,"5mins")]
DT1[,.N,by=list(time)]

只给出每次输入的人数，但我现在卡在如何考虑 out_time.For 示例，id 1 在 2017-11-01 08:37:35 进入并在 [=13 离开=]。所以他会在从 2017-11-01 08:40:00 到 2017-11-01 08:45:00 而不是 2017-11-01 08:50:00 等等。

一个 ID 可以重复多次，就像一个人一天多次光顾商店一样。

感谢任何帮助。

Answer 1

这是一个使用 data.table::foverlaps 的选项：

#generate intervals of 5mins
times <- seq(as.POSIXct("2017-11-01 00:00:00", format=fmt), 
    as.POSIXct("2017-11-02 00:00:00", format=fmt), 
    by="5 min")
DT2 <- data.table(in_time=times[-length(times)], out_time=times[-1L], key=c("in_time","out_time"))

#set keys before foverlaps
setkey(DT1, in_time, out_time)

#find overlaps and count distinct in each 5min interval. 
#!is.na(id) is for truncating the output for checking. to be removed in actual code 
foverlaps(DT2, DT1)[!is.na(id), uniqueN(id), .(i.in_time, i.out_time)]

而如果id在每个时间区间内都是唯一的，最后一行代码可以foverlaps(DT2, DT1)[, sum(!is.na(id)), .(i.in_time, i.out_time)]代替

前 8 行输出：

              i.in_time          i.out_time V1
 1: 2017-11-01 08:35:00 2017-11-01 08:40:00  1
 2: 2017-11-01 08:40:00 2017-11-01 08:45:00  1
 3: 2017-11-01 08:45:00 2017-11-01 08:50:00  1
 4: 2017-11-01 09:05:00 2017-11-01 09:10:00  1
 5: 2017-11-01 09:10:00 2017-11-01 09:15:00  1
 6: 2017-11-01 09:15:00 2017-11-01 09:20:00  1
 7: 2017-11-01 09:45:00 2017-11-01 09:50:00  1
 8: 2017-11-01 09:50:00 2017-11-01 09:55:00  1

数据：

library(data.table)
DT1 <- data.table(
    id=c(1,2,3,4,3,2),
    in_time=c("2017-11-01 08:37:35","2017-11-01 09:07:44","2017-11-01 09:46:16","2017-11-01 10:32:29","2017-11-01 10:59:25","2017-11-01 13:24:12"),
    out_time=c("2017-11-01 08:45:35","2017-11-01 09:15:30","2017-11-01 10:11:16","2017-11-01 10:37:05","2017-11-01 11:45:25","2017-11-01 14:10:09")
)
cols <- c("in_time", "out_time")
fmt <- "%Y-%m-%d %T"
DT1[, (cols) := lapply(.SD, as.POSIXct, format=fmt), .SDcols=cols]

如何让人们每 5 分钟进店一次？

How to get people in the store at every 5 minutes?

r

lubridate

dplyr

data.table