仅当列值在 R 中匹配时才计算 difftime

Question

如果列 serviceID 具有相同的值，我必须找出连续行的日期时间（以秒为单位）之间的差异。

dt :

输出：

如何做到这一点？我试过了但是出错了：

dt<-dt %>% 
group_by(serviceID) %>%
mutate(diff= as.numeric(difftime(dt$datetime, lag(dt$datetime))))

有人可以帮忙吗？谢谢

Answer 1

在使用 dplyr 管道时不要使用 $。此外，明确说明 difftime.

中的单位总是更安全

library(dplyr)

dt <- dt %>% 
  group_by(serviceID) %>%
  mutate(diff= as.numeric(difftime(datetime, lag(datetime), units = 'secs'))) %>%
  ungroup

如果您想在 data.table -

中执行此操作

library(data.table)
setDT(dt)

dt[, diff := as.numeric(difftime(datetime, shift(datetime), units = 'secs')), serviceID]

Calculate difftime only if a column value matches in R