使用 dplyr 在 R 中日期数据
Date Data in R using dplyr
我的数据包含每个主题的两列日期数据,例如 date1 和 date2,其中 date1 < date2。如何创建一个变量,指示给定主题的日期 1 的下一个值是否在日期 2 的当前值之前?例如以下数据:
subject date1 date2
1 2018-01-01 2019-01-01
1 2018-02-01 2019-01-01
1 2020-01-01 2021-01-01
指标变量第一行应为 1,第二行应为 0,第三行应为 NA。
按'subject'
分组后,我们可以用lead
做下一个'date1'和当前'date2'的比较
library(dplyr)
df1 %>%
group_by(subject) %>%
mutate(new = as.integer(lead(date1) < date2))
# A tibble: 3 x 4
# Groups: subject [1]
# subject date1 date2 new
# <int> <date> <date> <int>
#1 1 2018-01-01 2019-01-01 1
#2 1 2018-02-01 2019-01-01 0
#3 1 2020-01-01 2021-01-01 NA
数据
df1 <- structure(list(subject = c(1L, 1L, 1L), date1 = structure(c(17532,
17563, 18262), class = "Date"), date2 = structure(c(17897, 17897,
18628), class = "Date")), .Names = c("subject", "date1", "date2"
), row.names = c(NA, -3L), class = "data.frame")
我的数据包含每个主题的两列日期数据,例如 date1 和 date2,其中 date1 < date2。如何创建一个变量,指示给定主题的日期 1 的下一个值是否在日期 2 的当前值之前?例如以下数据:
subject date1 date2
1 2018-01-01 2019-01-01
1 2018-02-01 2019-01-01
1 2020-01-01 2021-01-01
指标变量第一行应为 1,第二行应为 0,第三行应为 NA。
按'subject'
分组后,我们可以用lead
做下一个'date1'和当前'date2'的比较
library(dplyr)
df1 %>%
group_by(subject) %>%
mutate(new = as.integer(lead(date1) < date2))
# A tibble: 3 x 4
# Groups: subject [1]
# subject date1 date2 new
# <int> <date> <date> <int>
#1 1 2018-01-01 2019-01-01 1
#2 1 2018-02-01 2019-01-01 0
#3 1 2020-01-01 2021-01-01 NA
数据
df1 <- structure(list(subject = c(1L, 1L, 1L), date1 = structure(c(17532,
17563, 18262), class = "Date"), date2 = structure(c(17897, 17897,
18628), class = "Date")), .Names = c("subject", "date1", "date2"
), row.names = c(NA, -3L), class = "data.frame")