识别值何时在 r 中重复

Question

我有一个这样的数据框。

data <- data.frame(Condition = c(1,1,2,3,1,1,2,2,2,3,1,1,2,3,3))

我想填充一个新变量 Sequence，它标识何时 Condition 从 1 再次开始。

所以新的数据框看起来像这样。

在此先感谢您的帮助！

data <- data.frame(Condition = c(1,1,2,3,1,1,2,2,2,3,1,1,2,3,3),
                   Sequence = c(1,1,1,1,2,2,2,2,2,2,3,3,3,3,3))

Answer 1

基础 R

data$Sequence2 <- cumsum(c(TRUE, data$Condition[-1] == 1 & data$Condition[-nrow(data)] != 1))
data
#    Condition Sequence Sequence2
# 1          1        1         1
# 2          1        1         1
# 3          2        1         1
# 4          3        1         1
# 5          1        2         2
# 6          1        2         2
# 7          2        2         2
# 8          2        2         2
# 9          2        2         2
# 10         3        2         2
# 11         1        3         3
# 12         1        3         3
# 13         2        3         3
# 14         3        3         3
# 15         3        3         3

dplyr

library(dplyr)
data %>%
  mutate(
    Sequence2 = cumsum(Condition == 1 & lag(Condition != 1, default = TRUE))
  )
#    Condition Sequence Sequence2
# 1          1        1         1
# 2          1        1         1
# 3          2        1         1
# 4          3        1         1
# 5          1        2         2
# 6          1        2         2
# 7          2        2         2
# 8          2        2         2
# 9          2        2         2
# 10         3        2         2
# 11         1        3         3
# 12         1        3         3
# 13         2        3         3
# 14         3        3         3
# 15         3        3         3

Answer 2

这需要一段时间。最后我找到了这个解决方案：

library(dplyr)
data %>% 
  group_by(Sequnce = cumsum(
    ifelse(Condition==1, lead(Condition)+1, Condition) 
      - Condition==1)
    )

   Condition Sequnce
       <dbl>   <int>
 1         1       1
 2         1       1
 3         2       1
 4         3       1
 5         1       2
 6         1       2
 7         2       2
 8         2       2
 9         2       2
10         3       2
11         1       3
12         1       3
13         2       3
14         3       3
15         3       3

识别值何时在 r 中重复

identify whenever values repeat in r

r

dplyr

基础 R

dplyr