将行中的 NA 替换为相邻行 "ROW" 而非列中的值

Question

原始数据：

    V1 V2
1   c1  a
2   c2  b
3 <NA>  c
4 <NA>  d
5   c3  e
6 <NA>  f
7   c4  g

可重现的样本数据

V1 = c('c1','c2',NA,NA,'c3',NA,'c4')
V2 = c('a','b','c','d','e','f','g')

data.frame(V1,V2)

预期输出

  V1_after V2_after
1       c1        a
2       c2    b c d
3       c3      e f
4       c4        g

V1_after <- c('c1','c2','c3','c4')
V2_after <- c('a',paste('b','c','d'),paste('e','f'),'g')

data.frame(V1_after,V2_after)

这是示例数据。在真实数据中，V1 中 NA 不规则的行

对我来说太难了

Answer 1

您可以 fill NA 使用先前的非 NA 值和 summarise 数据。

library(dplyr)
library(tidyr)

df %>%
  fill(V1) %>%
  group_by(V1) %>%
  summarise(V2 = paste(V2, collapse = ' '))

#   V1    V2   
#  <chr> <chr>
#1 c1    a    
#2 c2    b c d
#3 c3    e f  
#4 c4    g

Answer 2

您可以为此使用 zoo::na.locf。它采用最近的非 NA 值并在途中填充所有 NA 值：

library(dplyr)
library(zoo)

df %>%
  mutate(V1 = zoo::na.locf(V1)) %>%
  group_by(V1) %>%
  summarise(V2 = paste0(V2, collapse = " "))

# A tibble: 4 x 2
  V1    V2   
  <chr> <chr>
1 c1    a    
2 c2    b c d
3 c3    e f  
4 c4    g

Answer 3

使用 na.omit + cumsum + aggregate

的基础 R 选项

aggregate(
  V2 ~ .,
  transform(
    df,
    V1 = na.omit(V1)[cumsum(!is.na(V1))]
  ), c
)

给予

  V1      V2
1 c1       a
2 c2 b, c, d
3 c3    e, f
4 c4       g

将行中的 NA 替换为相邻行 "ROW" 而非列中的值

Replace NA in row with value in adjacent row "ROW" not column

r

dataframe

na