r - 'rbind' 列名称中具有不同前缀的数据帧

Question

我有两个如下所示的数据框：

df1 <- data.frame(ID = c(1:4),
       Year = 2001,
       a_Var1 = c("A","B","C","D"),
       a_Var2 = c("T","F","F","T"))

df2 <- data.frame(ID = c(1:4),
       Year = 2002,
       b_Var1 = c("E","F","G","H"))

所需的最终产品是

df_combined <- data.frame(ID = c(1,1,2,2,3,3,4,4),
                      Year = c(2001,2002,2001,2002,2001,2002,2001,2002),
                      Var1 = c("A","E","B","F","C","G","D","H"),
                      Var2 = c("T",NA,"F",NA,"F",NA,"T",NA))

问题是如何 'rbind' 删除前缀 a_ 或 b_ 并且 Var1、Var2 等成为新专栏。

尝试了 plyr 的 rbind.fill，但这并没有解决问题。

Answer 1

这是一种选择。通过 'ID'

删除包括 _ 和 arrange 的前缀部分，将数据集放在 list、rename 中

library(tidyverse)
map_df(list(df1, df2), ~ .x %>% 
             rename_all(~ str_remove(.x, "^[^_]+_"))) %>%
   arrange(ID)
#  ID Year Var1 Var2
#1  1 2001    A    T
#2  1 2002    E <NA>
#3  2 2001    B    F
#4  2 2002    F <NA>
#5  3 2001    C    F
#6  3 2002    G <NA>
#7  4 2001    D    T
#8  4 2002    H <NA>

r - 'rbind' 列名称中具有不同前缀的数据帧

r - 'rbind' dataframes with different prefix in column names

r

dataframe

rbind

tidyverse