根据特定条件从具有相同列结构的多个数据框中删除列

Question

我有 4 个数据框，用于 4 个不同的数据组（总共 16 个数据框），具有相同的列结构，每个数据框都有列 a、b、c、d 等（超过数百列），但值不同对于每个数据帧。唯一相同的是每个 "data group" 的变量数量和列名（在某种程度上，但没有模式。列名是项目的名称，而不是 a、b、c 等） .

例如：

dat1 = data.frame(x = c(0.1,0.2,0.3,0.4,0.5),
                  y = c(0.6,0.7,0.8,0.9,0.10), 
                  z = c(0.12,0.13,0.14,0.15,0.16))

产生

   x   y    z
1 0.1 0.6 0.12
2 0.2 0.7 0.13
3 0.3 0.8 0.14
4 0.4 0.9 0.15
5 0.5 0.1 0.16

和第二个数据框

dat2 = data.frame(x = c(1,2,3,4,5), y = c(6,7,8,9,10), z = c(12,13,14,15,16))

  x  y  z
1 1  6 12
2 2  7 13
3 3  8 14
4 4  9 15
5 5 10 16

我想根据某些标准在 dat1 中进行数据清理，这样如果我在 dat1 中删除列 x，那么列 x 也将是在 dat2 中删除。这些具体标准可以是

dat1[,tail(dat1, n = 1) < 0.2] 

   y    z
1 0.6 0.12
2 0.7 0.13
3 0.8 0.14
4 0.9 0.15
5 0.1 0.16

这样 dat2 也会自动删除列 x。

有办法吗？我一直试图在 Whosebug 上搜索它，但找不到任何有用的东西。谢谢。

Answer 1

是这样的吗？
使用您发布的数据，它按预期工作。

cols.to.remove <- function(DF1, DF2) {
    d <- setdiff(names(DF1), names(DF2))
    -which(d %in% names(DF1))
}


dat2 <- dat2[cols.to.remove(dat2, dat1)]
dat2
#   y  z
#1  6 12
#2  7 13
#3  8 14
#4  9 15
#5 10 16

根据特定条件从具有相同列结构的多个数据框中删除列

Remove columns based on specific criteria from multiple data frames with same column structures

r

dataframe

data-cleaning