R：如何删除 data.frame 中的某些行

Question

> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
    a    b
1 100   23
2 -99   11
3 322   25
4 155   25
5 256 -999

对于这样的 data.frame 我想删除任何包含 -99 或 -999 的行。所以我的结果 data.frame 应该只包含第 1、3 和 4 行。

我正在考虑为此编写一个循环，但我希望有更简单的方法。（如果我的 data.frame 有 a-z 列，那么循环方法会非常笨重）。我的循环可能看起来像这样

i = 1
for(i in 1:nrow(data)){
  if(data$a[i] < 0){
    data = data[-i,]
  }else if(data$b[i] < 0){
    data = data[-i,]
  }else data = data
}

Answer 1

也许是这样：

ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
    a  b
1 100 23
3 322 25
4 155 25

Answer 2

 data [ rowSums(data == -99 | data==-999) == 0 , ]
    a  b
1 100 23
3 322 25
4 155 25

“==”和“|” (OR) 运算符将数据帧作为矩阵进行操作，返回相同维度的逻辑对象，以便 rowSums 可以成功。

Answer 3

@rawr 的评论可能最适合在导入期间执行此操作。不过，如果你已经有数据，你可以做类似的事情：

na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
#    a  b
#1 100 23
#3 322 25
#4 155 25

R：如何删除 data.frame 中的某些行

R: how to remove certain rows in data.frame

r

subset