R:如何删除 data.frame 中的某些行

R: how to remove certain rows in data.frame

> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
    a    b
1 100   23
2 -99   11
3 322   25
4 155   25
5 256 -999

对于这样的 data.frame 我想删除任何包含 -99 或 -999 的行。所以我的结果 data.frame 应该只包含第 1、3 和 4 行。

我正在考虑为此编写一个循环,但我希望有更简单的方法。 (如果我的 data.frame 有 a-z 列,那么循环方法会非常笨重)。我的循环可能看起来像这样

i = 1
for(i in 1:nrow(data)){
  if(data$a[i] < 0){
    data = data[-i,]
  }else if(data$b[i] < 0){
    data = data[-i,]
  }else data = data
}

也许是这样:

ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
    a  b
1 100 23
3 322 25
4 155 25
 data [ rowSums(data == -99 | data==-999) == 0 , ]
    a  b
1 100 23
3 322 25
4 155 25

“==”和“|” (OR) 运算符将数据帧作为矩阵进行操作,返回相同维度的逻辑对象,以便 rowSums 可以成功。

@rawr 的评论可能最适合在导入期间执行此操作。不过,如果你已经有数据,你可以做类似的事情:

na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
#    a  b
#1 100 23
#3 322 25
#4 155 25