R:如何删除 data.frame 中的某些行
R: how to remove certain rows in data.frame
> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
a b
1 100 23
2 -99 11
3 322 25
4 155 25
5 256 -999
对于这样的 data.frame 我想删除任何包含 -99 或 -999 的行。所以我的结果 data.frame 应该只包含第 1、3 和 4 行。
我正在考虑为此编写一个循环,但我希望有更简单的方法。 (如果我的 data.frame 有 a-z 列,那么循环方法会非常笨重)。我的循环可能看起来像这样
i = 1
for(i in 1:nrow(data)){
if(data$a[i] < 0){
data = data[-i,]
}else if(data$b[i] < 0){
data = data[-i,]
}else data = data
}
也许是这样:
ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
a b
1 100 23
3 322 25
4 155 25
data [ rowSums(data == -99 | data==-999) == 0 , ]
a b
1 100 23
3 322 25
4 155 25
“==”和“|” (OR) 运算符将数据帧作为矩阵进行操作,返回相同维度的逻辑对象,以便 rowSums 可以成功。
@rawr 的评论可能最适合在导入期间执行此操作。不过,如果你已经有数据,你可以做类似的事情:
na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
# a b
#1 100 23
#3 322 25
#4 155 25
> data = data.frame(a = c(100, -99, 322, 155, 256), b = c(23, 11, 25, 25, -999))
> data
a b
1 100 23
2 -99 11
3 322 25
4 155 25
5 256 -999
对于这样的 data.frame 我想删除任何包含 -99 或 -999 的行。所以我的结果 data.frame 应该只包含第 1、3 和 4 行。
我正在考虑为此编写一个循环,但我希望有更简单的方法。 (如果我的 data.frame 有 a-z 列,那么循环方法会非常笨重)。我的循环可能看起来像这样
i = 1
for(i in 1:nrow(data)){
if(data$a[i] < 0){
data = data[-i,]
}else if(data$b[i] < 0){
data = data[-i,]
}else data = data
}
也许是这样:
ind <- Reduce(`|`,lapply(data,function(x) x %in% c(-99,-999)))
> data[!ind,]
a b
1 100 23
3 322 25
4 155 25
data [ rowSums(data == -99 | data==-999) == 0 , ]
a b
1 100 23
3 322 25
4 155 25
“==”和“|” (OR) 运算符将数据帧作为矩阵进行操作,返回相同维度的逻辑对象,以便 rowSums 可以成功。
@rawr 的评论可能最适合在导入期间执行此操作。不过,如果你已经有数据,你可以做类似的事情:
na.omit(replace(data, sapply(data,`%in%`,c(-99,-999)), NA))
# a b
#1 100 23
#3 322 25
#4 155 25