使用 data.table 和多个语句进行条件过滤

Conditional filtering with data.table with multiple statements

我想知道是否有一种优雅简洁的方法来使用data.table进行条件过滤。

我的目标是: 如果满足条件1,则根据条件2过滤。

例如,对于鸢尾花数据集, 如何在 Sepal.Length<5.5 中删除 Species=="setosa" 中的观察结果,同时保留其他物种的 Sepal.Length<5.5 的所有观察结果?

我知道如何分步完成,但我想知道是否有更好的方法在单行中完成

# this is how I would do it in steps. 

data("iris")

# first only select observations in setosa I am interested in keeping 
iris1<- setDT(iris)[Sepal.Length>=5.5&Species=="setosa"] 

# second, drop all of setosa observations. 
iris2<- setDT(iris)[Species!="setosa"] 

# join data,
iris_final<-full_join(iris1,iris2)

head(iris_final)
   Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1:          5.8         4.0          1.2         0.2     setosa
2:          5.7         4.4          1.5         0.4     setosa
3:          5.7         3.8          1.7         0.3     setosa
4:          5.5         4.2          1.4         0.2     setosa
5:          5.5         3.5          1.3         0.2     setosa # only keeping setosa with Sepal.Length>=5.5. Note that for other species, Sepal.Length can be <5.5
6:          7.0         3.2          4.7         1.4 versicolor

有没有更简洁优雅的方法?

您是否正在寻找类似以下内容的内容?不是很清楚你想要什么

library(data.table)

dt <- data.table(iris)
dt[Sepal.Length >= 5.5 & Species == "setosa" | Species != "setosa"]

#>      Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
#>   1:          5.8         4.0          1.2         0.2    setosa
#>   2:          5.7         4.4          1.5         0.4    setosa
#>   3:          5.7         3.8          1.7         0.3    setosa
#>   4:          5.5         4.2          1.4         0.2    setosa
#>   5:          5.5         3.5          1.3         0.2    setosa
#>  ---                                                            
#> 101:          6.7         3.0          5.2         2.3 virginica
#> 102:          6.3         2.5          5.0         1.9 virginica
#> 103:          6.5         3.0          5.2         2.0 virginica
#> 104:          6.2         3.4          5.4         2.3 virginica
#> 105:          5.9         3.0          5.1         1.8 virginica

您可以使用 | 或运算符:

这要求删除 Species=="setosa" & Sepal.Length<5.5 处的任何行并保留 Sepal.Length>5.5

处的行
iris1[!(Species=="setosa" & Sepal.Length<5.5) | Sepal.Length>5.5]
     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
  1:          5.8         4.0          1.2         0.2    setosa
  2:          5.7         4.4          1.5         0.4    setosa
  3:          5.7         3.8          1.7         0.3    setosa
  4:          5.5         4.2          1.4         0.2    setosa
  5:          5.5         3.5          1.3         0.2    setosa
 ---                                                            
101:          6.7         3.0          5.2         2.3 virginica
102:          6.3         2.5          5.0         1.9 virginica
103:          6.5         3.0          5.2         2.0 virginica
104:          6.2         3.4          5.4         2.3 virginica
105:          5.9         3.0          5.1         1.8 virginica