在 R 中删除数据表中的空列的最有效方法是什么
What is the most efficient way to remove empty columns in a datatable in R
我有一些文件导入问题,在末尾创建了一个空列,例如:
library(data.table)
library(tidyverse)
MWE <- data.table(var1=c(1,2),var2=c(3,4),var3=c(NA,NA))
现在我可以轻松删除它,因为我知道空栏是最后一栏:
MWE2 <- MWE[,c(length(MWE)):=NULL]
但我想知道如果我只是想删除一个随机的空列而不知道它的编号我该怎么办。在这里和数据表页面上的快速搜索给了我很多关于如何的例子:
- 删除数据表中的空行,通过
na.omit
- 删除数据框中的空列,例如here
但我没有找到删除数据表中空列的解决方案。有哪些选项,哪个最快?
我们可以检查列中的 all
值是否为 NA
,获取列名并将其分配给 NULL
nm1 <- MWE[, names(which(sapply(.SD, function(x) all(is.na(x)))))]
# or
# nm1 <- MWE[, names(which(!colSums(!is.na(.SD))))]
MWE[, (nm1) := NULL]
或 Filter
MWE[, Filter(function(x) any(!is.na(x)), .SD)]
或使用select
library(dplyr)
MWE %>%
select(where(~ any(!is.na(.))))
我有一些文件导入问题,在末尾创建了一个空列,例如:
library(data.table)
library(tidyverse)
MWE <- data.table(var1=c(1,2),var2=c(3,4),var3=c(NA,NA))
现在我可以轻松删除它,因为我知道空栏是最后一栏:
MWE2 <- MWE[,c(length(MWE)):=NULL]
但我想知道如果我只是想删除一个随机的空列而不知道它的编号我该怎么办。在这里和数据表页面上的快速搜索给了我很多关于如何的例子:
- 删除数据表中的空行,通过
na.omit
- 删除数据框中的空列,例如here
但我没有找到删除数据表中空列的解决方案。有哪些选项,哪个最快?
我们可以检查列中的 all
值是否为 NA
,获取列名并将其分配给 NULL
nm1 <- MWE[, names(which(sapply(.SD, function(x) all(is.na(x)))))]
# or
# nm1 <- MWE[, names(which(!colSums(!is.na(.SD))))]
MWE[, (nm1) := NULL]
或 Filter
MWE[, Filter(function(x) any(!is.na(x)), .SD)]
或使用select
library(dplyr)
MWE %>%
select(where(~ any(!is.na(.))))