R - 一次删除所有异常值
R - Remove all outliers at once
我在 R 中导入了一个数据集,我试图在其中删除异常值。到目前为止,我已经用箱线图确定了所有离群值并将它们保存在一个变量中。
outlier_values_2 <- boxplot.stats(myfileswoNA$smart_1_raw)$out # outlier values.
boxplot(myfileswoNA$smart_1_raw, main="Outlier", boxwex=0.1)
hist(myfileswoNA$smart_1_raw)
summary(myfileswoNA$smart_1_raw)
现在我正在尝试删除具有已识别异常值的行。我可以用一个特定的值来做到这一点:
example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]
但我想做的是一次删除所有异常值,这些异常值存储在变量 outlier_values_2
例如这种方式是行不通的:
example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]
谁能帮我解决这个问题?或者有人有想法吗?
@LAP 的回答帮我解决了问题。
以下是他的建议:
If all outlier values are stored in outlier_values_2
,
try
myfileswoNA[!myfileswoNA$smart_1_raw %in% outlier_values_2,]
我在 R 中导入了一个数据集,我试图在其中删除异常值。到目前为止,我已经用箱线图确定了所有离群值并将它们保存在一个变量中。
outlier_values_2 <- boxplot.stats(myfileswoNA$smart_1_raw)$out # outlier values.
boxplot(myfileswoNA$smart_1_raw, main="Outlier", boxwex=0.1)
hist(myfileswoNA$smart_1_raw)
summary(myfileswoNA$smart_1_raw)
现在我正在尝试删除具有已识别异常值的行。我可以用一个特定的值来做到这一点:
example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]
但我想做的是一次删除所有异常值,这些异常值存储在变量 outlier_values_2
例如这种方式是行不通的:
example <- myfileswoNA[myfileswoNA$smart_1_raw!=4294967295,]
谁能帮我解决这个问题?或者有人有想法吗?
@LAP 的回答帮我解决了问题。 以下是他的建议:
If all outlier values are stored in
outlier_values_2
, trymyfileswoNA[!myfileswoNA$smart_1_raw %in% outlier_values_2,]