如何在 R 中绘制箱形图以检测大量行的异常值?
How to plot a box plot in R for outlier detection for a huge number of rows?
我有一个包含大量行的数据集。我想绘制单个特征的箱线图,但 R 中的简单箱线图()命令给我一个错误。
我正在处理一个超过 200,000 行的数据集。头部是这样的:
年
月
日
n_impacted
2013 年 1 月 4 日
2013 年 1 月 4 日
2013 年 1 月 5 日
2013 年 1 月 4 日
2013 年 1 月 4 日
2013 年 1 月 5 日
箱线图(na_omit_noguns$n_impacted)
错误 plot.window(xlim = xlim, ylim = ylim, log = log, yaxs = pars$yaxs):需要有限的 'ylim' 值
我应该能够绘制显示异常值的箱线图。
问题是由于 Inf
或 -Inf
值造成的。可以通过仅对有限值进行子集化(使用is.finite
)
来删除这些元素来更正
i1 <- is.finite(na_omit_noguns$n_impacted)
boxplot(na_omit_noguns$n_impacted[i1])
我正在处理一个超过 200,000 行的数据集。头部是这样的:
年 月 日 n_impacted 2013 年 1 月 4 日 2013 年 1 月 4 日 2013 年 1 月 5 日 2013 年 1 月 4 日 2013 年 1 月 4 日 2013 年 1 月 5 日
箱线图(na_omit_noguns$n_impacted)
错误 plot.window(xlim = xlim, ylim = ylim, log = log, yaxs = pars$yaxs):需要有限的 'ylim' 值
我应该能够绘制显示异常值的箱线图。
问题是由于 Inf
或 -Inf
值造成的。可以通过仅对有限值进行子集化(使用is.finite
)
i1 <- is.finite(na_omit_noguns$n_impacted)
boxplot(na_omit_noguns$n_impacted[i1])