如何在 R 中绘制箱形图以检测大量行的异常值?

How to plot a box plot in R for outlier detection for a huge number of rows?

我有一个包含大量行的数据集。我想绘制单个特征的箱线图,但 R 中的简单箱线图()命令给我一个错误。

我正在处理一个超过 200,000 行的数据集。头部是这样的:

年 月 日 n_impacted 2013 年 1 月 4 日 2013 年 1 月 4 日 2013 年 1 月 5 日 2013 年 1 月 4 日 2013 年 1 月 4 日 2013 年 1 月 5 日

箱线图(na_omit_noguns$n_impacted)

错误 plot.window(xlim = xlim, ylim = ylim, log = log, yaxs = pars$yaxs):需要有限的 'ylim' 值

我应该能够绘制显示异常值的箱线图。

问题是由于 Inf-Inf 值造成的。可以通过仅对有限值进行子集化(使用is.finite

来删除这些元素来更正
i1 <- is.finite(na_omit_noguns$n_impacted)
boxplot(na_omit_noguns$n_impacted[i1])