箱线图看到不存在的值

Boxplot sees values that aren't there

我有一个 IMDB dataset 并试图制作电影收视率的箱线图。

我已成功加载数据集并尝试制作箱线图,但它产生了一个非常奇怪的结果。

它看起来试图为所有电影制作箱线图,而不仅仅是选定的电影。

boxplot(rating ~ title, data=imdb[imdb$title == "Top Gun (1986)", ])

生成的图表:

如您所见,y 轴看起来好像它包含根本不在过滤数据集中的电影(我通过标题选择了那些)。

因子即使在子集化后仍保持其水平,您可以删除那些未使用的 droplevels:

boxplot(rating ~ title, data=droplevels(imdb[imdb$title == "Top Gun (1986)", ]))