箱线图看到不存在的值
Boxplot sees values that aren't there
我有一个 IMDB dataset 并试图制作电影收视率的箱线图。
我已成功加载数据集并尝试制作箱线图,但它产生了一个非常奇怪的结果。
它看起来试图为所有电影制作箱线图,而不仅仅是选定的电影。
boxplot(rating ~ title, data=imdb[imdb$title == "Top Gun (1986)", ])
生成的图表:
如您所见,y 轴看起来好像它包含根本不在过滤数据集中的电影(我通过标题选择了那些)。
因子即使在子集化后仍保持其水平,您可以删除那些未使用的 droplevels
:
boxplot(rating ~ title, data=droplevels(imdb[imdb$title == "Top Gun (1986)", ]))
我有一个 IMDB dataset 并试图制作电影收视率的箱线图。
我已成功加载数据集并尝试制作箱线图,但它产生了一个非常奇怪的结果。
它看起来试图为所有电影制作箱线图,而不仅仅是选定的电影。
boxplot(rating ~ title, data=imdb[imdb$title == "Top Gun (1986)", ])
生成的图表:
如您所见,y 轴看起来好像它包含根本不在过滤数据集中的电影(我通过标题选择了那些)。
因子即使在子集化后仍保持其水平,您可以删除那些未使用的 droplevels
:
boxplot(rating ~ title, data=droplevels(imdb[imdb$title == "Top Gun (1986)", ]))