如何在ggboxplot中添加自定义图例

How to add custom legend in ggboxplot

我正在尝试在 R 中创建一些箱线图。我一直在使用 ggboxplot 和 ggplot。到目前为止,这是我的代码和输出:

ggboxplot:

ggboxplot(shp_PA@data, x = "hei_1998to2007_cat", y = "adjrate.2008to2017", 
          xlab = "Hazardous Exposure Index Jenks", 
          ylab = "Lung Cancer Incidence Rate",
          color = "red",
          add = c("jitter", "mean"), 
          add.params = list(color = "black", shape=20)) 

ggplot:

shp_PA@data %>%
  ggplot(aes(x=hei_1998to2007_cat, y=adjrate.2008to2017)) +
  geom_boxplot(colour = "red") + 
  geom_jitter(color="black", size=0.75) +
  stat_summary(fun=mean, geom="point", shape=4, size=3, color="black") +
  xlab("Hazardous Exposure Index Jenks") + 
  ylab("Lung Cancer Incidence Rate")

我现在的主要兴趣是在每个箱线图上放置一个图例,该图例具有用于描述均值的符号,旁边还有“均值”一词。在 base R 中,它就像放置

这样的东西一样简单
legend("topright", legend=c("Mean"),pch=5, col="red")

但我无法在 ggboxplot 或 ggplot 中弄清楚。我在网上看到的大多数内容都在讨论修改已经存在的图例。

我想知道如何做的另一件事是 ggboxplot 特有的。我希望能够使抖动点的颜色和形状与均值符号不同。我尝试将 add.params 代码更改为

add.params = list(color = c("black", "blue"), shape=c(20,4))

但我得到了错误

Error: Aesthetics must be either length 1 or the same as the data (213): shape and colour

非常感谢任何帮助!

编辑:使用 R 中的鸢尾花数据集添加可重现的示例

ggboxplot:

ggboxplot(iris, x = "Species", y = "Sepal.Length", 
          color = "red",
          add = c("jitter", "mean"), 
          add.params = list(color = "black", shape=20)) 

ggplot:

ggplot(data=iris, aes(x=Species, y=Sepal.Length)) +
  geom_boxplot(colour = "red") + 
  geom_jitter(color="black", size=0.75) +
  stat_summary(fun=mean, geom="point", shape=4, size=3, color="black")

再次,我想添加一个图例,其中包含用于描述均值的符号和“均值”一词,并能够使用 ggboxplot 使抖动和均值的颜色和形状不同.

欢迎来到 SO!

ggplot2 添加自定义标签是出了名的困难,我相信这是设计使然。所有图例都由 aesscale_*_[continuoues|discrete|manual] 中的参数控制。如果我们不想开始学习如何 grob(可能会花费几个小时),我们可以通过

获得所需的输出
  1. 添加是对数据本身的统计
  2. 创建一个列,指示哪个是统计数据,哪个是数据点
  3. 滥用我们可以 直接在我们的 geom_* 函数中为 jitter 和非 jittered 点创建一个特定的图层,并将形状设置为这些层的美学
  4. 使用 scale_shape_manual(或 scale_shape_discrete)自定义标记。

使用 mtcars 数据集作为示例(和 dplyr 用于管道)我们可以获得与 ggboxplot

非常相似的东西
library(ggplot2)
library(dplyr)
data(mtcars)
# Setup data with mean instead of using stat_summary
mtcars %>% 
  select(cyl, hp) %>%
  group_by(cyl) %>%
  summarize(hp = mean(hp)) %>% 
  bind_cols(stat = factor(rep('mean', 3))) %>% 
  bind_rows(mtcars %>%
              select(cyl, hp) %>% 
              bind_cols(stat = rep('data', nrow(mtcars)))) %>%

  # Create ggplot
  ggplot(aes(x = factor(cyl), y = hp)) + 
  geom_boxplot(colour = 'red') + 

  # Jitter based on subset of data. Do the same for geom_point (means)
  ## Note that to only plot a subset I pass a function to data that "filters" the data.
  geom_jitter(data = function(.data)filter(.data, stat == 'data'), 
              aes(shape = stat), color = 'black') +
  # Add mean to the point and change shape into something we like.
  geom_point(data = function(.data)filter(.data, stat == 'mean'), 
             aes(shape = stat), size = 2.5) +
  ## Use scale_shape_manual to change shape into something i like.
  scale_shape_manual(values = c('mean' = 8, 'data' = 16)) +

  # Fix the plot theme to be similar to ggboxplot
  theme(panel.grid = element_line(colour = NA),
        panel.background = element_rect(fill = "#00000000"),
        axis.line.x = element_line(colour = 'black'), 
        axis.line.y = element_line(colour = 'black'), 
        axis.text = element_text(size = 11),
        legend.position = 'bottom'
        ) +
  # Remove label from the legend if wanted
  labs(shape = NULL)

使用 ggplot 有点 non-standard 的方式,但您可以这样做。

add a legend with the symbol used to depict the mean and the word "Mean"

使用 aes 将不同的形状映射到 geom_jitterstat_summary。使用 scale_shape_manual

控制这些形状

have the color and shape of the jitter and mean to be different

使用color更改抖动点和平均点的颜色,使用override.aes更改图例中的颜色。

ggplot(data=iris, aes(x=Species, y=Sepal.Length)) +
    geom_boxplot(colour = "red") + 
    geom_jitter(size=1, color = 'green', aes(shape = 'all data')) +
    stat_summary(fun=mean, geom="point", size=3, color = 'black', aes(shape = 'mean')) +
    scale_shape_manual(values = c(20, 4)) +
    guides(shape = guide_legend(override.aes = list(color = c('green', 'black'))))

这里还有一个类似的答案: