按 p 值排序 geom_boxplot

Order geom_boxplot by p value

我正在使用以下代码。

 library(ggplot2)
 library(ggpubr)
 mtcars$carb <- as.factor(mtcars$carb)
 mtcars$am <- as.factor(mtcars$am)
 ggplot(mtcars) + 
     geom_boxplot(aes(x = carb, y = mpg, fill = am), 
         position = position_dodge(0.9)) + 
     stat_compare_means(aes(x = carb, y = mpg, group = am), label = "p.format")

这导致了这个情节:

请问如何从低到高的 p 值排序,使 x 轴上的顺序变为 carb = 2, 1, 4, 3, 6, 8?

请注意,我需要将其应用于更大的数据集,因此我需要使用 p 值而不是 c(2,1,4,3,6,8) 之类的方法进行排序。谢谢。

感觉应该有比这个解决方案更简单、更优雅的方法,但这里是。

方法:

  • 创建一个列表列,其中 ammpg 嵌套在 carb
  • am (l == 2)
  • 过滤只有 2 个唯一级别的行
  • 运行 t.test 并添加带有 p-value
  • 的列
  • 加入carbpval返回原始数据
  • pval 排序并使 carb 成为具有所需顺序水平的因子(按 pval
  • 现在我们可以ggplot

代码。请注意,我使用 t.test 来比较两种情况下的均值,因此 p-value 与您的不同,我认为默认情况下使用 wilcox 检验。

library(tidyverse)
library(ggpubr)

mtcars %>% 
  select(carb, am, mpg) %>% 
  mutate(am = factor(am)) %>% 
  nest(am, mpg)  %>% 
  mutate(l = map_int(data, ~unique(.$am) %>% length)) %>% 
  filter(l == 2) %>% 
  mutate(pval = map_dbl(data, ~t.test(mpg ~ am, .)$p.value)) %>% 
  select(carb, pval) %>% 
  right_join(mtcars) %>% 
  arrange(pval) %>% 
  mutate(carb = factor(carb, levels = unique(.$carb)), 
         am = factor(am)) %>% 
  ggplot(aes(carb, mpg)) + 
  geom_boxplot(aes(fill = am)) + 
  stat_compare_means(aes(carb, mpg, group = am), 
                     label = "p.format", 
                     method = "t.test")

结果: