按 p 值排序 geom_boxplot

Question

我正在使用以下代码。

 library(ggplot2)
 library(ggpubr)
 mtcars$carb <- as.factor(mtcars$carb)
 mtcars$am <- as.factor(mtcars$am)
 ggplot(mtcars) + 
     geom_boxplot(aes(x = carb, y = mpg, fill = am), 
         position = position_dodge(0.9)) + 
     stat_compare_means(aes(x = carb, y = mpg, group = am), label = "p.format")

这导致了这个情节：

请问如何从低到高的 p 值排序，使 x 轴上的顺序变为 carb = 2, 1, 4, 3, 6, 8？

请注意，我需要将其应用于更大的数据集，因此我需要使用 p 值而不是 c(2,1,4,3,6,8) 之类的方法进行排序。谢谢。

Answer 1

感觉应该有比这个解决方案更简单、更优雅的方法，但这里是。

方法：

创建一个列表列，其中 am 和 mpg 嵌套在 carb
为 am (l == 2)
运行 t.test 并添加带有 p-value
加入carb和pval返回原始数据
按 pval 排序并使 carb 成为具有所需顺序水平的因子（按 pval）
现在我们可以ggplot

代码。请注意，我使用 t.test 来比较两种情况下的均值，因此 p-value 与您的不同，我认为默认情况下使用 wilcox 检验。

library(tidyverse)
library(ggpubr)

mtcars %>% 
  select(carb, am, mpg) %>% 
  mutate(am = factor(am)) %>% 
  nest(am, mpg)  %>% 
  mutate(l = map_int(data, ~unique(.$am) %>% length)) %>% 
  filter(l == 2) %>% 
  mutate(pval = map_dbl(data, ~t.test(mpg ~ am, .)$p.value)) %>% 
  select(carb, pval) %>% 
  right_join(mtcars) %>% 
  arrange(pval) %>% 
  mutate(carb = factor(carb, levels = unique(.$carb)), 
         am = factor(am)) %>% 
  ggplot(aes(carb, mpg)) + 
  geom_boxplot(aes(fill = am)) + 
  stat_compare_means(aes(carb, mpg, group = am), 
                     label = "p.format", 
                     method = "t.test")

结果：

按 p 值排序 geom_boxplot

Order geom_boxplot by p value

r

ggplot2

boxplot