按 p 值排序 geom_boxplot
Order geom_boxplot by p value
我正在使用以下代码。
library(ggplot2)
library(ggpubr)
mtcars$carb <- as.factor(mtcars$carb)
mtcars$am <- as.factor(mtcars$am)
ggplot(mtcars) +
geom_boxplot(aes(x = carb, y = mpg, fill = am),
position = position_dodge(0.9)) +
stat_compare_means(aes(x = carb, y = mpg, group = am), label = "p.format")
这导致了这个情节:
请问如何从低到高的 p 值排序,使 x 轴上的顺序变为 carb = 2, 1, 4, 3, 6, 8?
请注意,我需要将其应用于更大的数据集,因此我需要使用 p 值而不是 c(2,1,4,3,6,8)
之类的方法进行排序。谢谢。
感觉应该有比这个解决方案更简单、更优雅的方法,但这里是。
方法:
- 创建一个列表列,其中
am
和 mpg
嵌套在 carb
下
- 为
am
(l == 2) 过滤只有 2 个唯一级别的行
- 运行
t.test
并添加带有 p-value 的列
- 加入
carb
和pval
返回原始数据
- 按
pval
排序并使 carb
成为具有所需顺序水平的因子(按 pval
)
- 现在我们可以
ggplot
代码。请注意,我使用 t.test
来比较两种情况下的均值,因此 p-value 与您的不同,我认为默认情况下使用 wilcox 检验。
library(tidyverse)
library(ggpubr)
mtcars %>%
select(carb, am, mpg) %>%
mutate(am = factor(am)) %>%
nest(am, mpg) %>%
mutate(l = map_int(data, ~unique(.$am) %>% length)) %>%
filter(l == 2) %>%
mutate(pval = map_dbl(data, ~t.test(mpg ~ am, .)$p.value)) %>%
select(carb, pval) %>%
right_join(mtcars) %>%
arrange(pval) %>%
mutate(carb = factor(carb, levels = unique(.$carb)),
am = factor(am)) %>%
ggplot(aes(carb, mpg)) +
geom_boxplot(aes(fill = am)) +
stat_compare_means(aes(carb, mpg, group = am),
label = "p.format",
method = "t.test")
结果:
我正在使用以下代码。
library(ggplot2)
library(ggpubr)
mtcars$carb <- as.factor(mtcars$carb)
mtcars$am <- as.factor(mtcars$am)
ggplot(mtcars) +
geom_boxplot(aes(x = carb, y = mpg, fill = am),
position = position_dodge(0.9)) +
stat_compare_means(aes(x = carb, y = mpg, group = am), label = "p.format")
这导致了这个情节:
请问如何从低到高的 p 值排序,使 x 轴上的顺序变为 carb = 2, 1, 4, 3, 6, 8?
请注意,我需要将其应用于更大的数据集,因此我需要使用 p 值而不是 c(2,1,4,3,6,8)
之类的方法进行排序。谢谢。
感觉应该有比这个解决方案更简单、更优雅的方法,但这里是。
方法:
- 创建一个列表列,其中
am
和mpg
嵌套在carb
下
- 为
am
(l == 2) 过滤只有 2 个唯一级别的行
- 运行
t.test
并添加带有 p-value 的列
- 加入
carb
和pval
返回原始数据 - 按
pval
排序并使carb
成为具有所需顺序水平的因子(按pval
) - 现在我们可以
ggplot
代码。请注意,我使用 t.test
来比较两种情况下的均值,因此 p-value 与您的不同,我认为默认情况下使用 wilcox 检验。
library(tidyverse)
library(ggpubr)
mtcars %>%
select(carb, am, mpg) %>%
mutate(am = factor(am)) %>%
nest(am, mpg) %>%
mutate(l = map_int(data, ~unique(.$am) %>% length)) %>%
filter(l == 2) %>%
mutate(pval = map_dbl(data, ~t.test(mpg ~ am, .)$p.value)) %>%
select(carb, pval) %>%
right_join(mtcars) %>%
arrange(pval) %>%
mutate(carb = factor(carb, levels = unique(.$carb)),
am = factor(am)) %>%
ggplot(aes(carb, mpg)) +
geom_boxplot(aes(fill = am)) +
stat_compare_means(aes(carb, mpg, group = am),
label = "p.format",
method = "t.test")
结果: