具有标准化 x 轴值的多列的箱线图

box-plot for multiple columns with normalized x-axis values

我有以下数据(在 csv 文件中)

 product release_after_issue  release_before_issue
 P1                           40
 P1      100    
 P1                           10
 P2      50
 P2      300
 P2                           200
 P3      10
 P3      20
 P3      300    

我想使用箱线图显示基于 release_after_issuerelease_before_issue 的每个产品发布(P1、P2 等)的天数分布。 x 轴是产品名称,y 轴是天数。

我现在面临的问题 are:the 每列中的空值,以及天数很大。

如何将 y 轴上的天数标准化为月份(易于阅读)?我希望每个产品 (Ps) 都有自己的基于列数据的箱线图 (release_after_issuerelease_before_issue)

我试图省略 NA 值并绘制测试示例,但它没有用

data <- read.csv("commons-fileupload.csv")
    ggplot(data[!is.na(data$release_after_issue),],aes(x=product,y=release_after_issue))
    + geom_point()

任何帮助!

不确定你的代码有什么问题,下面的虚拟数据对我来说很好用。 此外,ggplot 会为您删除 NA。

data <- data.frame(product=c("P1","P2","P1","P1","P2"),release_after_issue=c(100,NA,50,10,30))
ggplot(data,aes(x=product,y=release_after_issue))+ geom_boxplot()