在 R 中使用 ggplot 按周绘图

Plotting by week with ggplot in R

我有以下数据:

set.seed(123)
timeseq <- as.Date(Sys.time() + cumsum(runif(1000)*86400))
data <- rnorm(1000)
df <- data.frame(timeseq,data)

我想知道是否有人有任何方法可以按周汇总 data。我想要做的是绘制一个时间序列 ggplot,所以如果我可以跳过这一步并让 ggplot 处理它就更好了。一整天都卡在这个上面。

要获得星期,我们可以使用 lubridate 库,使用 floor_date 函数,如下所示:

library(lubridate)
df$week <- floor_date(df$timeseq, "week")

我们可以使用 ggplot 通过统计汇总来绘制数据(可能有更好的方法?),它看起来像这样:

stat_sum_single <- function(fun, geom="point", ...) {
  stat_summary(fun.y=fun, colour="red", geom=geom, size = 3, ...)
}

ggplot(df, aes(x=floor_date(timeseq, "week"), y=data)) + 
  stat_sum_single(sum, geom="line") + 
  xlab("week")

这将有输出:

另一种使用 dplyr 按周手动聚合的方法。

library(dplyr)
df$weeks <- cut(df[,"timeseq"], breaks="week")
agg <- df %>% group_by(weeks) %>% summarise(agg=sum(data))
ggplot(agg, aes(as.Date(weeks), agg)) + geom_point() + scale_x_date() +
    ylab("Aggregated by Week") + xlab("Week") + geom_line()

您还可以使用 scale_x_date() 函数的 breaks 参数聚合日期美学。

ggplot(df, aes(x = timeseq, y = data)) +
    stat_summary(fun.y = sum, geom = "line") +
    scale_x_date(labels = date_format("%Y-%m-%d"),
                 breaks = "1 week")

我想扩展@chappers 使用包 lubridate 的想法,但是以完全管道的方式。

library(dplyr)
library(ggplot2)
library(lubridate)
set.seed(123)
data.frame(
  timeseq = as.Date(Sys.time() + cumsum(runif(1000) * 86400)),
  data = rnorm(1000)
) %>%
  mutate(timeseq = floor_date(timeseq, unit = "week")) %>%
  group_by(timeseq) %>%
  summarise(data = sum(data)) %>%
  ggplot() +
  geom_line(aes(x = timeseq, y = data))

如果您已经将其存储为对象,请将 data.frame 行替换为 df