R:将日期从每日转换为每周并绘制它们
R: convert dates from daily to weekly and plotting them
我正在尝试学习如何处理时间序列数据。我创建了一些假的每日数据,尝试按周汇总然后绘制它:
set.seed(123)
library(xts)
library(ggplot2)
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
final_data <- data.frame(date_decision_made, property_damages_in_dollars)
y.mon<-aggregate(property_damages_in_dollars~format(as.Date(date_decision_made),
format="%W"),data=final_data, FUN=sum)
y.mon$week = y.mon$`format(as.Date(date_decision_made), format = "%W")`
g = ggplot(y.mon, aes(x = week, y=property_damages_in_dollars) + geom_line(aes(group=1))
该图似乎有效,但轴上只有 52 个“刻度”,而应该是该数量的两倍(有 2 年的数据)。我认为将数据从每日数据转换为每周数据时出现问题 - 有人可以告诉我如何解决这个问题吗?
在我的实际数据中,我有30年的数据。日期似乎很拥挤。我试图“取消拥挤”的日期:
library(scales)
g + scale_x_date(date_breaks = "1 week", expand = c(0,0)) +
theme(axis.text.x = element_text(angle=90, vjust=.5))
但这也行不通。有人可以告诉我我做错了什么吗?
谢谢
注意:如果有两列,是否还可以使用聚合函数?
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
other_damages_in_dollars <- rnorm(731,10,10)
final_data <- data.frame(date_decision_made, other_damages_in_dollars, property_damages_in_dollars)
y.mon<-aggregate(property_damages_in_dollars, other_damages_in_dollars ~format(as.Date(date_decision_made),
format="%Y/%m"),data=final_data, FUN=sum)
一种方法可以像这样将年份添加到星期:
library(ggplot2)
#Code 1
#Data
y.mon<-aggregate(property_damages_in_dollars~format(as.Date(date_decision_made),
format="%W-%y"),data=final_data, FUN=sum)
y.mon$week = y.mon$`format(as.Date(date_decision_made), format = "%W-%y")`
#Plot
ggplot(y.mon, aes(x = week, y=property_damages_in_dollars))+
geom_line(aes(group=1))+
scale_x_discrete(guide = guide_axis(n.dodge=2))+
theme(axis.text.x = element_text(angle = 45))
输出:
如果您感到好奇,我将使用 scale_x_date()
并直接根据日期汇总:
#Code 2
y.mon<-aggregate(property_damages_in_dollars~as.Date(date_decision_made),data=final_data, FUN=sum)
y.mon$week = y.mon$`as.Date(date_decision_made)`
#Plot
ggplot(y.mon, aes(x = week, y=property_damages_in_dollars)) +
geom_line(aes(group=1))+
scale_x_date(date_labels = '%Y-%W',breaks = '8 weeks')
输出:
我正在尝试学习如何处理时间序列数据。我创建了一些假的每日数据,尝试按周汇总然后绘制它:
set.seed(123)
library(xts)
library(ggplot2)
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
final_data <- data.frame(date_decision_made, property_damages_in_dollars)
y.mon<-aggregate(property_damages_in_dollars~format(as.Date(date_decision_made),
format="%W"),data=final_data, FUN=sum)
y.mon$week = y.mon$`format(as.Date(date_decision_made), format = "%W")`
g = ggplot(y.mon, aes(x = week, y=property_damages_in_dollars) + geom_line(aes(group=1))
该图似乎有效,但轴上只有 52 个“刻度”,而应该是该数量的两倍(有 2 年的数据)。我认为将数据从每日数据转换为每周数据时出现问题 - 有人可以告诉我如何解决这个问题吗?
在我的实际数据中,我有30年的数据。日期似乎很拥挤。我试图“取消拥挤”的日期:
library(scales)
g + scale_x_date(date_breaks = "1 week", expand = c(0,0)) +
theme(axis.text.x = element_text(angle=90, vjust=.5))
但这也行不通。有人可以告诉我我做错了什么吗?
谢谢
注意:如果有两列,是否还可以使用聚合函数?
date_decision_made = seq(as.Date("2014/1/1"), as.Date("2016/1/1"),by="day")
date_decision_made <- format(as.Date(date_decision_made), "%Y/%m/%d")
property_damages_in_dollars <- rnorm(731,100,10)
other_damages_in_dollars <- rnorm(731,10,10)
final_data <- data.frame(date_decision_made, other_damages_in_dollars, property_damages_in_dollars)
y.mon<-aggregate(property_damages_in_dollars, other_damages_in_dollars ~format(as.Date(date_decision_made),
format="%Y/%m"),data=final_data, FUN=sum)
一种方法可以像这样将年份添加到星期:
library(ggplot2)
#Code 1
#Data
y.mon<-aggregate(property_damages_in_dollars~format(as.Date(date_decision_made),
format="%W-%y"),data=final_data, FUN=sum)
y.mon$week = y.mon$`format(as.Date(date_decision_made), format = "%W-%y")`
#Plot
ggplot(y.mon, aes(x = week, y=property_damages_in_dollars))+
geom_line(aes(group=1))+
scale_x_discrete(guide = guide_axis(n.dodge=2))+
theme(axis.text.x = element_text(angle = 45))
输出:
如果您感到好奇,我将使用 scale_x_date()
并直接根据日期汇总:
#Code 2
y.mon<-aggregate(property_damages_in_dollars~as.Date(date_decision_made),data=final_data, FUN=sum)
y.mon$week = y.mon$`as.Date(date_decision_made)`
#Plot
ggplot(y.mon, aes(x = week, y=property_damages_in_dollars)) +
geom_line(aes(group=1))+
scale_x_date(date_labels = '%Y-%W',breaks = '8 weeks')
输出: