使用 R 将时间序列数据分为工作日和周末数据集

Divide time-series data into weekday and weekend datasets using R

我有包含两列(时间戳和功率)的数据集:

 str(df2)
'data.frame':   720 obs. of  2 variables:
 $ timestamp: POSIXct, format: "2015-08-01 00:00:00" "2015-08-01 01:00:00" " ...
 $ power    : num  124 149 118 167 130 ..

这个数据集有整整一个月的时间。我想创建它的两个子集——一个包含周末数据,另一个包含工作日(周一至周五)数据。换句话说,一个数据集应包含对应于周六和周日的数据,而另一个数据集应包含其他日期的数据。两个子集都应保留两列。我如何在 R 中执行此操作?

我尝试使用了聚合和拆分的概念,但是聚合的函数参数(FUN)不清楚,应该如何指定数据集的划分。

您可以使用 R 基本函数来执行此操作,首先使用 strptime 将日期数据与第一列分开,然后使用函数 weekdays。 示例:

df1<-data.frame(timestamp=c("2015-08-01 00:00:00","2015-10-13 00:00:00"),power=1:2)
df1$day<-strptime(df1[,1], "%Y-%m-%d")
df1$weekday<-weekdays(df1$day)
df1
 timestamp              power   day      weekday
 2015-08-01 00:00:00     1   2015-08-01  Saturday
 2015-10-13 00:00:00     2   2015-10-13  Tuesday

最初,我尝试使用额外的库来实现复杂的方法,但最后,我想出了一个使用 R 的基本方法。

    #adding day column to existing set 
    df2$day <- weekdays(as.POSIXct(df2$timestamp))    
    # creating two data_subsets, i.e., week_data and weekend_data
    week_data<- data.frame(timestamp=factor(), power= numeric(),day= character())
    weekend_data<- data.frame(timestamp=factor(),power=numeric(),day= character())
    #Specifying weekend days in vector, weekend
    weekend <- c("Saturday","Sunday")
    for(i in 1:nrow(df2)){
      if(is.element(df2[i,3], weekend)){
        weekend_data <- rbind(weekend_data, df2[i,])
      } else{
        week_data <- rbind(week_data, df2[i,])
      }
    }

创建的数据集,即weekend_data和week_data是我需要的子数据集。

在@ShruS 示例之上构建:

df<-data.frame(timestamp=c("2015-08-01 00:00:00","2015-10-13 00:00:00", "2015-10-11 00:00:00", "2015-10-14 00:00:00"))
df$day<-strptime(df[,1], "%Y-%m-%d")
df$weekday<-weekdays(df$day)
df1 = subset(df,df$weekday == "Saturday" | df$weekday == "Sunday")
df2 = subset(df,df$weekday != "Saturday" & df$weekday != "Sunday")

> df
            timestamp        day   weekday
1 2015-08-01 00:00:00 2015-08-01  Saturday
2 2015-10-13 00:00:00 2015-10-13   Tuesday
3 2015-10-11 00:00:00 2015-10-11    Sunday
4 2015-10-14 00:00:00 2015-10-14 Wednesday

> df1
            timestamp        day  weekday
1 2015-08-01 00:00:00 2015-08-01 Saturday
3 2015-10-11 00:00:00 2015-10-11   Sunday

> df2
            timestamp        day   weekday
2 2015-10-13 00:00:00 2015-10-13   Tuesday
4 2015-10-14 00:00:00 2015-10-14 Wednesday