使用多个回归变量预测每周时间序列数据

Forecasting Weekly Time-Series Data with Multiple Regressors

我想知道如何调整 Rob Hyndman 对 this blog post 中傅立叶项的使用,以使用额外的回归量预测每周时间序列数据。以下是我的尝试,但我读到 xreg is rank deficient

时出错
library(forecast)
gascsv <- read.csv("https://robjhyndman.com/data/gasoline.csv", header=FALSE)[,1]
gas<- ts(gascsv[1:300], freq=365.25/7, start=1991+31/365.25)
#assume that gasreg is an additional regressor used to forecast gas
gasreg <- ts(gascsv[301:600], freq=365.25/7, start=1991+31/365.25)


bestfit <- list(aicc=Inf)
for(i in 1:25){
  for(j in 1:25){
    fit <- auto.arima(gas, xreg=cbind(fourier(gas, K=i),fourier(gasreg,K=j)), seasonal=FALSE)
    if(fit$aicc < bestfit$aicc){
      bestfit <- fit
      k <-i
      l <- j 
      }
    else break;
  }
}

谢谢!

编辑:在网上进行了一些额外的挖掘之后,我发现了一些看起来很有用的材料。 Another of Rob's blog posts uses a set of Fourier terms as well as a dummy variable as regressors. This post on kaggle(参见 3. ARIMA 模型)以与我正在做的非常相似的方式使用多个傅里叶项,尽管我仍然收到 xreg is rank deficient 错误。这会不会是因为 gasreg 与 gas 的数据相同?

fourier(gas, K=i)fourier(gasreg,K=j) 产生相同的傅里叶集-我相信 fourier() 的结果只取决于时间序列的长度,而不是内容。等级不足错误是由两次使用相同的回归量引起的。我认为我不需要输入两次傅里叶级数,下面的代码似乎就足够了。

bestfit <- list(aicc=Inf)
for(i in 1:25){
  for(j in 1:25){
    fit <- auto.arima(gas, xreg=cbind(fourier(gas, K=i),gasreg), seasonal=FALSE)
    if(fit$aicc < bestfit$aicc){
      bestfit <- fit
      k <-i
      }
    else break;
  }
}