R:可变长度不同

R: Variable lengths differ

我正在尝试创建基于时间序列分析的线性模型,如下所示:

模型 1 = novice_crash ~ 时间 + 毕业 + time.after + 月份

我有以下创建上述变量的代码:

grad<- c(replicate(66,0),replicate(30,1))
grad<- ts(grad, start=c(2002,1), frequency=12)

time<- seq(1,96, by=1)
time<- ts(time,start=c(2002,1), frequency = 12)

time.after<- c(replicate(66,0),replicate(30,1))
time.after<- ts(time.after, start=c(2002,1), frequency = 12)

#month<- seasonaldummy(novice_crashes)
month<-time

grad.lag1<- lag(grad)

time.after.lag1<- lag(time.after)

'novice_crashes' 是一个来自以下代码的 ts 对象(其中 'crashes' 是一个 csv 文件

novice<- crash$novice_crash
total<- crash$total_crash
novice_crashes<-ts(novice, start = c(2002,12), end=c(2009,12), frequency = 12)

当我尝试 运行 这个 model1<- lm(novice_crashes ~ time + grad + time.after + month) 我得到以下错误:

Error in model.frame.default(formula = novice_crashes ~ time + grad + : variable lengths differ (found for 'time')

我检查了时间、毕业、time.after 和月份的长度(都是 96 个单位长)。

数据集 crash 有 NA,但我删除了

crash<- na.omit(crash)

我更习惯 python 所以我可能在这里遗漏了一些东西...

enter code here我同意 MrFlick 的评论。但是从你所说的你没有检查novice_crashes变量的长度。由于与其他时间序列 (start = c(2002,1)) 相比,此时间序列开始时间较晚 (start = c(2002,12))。可能有问题。

让我知道这是否是问题所在,否则请提供 post 可重现的示例。