奇怪的 SARMAX 适合 python 个统计模型
Strange SARMAX fit with python statsmodels
我有一个包含 48 个 obs(每月)的数据集,python 已经能够拟合 SARIMAX ((4, 1, 3), (3, 0, 5)) 模型...这对我来说似乎很奇怪。由于我只有 48 个数据点,它如何计算 B^(12*5) 项和后续项?
我也尝试过 ((0, 1, 4), (5, 0, 1)) 并且它有效......此外,我计算了下一个 MAPE 12 个周期,相当不错(3% 和 6%)。
想法?
谢谢
基本上,估计是在假设样本前观察是从隐含的 SARIMA 过程的无条件分布中得出的假设下完成的。
SARIMAX 模型使用状态 space 方法进行估计,如果您是常客,则此过程称为第一个状态向量的“初始化”,而如果您是贝叶斯,则您会认为这是在第一个状态向量上放置一个特定的先验(状态向量包含过程的所有必需滞后,因此“初始化”或先验描述了足够的样本前观察以使模型适合) .
虽然这是一种非常合理的模型设置方法,可以对其进行估计,但这并不一定意味着指定具有如此多参数和如此少观察值的模型是个好主意。您的估计将开始更多地依赖于先验而不是数据。
我有一个包含 48 个 obs(每月)的数据集,python 已经能够拟合 SARIMAX ((4, 1, 3), (3, 0, 5)) 模型...这对我来说似乎很奇怪。由于我只有 48 个数据点,它如何计算 B^(12*5) 项和后续项? 我也尝试过 ((0, 1, 4), (5, 0, 1)) 并且它有效......此外,我计算了下一个 MAPE 12 个周期,相当不错(3% 和 6%)。
想法?
谢谢
基本上,估计是在假设样本前观察是从隐含的 SARIMA 过程的无条件分布中得出的假设下完成的。
SARIMAX 模型使用状态 space 方法进行估计,如果您是常客,则此过程称为第一个状态向量的“初始化”,而如果您是贝叶斯,则您会认为这是在第一个状态向量上放置一个特定的先验(状态向量包含过程的所有必需滞后,因此“初始化”或先验描述了足够的样本前观察以使模型适合) .
虽然这是一种非常合理的模型设置方法,可以对其进行估计,但这并不一定意味着指定具有如此多参数和如此少观察值的模型是个好主意。您的估计将开始更多地依赖于先验而不是数据。