如何处理包含 "periods of time" 和缺失数据的数据集
How to deal with a dataset with "periods of time" and missing data
我正在处理一个数据集,它的列是时间点(例如八月、九月等),行是当时收集的不同测量值。
除此之外,数据根本不干净,有很多缺失的数据,我不能用它们删除所有行或填充它们所以我的想法是将数据集分成 4 个较小的数据集。
可以对这种数据集进行什么样的分析?我应该反转列和行吗?
具有缺失数据的时间序列回归是统计分析中的一个特例。简单地重新调整数据集不是解决方案。
我了解执行周期性分析和频谱分析以确定最佳拟合的正弦波,即正弦波驱动通过缺失的数据点,回归是确定与现有数据的拟合的一种方法。
之前在基于 ARIMA(移动平均)的 Stats exchange 上提出了同样的问题。就个人而言,我并没有被这种方法吓倒,因为会有一个专业的解决方案。
https://stats.stackexchange.com/questions/121414/how-do-i-handle-nonexistent-or-missing-data
我正在处理一个数据集,它的列是时间点(例如八月、九月等),行是当时收集的不同测量值。
除此之外,数据根本不干净,有很多缺失的数据,我不能用它们删除所有行或填充它们所以我的想法是将数据集分成 4 个较小的数据集。
可以对这种数据集进行什么样的分析?我应该反转列和行吗?
具有缺失数据的时间序列回归是统计分析中的一个特例。简单地重新调整数据集不是解决方案。
我了解执行周期性分析和频谱分析以确定最佳拟合的正弦波,即正弦波驱动通过缺失的数据点,回归是确定与现有数据的拟合的一种方法。
之前在基于 ARIMA(移动平均)的 Stats exchange 上提出了同样的问题。就个人而言,我并没有被这种方法吓倒,因为会有一个专业的解决方案。 https://stats.stackexchange.com/questions/121414/how-do-i-handle-nonexistent-or-missing-data