如何用前后一天的平均值填充数据缺失的天数

How to fill in missing days of data with average of day before and after

我从 Yahoo finances 获得了 Amazon Stock 数据,但缺少一些没有数据的日子。

我想知道是否有办法,使用 google collab,然后 "create" 那些缺失的天数,并用平均无论相邻的日子是什么。

我想在 缺失天数 之前和之后使用最近的数据天数来创建缺失天数的数据。

我看了很多slack的答案,但是我找不到一个具体的答案来解决我的问题。看起来最接近的命令是: ws = Amazon.worksheet('Amazon') idx = pd.date_range(start = '05-15-1997', end = '07-05-2019') Amazon_df = get_as_dataframe(ws) AMZ = pd.DataFrame(Amazon_df) AMZ.index = pd.DatetimeIndex(AMZ.index) AMZ = AMZ.reindex(idx, fill_value=np.nan)

此命令的问题是我必须手动添加缺失的日期,并且使用亚马逊库​​存,这将花费很长时间。

我似乎想不出如何解决这个问题。电子表格的 link 是 https://docs.google.com/spreadsheets/d/1fLicjjVRTchd8ps6aiVsGfP1GVFfvJN2rgfoYxxSHZk/edit?usp=sharing

我想弄清楚这些数据,这样我就可以在没有随机 'missing' 天的情况下绘制图表。我想用实际有数据的前后几天的平均值填充 "missing" 天。

我认为您可以使用模拟来填充缺失值。我有一个函数 rts_clean() 但在 R 代码(GeoRTS 包)中,它基于 STL-loess 分解(趋势、平稳性和噪声,承认缺失值),首先分解时间序列在这 3 个组件中,然后您只需使用它的分布(对于可用数据)来模拟噪声值。然后你会得到这样的东西:

示例: https://github.com/InstitutoInvestigacionesEconomicasPUCE/geortsBeta/blob/master/man/figures/rearme_img1.png

代码: https://github.com/InstitutoInvestigacionesEconomicasPUCE/geortsBeta/blob/master/R/rts_clean.R