调用已从较大数据帧重新采样和聚合的各个列

Calling individual columns that have been resampled and aggregated from a larger dataframe

我有一个大数据框,为了收集一些数据的统计数据,我每 6 小时对数据重新采样一次,然后按平均数和计数汇总该数据。

执行此操作的代码。

meantime = df.set_index('datetime').resample('6h').agg(['mean', 'count'])

print(meantime['l16'])

请注意,我只对数据帧的一列 (l16) 重新采样,这就是我想要的。

结果:

                          mean  count
datetime                             
2019-02-03 00:00:00   1.322222      9
2019-02-03 06:00:00   5.733333     12
2019-02-03 12:00:00   6.258333     12
2019-02-03 18:00:00   2.325000     12

我想用这个做两件事。

  1. 删除任何计数小于 6 的重采样行。

  2. 分离均值列,并将其转换为列表,以便最终绘制为图上的叠加层。

我 运行 遇到的问题就是如何完成每个部分。我不确定如何编写代码来执行此操作。

我试图通过编写类似的东西来实现这一点,但我不知道如何将重采样列与数据帧列隔离。

invalid = meantime['l16' *count?* ] < 6
print(meantime['l16' *mean?*]

我环顾四周,似乎找不到我的问题的答案。

如有任何帮助,我们将不胜感激。

如果您只想接收 6 个重采样数据,那么您应该使用 for 循环,如下所示:

x = 1
while True:
    print "To infinity and beyond! We're getting close, on %d now!" % (x)
    x += 1
  1. 隔离任何计数小于 6 的重采样行。

    invalid = meantime.loc[meantime['count'] < 6]

  2. 分离均值列,并将其转换为最终列表 绘制为图上的叠加层。

    meanvalues = meantime['mean'].to_list()