调用已从较大数据帧重新采样和聚合的各个列

Question

我有一个大数据框，为了收集一些数据的统计数据，我每 6 小时对数据重新采样一次，然后按平均数和计数汇总该数据。

执行此操作的代码。

meantime = df.set_index('datetime').resample('6h').agg(['mean', 'count'])

print(meantime['l16'])

请注意，我只对数据帧的一列 (l16) 重新采样，这就是我想要的。

结果：

                          mean  count
datetime                             
2019-02-03 00:00:00   1.322222      9
2019-02-03 06:00:00   5.733333     12
2019-02-03 12:00:00   6.258333     12
2019-02-03 18:00:00   2.325000     12

我想用这个做两件事。

删除任何计数小于 6 的重采样行。
分离均值列，并将其转换为列表，以便最终绘制为图上的叠加层。

我运行遇到的问题就是如何完成每个部分。我不确定如何编写代码来执行此操作。

我试图通过编写类似的东西来实现这一点，但我不知道如何将重采样列与数据帧列隔离。

invalid = meantime['l16' *count?* ] < 6
print(meantime['l16' *mean?*]

我环顾四周，似乎找不到我的问题的答案。

如有任何帮助，我们将不胜感激。

Answer 1

如果您只想接收 6 个重采样数据，那么您应该使用 for 循环，如下所示：

x = 1
while True:
    print "To infinity and beyond! We're getting close, on %d now!" % (x)
    x += 1

Answer 2

隔离任何计数小于 6 的重采样行。

invalid = meantime.loc[meantime['count'] < 6]
分离均值列，并将其转换为最终列表绘制为图上的叠加层。

meanvalues = meantime['mean'].to_list()

调用已从较大数据帧重新采样和聚合的各个列

Calling individual columns that have been resampled and aggregated from a larger dataframe

python

aggregate

resampling

pandas