调用已从较大数据帧重新采样和聚合的各个列
Calling individual columns that have been resampled and aggregated from a larger dataframe
我有一个大数据框,为了收集一些数据的统计数据,我每 6 小时对数据重新采样一次,然后按平均数和计数汇总该数据。
执行此操作的代码。
meantime = df.set_index('datetime').resample('6h').agg(['mean', 'count'])
print(meantime['l16'])
请注意,我只对数据帧的一列 (l16) 重新采样,这就是我想要的。
结果:
mean count
datetime
2019-02-03 00:00:00 1.322222 9
2019-02-03 06:00:00 5.733333 12
2019-02-03 12:00:00 6.258333 12
2019-02-03 18:00:00 2.325000 12
我想用这个做两件事。
删除任何计数小于 6 的重采样行。
分离均值列,并将其转换为列表,以便最终绘制为图上的叠加层。
我 运行 遇到的问题就是如何完成每个部分。我不确定如何编写代码来执行此操作。
我试图通过编写类似的东西来实现这一点,但我不知道如何将重采样列与数据帧列隔离。
invalid = meantime['l16' *count?* ] < 6
print(meantime['l16' *mean?*]
我环顾四周,似乎找不到我的问题的答案。
如有任何帮助,我们将不胜感激。
如果您只想接收 6 个重采样数据,那么您应该使用 for 循环,如下所示:
x = 1
while True:
print "To infinity and beyond! We're getting close, on %d now!" % (x)
x += 1
隔离任何计数小于 6 的重采样行。
invalid = meantime.loc[meantime['count'] < 6]
分离均值列,并将其转换为最终列表
绘制为图上的叠加层。
meanvalues = meantime['mean'].to_list()
我有一个大数据框,为了收集一些数据的统计数据,我每 6 小时对数据重新采样一次,然后按平均数和计数汇总该数据。
执行此操作的代码。
meantime = df.set_index('datetime').resample('6h').agg(['mean', 'count'])
print(meantime['l16'])
请注意,我只对数据帧的一列 (l16) 重新采样,这就是我想要的。
结果:
mean count
datetime
2019-02-03 00:00:00 1.322222 9
2019-02-03 06:00:00 5.733333 12
2019-02-03 12:00:00 6.258333 12
2019-02-03 18:00:00 2.325000 12
我想用这个做两件事。
删除任何计数小于 6 的重采样行。
分离均值列,并将其转换为列表,以便最终绘制为图上的叠加层。
我 运行 遇到的问题就是如何完成每个部分。我不确定如何编写代码来执行此操作。
我试图通过编写类似的东西来实现这一点,但我不知道如何将重采样列与数据帧列隔离。
invalid = meantime['l16' *count?* ] < 6
print(meantime['l16' *mean?*]
我环顾四周,似乎找不到我的问题的答案。
如有任何帮助,我们将不胜感激。
如果您只想接收 6 个重采样数据,那么您应该使用 for 循环,如下所示:
x = 1
while True:
print "To infinity and beyond! We're getting close, on %d now!" % (x)
x += 1
隔离任何计数小于 6 的重采样行。
invalid = meantime.loc[meantime['count'] < 6]
分离均值列,并将其转换为最终列表 绘制为图上的叠加层。
meanvalues = meantime['mean'].to_list()