pandas时序数据预处理

pandas time-series data preprocessing

我的数据框看起来像这样:

> dt
    text    timestamp
0   a   2016-06-13 18:00
1   b   2016-06-20 14:08
2   c   2016-07-01 07:41
3   d   2016-07-11 19:07
4   e   2016-08-01 16:00

我想总结每个月的数据,如:

> dt_month
count   timestamp
0   2   2016-06
1   2   2016-07
2   1   2016-08

原始数据集(dt)可以通过以下方式生成:

import pandas as pd
data = {'text': ['a', 'b', 'c', 'd', 'e'],
    'timestamp': ['2016-06-13 18:00', '2016-06-20 14:08', '2016-07-01 07:41', '2016-07-11 19:07', '2016-08-01 16:00']}
dt = pd.DataFrame(data)

有没有什么方法可以通过 dt_month 绘制时频图?

您可以按 timestamp 列进行分组转换 to_period and aggregate size:

print (df.text.groupby(df.timestamp.dt.to_period('m'))
              .size()
              .rename('count')
              .reset_index())

  timestamp  count
0   2016-06      2
1   2016-07      2
2   2016-08      1