从 Pandas DataFrame 中绘制出现次数(条件选择)
plot number of occurrences (conditional selection) from Pandas DataFrame
我有一个包含三列的 DataFrame。 1) 其中一个包含时间戳,2) 第二个包含错误级别(级别 1、级别 2 和级别 3),第三个包含错误类别(类别 1、类别 2 和类别 3)
我想知道某一天发生了多少次某一级别和类别的错误。例如,对于每一天,我想计算类别 1 的级别 1 的错误发生次数,并将此数据绘制为 X 轴上的日期和 Y 轴上的发生次数。如果您能使用 pandas 和 matplotlib 提供答案,我将不胜感激。
Time Level Category
2000-12-29 00:10:00 Level 1 Category 1
2000-12-29 00:20:00 Level 2 Category 2
2000-12-29 00:30:00 Level 3 Category 3
2000-12-29 00:40:00 Level 3 Category 3
2000-12-29 00:50:00 Level 3 Category 3
...
2000-12-31 00:10:00 Level 3 Category 3
2000-12-31 00:20:00 Level 2 Category 2
2000-12-31 00:30:00 Level 1 Category 1
data.time、data.level 和 data.category
假设您从这样的事情开始:
import pandas as pd
df = pd.DataFrame(
{'Time': [1, 2, 2, 3, 4, 5],
'Level': [1, 2, 2, 2, 1, 2],
'Category': ['a', 'a', 'a', 'a', 'b', 'a']})
首先添加一个虚拟列:
df['dummy'] = 1
现在只是 select 级别和类别,按时间分组,为每个组添加虚拟对象,然后绘图:
df[(df.Category == 'a') & (df.Level == 2)][['Time', 'dummy']].dummy.groupby([df.Time]).sum().plot();
我有一个包含三列的 DataFrame。 1) 其中一个包含时间戳,2) 第二个包含错误级别(级别 1、级别 2 和级别 3),第三个包含错误类别(类别 1、类别 2 和类别 3)
我想知道某一天发生了多少次某一级别和类别的错误。例如,对于每一天,我想计算类别 1 的级别 1 的错误发生次数,并将此数据绘制为 X 轴上的日期和 Y 轴上的发生次数。如果您能使用 pandas 和 matplotlib 提供答案,我将不胜感激。
Time Level Category
2000-12-29 00:10:00 Level 1 Category 1
2000-12-29 00:20:00 Level 2 Category 2
2000-12-29 00:30:00 Level 3 Category 3
2000-12-29 00:40:00 Level 3 Category 3
2000-12-29 00:50:00 Level 3 Category 3
...
2000-12-31 00:10:00 Level 3 Category 3
2000-12-31 00:20:00 Level 2 Category 2
2000-12-31 00:30:00 Level 1 Category 1
data.time、data.level 和 data.category
假设您从这样的事情开始:
import pandas as pd
df = pd.DataFrame(
{'Time': [1, 2, 2, 3, 4, 5],
'Level': [1, 2, 2, 2, 1, 2],
'Category': ['a', 'a', 'a', 'a', 'b', 'a']})
首先添加一个虚拟列:
df['dummy'] = 1
现在只是 select 级别和类别,按时间分组,为每个组添加虚拟对象,然后绘图:
df[(df.Category == 'a') & (df.Level == 2)][['Time', 'dummy']].dummy.groupby([df.Time]).sum().plot();