如何总结 bin 的 Y 值而不是求平均值?
How to sum up Y values for bins instead of averaging?
我有以下数据框 data
:
import pandas as pd
from io import StringIO
data = pd.read_table(StringIO("""time_diff avg_trips_per_day
631 1.0
231 1.0
431 1.0
7031 1.0
17231 1.0
20000 20.0
21000 15.0
22000 10.0"""), delim_whitespace=True)
我创建了一个条形图如下:
import seaborn as sns
data['timegroup'] = pd.qcut(data['time_diff'], 3)
sns.barplot(x='timegroup', y='avg_trips_per_day', data=data)
目前它为每个 bin (timegroup
) 取 avg_trips_per_day
的值并计算平均值 avg_trips_per_day
。
但是,我想对每个 bin timegroup
的 avg_trips_per_day
的值求和,而不是使用平均值。我怎样才能做到这一点?
使用barplot的estimator参数:
sns.barplot(x='timegroup', y='avg_trips_per_day', data=data, estimator=sum)
我有以下数据框 data
:
import pandas as pd
from io import StringIO
data = pd.read_table(StringIO("""time_diff avg_trips_per_day
631 1.0
231 1.0
431 1.0
7031 1.0
17231 1.0
20000 20.0
21000 15.0
22000 10.0"""), delim_whitespace=True)
我创建了一个条形图如下:
import seaborn as sns
data['timegroup'] = pd.qcut(data['time_diff'], 3)
sns.barplot(x='timegroup', y='avg_trips_per_day', data=data)
目前它为每个 bin (timegroup
) 取 avg_trips_per_day
的值并计算平均值 avg_trips_per_day
。
但是,我想对每个 bin timegroup
的 avg_trips_per_day
的值求和,而不是使用平均值。我怎样才能做到这一点?
使用barplot的estimator参数:
sns.barplot(x='timegroup', y='avg_trips_per_day', data=data, estimator=sum)