python 中 table 个值的箱线图
Boxplot from a table of values in python
我有一个数据框,其中包含年份值、乘客数据及其来自的国家/地区。考虑到数据框,该国家/地区保持不变。
我正在尝试绘制箱线图。其中国家:"USA" 在 x 轴上,所有年份的乘客数据显示在 y 轴上。
但我得到:AttributeError: 'Series' object has no attribute 'boxplot'
from matplotlib import pyplot as plt
import pandas as pd
df = pd.read_csv('CityPairs.csv')
filt = (df.Country == 'USA')
df = df[filt]
reqcol = ['Year', 'Country', 'Passengers_Total']
df = df[reqcol]
groupbyCountry = df.groupby(['Year', 'Country'])['Passengers_Total'].sum()
groupbyCountry
groupbyCountry.boxplot(column = 'Passengers_Total', by = 'Country')
任何帮助将不胜感激
对DataFrame
使用reset_index
或参数as_index=True
:
groupbyCountry = df.groupby(['Year', 'Country'])['Passengers_Total'].sum().reset_index()
或者:
groupbyCountry = df.groupby(['Year', 'Country'], as_index=False)['Passengers_Total'].sum()
如果只绘制一个类别 (USA
),您可以简化代码:
groupbyCountry.boxplot(column = 'Passengers_Total')
我有一个数据框,其中包含年份值、乘客数据及其来自的国家/地区。考虑到数据框,该国家/地区保持不变。
我正在尝试绘制箱线图。其中国家:"USA" 在 x 轴上,所有年份的乘客数据显示在 y 轴上。
但我得到:AttributeError: 'Series' object has no attribute 'boxplot'
from matplotlib import pyplot as plt
import pandas as pd
df = pd.read_csv('CityPairs.csv')
filt = (df.Country == 'USA')
df = df[filt]
reqcol = ['Year', 'Country', 'Passengers_Total']
df = df[reqcol]
groupbyCountry = df.groupby(['Year', 'Country'])['Passengers_Total'].sum()
groupbyCountry
groupbyCountry.boxplot(column = 'Passengers_Total', by = 'Country')
任何帮助将不胜感激
对DataFrame
使用reset_index
或参数as_index=True
:
groupbyCountry = df.groupby(['Year', 'Country'])['Passengers_Total'].sum().reset_index()
或者:
groupbyCountry = df.groupby(['Year', 'Country'], as_index=False)['Passengers_Total'].sum()
如果只绘制一个类别 (USA
),您可以简化代码:
groupbyCountry.boxplot(column = 'Passengers_Total')