系列描述函数pandas绘图
Series describe function pandas ploting
我有问题要问你。哪个图最适合显示系列描述结果 [=14=]
filter = genderage['Customer_Gender'] == "F"
genderage[filter]
genderage[filter].describe()
Customer_Age
count 54724.000000
mean 36.168993
std 10.910622
min 17.000000
25% 28.000000
50% 35.000000
75% 43.000000
max 87.000000
A boxplot
会将几乎所有这些信息组合到一个可视化中。默认情况下它不会绘制 mean
但您可以将其添加为带有 meanline
和 showmeans
.
的虚线
胡须从 max
延伸到 min
。虚线是平均值。方框从 25% 延伸到 75%,方框内的实线是中位数 (50%)。您只是错过了标准偏差和计数,如果需要,可以将其添加为文本。
import numpy as np
import pandas as pd
np.random.seed(123)
s = pd.Series(np.random.chisquare(34, 100))
s.describe()
#count 100.000000
#mean 34.674010
#std 8.393988
#min 15.306646
#25% 29.043357
#50% 33.556184
#75% 40.380201
#max 56.930963
#dtype: float64
s.to_frame('data').boxplot(meanline=True, showmeans=True)
我有问题要问你。哪个图最适合显示系列描述结果 [=14=]
filter = genderage['Customer_Gender'] == "F"
genderage[filter]
genderage[filter].describe()
Customer_Age
count 54724.000000
mean 36.168993
std 10.910622
min 17.000000
25% 28.000000
50% 35.000000
75% 43.000000
max 87.000000
A boxplot
会将几乎所有这些信息组合到一个可视化中。默认情况下它不会绘制 mean
但您可以将其添加为带有 meanline
和 showmeans
.
胡须从 max
延伸到 min
。虚线是平均值。方框从 25% 延伸到 75%,方框内的实线是中位数 (50%)。您只是错过了标准偏差和计数,如果需要,可以将其添加为文本。
import numpy as np
import pandas as pd
np.random.seed(123)
s = pd.Series(np.random.chisquare(34, 100))
s.describe()
#count 100.000000
#mean 34.674010
#std 8.393988
#min 15.306646
#25% 29.043357
#50% 33.556184
#75% 40.380201
#max 56.930963
#dtype: float64
s.to_frame('data').boxplot(meanline=True, showmeans=True)