seaborn histplot 和 displot 输出不匹配
seaborn histplot and displot output doesn't match
seaborn.histplot
and seaborn.displot
生成的直方图不匹配。
sns.displot
的默认绘图是 kind='hist'
- 使用
python3.8.11
、seaborn 0.11.2
和 matplotlib 3.4.2
进行了测试
- 为什么输出不匹配,如何解决?
- 预期是,给定
bins
,相应地块的 density
应该匹配。
bins
传递给 numpy.histogram_bin_edges
- Visualizing distributions of data 中包含的信息无法解决问题。
import seaborn as sns
import matplotlib.pyplot as plt
# sample data: wide
dfw = sns.load_dataset("penguins", cache=False)[['bill_length_mm', 'bill_depth_mm']].dropna()
# sample data: long
dfl = dfw.melt(var_name='bill_size', value_name='vals')
seaborn.displot
- 忽略
'sharex': False
,但 'sharey'
有效
- 忽略
bins
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
plt.show()
- 设置
xlim
没有区别
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
axes = fg.axes.ravel()
axes[0].set_xlim(25, 65)
axes[1].set_xlim(13, 26)
plt.show()
seaborn.histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.tight_layout()
plt.show()
更新
- 正如 mwaskom 所建议的那样,
common_bins=False
将直方图变为相同的形状,解决了忽略 bins
和 sharex
的问题。然而,density
似乎受到了 displot
中地块数量的影响。
- 如果
displot
中有3个地块,那么密度是histplot
中显示的1/3;对于 2 个地块,密度为 1/2。
- 正如 mwaskom 在评论中所建议的那样,
common_bins=False
将直方图变为相同的形状,解决了忽略 bins
和 sharex
的问题,以及 density
在分面图中按每个分面中的数据点数而不是分面数缩放。
density
被 displot
中的地块数量分割的问题已通过使用 common_norm=False
解决
剧情代码
# displot
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4,
facet_kws={'sharey': False, 'sharex': False}, common_bins=False, common_norm=False)
fg.fig.subplots_adjust(top=0.85)
fg.fig.suptitle('Displot with common_bins & common_norm as False')
plt.show()
# histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.subplots_adjust(top=0.85)
fig.suptitle('Histplot')
fig.tight_layout()
plt.show()
seaborn.histplot
andseaborn.displot
生成的直方图不匹配。sns.displot
的默认绘图是kind='hist'
- 使用
python3.8.11
、seaborn 0.11.2
和matplotlib 3.4.2
进行了测试
- 为什么输出不匹配,如何解决?
- 预期是,给定
bins
,相应地块的density
应该匹配。bins
传递给numpy.histogram_bin_edges
- Visualizing distributions of data 中包含的信息无法解决问题。
import seaborn as sns
import matplotlib.pyplot as plt
# sample data: wide
dfw = sns.load_dataset("penguins", cache=False)[['bill_length_mm', 'bill_depth_mm']].dropna()
# sample data: long
dfl = dfw.melt(var_name='bill_size', value_name='vals')
seaborn.displot
- 忽略
'sharex': False
,但'sharey'
有效 - 忽略
bins
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
plt.show()
- 设置
xlim
没有区别
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4, facet_kws={'sharey': False, 'sharex': False})
axes = fg.axes.ravel()
axes[0].set_xlim(25, 65)
axes[1].set_xlim(13, 26)
plt.show()
seaborn.histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.tight_layout()
plt.show()
更新
- 正如 mwaskom 所建议的那样,
common_bins=False
将直方图变为相同的形状,解决了忽略bins
和sharex
的问题。然而,density
似乎受到了displot
中地块数量的影响。- 如果
displot
中有3个地块,那么密度是histplot
中显示的1/3;对于 2 个地块,密度为 1/2。
- 如果
- 正如 mwaskom 在评论中所建议的那样,
common_bins=False
将直方图变为相同的形状,解决了忽略bins
和sharex
的问题,以及density
在分面图中按每个分面中的数据点数而不是分面数缩放。 density
被displot
中的地块数量分割的问题已通过使用common_norm=False
解决
剧情代码
# displot
fg = sns.displot(data=dfl, x='vals', col='bill_size', kde=True, stat='density', bins=12, height=4,
facet_kws={'sharey': False, 'sharex': False}, common_bins=False, common_norm=False)
fg.fig.subplots_adjust(top=0.85)
fg.fig.suptitle('Displot with common_bins & common_norm as False')
plt.show()
# histplot
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(8, 4))
sns.histplot(data=dfw.bill_length_mm, kde=True, stat='density', bins=12, ax=ax1)
sns.histplot(data=dfw.bill_depth_mm, kde=True, stat='density', bins=12, ax=ax2)
fig.subplots_adjust(top=0.85)
fig.suptitle('Histplot')
fig.tight_layout()
plt.show()