Python/Seaborn: 数据点的内部水平分布是什么意思还是随机的?
Python/Seaborn: What does the inside horizontal distribution of the data-points means or is it random?
每次绘制(使用 Seaborn)时,直方图数据点的内部分布似乎几乎是 运行dom - 是为了便于阅读还是其他有意义的目的?
我正在使用 Python 3.0,Seaborn 为这个问题提供了名为 'tips' 的数据集。
import seaborn as sns
tips = sns.load_dataset("tips")
在我 运行 下面两次相同的代码之后,我看到了内部点分布的差异。这是您可以 运行 几次的代码:
ax = sns.stripplot(x="day", y="total_bill", data=tips, alpha=.55,
palette='Set1', jitter=True, linewidth=1 )
现在,如果您查看这些图(例如,如果您 运行 它两次),您会注意到 2 个图之间的点分布不同:
请解释为什么 2 个单独的 运行 点分布不相同?另外,判断水平刻度上的那些点;有没有理由(例如)一个红点比其他红点更靠左,或者仅仅是为了便于阅读?
提前致谢!
经过更多研究,我认为数据点的分布是 random but uniform(感谢@ImportanceOfBeingErnest 指向代码)。因此,回答我自己的问题没有 hidden 在 distribution 方面的意思,水平范围只是为了可见性而设置,它也会改变或保持不变基于 set/notset 种子。
每次绘制(使用 Seaborn)时,直方图数据点的内部分布似乎几乎是 运行dom - 是为了便于阅读还是其他有意义的目的?
我正在使用 Python 3.0,Seaborn 为这个问题提供了名为 'tips' 的数据集。
import seaborn as sns
tips = sns.load_dataset("tips")
在我 运行 下面两次相同的代码之后,我看到了内部点分布的差异。这是您可以 运行 几次的代码:
ax = sns.stripplot(x="day", y="total_bill", data=tips, alpha=.55,
palette='Set1', jitter=True, linewidth=1 )
现在,如果您查看这些图(例如,如果您 运行 它两次),您会注意到 2 个图之间的点分布不同:
请解释为什么 2 个单独的 运行 点分布不相同?另外,判断水平刻度上的那些点;有没有理由(例如)一个红点比其他红点更靠左,或者仅仅是为了便于阅读?
提前致谢!
经过更多研究,我认为数据点的分布是 random but uniform(感谢@ImportanceOfBeingErnest 指向代码)。因此,回答我自己的问题没有 hidden 在 distribution 方面的意思,水平范围只是为了可见性而设置,它也会改变或保持不变基于 set/notset 种子。