density/frequency 和 hist() 中的概率

density/frequency and probability in hist()

我用过代码

hist(x, probability=TRUE)

这给了我一个从 0 到 2 的 y 轴,名称为密度。我不明白这是什么意思。它是积分为 1、总和为 1,还是 y 值等于多少?文档说 "freq = NULL, probability = !freq" 但这对我来说没有意义。如果我不使用 probability=TRUE,我会在 y 轴上得到 Frequency,但绘图的形状是相同的。

您可以将直方图保存到变量中并查看它。

x=rnorm(1000)
h<-hist(x)

h

$breaks
 [1] -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5  0.0  0.5  1.0  1.5  2.0  2.5  3.0  3.5  4.0

$counts
 [1]   2   8  24  42  87 169 188 189 146  78  38  23   5   0   1

$density
 [1] 0.004 0.016 0.048 0.084 0.174 0.338 0.376 0.378 0.292 0.156 0.076 0.046 0.010 0.000 0.002

$mids
 [1] -3.25 -2.75 -2.25 -1.75 -1.25 -0.75 -0.25  0.25  0.75  1.25  1.75  2.25  2.75  3.25  3.75

$xname
[1] "x"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"

默认情况下它绘制频率(可以通过 h$counts 访问),这只是每个间隔内获得的点数。点的总数等于向量的长度,你可以用

检查
sum(h$counts)
[1] 1000

如果指定probability=TRUE,它将绘制每个点进入每个区间的概率。概率总和乘以条形宽度应等于 1。在我们的例子中,条形宽度为 0.5,因此我们得到

sum(h$density*0.5)
[1] 1