绘制加权数据时,箱线图失去了 "box" 的性质

Boxplots lose "box" nature when plotting weighted data

我在 Stata 中有以下数据:

input drug  halflife    hl_weight
3       2.95        0.0066
2       6.00        0.0004
5       13.60       0.0006
1       2.82        0.0331
4       8.80        0.0001
4       1.24        0.0075
2       6.25        0.1123
4       17.20       0.0002
5       14.50       0.0020
4       5.50        0.0016
5       13.30       0.0003
4       8.26        0.0201
4       16.50       0.0103
4       11.40       0.0016
4       5.90        0.0005
4       3.99        0.0100
4       2.80        0.0073
4       3.00        0.0133
4       3.17        0.0061
4       4.95        0.1404
end

我正在尝试使用以下命令创建药物半衰期的箱线图:

graph box halflife [aweight=hl_weight], over(drug)

当我包含权重选项时,一些生成的箱形图由多个点组成,而不是典型的四分位间距和中位数:

为什么会发生这种情况,我该如何解决?

显然,这是因为加权。权重更加强调远在四分位数范围之外的值。

我不认为这里有什么可以解决的。您可以尝试使用 graph box 命令的 nooutsides 选项来隐藏点,但我不推荐它。