绘制加权数据时,箱线图失去了 "box" 的性质
Boxplots lose "box" nature when plotting weighted data
我在 Stata 中有以下数据:
input drug halflife hl_weight
3 2.95 0.0066
2 6.00 0.0004
5 13.60 0.0006
1 2.82 0.0331
4 8.80 0.0001
4 1.24 0.0075
2 6.25 0.1123
4 17.20 0.0002
5 14.50 0.0020
4 5.50 0.0016
5 13.30 0.0003
4 8.26 0.0201
4 16.50 0.0103
4 11.40 0.0016
4 5.90 0.0005
4 3.99 0.0100
4 2.80 0.0073
4 3.00 0.0133
4 3.17 0.0061
4 4.95 0.1404
end
我正在尝试使用以下命令创建药物半衰期的箱线图:
graph box halflife [aweight=hl_weight], over(drug)
当我包含权重选项时,一些生成的箱形图由多个点组成,而不是典型的四分位间距和中位数:
为什么会发生这种情况,我该如何解决?
显然,这是因为加权。权重更加强调远在四分位数范围之外的值。
我不认为这里有什么可以解决的。您可以尝试使用 graph box
命令的 nooutsides
选项来隐藏点,但我不推荐它。
我在 Stata 中有以下数据:
input drug halflife hl_weight
3 2.95 0.0066
2 6.00 0.0004
5 13.60 0.0006
1 2.82 0.0331
4 8.80 0.0001
4 1.24 0.0075
2 6.25 0.1123
4 17.20 0.0002
5 14.50 0.0020
4 5.50 0.0016
5 13.30 0.0003
4 8.26 0.0201
4 16.50 0.0103
4 11.40 0.0016
4 5.90 0.0005
4 3.99 0.0100
4 2.80 0.0073
4 3.00 0.0133
4 3.17 0.0061
4 4.95 0.1404
end
我正在尝试使用以下命令创建药物半衰期的箱线图:
graph box halflife [aweight=hl_weight], over(drug)
当我包含权重选项时,一些生成的箱形图由多个点组成,而不是典型的四分位间距和中位数:
为什么会发生这种情况,我该如何解决?
显然,这是因为加权。权重更加强调远在四分位数范围之外的值。
我不认为这里有什么可以解决的。您可以尝试使用 graph box
命令的 nooutsides
选项来隐藏点,但我不推荐它。