箱线图计数数据与 R 中的连续变量
Boxplotting count data with a continuous variable in R
我在绘制计数数据箱线图时遇到问题。我有一个包含 420 个研究地点的数据集,其中包含每个地点的鸟类观察和海拔数据。研究地点成行,不同的鸟类和海拔高度成列。我的目标是在海拔梯度中绘制不同鸟类的箱线图(X = 鸟类,Y = 海拔)。
siteID
BirdA
BirdB
BirdC
elevation
1
3
2
0
275
2
1
5
1
550
3
0
0
3
850
4
4
3
2
322
我的问题是鸟类数据是计数数据。例如,site1 可能有三对鸟 A、两对鸟 B 和零对鸟 C,这使得箱线图在某种程度上变得困难。 boxplot 命令为具有不同观察量的站点创建不同的框(自己的框用于零个观察、一个观察、两个观察、三个观察等)。
我只想为每种鸟类一个盒子,我希望箱线图注意到 sites/elevations 和 几对 某些鸟类,因为它提供了线索该特定鸟类的最佳海拔高度。我可以将计数数据更改为存在-不存在,但它会改变我的结果。
我发现解决方案是将具有 3 个 BirdA 观测值的一行更改为在特定高度上具有 1 个 BirdA 观测值的 3 行。是否有命令或程序包可以帮助我将数据从计数数据更改为二项式数据?或者有没有更简单的方法来绘制这些值?
我不认为在这个设置框中绘制是合适的,因为评论中 。此外,我希望这里的解决方案有点帮助:
library(ggplot2)
ggplot(df1, aes(fill=siteID, y=Count, x=Bird)) +
geom_bar(position="stack", stat="identity") +
theme_bw() +
facet_grid( ~ elevation)
我在绘制计数数据箱线图时遇到问题。我有一个包含 420 个研究地点的数据集,其中包含每个地点的鸟类观察和海拔数据。研究地点成行,不同的鸟类和海拔高度成列。我的目标是在海拔梯度中绘制不同鸟类的箱线图(X = 鸟类,Y = 海拔)。
siteID | BirdA | BirdB | BirdC | elevation |
---|---|---|---|---|
1 | 3 | 2 | 0 | 275 |
2 | 1 | 5 | 1 | 550 |
3 | 0 | 0 | 3 | 850 |
4 | 4 | 3 | 2 | 322 |
我的问题是鸟类数据是计数数据。例如,site1 可能有三对鸟 A、两对鸟 B 和零对鸟 C,这使得箱线图在某种程度上变得困难。 boxplot 命令为具有不同观察量的站点创建不同的框(自己的框用于零个观察、一个观察、两个观察、三个观察等)。
我只想为每种鸟类一个盒子,我希望箱线图注意到 sites/elevations 和 几对 某些鸟类,因为它提供了线索该特定鸟类的最佳海拔高度。我可以将计数数据更改为存在-不存在,但它会改变我的结果。
我发现解决方案是将具有 3 个 BirdA 观测值的一行更改为在特定高度上具有 1 个 BirdA 观测值的 3 行。是否有命令或程序包可以帮助我将数据从计数数据更改为二项式数据?或者有没有更简单的方法来绘制这些值?
我不认为在这个设置框中绘制是合适的,因为评论中
library(ggplot2)
ggplot(df1, aes(fill=siteID, y=Count, x=Bird)) +
geom_bar(position="stack", stat="identity") +
theme_bw() +
facet_grid( ~ elevation)