是什么导致了 R 中栅格计算中的 calc 和 cellStats 之间的差异?

What causes the difference between calc and cellStats in raster calculations in R?

我正在处理一个由 20 个层组成的数据集,这些层堆叠在一个 RasterBrick 中(源自一个数组)。我研究了层的总和,用 'calc' 和 'cellStats' 计算。我使用 calc 计算总值的总和,使用 cellStats 查看每层值的平均值(对时间序列有用)。 但是,当我对每一层的平均值求和时,它是另一个计算总和的值的一半。是什么导致了这种差异?我忽略了什么?

代码如下所示:

testarray <- runif(54214776,0,1) 
# Although testarray should contain a raster of 127x147 with 2904 time layers. 
# Not really sure how to create that yet. 

for (i in 1830:1849){
  slice<-array2[,,i]
  r <- raster(nrow=(127*5), ncol=(147*5), resolution =5, ext=ext1, vals=slice)
  x <- stack(x , r)
}

brickhp2 <- brick(x)

r_sumhp2 <- calc(brickhp2, sum, na.rm=TRUE)
r_sumhp2[r_sumhp2<= 0] <- NA


SWEavgpertimestepM <- cellStats(brickhp2, stat='mean', na.rm=TRUE)

目标是比较用'calc(x, sum)'计算的层数总和与用'cellStats(x, mean)'计算的均值总和。

Rasterbrick 看起来像这样(600kb,GTiff):http://www.filedropper.com/brickhp2 *如果有更好的分享方式,请告诉我。

当您使用 calc 时会产生混淆,它在砖块上按像素操作(即对每个像素的 20 个值和 returns 单个栅格层执行计算)和 cellStats 分别对每个栅格图层执行计算,returns 对每个图层执行单个值。如果使用此代码,您可以看到结果具有可比性:

library(raster)
##set seed so you get the same runif vals
set.seed(999)

##create example rasters
ls=list()
for (i in 1:20){
  r <- raster(nrow=(127*5), ncol=(147*5), vals=runif(127*5*147*5))
  ls[[i]] <- r
}
##create raster brick
brickhp2 <- brick(ls)

##calc sum (pixel-wise)
r_sumhp2 <- calc(brickhp2, sum, na.rm=TRUE)
r_sumhp2 ##returns raster layer

##calc mean (layer-wise)
r_meanhp2 <- cellStats(brickhp2, stat='mean', na.rm=TRUE)
r_meanhp2 ##returns vector of length nlayers(brickhp2)

##to get equivalent values you need to divide r_sumhp2 by the number of layers 
##and then calculate the mean
cellStats(r_sumhp2/nlayers(brickhp2),stat="mean")

[1] 0.4999381

##and for r_meanhp2 you need to calculate the mean of the means
mean(r_meanhp2)

[1] 0.4999381

您需要自己决定是否要为您的应用程序使用像素或图层方式的结果。