是什么导致了 R 中栅格计算中的 calc 和 cellStats 之间的差异?
What causes the difference between calc and cellStats in raster calculations in R?
我正在处理一个由 20 个层组成的数据集,这些层堆叠在一个 RasterBrick 中(源自一个数组)。我研究了层的总和,用 'calc' 和 'cellStats' 计算。我使用 calc 计算总值的总和,使用 cellStats 查看每层值的平均值(对时间序列有用)。
但是,当我对每一层的平均值求和时,它是另一个计算总和的值的一半。是什么导致了这种差异?我忽略了什么?
代码如下所示:
testarray <- runif(54214776,0,1)
# Although testarray should contain a raster of 127x147 with 2904 time layers.
# Not really sure how to create that yet.
for (i in 1830:1849){
slice<-array2[,,i]
r <- raster(nrow=(127*5), ncol=(147*5), resolution =5, ext=ext1, vals=slice)
x <- stack(x , r)
}
brickhp2 <- brick(x)
r_sumhp2 <- calc(brickhp2, sum, na.rm=TRUE)
r_sumhp2[r_sumhp2<= 0] <- NA
SWEavgpertimestepM <- cellStats(brickhp2, stat='mean', na.rm=TRUE)
目标是比较用'calc(x, sum)'计算的层数总和与用'cellStats(x, mean)'计算的均值总和。
Rasterbrick 看起来像这样(600kb,GTiff):http://www.filedropper.com/brickhp2
*如果有更好的分享方式,请告诉我。
当您使用 calc
时会产生混淆,它在砖块上按像素操作(即对每个像素的 20 个值和 returns 单个栅格层执行计算)和 cellStats
分别对每个栅格图层执行计算,returns 对每个图层执行单个值。如果使用此代码,您可以看到结果具有可比性:
library(raster)
##set seed so you get the same runif vals
set.seed(999)
##create example rasters
ls=list()
for (i in 1:20){
r <- raster(nrow=(127*5), ncol=(147*5), vals=runif(127*5*147*5))
ls[[i]] <- r
}
##create raster brick
brickhp2 <- brick(ls)
##calc sum (pixel-wise)
r_sumhp2 <- calc(brickhp2, sum, na.rm=TRUE)
r_sumhp2 ##returns raster layer
##calc mean (layer-wise)
r_meanhp2 <- cellStats(brickhp2, stat='mean', na.rm=TRUE)
r_meanhp2 ##returns vector of length nlayers(brickhp2)
##to get equivalent values you need to divide r_sumhp2 by the number of layers
##and then calculate the mean
cellStats(r_sumhp2/nlayers(brickhp2),stat="mean")
[1] 0.4999381
##and for r_meanhp2 you need to calculate the mean of the means
mean(r_meanhp2)
[1] 0.4999381
您需要自己决定是否要为您的应用程序使用像素或图层方式的结果。
我正在处理一个由 20 个层组成的数据集,这些层堆叠在一个 RasterBrick 中(源自一个数组)。我研究了层的总和,用 'calc' 和 'cellStats' 计算。我使用 calc 计算总值的总和,使用 cellStats 查看每层值的平均值(对时间序列有用)。 但是,当我对每一层的平均值求和时,它是另一个计算总和的值的一半。是什么导致了这种差异?我忽略了什么?
代码如下所示:
testarray <- runif(54214776,0,1)
# Although testarray should contain a raster of 127x147 with 2904 time layers.
# Not really sure how to create that yet.
for (i in 1830:1849){
slice<-array2[,,i]
r <- raster(nrow=(127*5), ncol=(147*5), resolution =5, ext=ext1, vals=slice)
x <- stack(x , r)
}
brickhp2 <- brick(x)
r_sumhp2 <- calc(brickhp2, sum, na.rm=TRUE)
r_sumhp2[r_sumhp2<= 0] <- NA
SWEavgpertimestepM <- cellStats(brickhp2, stat='mean', na.rm=TRUE)
目标是比较用'calc(x, sum)'计算的层数总和与用'cellStats(x, mean)'计算的均值总和。
Rasterbrick 看起来像这样(600kb,GTiff):http://www.filedropper.com/brickhp2 *如果有更好的分享方式,请告诉我。
当您使用 calc
时会产生混淆,它在砖块上按像素操作(即对每个像素的 20 个值和 returns 单个栅格层执行计算)和 cellStats
分别对每个栅格图层执行计算,returns 对每个图层执行单个值。如果使用此代码,您可以看到结果具有可比性:
library(raster)
##set seed so you get the same runif vals
set.seed(999)
##create example rasters
ls=list()
for (i in 1:20){
r <- raster(nrow=(127*5), ncol=(147*5), vals=runif(127*5*147*5))
ls[[i]] <- r
}
##create raster brick
brickhp2 <- brick(ls)
##calc sum (pixel-wise)
r_sumhp2 <- calc(brickhp2, sum, na.rm=TRUE)
r_sumhp2 ##returns raster layer
##calc mean (layer-wise)
r_meanhp2 <- cellStats(brickhp2, stat='mean', na.rm=TRUE)
r_meanhp2 ##returns vector of length nlayers(brickhp2)
##to get equivalent values you need to divide r_sumhp2 by the number of layers
##and then calculate the mean
cellStats(r_sumhp2/nlayers(brickhp2),stat="mean")
[1] 0.4999381
##and for r_meanhp2 you need to calculate the mean of the means
mean(r_meanhp2)
[1] 0.4999381
您需要自己决定是否要为您的应用程序使用像素或图层方式的结果。