向量化一个循环,其中迭代依赖于 R 中的先前迭代
Vectorize a loop where iterations are dependent on previous ones in R
我有以下工作代码:
x <- c(10.7, 13.0, 11.4, 11.5, 12.5, 14.1, 14.8, 14.1, 12.6, 16.0, 11.7, 10.6,
10.0, 11.4, 7.9, 9.5, 8.0, 11.8, 10.5, 11.2, 9.2, 10.1, 10.4, 10.5)
cusum <- function(x) {
s <- NA
mn <- mean(x)
for (i in seq_along(x)) {
if (i == 1)
s[i] <- 0 + x[i] - mn
else
s[i] <- s[i - 1] + x[i] - mn
}
s
}
cusum(x)
我希望对我的代码进行矢量化以提高性能,但我不知道该怎么做,因为:
- 我不能在
lapply
和 中使用“迭代依赖”(即 s[i - 1]
来计算 s[i]
)
- 我无法循环遍历
Reduce
中的两个向量(即 s
和 x
)
如何在 base R 中向量化我的函数?我在限制性环境中工作,我只能访问基础 R。
对于这个特定的迭代,您不需要循环:只需在 x - mean(x)
:
上使用 cumsum
cumsum(x - mean(x))
[1] -6.958333e-01 9.083333e-01 9.125000e-01 1.016667e+00 2.120833e+00 4.825000e+00 8.229167e+00 1.093333e+01 1.213750e+01
[10] 1.674167e+01 1.704583e+01 1.625000e+01 1.485417e+01 1.485833e+01 1.136250e+01 9.466667e+00 6.070833e+00 6.475000e+00
[19] 5.579167e+00 5.383333e+00 3.187500e+00 1.891667e+00 8.958333e-01 -1.598721e-14
@Cettt 的回答是最直接的,如果需要的话,坚持下去。但是,如果您的意思是您不知道如何向量化任意函数,那么 ...
当你的计算依赖于一个值和之前的值时,那是一回事,可以进行矢量化。但是,看起来您的计算似乎依赖于先前的计算,在这种情况下,这完全是另一回事。您的功能似乎是后者,所以尝试一下:
func <- function(x) {
mn <- mean(x)
Reduce(function(a, b) {
a + b - mn
}, x, init = 0, accumulate = TRUE)[-1]
}
func(x)
# [1] -6.96e-01 9.08e-01 9.12e-01 1.02e+00 2.12e+00 4.82e+00 8.23e+00
# [8] 1.09e+01 1.21e+01 1.67e+01 1.70e+01 1.62e+01 1.49e+01 1.49e+01
# [15] 1.14e+01 9.47e+00 6.07e+00 6.47e+00 5.58e+00 5.38e+00 3.19e+00
# [22] 1.89e+00 8.96e-01 -1.60e-14
演练:
Reduce
首先调用 func(x[1], x[2])
,我们调用那个结果 res[1]
。然后调用 func(res[1], x[2])
(并存储在 res[2]
中)。然后func(res[2], x[3])
,等等
由于您有不同的第一条件 (if (i == 1)
),因此我们使用 init=0
为初始状态设定种子。我们也可以这样做:
func <- function(x) {
mn <- mean(x)
Reduce(function(a, b) {
if (is.null(a)) {
0 + b - mn
} else {
a + b - mn
}
}, x, init = NULL, accumulate = TRUE)[-1]
}
允许更复杂的初始条件。
由于我们定义了 init=
,在这种情况下我们还需要删除第一个返回值,因此 [-1]
.
Reduce
默认只返回最后一次计算的值(这里是-1.60e-14
),所以我们加上accumulate=TRUE
来捕获所有的计算值。
我有以下工作代码:
x <- c(10.7, 13.0, 11.4, 11.5, 12.5, 14.1, 14.8, 14.1, 12.6, 16.0, 11.7, 10.6,
10.0, 11.4, 7.9, 9.5, 8.0, 11.8, 10.5, 11.2, 9.2, 10.1, 10.4, 10.5)
cusum <- function(x) {
s <- NA
mn <- mean(x)
for (i in seq_along(x)) {
if (i == 1)
s[i] <- 0 + x[i] - mn
else
s[i] <- s[i - 1] + x[i] - mn
}
s
}
cusum(x)
我希望对我的代码进行矢量化以提高性能,但我不知道该怎么做,因为:
- 我不能在
lapply
和 中使用“迭代依赖”(即 - 我无法循环遍历
Reduce
中的两个向量(即s
和x
)
s[i - 1]
来计算 s[i]
)
如何在 base R 中向量化我的函数?我在限制性环境中工作,我只能访问基础 R。
对于这个特定的迭代,您不需要循环:只需在 x - mean(x)
:
cumsum
cumsum(x - mean(x))
[1] -6.958333e-01 9.083333e-01 9.125000e-01 1.016667e+00 2.120833e+00 4.825000e+00 8.229167e+00 1.093333e+01 1.213750e+01
[10] 1.674167e+01 1.704583e+01 1.625000e+01 1.485417e+01 1.485833e+01 1.136250e+01 9.466667e+00 6.070833e+00 6.475000e+00
[19] 5.579167e+00 5.383333e+00 3.187500e+00 1.891667e+00 8.958333e-01 -1.598721e-14
@Cettt 的回答是最直接的,如果需要的话,坚持下去。但是,如果您的意思是您不知道如何向量化任意函数,那么 ...
当你的计算依赖于一个值和之前的值时,那是一回事,可以进行矢量化。但是,看起来您的计算似乎依赖于先前的计算,在这种情况下,这完全是另一回事。您的功能似乎是后者,所以尝试一下:
func <- function(x) {
mn <- mean(x)
Reduce(function(a, b) {
a + b - mn
}, x, init = 0, accumulate = TRUE)[-1]
}
func(x)
# [1] -6.96e-01 9.08e-01 9.12e-01 1.02e+00 2.12e+00 4.82e+00 8.23e+00
# [8] 1.09e+01 1.21e+01 1.67e+01 1.70e+01 1.62e+01 1.49e+01 1.49e+01
# [15] 1.14e+01 9.47e+00 6.07e+00 6.47e+00 5.58e+00 5.38e+00 3.19e+00
# [22] 1.89e+00 8.96e-01 -1.60e-14
演练:
Reduce
首先调用func(x[1], x[2])
,我们调用那个结果res[1]
。然后调用func(res[1], x[2])
(并存储在res[2]
中)。然后func(res[2], x[3])
,等等由于您有不同的第一条件 (
if (i == 1)
),因此我们使用init=0
为初始状态设定种子。我们也可以这样做:func <- function(x) { mn <- mean(x) Reduce(function(a, b) { if (is.null(a)) { 0 + b - mn } else { a + b - mn } }, x, init = NULL, accumulate = TRUE)[-1] }
允许更复杂的初始条件。
由于我们定义了
init=
,在这种情况下我们还需要删除第一个返回值,因此[-1]
.
Reduce
默认只返回最后一次计算的值(这里是-1.60e-14
),所以我们加上accumulate=TRUE
来捕获所有的计算值。