向量化一个循环，其中迭代依赖于 R 中的先前迭代

Question

我有以下工作代码：

x <- c(10.7, 13.0, 11.4, 11.5, 12.5, 14.1, 14.8, 14.1, 12.6, 16.0, 11.7, 10.6,
       10.0, 11.4, 7.9, 9.5, 8.0, 11.8, 10.5, 11.2, 9.2, 10.1, 10.4, 10.5)

cusum <- function(x) {
  
  s <- NA
  mn <- mean(x)
  
  for (i in seq_along(x)) {
  if (i == 1)
    s[i] <- 0 + x[i] - mn
  else
    s[i] <- s[i - 1] + x[i] - mn
  }
  
  s
  
}

cusum(x)

我希望对我的代码进行矢量化以提高性能，但我不知道该怎么做，因为：

我不能在 lapply 和

s[i - 1]

s[i]

我无法循环遍历 Reduce 中的两个向量（即 s 和 x）

如何在 base R 中向量化我的函数？我在限制性环境中工作，我只能访问基础 R。

Answer 1

对于这个特定的迭代，您不需要循环：只需在 x - mean(x):

上使用 cumsum

cumsum(x - mean(x))
 [1] -6.958333e-01  9.083333e-01  9.125000e-01  1.016667e+00  2.120833e+00  4.825000e+00  8.229167e+00  1.093333e+01  1.213750e+01
[10]  1.674167e+01  1.704583e+01  1.625000e+01  1.485417e+01  1.485833e+01  1.136250e+01  9.466667e+00  6.070833e+00  6.475000e+00
[19]  5.579167e+00  5.383333e+00  3.187500e+00  1.891667e+00  8.958333e-01 -1.598721e-14

Answer 2

@Cettt 的回答是最直接的，如果需要的话，坚持下去。但是，如果您的意思是您不知道如何向量化任意函数，那么 ...

当你的计算依赖于一个值和之前的值时，那是一回事，可以进行矢量化。但是，看起来您的计算似乎依赖于先前的计算，在这种情况下，这完全是另一回事。您的功能似乎是后者，所以尝试一下：

func <- function(x) {
  mn <- mean(x)
  Reduce(function(a, b) {
    a + b - mn
  }, x, init = 0, accumulate = TRUE)[-1]
}

func(x)
#  [1] -6.96e-01  9.08e-01  9.12e-01  1.02e+00  2.12e+00  4.82e+00  8.23e+00
#  [8]  1.09e+01  1.21e+01  1.67e+01  1.70e+01  1.62e+01  1.49e+01  1.49e+01
# [15]  1.14e+01  9.47e+00  6.07e+00  6.47e+00  5.58e+00  5.38e+00  3.19e+00
# [22]  1.89e+00  8.96e-01 -1.60e-14

演练：

Reduce 首先调用 func(x[1], x[2])，我们调用那个结果 res[1]。然后调用 func(res[1], x[2])（并存储在 res[2] 中）。然后func(res[2], x[3])，等等
由于您有不同的第一条件 (if (i == 1))，因此我们使用 init=0 为初始状态设定种子。我们也可以这样做：
```
func <- function(x) {
  mn <- mean(x)
  Reduce(function(a, b) {
    if (is.null(a)) {
      0 + b - mn
    } else {
      a + b - mn
    }
  }, x, init = NULL, accumulate = TRUE)[-1]
}
```
允许更复杂的初始条件。

由于我们定义了 init=，在这种情况下我们还需要删除第一个返回值，因此 [-1].

Reduce默认只返回最后一次计算的值（这里是-1.60e-14），所以我们加上accumulate=TRUE来捕获所有的计算值。

向量化一个循环，其中迭代依赖于 R 中的先前迭代

Vectorize a loop where iterations are dependent on previous ones in R

reduce

for-loop

r

vectorization

lapply