R 中的 %dopar% 无法正常工作
%dopar% in R does not work properly
我刚开始在 R 中使用 foreach 和 %dopar% 方法进行并行处理,但我得到的结果令人困惑,而且与 for 循环不同;这是我用来测试我得到的那些方法和结果的代码:
library(plyr); library(doParallel); library(foreach)
cs <- makeCluster(2)
registerDoParallel(cs)
sfor_start <- Sys.time()
s_for=as.numeric()
for (i in 1:1000) {
s_for[i] = sqrt(i)
}
print(Sys.time() - sfor_start)
sdopar_start <- Sys.time()
sdopar=as.numeric()
foreach(k=1:1000) %dopar% {
sdopar[k] = sqrt(k)
}
print(Sys.time() - sdopar_start)
结果如下:
> s_for[1:10]; sdopar[1:10]
[1] 1.000000 1.414214 1.732051 2.000000 2.236068 2.449490 2.645751 2.828427 3.000000 3.162278
[1] NA NA NA NA NA NA NA NA NA NA
提前致谢:)
请先阅读函数的文档,然后再说它们不起作用。
foreach
比 for
循环更像 lapply
。
因此,例如,foreach(k=1:1000) %dopar% sqrt(k)
给出与 lapply(1:1000, sqrt)
相同的结果。
然而,使用 foreach
SEQUENTIALLY 时确实可以修改全局变量。然而,当使用并行性时,向量 sdopar
被复制到每个 "cluster" 以便您修改副本,而不是初始对象。
因此,您必须按照@ChiPak 提到的选项 .combine = c
或之后使用 do.call(sdopar, c)
进行操作。
PS:始终初始化您迭代填充的向量(为了不增长向量的效率),例如这样:s_for <- double(1000)
.
我刚开始在 R 中使用 foreach 和 %dopar% 方法进行并行处理,但我得到的结果令人困惑,而且与 for 循环不同;这是我用来测试我得到的那些方法和结果的代码:
library(plyr); library(doParallel); library(foreach)
cs <- makeCluster(2)
registerDoParallel(cs)
sfor_start <- Sys.time()
s_for=as.numeric()
for (i in 1:1000) {
s_for[i] = sqrt(i)
}
print(Sys.time() - sfor_start)
sdopar_start <- Sys.time()
sdopar=as.numeric()
foreach(k=1:1000) %dopar% {
sdopar[k] = sqrt(k)
}
print(Sys.time() - sdopar_start)
结果如下:
> s_for[1:10]; sdopar[1:10]
[1] 1.000000 1.414214 1.732051 2.000000 2.236068 2.449490 2.645751 2.828427 3.000000 3.162278
[1] NA NA NA NA NA NA NA NA NA NA
提前致谢:)
请先阅读函数的文档,然后再说它们不起作用。
foreach
比 for
循环更像 lapply
。
因此,例如,foreach(k=1:1000) %dopar% sqrt(k)
给出与 lapply(1:1000, sqrt)
相同的结果。
然而,使用 foreach
SEQUENTIALLY 时确实可以修改全局变量。然而,当使用并行性时,向量 sdopar
被复制到每个 "cluster" 以便您修改副本,而不是初始对象。
因此,您必须按照@ChiPak 提到的选项 .combine = c
或之后使用 do.call(sdopar, c)
进行操作。
PS:始终初始化您迭代填充的向量(为了不增长向量的效率),例如这样:s_for <- double(1000)
.