如何分叉多个 children 以同时计算动态过程的多个时间步长
How to fork several children to simultaneously compute several timesteps of a dynamical process
我认为答案是"it can't be done",但我不想在没有穷尽所有可能性的情况下对项目进行编程。这里有更多详细信息...
我已经成功地编写了一个模拟程序,其输出是一个动画 gif,其中的帧在一个时间步之后显示模拟系统的配置时间步长。但在这个成功的案例中,时间步长可以独立计算,即有一个 closed-form 解决方案,因此我不需要时间步长 t 的结果来计算 t+dt, 等等 所以我 fork 了几个,比如说 n, child processes for t,t+dt,t+2dt,...,t+(n-1)dt,等他们全部完成,然后然后 assemble time-order 中的 gif 帧。工作正常。
但在这种新情况下,动力系统更加复杂,如果不首先对时间步 t[= 进行数值计算,则无法计算时间步 t+dt 27=]。也就是说,没有 closed-form 解决方案。所以在我看来问题是 non-parallelizable,并且没有有效的方法来利用多核。 (我可以将 child 分叉到 assemble 时间步 t 的 gif 帧,而 t+dt 正在计算,但是那是微不足道的。)我希望是错的吗?在这种情况下,有什么有用的方法可以利用多核吗?
我之前模拟过时间相关的物理过程,我知道尽可能加快这个过程是可取的。虽然每个时间步的相互依赖性使得并行化变得困难,但如果不是不可能的话,您仍然可以尝试在每个时间步内并行一些计算。
每个时间步长的算法是否有循环可以并行化?
如果没有循环,每个时间步内的计算是否可以分成几个部分独立进行?然后你可以让不同的核心同时做这些事情。
如果你有不同的参数/设置来尝试(通常用于发表学术论文,需要一些参数扫描来生成绘图),你可以并行化这些参数吗?时间依赖性将以这种方式消失。
您是否有数组/矩阵运算,您可以使用 CPU 的某些 SIMD 功能来加速(这是对使用多核的补充),如果还没有的话由专门这样做的图书馆处理?
我认为答案是"it can't be done",但我不想在没有穷尽所有可能性的情况下对项目进行编程。这里有更多详细信息...
我已经成功地编写了一个模拟程序,其输出是一个动画 gif,其中的帧在一个时间步之后显示模拟系统的配置时间步长。但在这个成功的案例中,时间步长可以独立计算,即有一个 closed-form 解决方案,因此我不需要时间步长 t 的结果来计算 t+dt, 等等 所以我 fork 了几个,比如说 n, child processes for t,t+dt,t+2dt,...,t+(n-1)dt,等他们全部完成,然后然后 assemble time-order 中的 gif 帧。工作正常。
但在这种新情况下,动力系统更加复杂,如果不首先对时间步 t[= 进行数值计算,则无法计算时间步 t+dt 27=]。也就是说,没有 closed-form 解决方案。所以在我看来问题是 non-parallelizable,并且没有有效的方法来利用多核。 (我可以将 child 分叉到 assemble 时间步 t 的 gif 帧,而 t+dt 正在计算,但是那是微不足道的。)我希望是错的吗?在这种情况下,有什么有用的方法可以利用多核吗?
我之前模拟过时间相关的物理过程,我知道尽可能加快这个过程是可取的。虽然每个时间步的相互依赖性使得并行化变得困难,但如果不是不可能的话,您仍然可以尝试在每个时间步内并行一些计算。
每个时间步长的算法是否有循环可以并行化?
如果没有循环,每个时间步内的计算是否可以分成几个部分独立进行?然后你可以让不同的核心同时做这些事情。
如果你有不同的参数/设置来尝试(通常用于发表学术论文,需要一些参数扫描来生成绘图),你可以并行化这些参数吗?时间依赖性将以这种方式消失。
您是否有数组/矩阵运算,您可以使用 CPU 的某些 SIMD 功能来加速(这是对使用多核的补充),如果还没有的话由专门这样做的图书馆处理?