每个节点或每个工作人员是否存在广播变量?

Do broadcasted variables exist per node or per worker?

上下文:

问题:

提前致谢。

数据将存在于每个 dask worker 进程中。您将在每个节点上拥有十个副本。

任务工作者完全独立运作。他们不知道可能在同一节点上的其他工作人员。

相反,您可以考虑在具有十个线程的每个节点上创建一个单一的 dask worker。这通常是正确的选择,尤其是在处理大量数字数据时。