主机和设备上 cuSolver 函数的并行化设置
Parallelisation settings for cuSolver functions on host and device
我正在对 cuSolver CUDA 库中的稀疏矩阵使用 QR 和 LU 分解和求解函数。根据文档,LU 函数仅在主机路径上可用,而 QR 函数在设备上也可用。
我想知道是否有任何设置或类似的设置来控制主机和设备功能的并行化设置。两种函数的线程数如何控制?
没有任何并行化设置。
无法直接控制线程数,并且没有public描述函数如何在您要求的级别上工作。
图书馆不透明。与库调用启动的任何内核调用关联的线程数将由库使用的试探法确定,该试探法未被描述。
我正在对 cuSolver CUDA 库中的稀疏矩阵使用 QR 和 LU 分解和求解函数。根据文档,LU 函数仅在主机路径上可用,而 QR 函数在设备上也可用。
我想知道是否有任何设置或类似的设置来控制主机和设备功能的并行化设置。两种函数的线程数如何控制?
没有任何并行化设置。
无法直接控制线程数,并且没有public描述函数如何在您要求的级别上工作。
图书馆不透明。与库调用启动的任何内核调用关联的线程数将由库使用的试探法确定,该试探法未被描述。