CUDA 中的线性代数库和动态并行性

Linear algebra libraries and dynamic parallelism in CUDA

随着 3.5 及更高版本 CUDA 架构中动态并行的出现,是否可以从 __device__ 函数中调用线性代数库?

能否从内核 (__global__) 函数调用 CUDA 7 中的 CUSOLVER 库?

CUBLAS 库函数可以called from device code.

推力算法可以called from device code.

各种CURAND函数可以called from device code.

目前属于 CUDA 工具包的其他库(即 CUDA 7)——CUFFT、CUSPARSE、CUSOLVER——只能从主机代码中使用。