Cuda Occupancy Calculator 的更新版本或替代版本是什么?

What's the newer version or the alternative to Cuda Occupancy Calculator?

我正在使用计算能力为 6.0 的 Tesla P100。 我想找到一个工具,自动为我的内核代码提供最佳网格和块大小。

我最近发现了 CUDA 占用计算器(.xls 电子表格)。 但是当我下载它时,我意识到它有点过时了,因为 Capability 直到 2.1.

我也在问自己: CUDA 分析器(nvprofNsight)可以对占用率进行一些估计并给出一些最佳 block/grid 大小吗?

我对这些工具有点不熟练,所以如果我问一些琐碎的问题,我很抱歉。

CUDA 占用计算器电子表格的更新版本随 CUDA 工具包一起提供,因此当您安装 CUDA 工具包时,excel 电子表格也会安装在您的计算机上。也许最简单的方法就是使用 OS 的文件查找实用程序来找到它。

CUDA occupancy API 允许您在运行时进行相同的计算。

NVIDIA 分析器提供了一些检查已实现占用的功能。例如,nvvp can display achieved occupancy, and there is a metric for achieved occupancy which you can gather with nvprof. You may wish to simply search the profiler docs 表示单词 "occupancy"。这些工具不会估计最佳块和网格大小,但它们可能会指示占用率是否会限制您的应用程序的性能。这些工具还可以报告每个内核启动的实际块和网格大小。

有一个非常完整的工具可以帮助您找到最佳配置 检查我的配置和图表 您希望红点位于每个图形的峰值

你可以看看https://xmartlabs.github.io/cuda-calculator/