Cuda Occupancy Calculator 的更新版本或替代版本是什么?
What's the newer version or the alternative to Cuda Occupancy Calculator?
我正在使用计算能力为 6.0 的 Tesla P100。
我想找到一个工具,自动为我的内核代码提供最佳网格和块大小。
我最近发现了 CUDA 占用计算器(.xls 电子表格)。
但是当我下载它时,我意识到它有点过时了,因为 Capability 直到 2.1.
我试图搜索该电子表格的更新版本,它允许计算更高的 C.C,但没有任何结果。
所以我试图寻找一个替代方案,我发现从 CUDA 6.5 开始,引入了 Occupancy APIs。
这是电子表格的更新替代品吗?
此外我发现tool
来自 GitHub。
它是一个好工具吗?我可以考虑将其作为替代方案吗?还是使用上述 Occupancy API 更好?
我也在问自己:
CUDA 分析器(nvprof 或 Nsight)可以对占用率进行一些估计并给出一些最佳 block/grid 大小吗?
我对这些工具有点不熟练,所以如果我问一些琐碎的问题,我很抱歉。
CUDA 占用计算器电子表格的更新版本随 CUDA 工具包一起提供,因此当您安装 CUDA 工具包时,excel 电子表格也会安装在您的计算机上。也许最简单的方法就是使用 OS 的文件查找实用程序来找到它。
CUDA occupancy API 允许您在运行时进行相同的计算。
NVIDIA 分析器提供了一些检查已实现占用的功能。例如,nvvp can display achieved occupancy, and there is a metric for achieved occupancy which you can gather with nvprof. You may wish to simply search the profiler docs 表示单词 "occupancy"。这些工具不会估计最佳块和网格大小,但它们可能会指示占用率是否会限制您的应用程序的性能。这些工具还可以报告每个内核启动的实际块和网格大小。
有一个非常完整的工具可以帮助您找到最佳配置
检查我的配置和图表
您希望红点位于每个图形的峰值
我正在使用计算能力为 6.0 的 Tesla P100。 我想找到一个工具,自动为我的内核代码提供最佳网格和块大小。
我最近发现了 CUDA 占用计算器(.xls 电子表格)。 但是当我下载它时,我意识到它有点过时了,因为 Capability 直到 2.1.
我试图搜索该电子表格的更新版本,它允许计算更高的 C.C,但没有任何结果。
所以我试图寻找一个替代方案,我发现从 CUDA 6.5 开始,引入了 Occupancy APIs。 这是电子表格的更新替代品吗?
此外我发现tool 来自 GitHub。 它是一个好工具吗?我可以考虑将其作为替代方案吗?还是使用上述 Occupancy API 更好?
我也在问自己: CUDA 分析器(nvprof 或 Nsight)可以对占用率进行一些估计并给出一些最佳 block/grid 大小吗?
我对这些工具有点不熟练,所以如果我问一些琐碎的问题,我很抱歉。
CUDA 占用计算器电子表格的更新版本随 CUDA 工具包一起提供,因此当您安装 CUDA 工具包时,excel 电子表格也会安装在您的计算机上。也许最简单的方法就是使用 OS 的文件查找实用程序来找到它。
CUDA occupancy API 允许您在运行时进行相同的计算。
NVIDIA 分析器提供了一些检查已实现占用的功能。例如,nvvp can display achieved occupancy, and there is a metric for achieved occupancy which you can gather with nvprof. You may wish to simply search the profiler docs 表示单词 "occupancy"。这些工具不会估计最佳块和网格大小,但它们可能会指示占用率是否会限制您的应用程序的性能。这些工具还可以报告每个内核启动的实际块和网格大小。
有一个非常完整的工具可以帮助您找到最佳配置 检查我的配置和图表 您希望红点位于每个图形的峰值