NVIDIA nvprof / nvvp工具安装和使用介绍 |
您所在的位置:网站首页 › 英伟达inspector怎么用 › NVIDIA nvprof / nvvp工具安装和使用介绍 |
前言
NVIDIA nvprof / nvvp工具是英伟达N卡GPU编程中用于观察的利器。全称是NVIDIA Visual Profiler,是由2008年起开始支持的性能分析器。交互性好,利于使用。其中记录运行日志时使用命令nvprof,可视化显示日志时使用命令nvvp。 该工具的官方介绍如下: 不过在最近几年,英伟达官方推出了新的性能分析工具NSight,官方更加建议使用新的工具,给出的原因是NSight运行时消耗的资源更少,统计的数据更加贴近实际运行情况的数据。相比之下使用nvprof/nvvp方式运行时消耗资源较多,数据统计容易不准确。 除此以外,英伟达还给出了其他的工具,如果希望深入GPU编程,那么这些工具都是傍身利器。 在带有N卡的Linux和Windows机器环境下,在安装好CUDA Toolkit后则自带了nvprof / nvvp等工具。且一般会有相应的应用图标(NVIDIA Visual Profiler 和 NSight),可以直接点击图标打开。 也可以通过命令行方式打开。
最开始打开日志时显示如下,可以初步看到整个程序运行时的耗时情况: nvprof和nvvp还有更多的特性,例如多进程跟踪支持,核函数调用和运行情况统计等。详细使用可以参考官方文档。 MacOSMac自从不再支持英伟达显卡后,只能使用nvvp工具查看profile文件。 要使Mac能查看nvvp日志,需要安装JDK环境和nvvp工具包。安装过程参考官网:https://developer.nvidia.com/nvidia-cuda-toolkit-developer-tools-mac-hosts 适用于macOS 系统版本11以下下载nvidia-visual-profiler-mac-11.1-28936279.dmg(官网或者CSDN资源) 下载zulu8.23.0.3-jdk8.0.144-macosx_x64.zip(官网或者CSDN资源) 解压放至某文件夹(如/users/name/test/) 注: ①JDK可以不用安装,解压放在nvvp文件夹下即可。 ②JDK如果不是上述版本,可能会出现无法使用的问题(弹出workspace选择界面后卡死)。 使用 初次使用可能会被Mac系统拦截,这是由于安全性设置导致的。可以在下面的页面允许jdk相关程序运行(会调用jdk的bin目录下8个左右程序),也可以关闭该安全性设置(参考资料[6])。 需要注意-vm后的路径需为绝对路径。如不指定则自动寻找环境变量中的java。 Mac下打开nvvp文件显示如下,使用方式参考上述“打开nvvp日志文件”部分: 下载nvidia-visual-profiler-mac-11.1-28936279.dmg(官网或者CSDN资源) 下载zulu8.23.0.3-jdk8.0.144-macosx_x64.dmg(官网或者CSDN资源) 点击zulu8.23.0.3-jdk8.0.144-macosx_x64.dmg安装jdk 建立libjvm.dylib的软链接 sudo ln -s /Library/Java/JavaVirtualMachines/zulu-8.jdk/Contents/Home/jre/lib/server/libjvm.dylib /Library/Java/JavaVirtualMachines/zulu-8.jdk/Contents/Home/lib/libserver.dylib 使用 cd nvvp ./bin/nvvp需要注意在MacOS11及以上的版本无需再指定-vm参数。 初次使用可能会遇到'lib.dylib' cannot be allowed to run because its origin cannot be verified的报错,说明jdk运行时被Mac系统拦截,这是由于安全性设置导致的。打开系统安全性设置点击允许(‘System Preferences’ → ‘Security & Privacy’ → ‘General’)。 [1] Nvidia Developer - Performance Analysis Tools [2] NVIDIA Visual Profiler [3] [腾讯机智] tensorflow profiling工具简介——nvprof和nvvp [4] CUDA Toolkit v11.1.1 Doc - Profiler - Visual Profiler [5] NVIDIA CUDA Toolkit - Developer Tools for macOS [6] macOS Catalina(10.15)解决阻止程序运行“macOS无法验证此App不包含恶意软件” [7] How to use NVIDIA profiler [8] Understanding the Visualization of Overhead and Latency in NVIDIA Nsight Systems [9] NVIDIA Nsight Systems [10] Does calling a CUDA kernel multiple times affect execution speed? |
今日新闻 |
推荐新闻 |
CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3 |