首页 > 解决方案 > nv-nsight-cu-cli 导致 TensorFlow 失败

问题描述

我已经下载了最新的 Nsight Compute 分析工具,我想用它来对 Tensorflow 应用程序进行基准测试。我使用的代码在这里。当我执行它时它运行得非常好,当我用nvprof ./mnist.py它进行基准测试时完全没有问题。但是,当我尝试使用命令运行它时,sudo ./nv-nsight-cu-cli [path to the file]出现以下错误:

ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory

我怀疑nv-nsight-cu-cli不知何故根本没有识别环境变量。周围有什么解决办法吗?

标签: tensorflowgpunvidianvprofnsight-compute

解决方案


您需要搜索两种环境中的差异:

  • 环境变量
  • LD_LIBRARY_PATH
  • /etc/ld.so.conf
  • /etc/ld.so.conf.d/*
  • cuBLAS
    • 安装是否完成/没有损坏?
    • 它是否安装在两台机器上的同一位置?
    • 版本
  • ...

您可以从locate libcublas.so两台机器上开始,看看是否有区别。或者,您可以strace -f -e open让程序检查它尝试libcublas.so从哪里开始。

您的错误(目前)与 GPU 无关:libcublas.so.9.0只是找不到。找到它,找到Tensorflow为什么找不到它,你的问题就解决了。


推荐阅读