但是 nvdia-smi 与 nvcc --version 都可以看到 cuda 版本。
这个问题可能是由于缺少 CUDA 环境变量设置导致的。您可以尝试以下方法来解决此问题:
-
确定您的 CUDA 安装路径,并将其添加到 PATH 环境变量中。例如,如果 CUDA 安装在 /usr/local/cuda 目录下,则可以执行以下命令:
export PATH=/usr/local/cuda/bin:$PATH
这将在当前会话中添加 CUDA 环境变量,如果希望每次打开终端时都自动添加,可以将它添加到您的 ~/.bashrc 或 ~/.bash_profile 文件中。
-
确定您的 CUDA 库路径,并将其添加到 LD_LIBRARY_PATH 环境变量中。例如,如果 CUDA 库位于 /usr/local/cuda/lib64 目录下,则可以执行以下命令:
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
这将在当前会话中添加 CUDA 库路径,如果希望每次打开终端时都自动添加,可以将它添加到您的 ~/.bashrc 或 ~/.bash_profile 文件中。
-
确认您的 NVIDIA 显卡驱动已正确安装。您可以使用 nvidia-smi 工具来检查显卡的状态和驱动版本。如果驱动未正确安装,请按照 NVIDIA 官方文档中的说明进行安装。
-
如果您已经执行了上述步骤并且仍然遇到问题,请确保安装了与 TensorFlow 版本相对应的 CUDA 和 cuDNN 版本。您可以在 TensorFlow 官方文档中找到这些信息。
-
如果还是无法解决问题,请尝试重新安装 TensorFlow,并确保您已经正确设置了所有必要的环境变量。
希望这些方法可以帮助您解决问题。