f 运维.售后-Ubuntu20.04CUDA及cuDNN安装教程 - Powered by qidao123.com技术社区

Ubuntu20.04CUDA及cuDNN安装教程

打印 上一主题 下一主题

主题 1804|帖子 1804|积分 5412

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
以下是针对 Ubuntu 20.04 安装 CUDAcuDNN 的具体教程,包含版本选择、步调表明、验证方法及常见问题办理方案:

一、安装前的准备

1. 硬件与体系要求



  • GPU 支持:确保你的 NVIDIA GPU 支持 CUDA(如 RTX 20/30/40 系列、Titan 系列等)。
  • 体系版本:Ubuntu 20.04 LTS(64-bit)。
  • 最小内存:建议至少 8GB RAM。
2. 检查当前驱动

  1. lspci | grep -i nvidia  # 查看是否有 NVIDIA GPU
  2. nvidia-smi             # 若已安装驱动,会显示 GPU 状态
复制代码
3. 确定 CUDA 和 cuDNN 版本



  • CUDA 版本:根据你的 GPU 型号和深度学习框架需求选择。比方:

    • RTX 30 系列可选 CUDA 11.8(支持最新驱动)。
    • 若需 TensorFlow 2.x 或 PyTorch 2.x,CUDA 11.8 和 cuDNN 8.9 是常见组合。

  • cuDNN 版本:需与 CUDA 版本严格匹配(如 CUDA 11.8 对应 cuDNN 8.9)。
  • 驱动版本:CUDA 11.8 需 NVIDIA 驱动 525.60.13 或更高。

二、安装 NVIDIA 驱动

1. 卸载旧驱动(如有)

  1. # 卸载旧的 NVIDIA 相关包
  2. sudo apt-get purge nvidia* -y
  3. sudo apt autoremove --purge -y
  4. sudo apt-get remove --auto-remove nvidia*
  5. # 删除旧的配置文件
  6. sudo rm -rf /etc/X11/xorg.conf*
复制代码
2. 安装最新驱动(保举方法)

  1. # 添加官方驱动仓库
  2. sudo add-apt-repository ppa:graphics-drivers/ppa
  3. sudo apt update
  4. # 安装推荐驱动(自动选择最佳版本)
  5. sudo ubuntu-drivers autoinstall
  6. # 或手动安装指定驱动版本(如 525)
  7. sudo apt install nvidia-driver-525 -y
复制代码
3. 重启体系

  1. sudo reboot
复制代码
4. 验证驱动安装

  1. nvidia-smi          # 应显示驱动版本和 GPU 信息
  2. nvidia-settings     # 图形界面工具,可查看详细信息
复制代码

三、安装 CUDA Toolkit

1. 添加 CUDA 堆栈

  1. # 下载并配置仓库优先级(确保 CUDA 优先于其他版本)
  2. wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2004/x86_64/cuda-ubuntu2004.pin
  3. sudo mv cuda-ubuntu2004.pin /etc/apt/preferences.d/cuda-repository-pin-600
  4. # 下载公钥
  5. wget https://developer.download.nvidia.com/compute/cuda/keys/deb/repos/ubuntu2004/x86_64/7fa2af80.pub
  6. sudo apt-key add 7fa2af80.pub
  7. # 添加 CUDA 仓库源(以 CUDA 11.8 为例)
  8. sudo apt-add-repository "deb https://developer.download.nvidia.com/compute/cuda/11.8.0/local_debianrepos/cuda-ubuntu2004-pool/ /"
复制代码
2. 更新并安装 CUDA

  1. sudo apt-get update
  2. sudo apt-get install cuda -y
复制代码
3. 配置情况变量

  1. # 编辑 ~/.bashrc 或 ~/.zshrc(取决于你的 shell)
  2. nano ~/.bashrc
  3. # 在文件末尾添加以下内容:
  4. export PATH=/usr/local/cuda-11.8/bin:$PATH
  5. export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64:$LD_LIBRARY_PATH
  6. export CUDA_HOME=/usr/local/cuda-11.8
  7. # 使配置生效
  8. source ~/.bashrc
复制代码
4. 验证 CUDA 安装

  1. # 查看 CUDA 版本
  2. nvcc --version
  3. # 运行示例程序(需编译)
  4. cd /usr/local/cuda-11.8/samples/1_Utilities/deviceQuery
  5. sudo make
  6. ./deviceQuery
  7. # 输出应显示 "Result = PASS"
复制代码

四、安装 cuDNN

1. 下载 cuDNN



  • 访问 NVIDIA cuDNN 下载页面。
  • 登录 NVIDIA 账户(没有则需注册)。
  • 选择版本:根据 CUDA 版本选择对应的 cuDNN:

    • CUDA 11.8 对应 cuDNN 8.9.5(下载 cudnn-linux-x64-v8.9.5.25.tgz)。

  • 下载完成后解压:
  1. tar -xzvf cudnn-linux-x64-v8.9.5.25.tgz
复制代码
2. 安装 cuDNN

  1. # 复制文件到 CUDA 目录
  2. sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.8/include/
  3. sudo cp cuda/lib/x64/libcudnn* /usr/local/cuda-11.8/lib64/
  4. # 设置权限
  5. sudo chmod a+r /usr/local/cuda-11.8/include/cudnn*.h
  6. sudo chmod a+r /usr/local/cuda-11.8/lib64/libcudnn*
  7. # 创建符号链接(可选)
  8. sudo ln -s /usr/local/cuda-11.8/lib64/libcudnn.so.8.9.5 /usr/local/cuda-11.8/lib64/libcudnn.so
复制代码
3. 验证 cuDNN

  1. # 编写测试代码(保存为 cudnnTest.cu)
  2. nano cudnnTest.cu
复制代码
cudnnTest.cu 内容
  1. #include <cudnn.h>
  2. #include <stdio.h>
  3. int main() {
  4.     cudnnHandle_t handle;
  5.     cudnnStatus_t status = cudnnCreate(&handle);
  6.     if (status != CUDNN_STATUS_SUCCESS) {
  7.         printf("cuDNN 初始化失败!\n");
  8.         return -1;
  9.     }
  10.     printf("cuDNN 版本: %d\n", CUDNN_VERSION);
  11.     cudnnDestroy(handle);
  12.     return 0;
  13. }
复制代码
编译并运行
  1. nvcc -o cudnnTest cudnnTest.cu -lcudnn
  2. ./cudnnTest
  3. # 输出应显示类似 "cuDNN 版本: 8905"(8.9.5 对应 8905)
复制代码

五、常见问题办理

1. 驱动辩论导致无法启动 GUI

  1. # 若重启后黑屏,尝试进入 TTY 终端(Ctrl+Alt+F2)
  2. # 卸载驱动并重新安装
  3. sudo apt-get purge nvidia* -y
  4. sudo apt-get install nvidia-driver-525 -y
  5. sudo reboot
复制代码
2. 情况变量未见效



  • 检查 ~/.bashrc 或 ~/.zshrc 中的路径是否精确。
  • 确保实行 source ~/.bashrc 或重新登录终端。
3. CUDA 样本程序编译失败

  1. # 安装开发工具包
  2. sudo apt-get install build-essential freeglut3-dev
  3. # 重新编译示例
  4. cd /usr/local/cuda-11.8/samples/1_Utilities/deviceQuery
  5. sudo make clean && sudo make
复制代码
4. 权限问题

  1. # 若提示权限不足,使用 sudo 或修改文件权限
  2. sudo chmod +x /usr/local/cuda-11.8/bin/*
复制代码
5. 版本不匹配



  • CUDA 与驱动版本不匹配
    1. # 查看驱动版本
    2. nvidia-smi
    3. # 确保 CUDA 版本与驱动兼容(如驱动 525 需 CUDA 11.8)
    复制代码

六、深度学习框架验证

1. 安装 PyTorch

  1. # 指定 CUDA 版本安装(如 CUDA 11.8)
  2. pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
复制代码
2. 验证 PyTorch

  1. import torch
  2. print(torch.__version__)      # 查看版本
  3. print(torch.cuda.is_available())  # 应输出 True
  4. print(torch.cuda.get_device_name(0))  # 显示 GPU 名称
复制代码

七、附录:版本对应表

CUDA 版本cuDNN 版本NVIDIA 驱动版本对应深度学习框架11.88.9.5525.60.13+PyTorch 2.1+, TF 2.13+11.78.6.0515.65.01+PyTorch 1.13+, TF 2.11+
通过以上步调,您应该能够顺遂完成 CUDA 和 cuDNN 的安装与验证。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

风雨同行

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表