Linux|ubuntu22.04安装CUDA最新完备教程

打印 上一主题 下一主题

主题 552|帖子 552|积分 1656

流程:
安装前检查->安装->安装后配置->验证
   版本: CUDA12.5
体系: Ubuntu22.04
内核: 6.5.0-35-generic
  本文参考官方指南CUDA Installation Guide for Linux
一、安装前准备工作

查看GPU和型号

spci | grep -i nvidia
看到类似内容,我这是1660 S
  1. 01:00.0 VGA compatible controller: NVIDIA Corporation TU116 [GeForce GTX 1660 SUPER] (rev a1)
复制代码
查看GCC版本

gcc --version
虽然官方说6.0~13.0版本的都可以,但实测11.4版本的不可,可能有BUG。
若为11.4版本的,请下载12版本。
*下载gcc12

不须要下载的请跳过!
  1. # 查看之前的版本
  2. > gcc --version
  3. gcc-11 (Ubuntu 11.4.0-1ubuntu1~22.04) 11.4.0
  4. Copyright (C) 2021 Free Software Foundation, Inc.
  5. # 安装gcc12
  6. > sudo apt-get install gcc-12
  7. # 将他添加到gcc备选组中,且设置优先级为12
  8. > sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-12 12
复制代码


  • /usr/bin/gcc 主链接
  • gcc 组名
  • /usr/bin/gcc-12 要添加进组的下令
  • 12 优先级,数字越约莫优先
查看gcc的链接设置,看一眼配置对了没
sudo update-alternatives --config gcc
这时候查看gcc版本就是12.4了
gcc --version
*检查驱动

非须要举动!我们在安装toolkit的时候会自动安装GPU驱动
二、安装CUDA Toolkit

https://developer.nvidia.com/cuda-downloads
按照你的来,我这是选择的本地安装,就是下载一个安装包,在本地安装,deb类型的安装包是由APT管理,方便更新与卸载。

截止到目前位置为12.5版本,详细下令我这直接复制官网的,一条一条实行。
  1. wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
  2. sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600
  3. wget https://developer.download.nvidia.com/compute/cuda/12.5.0/local_installers/cuda-repo-ubuntu2204-12-5-local_12.5.0-555.42.02-1_amd64.deb
  4. sudo dpkg -i cuda-repo-ubuntu2204-12-5-local_12.5.0-555.42.02-1_amd64.deb
  5. sudo cp /var/cuda-repo-ubuntu2204-12-5-local/cuda-*-keyring.gpg /usr/share/keyrings/
  6. sudo apt-get update
  7. sudo apt-get -y install cuda-toolkit-12-5
复制代码
*安装驱动

上一步会自动安装GPU驱动的, 假如没有安装驱动乐成,才去选择手动安装。
检查驱动版本nvidia-smi
安装下令,最新版
sudo apt-get install -y cuda-drivers
假如你想要安装指定版本,2选1即可
sudo apt-get install -y cuda-drivers-555
三、安装后的工作

须要操作

设置环境变量,留意路径哈,是你安装版本的路径
  1. export PATH=/usr/local/cuda-12.5/bin${PATH:+:${PATH}}
复制代码
若想使其永久生效,,添加到.bashrc配置文件内里,假如你使用zsh,添加到.zshrc内里
  1. # 打开配置文件vi ~/.bashrc# 添加到最后一行,生存并退出export PATH=/usr/local/cuda-12.5/bin${PATH:+:${PATH}}
  2. # 重新激活配置文件source ~/.bashrc
复制代码
假如你选择安装cuda toolkit的不是deb安装形式,而是runfile方式,还须要手动添加动态链接库的路径.留意路径哈,是你安装版本的路径
  1. export LD_LIBRARY_PATH=/usr/local/cuda-12.5/lib64\
  2.                          ${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
复制代码
推荐的操作

开启保卫进程模式

开启保卫进程长期化模式,比传统长期化模式更优雅稳固elegent and robust
sudo /usr/bin/nvidia-persistenced --verbose
假如没有任何提示,说明启动乐成,linux惯例"没有消息就是最好的消息"
删除本地下载安装包

删除下令,按照你安装toolkit时的版本填入
sudo apt-get remove --purge "cuda-repo-<distro>-X-Y-local*"
我的删除下令
sudo apt-get remove --purge "cuda-repo-ubuntu2204-12-5-local*"
四、验证

验证CUDA版本,这是runtime运行时的版本
nvcc -V
验证驱动版本
nvidia-smi 右上角表现的cuda版本是驱动的CUDA版本 向下兼容,兼容比这个数字低的cuda 运行时版本
好比 nvidia-smi表现的cuda是12.5, 而 nvcc -V表现的是12.1这是没有题目的。但反过来不可哦!得更新驱动
二者的CUDA的区别
驱动API通常用于创建,因为它可以做更加精致化的控制,cuda RUNTIME API通常在运利用用时调用。
详细区别https://docs.nvidia.com/cuda/cuda-runtime-api/driver-vs-runtime-api.html
删除CUDA

假如你安装遇到题目,折腾好久没搞好!请先清除所有关于cuda的文件,再重新安装。
留意,在清除的时候,cuda依赖的其他库也可能会被删除!!可能会导致你的其他程序无法正常运行!
在删除的时候,留意下有哪些库被卸载了
删除下令
  1. # 删除CUDA TOOLKIT
  2. sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" \
  3. "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*" "*nvvm*"
  4. # 删除驱动
  5. sudo apt-get --purge remove "*nvidia*" "libxnvctrl*"
  6. # 清除一些依赖和安装包
  7. sudo apt-get autoremove
复制代码
常见题目及办理方案

还须要安装cuDNN吗?

不须要,安装CUDA Toolkit的时候,已经装好了
如何查看?
ldconfig -p | grep cudnn
表现结果:
  1.         libcudnn_ops.so.9 (libc6,x86-64) => /lib/x86_64-linux-gnu/libcudnn_ops.so.9
  2.         libcudnn_ops.so (libc6,x86-64) => /lib/x86_64-linux-gnu/libcudnn_ops.so
  3.         libcudnn_heuristic.so.9 (libc6,x86-64) => /lib/x86_64-linux-gnu/libcudnn_heuristic.so.9
  4.         libcudnn_heuristic.so (libc6,x86-64) => /lib/x86_64-linux-gnu/libcudnn_heuristic.so
  5.         libcudnn_graph.so.9 (libc6,x86-64) => /lib/x86_64-linux-gnu/libcudnn_graph.so.9
复制代码
nvcc: No such file or directory

没有添加环境变量!请仔细看安装后的工作哦
export PATH=/usr/local/cuda-12.5/bin${PATH:+{PATH}}

“error while loading shared libraries: : cannot open shared object file: No such file or directory”

没有设置动态库链接变量
  export LD_LIBRARY_PATH=/usr/local/cuda-12.5/lib${LD_LIBRARY_PATH:+{LD_LIBRARY_PATH}}

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

惊雷无声

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表