Ubuntu 22.04 + Nvidia driver 550 + Cuda 12.4 + cuDNN 9.5.1安装方案和踩 ...

打印 上一主题 下一主题

主题 807|帖子 807|积分 2421

我遇到最大的问题是,做好Ubuntu的启动盘后,插入电脑,选择该U盘作为启动项后,会直接卡在ubuntu logo页面。后面查抄bios的设置,发现启动项UEFI的兼容模型也是打开的。真的非常奇怪,以前从没遇到过这么离谱的变乱,反反复复启动了很多多少次,真的要瓦解!
问题分析:

厥后我发现再进入ubuntu的过程中,ubuntu 的 logo忽然会改变一下分辨率,从一个比较低的分辨率酿成一个比较高的分辨率。我记得新装的ubuntu都是默认的显卡驱动,是一个分辨率比较低,很糊的一个界面,装完显卡驱动重启后才会酿成一个比较高的分辨率。到这里我大概知道什么情况了:启动盘内里的ubuntu可能直接选择了显卡的驱动,而不是默认的驱动,我们还没装显卡驱动以是会卡在logo页面(我也不懂是动了那里的设置。。)
具体解决步骤:

使用启动盘安装ubuntu时,卡在logo页面

首先在选择启动盘的选项的时候,选择第一项大概第二项,但是不要按enter要按e键!!!

按e键后,会进入grub界面:
找到“quiet splash”,把他后边的 ”---“ 换成 ”nomodeset“,接着按F10保存并启动。然后就能正常启动了!
参考:安装ubuntu体系时卡在开机logo的解决方案_ubuntu20.04卡在logo界面-CSDN博客
安装完ubuntu 之后 拔掉启动盘,进入新做的体系照旧会遇到同样的问题。

在开机的过程中疯狂按shift键,进入体系的recovery模式:

移动到第二项,然后照旧按 ”e“ 键进入grub页面,同样也是找到“quiet splash”,把他后边的 ”---“ 换成 ”nomodeset“,接着按F10保存并启动。
做完以上步骤之后就可以正常进入ubuntu图形界面了,进去之后抓紧安装显卡驱动,不然重启体系还要继续再来一遍上面的操作。
ubuntu 深度学习框架安装:

大致流程:
1、进入体系后,点击菜单栏,选择  Software updater,让其主动更新。


2、(重要)安装gcc g++ make.

注意1:一定要在安装显卡驱动前安装这些包,不然安装显卡驱动直接报错,重启后照旧卡logo界面,又要重复上面的步骤。
注意2:千万不要换apt的下载源,本人尝试换源之后,下一步下载显卡驱动没有网速,下载非常慢
  1. sudo apt update
  2. sudo apt install gcc make g++
复制代码
3、安装显卡驱动

推荐直接在Software & Updates 内里安装推荐的driver。简单快捷

4、显卡驱动安装完,就可以放心重启了。

重启后执行 watch -n 1 nvidia-smi,出现下面的界面,说明显卡驱动已经打上了。
记着本身的CUDA Version,我这里是12.4

5、重要:设置Software & Updates 不让它主动更新:


6、假如有clash,建议安装clash,方便后面下载cuda和cudnn

贴一个好用的linux clash 的github堆栈:wnlen/clash-for-linux: clash-for-linux
按照教程,输入本身的订阅地点,假如没有订阅,网上找教程买一个!
假如按照教程操作完,发现照旧无法通过clash访问,可以试试我的方法:更改网络设置

这样设置后,假如不想使用clash,直接切换到Automatic,必要使用再切到Manual
7、安装Cuda

进入Nividia Cuda 的下载地点:CUDA Toolkit Archive | NVIDIA Developer 找和本身Cuda Version一致的Cuda,我这里选择12.4.0

按照官网提示下载并安装:

假如因为网络关系无法下载,建议装个clash,大概在其他地方下载好,再拷到这台机器上
8、Cuda 环境变量设置:

cuda安装好后,一般都在/usr/local下会有三个文件夹:

然后使用gedit打开~/.bashrc:
  1. sudo gedit ~/.bashrc
复制代码
在最后一行添加:
  1. $ export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
  2. $ export LD_LIBRARY_PATH=/usr/local/cuda/lib64{LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
复制代码
更新环境变量
  1. source ~/.bashrc
复制代码
9、cudnn安装

现在cudnn安装非常简单,按照官网的提示直接运行命令就行了,不消和以前一样手动解压、给权限,再复制到指定的文件夹下了
进入cudnn官网:CUDA Deep Neural Network (cuDNN) | NVIDIA Developer
选择完之后,直接按照提示安装。
假如因为网络关系无法下载,和下载cuda时一样的处置惩罚方法。
10、anaconda 安装

进入Anaconda官网:Anaconda | The Operating System for AI

.sh 文件下载到本地之后,必要手动安装一下(文件名改为本身的):
  1. bash ~/Downloads/Anaconda3-2021.11-Linux-x86_64.sh
复制代码
然后就是漫长的enter
第一次输入yes是为了同意上面的条款。第二个条款是为了让你选择安装的位置,建议手动更改安装位置,到 /home/anaconda3 这个位置:

安装完成之后可能会出现问题: conda: command not found
这时候就用到上面安装位置的信息了。修改环境变量:
  1. sudo gedit ~/.bashrc
复制代码
在这个文件的最后一行添加:
  1. export PATH=$PATH:/home/anaconda3/bin
复制代码
然后更新环境变量,并执行conda初始化操作:
  1. source ~/.bashrc
  2. conda init
复制代码
之后就可以在终端的前缀见到熟悉的(base):
这时我们执行 sudo gedit ~/.bashrc
,发现内里主动天生了conda 的环境变量:
保留主动天生的环境变量,删除我们本身添加的环境变量

最后再次革新环境变量
  1. source ~/.bashrc
复制代码
 11、使用pytorch 验证cuda是否可用:

创建虚拟环境,并下载pytorch
  1. conda create -n testenv python=3.10
  2. conda activate testenv
  3. pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
  4. python test.py
复制代码
创建test_cuda.py文件:
  1. import torch
  2. print(torch.cuda.is_available())
复制代码
输出 “True”,恭喜你已经完全安装了深度学习的环境!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

光之使者

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表