论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
主机系统
›
linux
›
服务器:显卡驱动重装(Ubuntu 20.04)
服务器:显卡驱动重装(Ubuntu 20.04)
伤心客
论坛元老
|
2024-10-14 18:11:00
|
显示全部楼层
|
阅读模式
楼主
主题
1804
|
帖子
1804
|
积分
5412
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
服务器近来GPU驱动老是掉,命令nvidia-smi无法输出,GPU相干代码无法运行,重启之后恢复正常。在排查之后发现是因为近期内核版本更新过,驱动出现兼容性问题,需要重装驱动。
为了避免再次因为内核版本更新出现该问题,需要关闭内核的自动升级,再重装显卡驱动。
1. 内核自动升级关闭
1.1 禁用unattended-upgrades:
打开“/etc/apt/apt.conf.d/20auto-upgrades”文件,将其中的“1”全部改成“0”,生存退出。
sudo vi /etc/apt/apt.conf.d/20auto-upgrades
复制代码
1.2 禁用自动更新:
打开“/etc/apt/apt.conf.d/10periodic”文件,将其中的“1”全部改成“0”,生存退出。
sudo vi /etc/apt/apt.conf.d/10periodic
复制代码
1.3 重启服务器
sudo reboot
复制代码
2. 显卡驱动重装
2.1 更新软件列表,安装必要软件、依赖
安装驱动前需要更新软件列表和安装必要软件、依赖
sudo apt-get update
sudo apt-get install g++
sudo apt-get install gcc
sudo apt-get install make
复制代码
2.2 禁用nouveau驱动(通用的驱动程序)
打开“/etc/modprobe.d/blacklist-nouveau.conf”文件
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
复制代码
在文件中添加以下内容,生存并退出
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
复制代码
关闭nouveau
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
复制代码
重新生成内核
sudo update-initramfs -u
复制代码
重启服务器
sudo reboot
复制代码
重启后执行部属命令,没有输出则说明nouveau禁用成功
lsmod | grep nouveau
复制代码
2.3 卸载原有驱动
sudo apt-get remove --purge nvidia*
复制代码
2.4 安装新驱动
获取服务器支持的驱动信息
ubuntu-drivers devices
复制代码
后面有“reconmmended”的驱动即为体系保举安装的驱动程序,这里体系保举安装的为“nvidia-driver-535-server-open”。“nvidia-driver-535-server-open”和“nvidia-driver-535-server”的区别如下:
nvidia-driver-535-server-open:这个版本提供了开放源代码的驱动,大概具有更广泛的兼容性,并且通常由社区进行维护和更新。这个版本大概更得当那些更注重开源和自由软件的用户,大概需要在开放环境中运行的服务器。
nvidia-driver-535-server:这个版本大概是官方提供的闭源驱动,由NVIDIA公司直接维护和支持。它通常会提供更好的性能和稳固性,但大概缺乏开源版本的某些优势。这个版本大概更得当那些对性能和稳固性有较高要求的用户,大概在闭源环境中运行的服务器。
思量到服务器紧张用途是跑深度学习模型,以是这次选择安装的驱动为“nvidia-driver-535-server”。
安装驱动
sudo apt install nvidia-driver-535-server
复制代码
2.5 安装后在执行“nvidia-smi”出现下述问题,重启即可
2.6 安装完成。
假如驱动还掉,可以思量重装CUDA。
CUDA卸载可参考:服务器:CUDA卸载(Ubuntu 20.04)
CUDA安装可参考:服务器:多CUDA配置
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
伤心客
论坛元老
这个人很懒什么都没写!
楼主热帖
《百万IT毕业生的心声:IT专业大学生毕 ...
Java打怪之路----谷粒商场认证服务 ...
xtrabackup2版本和xtrabackup8版本对比 ...
Excelize 发布 2.6.1 版本,支持工作簿 ...
原型设计工具比较及实践--滴爱音乐 ...
sqlserver导入sql文件的方式
Flink-使用流批一体API统计单词数量 ...
Snowflake(雪花算法),什么情况下会 ...
SQL Server 2008下载及安装
基于 SpringBoot + MyBatis 的博客系统 ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
前端开发
快速回复
返回顶部
返回列表