Linux+CentOS服务器NVIDIA显卡驱动更新(NVIDIA Driver)、CUDA、cuDNN更新 ...

打印 上一主题 下一主题

主题 1005|帖子 1005|积分 3015

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x

  • 目录
  • 一、服务器显卡驱动更新
  • 1、查看原有的显卡驱动和CUDA信息(做备份纪录)
  • 2、删除原本服务器上的nvidia驱动步伐
  • 3、重新安装nvidia驱动步伐
  • 二、CUDA更新
  • 1、官网查找cuda对应的版本:CUDA Toolkit Archive | NVIDIA Developer
  • 2、复制红框两行代码到服务器,进行CUDA下载
  • 3、设置环境变量
  • 三、安装cudnn
  • 1、官网下载cudnn
  • 2、下载tar.xz包后放在服务器目录下,使用tar命令对tar.xz进行解压:
  • 3、将解压后的头文件和库复制到cuda目录中:
  • 4、cuDNN安装完成,查看安装的版本:

一、服务器显卡驱动更新

1、查看原有的显卡驱动和CUDA信息(做备份纪录)

  1. nvidia-smi -a
复制代码
  备注:
  nvidia-smi:GPU驱动版本,driverAPI(支持的最高cuda版本)
  watch -n 1 nvidia-smi:动态监控显卡状态
  nvcc -V:cuda版本,timeAPI(运行时API)
  2、删除原本服务器上的nvidia驱动步伐

① 清除所有nvidia相关文件和依靠
  1. yum remove nvidia-*
复制代码
② 进一步清除(把nvidia-driver的相关组件都清理掉)
  1. rpm -qa|grep -i nvid|sort
  2. yum remove kmod-nvidia-*
复制代码
③ 清除cuda
  1. yum remove "*nvidia*"
  2. yum remove "*cublas*" "cuda*"
复制代码
④ 卸除驱动重启
  1. sudo reboot
复制代码
⑤ 输入nvidai-smi,报错的话就是卸载乐成了。
3、重新安装nvidia驱动步伐

① 在nvidia官网找到显卡对应的驱动步伐,下载后复制到服务器上。可以自界说放在这个目录:/root/Downloads/(自界说即可)
     nvidia官网驱动下载:官方驱动 | NVIDIA
  

② cd到这个驱动文件的目录,然后运行这个驱动文件
  1. cd /root/Downloads/
  2. sh NVIDIA-Linux-x86_64-470.57.02.run
复制代码
  备注:在安装过程中大概会显示一个问题
  

  选择NO继续。如果出现警告可以不消理会,直接继续,直到安装完成。
  ③ 安装完成后,输入nvidai-smi,显示如下,则安装乐成。

二、CUDA更新

1、官网查找cuda对应的版本:CUDA Toolkit Archive | NVIDIA Developer


2、复制红框两行代码到服务器,进行CUDA下载

安装过程中,会问你是否需要下载驱动(Drive),正常环境下请不要下载,即选择否。即取消第一个Drive的[X],改为[ ](使用回车键取消选择),然后选“Install”开始安装下载。(默认安装目录是/usr/local/)

   安装后会出现:
  

  3、设置环境变量

① 打开编辑~/.bashrc文件:vim ~/.bashrc
② 在文件末尾添加如下两行(应该是有很多种添加方式,这里选用了其中一种)。PS, 要将cuda版本11.7替换成你安装的版本,如cuda-12.2。
  1. export PATH=/usr/local/cuda-11.7/bin${PATH:+:${PATH}}
  2. export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
复制代码
③ 刷新~/.bashrc设置文件,使得设置生效:source ~/.bashrc
④ 测试、查询nvcc版本检查是否安装乐成:nvcc -V
三、安装cudnn

1、官网下载cudnn

   下载地址:https://developer.nvidia.com/rdp/cudnn-archive
  备注:需要挂梯子,然后登录/注册英伟达的账号,进行邮箱验证。
  2、下载tar.xz包后放在服务器目录下,使用tar命令对tar.xz进行解压:

  1. tar -xvf cudnn-linux-x86_64-8.8.1.3_cuda11-archive.tar.xz
复制代码
3、将解压后的头文件和库复制到cuda目录中:

注意看cuda目录是不是正确,大概是cuda-11.7
  1. cd cudnn-linux-x86_64-8.9.7.29_cuda11-archive
  2. sudo cp include/cudnn*    /usr/local/cuda/include
  3. sudo cp lib/libcudnn*    /usr/local/cuda/lib64
  4. sudo chmod a+r /usr/local/cuda/include/cudnn*   /usr/local/cuda/lib64/libcudnn*
复制代码
4、cuDNN安装完成,查看安装的版本:

  1. cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
复制代码
  

  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
~~~~~~~~~~~~~~~~~ 到这里搞定完啦 ~~~~~~~~~~~~~~~~~~~~

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

↓↓↓↓↓   以下是深度学习跑代码需要重新更新环境的步调哦   ↓↓↓↓↓


四、为深度学习模子练习设置新环境、新版本的pytorch

1、用anaconda新建一个环境:

  1. conda create -n env_name python=3.9.7 
复制代码
2、激活这个新的环境:

  1. conda activate env_name 
复制代码
3、下载pytorch:

  1. pip install torch==2.0.0+cu117 torchvision==0.15.1+cu117 -f https://download.pytorch.org/whl/torch_stable.html -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
  【备注官方pytorch的下载地址】 
  下载地址:Start Locally | PyTorch
  【备注一些anaconda的操纵说明】:
  查看安装了哪些包:conda list
查看有哪些假造环境:conda env list, conda info -e
创建假造环境:conda create -n env_name python=3.9.7  (env_name,改成本身的)
激活/切换假造环境:activate env_name   (env_name,改成本身的)
删除假造环境:conda remove -n env_name    (env_name,改成本身的)
  

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

怀念夏天

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表