ToB企服应用市场:ToB评测及商务社交产业平台

标题: 【2024最新】 服务器安装Ubuntu20.04 (安装教程、常用命令、故障排查)持 [打印本页]

作者: 雁过留声    时间: 2024-6-21 13:17
标题: 【2024最新】 服务器安装Ubuntu20.04 (安装教程、常用命令、故障排查)持
安装教程(体系、NVIDIA驱动、CUDA、CUDNN、Pytorch、Timeshift、ToDesk、花生壳)



  1. sudo apt-get install lightdm
复制代码

  1. //执行此语句,出现显卡信息则证明安装成功。
  2. nvidia-smi
复制代码

3. 安装Anaconda

  1. //先解决 2
  2. sudo vim ~/.bashrc
  3. //打开文件后,按i插入下一行,用户名更改为自己的用户名,之后按esc,输入:wq!,保存并关闭文件
  4. export PATH="/home/用户名/anaconda3/bin:$PATH"
  5. //更新source
  6. source ~/.bashrc
  7. //再解决 1,直接初始化conda
  8. conda init
复制代码

  1. mkdir ~/.pip
复制代码

  1. sudo vim ~/.pip/pip.conf
复制代码

  1. [global]
  2. index-url = https://pypi.tuna.tsinghua.edu.cn/simple
  3. [install]
  4. trusted-host = pypi.tuna.tsinghua.edu.cn
复制代码



  1. wget https://developer.download.nvidia.com/compute/cudnn/9.0.0/local_installers/cudnn-local-repo-ubuntu2004-9.0.0_1.0-1_amd64.deb
  2. sudo dpkg -i cudnn-local-repo-ubuntu2004-9.0.0_1.0-1_amd64.deb
  3. sudo cp /var/cudnn-local-repo-ubuntu2004-9.0.0/cudnn-*-keyring.gpg /usr/share/keyrings/
  4. sudo apt-get update
  5. sudo apt-get -y install cudnn
  6. # 如果当前环境的cuda版本为11.x,那么用这行代码
  7. sudo apt-get -y install cudnn-cuda-11
  8. # 如果当前环境的cuda版本为12.x,那么用这行代码
  9. sudo apt-get -y install cudnn-cuda-12
复制代码

  1.         sudo cp cuda/include/cudnn* /usr/local/cuda-xxx/include
  2.          
  3.         sudo cp cuda/lib/libcudnn* /usr/local/cuda-xxx/lib64
  4.          
  5.         sudo chmod a+r /usr/local/cuda-xxx/include/cudnn*
  6.         sudo chmod a+r /usr/local/cuda-xxx/lib64/libcudnn*
复制代码

  1. cat /usr/local/cuda-11.8/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
复制代码

  1. # 进入pytorch环境
  2. import torch
  3. # 可以正确输出 cuda 版本号,说明 cuda 安装成功
  4. print(torch.version.cuda)
  5. # 可以正确输出 cuDNN 的 版本号,说明 cuDNN 安装成功
  6. print(torch.backends.cudnn.version())
  7. # 输出是 True,说明 CUDA 和 GPU 驱动的搭配是正确的
  8. print(torch.cuda.is_available())
复制代码



服务器的简化操作(长途Pycharm)


常用命令

  1. # 如果-ls输入错误成-l,那么重新输入-ls后会出现以下信息:
  2. (base) pp@slol:~$ screen -ls
  3. There are screens on:
  4.         1301732.pts-7.slol    (2024年03月18日 21时37分41秒)   (Detached)
  5.         27515.pp        (2024年03月16日 21时07分52秒)   (Detached)
  6.         26902.pts-0.slol      (2024年03月16日 21时00分53秒)   (Detached)
  7. 3 Sockets in /run/screen/S-pp.
  8. * 这可以使用screen -r命令重新连接到要关闭的会话,例如:
  9. # 第一个和第三个的名称要输全
  10. screen -r 1301732.pts-7.slol
  11. screen -r 26902.pts-0.slol
  12. # 中间一个可以直接这样输入
  13. screen -r pp
  14. # 连接到会话后,可以按下Ctrl + A + K键组合来杀死当前会话,以及杀死对话中的进程。
  15. # 使用Ctrl + A + D键组合来暂时中断当前会话,不会杀死对话中的进程。
复制代码
  1. # 更改DNS服务器,查看DNS服务器设置
  2. systemd-resolve --status
  3. # 1. 修改系统的永久DNS文件,命令如下
  4. sudo vim /etc/systemd/resolved.conf
  5. # 2. 取消DNS行的注释,并更改如下:
  6. DNS=8.8.8.8 114.114.114.114
  7. # 3. 保存并推出永久DNS文件
  8. ESC + :wq!
  9. # 4. 清空本地DNS缓存
  10. sudo systemd-resolve --flush-caches
  11. # 5. 重启systemd-resolved服务
  12. sudo systemctl restart systemd-resolved
  13. # 6. 检查systemd-resolved服务状态
  14. sudo systemctl status systemd-resolved
  15. # 7. 查看接口名称
  16. nmcli con show
  17. # 8. 更改指定连接的DNS,将为IPv4设置Google的公共DNS服务器,并删除IPv6的DNS服务器
  18. #    并告诉NetworkManager忽略由DHCP提供的DNS服务器
  19. nmcli con mod "有线连接 1" ipv4.dns "8.8.8.8"
  20. nmcli con mod "有线连接 1" ipv4.ignore-auto-dns yes
  21. nmcli con mod "有线连接 1" ipv6.dns ""
  22. nmcli con mod "有线连接 1" ipv6.ignore-auto-dns yes
  23. # 9. 重启NetworkManager服务
  24. sudo systemctl restart NetworkManager
  25. # 10. 检查是否修改完成
  26. systemd-resolve --status
  27. # 禁用IPv6
  28. # 1. 进入sysctl.conf文件
  29. sudo vim /etc/sysctl.conf
  30. # 2. 添加以下行
  31. net.ipv6.conf.all.disable_ipv6 = 1
  32. net.ipv6.conf.default.disable_ipv6 = 1
  33. net.ipv6.conf.lo.disable_ipv6 = 1
  34. # 3. 保存更改后,执行以下命令
  35. sudo sysctl -p
复制代码
故障排查

  1. # 1. 先lastb 查看登录失败的用户名、ip、时间等信息
  2. sudo lastb
  3. # 2. 若btmp文件过大,被系统的logrotate自动轮转,则旧文件会默认以 btmp.1 btmp.2 btmp.3的形式存储在 /var/log/目录下
  4. # 再用以下命令查看某个btmp文件,如查看btmp.1
  5. sudo lastb -f /var/log/btmp.1
  6. # 3. 使用last命令查看已经登录过的用户名、ip、时间等信息
  7. sudo last
  8. # 4. 使用echo命令清空btmp文件或wtmp文件
  9. sudo echo > /var/log/btmp
  10. sudo echo > /var/log/wtmp
复制代码
  1. # 1. 先使用top命令查看当前占用cpu的进程号是什么
  2. # 2. 使用nvidia-smi命令查看当前占用gpu的进程叫什么名字
  3. # 3. 拿到进程号,比如3531之后,我们进入root用户
  4. su root
  5. # 4. 执行以下命令,即可查看该进程的目录列表
  6. ll /proc/3531
  7. # 5. 其中 cmd 是进程当前工作目录,exe 是进程的启动路径,cmdline 包含用于启动进程的完整命令行参数
复制代码

  1. sudo lastb |awk '{print $3}'|sort |uniq -c|awk '{if ($1 > 4) print $2}'
复制代码



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4