用户名
Email
论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
帖子
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
只需一步,快速开始
账号登录
立即注册
找回密码
用户名
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
IT评测·应用市场-qidao123.com技术社区
»
论坛
›
虚拟化.超融合.云计算
›
公有云
›
ShareStation工作站捏造化实现图形工作站的一机多用,满 ...
ShareStation工作站捏造化实现图形工作站的一机多用,满足大型设计软件需求 ...
雁过留声
论坛元老
|
2024-5-24 16:47:51
|
显示全部楼层
|
阅读模式
楼主
主题
1817
|
帖子
1817
|
积分
5451
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
一、背景
公司设计部需要使用大型的CAD/CAM软件进行设计。 好比运行 Siemens NX 的工作站配置了 i9 13900KF 和 NVIDIA RTX A5000显卡。略微差一些的工作站,配置了 A2000的显卡。 另有一些相对老旧的工作站配置 Q2000/Q2200 的显卡。 实际工作中,设计师的工作是分阶段的。 有些设计使命需要高端的工作站,另一些使命,使用中低端的工作站也能胜任。
这些图形工作站的使用存在如下一些题目:
1、
资源利用率低
。 好比将最高配置的工作站分配给某些员工,并不能充分发挥设备的作用。设备的实际利用率很低。
2、
信息安全题目
。 设计图纸是企业的关键核心资产。图纸的丢失和泄密,会给企业造成巨大的损失。直接让员工使用图形工作站,面临泄密和数据丢失的风险。
3、
远程设计需求
。公司希望员工离开办公室,也能进行远程设计。好比回家、出差时,也能进行设计。别的,设计图纸可能需要提供给供应商,大概提供给客户进行评审大概联合设计。 如果在当地工作站运行CAD/CAM 无法满足远程设计的业务需求。
二、工作站捏造化介绍
ShareStation工作站捏造化是利用最新的GPU捏造化技术,让用户通过客户端连接工作站,实现多个用户共享使用图形工作站。满足远程设计需求和信息安全需求。
我们选择一台高配的工作站进行捏造化改造。工作站配置如下:
CPU:intel i9:13900KF
内存:64G
显卡:nvidia RTXA5000-24G
显卡:A2000
硬盘:1TB NVME
工作站捏造化的软件系统采用 企业级 开源捏造化平台 Proxmox VE 和 多平台、分布式、一体化的云桌面软件系统 DoraCloud 。
三、硬件安装和BIOS配置
为了正常启用显卡的捏造化功能,硬件安装有如下要点:
1、A5000显卡不能接显示器。 A5000用作捏造化显卡,不能用于输出,因此不能接显示器。这时需要有另一个显卡接显示器。
2、BIOS 开启 SR-IOV(也叫 VT-D),开启 Above 4G MMIO BIOS Assignment
四、工作站捏造化的软件安装
1、安装Proxmox VE 7.x
安装Proxmox VE 7.x 参考 我之前的文章。
《https://www.cnblogs.com/doracloud/p/17203221.html》
2、安装和配置NVIDIA GRID vGPU
RTX A5000 GPU有多种工作模式。默认情况下是支持显示输出的。为了启用vGPU,需要关闭显示输出功能。 使用 displaymodeselector 工具,可以对显卡进行配置。displaymodeselector的使用方法,也参见上面的文章。
如果 A5000 已经接了显示器,并且作为工作站的默认显示输出,此时再修改显示A5000的工作模式,就会工作站无法点亮显示器,无法正常进入当地操纵。因此前面提到的硬件准备时,必须要有别的的显卡(独立显卡大概集成显卡)作为工作站的默认显示输出。
安装 NVIDIA的vGPU驱动,可以使用这个脚本。 https://gitee.com/deskpool/proxmox-vgpu
该下令的使用方法如下:
登陆 Proxmox VE的下令。 gpu01.sh 更新Proxmox VE的源。 gpu02.sh 启用 IOMMU。
apt install git-core -y
git clone https://gitee.com/deskpool/proxmox-vgpu
./proxmox-vgpu/nvidia/gpu01.sh
./proxmox-vgpu/nvidia/gpu02.sh
复制代码
Proxmox VE 系统会重启,重启后,先查抄 IOMMU是否启用。
root@pve08:~# dmesg |grep IOMMU
[ 0.046588] DMAR: IOMMU enabled
复制代码
然后执行gpu03.sh,安装 grid 16.4的驱动。
./proxmox-vgpu/nvidia/gpu03.sh
复制代码
Proxmox VE 系统再次重启后,进入 Proxmox VE,通过 nvidia-smi 下令验证,可以看到显卡驱动已经安装。
root@pvehost:~# nvidia-smi
Fri May 24 16:20:22 2024
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.161.05 Driver Version: 535.161.05 CUDA Version: N/A |
|-----------------------------------------+----------------------+----------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA RTX A5000 On | 00000000:01:00.0 Off | 0 |
| 30% 46C P8 29W / 230W | 22272MiB / 23028MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
| 1 NVIDIA RTX A2000 12GB On | 00000000:04:00.0 Off | 0 |
| 30% 42C P8 12W / 70W | 0MiB / 11514MiB | 0% Default |
| | | N/A |
+-----------------------------------------+----------------------+----------------------+
+---------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=======================================================================================|
| 0 N/A N/A 657157 C+G vgpu 7424MiB |
| 0 N/A N/A 657163 C+G vgpu 7424MiB |
| 0 N/A N/A 657623 C+G vgpu 7424MiB |
+---------------------------------------------------------------------------------------+
复制代码
接下来,你输入 mdevctl ,查看 vGPU 类型(vGPU Profile),如果是 Ampere架构之前的显卡,此时已经能够工作。 但是对Ampere架构的A5000显卡,还需要一步,通过下令开启SR-IOV。通过下令 sriov-manage -e 启用SR-IOV。好比笔者的显卡地点为 01:00.0,下令如下:/usr/lib/nvidia/sriov-manage -e 0000:01:00.0
执行该下令之后,mdevctl types 下令可以输出 vGPU的类型,即表明vGPU 驱动已经配置成功。
启用 SR-IOV 的下令在系统重启后,将失效。 因此需要创建一个 后台服务,在系统每次启动时,主动启用显卡的 SR-IOV。 脚本如下:
[code]cat >/etc/systemd/system/sriov.service
回复
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
雁过留声
论坛元老
这个人很懒什么都没写!
楼主热帖
XShell免费版的安装配置教程以及使用教 ...
阿里云体验有奖:如何将 PolarDB-X 与 ...
day02-代码实现01
【如何优化她】教你如何定位不合理的SQ ...
微服务大行其道的今天,Service Mesh是 ...
十年技术进阶路,让我明白了三件要事( ...
常用类-LocalDate、LocalTime、LocalDa ...
鸿蒙3.0来了,这次,我真的想批评鸿蒙 ...
无需支付688苹果开发者账号,xcode13打 ...
Elasticsearch 入门实战(5)--Java API ...
标签云
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
备份
登录参与点评抽奖加入IT实名职场社区
下次自动登录
忘记密码?点此找回!
登陆
新用户注册
用其它账号登录:
关闭
快速回复
返回顶部
返回列表