刘俊凯 发表于 2024-7-29 05:23:53

部署海潮服务器AiStation

前言

一般在前言我都会说一些题外话,嘿嘿~
近来,有个题目我想了好久,在这里分享给家人们哈,就是说假如有两种努力的方式,一种黑白常努力,对本身要求非常严格,每天没有什么玩的时间,本身的能力提升地很快,但是缺点是可能会缺失生活中很多的小快乐;还有一种是对本身要求没那么严格,但是也在努力,能力提升地比较缓慢,但是能领会到生活中的很多快乐。这两种努力的方式家人们更倾向于那种呢?大家可以在品评区留言哈,每一条我都会很认真地参考哒~
https://i-blog.csdnimg.cn/blog_migrate/7e0b53365407f0256df4b9a267e60627.png
好啦,言归正传了哈~
1. 起首进入海潮服务器网站

海潮服务器的网址:https://172.17.71.11:32206/login.html,有可能浏览器会提示这个网址并不安全,但是这个并没有关系,点击进入就好了。
进入网址之后的界面如下图所示:
https://i-blog.csdnimg.cn/blog_migrate/aba11d3c61c69f9649587e7193831fa5.png
然后输入用户名和密码就好了。
2. 如安在海潮上跑通实验

起首,家人们必须要知道一个事实,那就是海潮这个服务器吧,是一台裸机,也就是上面什么环境也没有,所以(重点来了奥),我们需要添加上我们的代码以及数据集,安装好anaconda,然后还有对应的conda捏造环境,其次还要有Pytorch。
(1)上传数据集&代码

点开“数据管理”这一栏,然后里面有个“文件管理”,下面的“数据集管理”先不用管。
https://i-blog.csdnimg.cn/blog_migrate/57d9b76bc853daffef70d080f394730d.png
然后这里有一些目录,如下图所示,有用户目录、公共目录。一般我们的代码和数据集都是放在一个文件夹里的,并且我们一般放在这个用户目录里。公共目录里的全局共享里也有一些文件,一般是管理员上传的一些比较常见的数据集等。
https://i-blog.csdnimg.cn/blog_migrate/7ce451e8a5b6f0472567a6f908e037e3.png
如下图所示,上传文件有两种方式,一种是下图中红色框框圈出来的“上传”,这种方式是从本地直接上传,但是有一个限定——上传的文件大小只能小于1G,所以这种方式我不是常常用。
https://i-blog.csdnimg.cn/blog_migrate/0a5684bfebcfa7bc8349bbae3a45177b.png
还有一种方式是通过SFTP工具来上传文件。
这里先简单介绍一下SFTP是什么哈。SFTP是一种文件网络传输的安全协议,一般可以或许连接远程服务器的工具一般都可以举行SFTP文件传输。像我一直用的SFTP工具叫做MobaXterm。
想进一步相识SFTP的可以参考一下这篇文章:https://blog.csdn.net/weixin_42046751/article/details/105250458
登录上MobaXterm后先连接上海潮服务器,点击左上角的session,然后点击SFTP,如下图所示。Remote host为海潮的ip地址:172.17.71.11 ,Username就是登录海潮的账号(像我就是学号),然后点击OK。
https://i-blog.csdnimg.cn/blog_migrate/42e1f24581c96e247c0ce0f49cd94909.png
然后需要让你输入密码,如下图所示。
https://i-blog.csdnimg.cn/blog_migrate/876ad67e622c37df978c62ded121e1a3.png
这里的密码需要在海潮服务器中手动点“复制密码”得到,如下图所示。
https://i-blog.csdnimg.cn/blog_migrate/73b805bbbe287e27757aef4a2ad871eb.png
登录上去之后就可以上传文件啦~
(2)创建一个开辟环境

点开目录的“业务管理”,然后再点击“开辟环境”。在里面的右上角有一个“创建”。
https://i-blog.csdnimg.cn/blog_migrate/180490b6c855aa5cd8f6fc214f9929d9.png
点击“创建”之后,你需要选择一个开辟环境镜像,我的环境时Pytorch,因此我选择了一个我的同砚公开出来的Pytorch环境镜像。
https://i-blog.csdnimg.cn/blog_migrate/73ce6ad9d2c012cca4eb531dfe38d00c.png
选择一个之后就到了下面这个窗口,选择一个还有显卡的节点。因为我这里已经有一个开辟环境了,所以这里CPU体现资源不敷,正常来说是4,加速卡应该是1。
https://i-blog.csdnimg.cn/blog_migrate/ea293cfe4b254cb049240fc3dc908deb.png
下面还有数据配置和更多选项,我没动,直接点“确定”了。
(3)下载并安装anaconda

先到清华大学开源镜像网站下载anaconda的脚本文件
镜像网站网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
在里面找到本身需要的脚本文件就行了,以我为例,我的是
Anaconda3-2021.11-Linux-x86_64.sh
点击之后就可以下载到本地了,然后再通过SFTP工具将上面的脚本文件上传到海潮服务器。
来到海潮的开辟环境的界面,点击开辟环境(就是下图中红色框框)
https://i-blog.csdnimg.cn/blog_migrate/f7a90d769c7ae4418f5612108ad20e13.png
之后再点击Shell,进入终端命令窗口。
https://i-blog.csdnimg.cn/blog_migrate/f813af2ab50fdfec8dd6b6032223d5c6.png
接着就可以实验脚本文件了,用下面的命令:
bash Anaconda3-2021.11-Linux-x86_64.sh

然后就是一开始是让大家接收协议,输入yes就好。再接着就是让你确认安装目录,默认的目录是/root/anaconda3,我没改。最后会问你是否配置环境变量,你可以选yes,但是我选了no,然后我又本身手动配置了anaconda的环境变量。最后系统就会提示大家 installed successfully !
那么,我来和家人们说说怎么手动配置环境变量哈~
(1)添加环境变量
echo 'export PATH="/root/anaconda3/bin:$PATH"' >> ~/.bashrc
这里的/root/anaconda3/bin 不是一尘不变的,要根据本身的anaconda目录来配置。
(2)使其立即收效
source ~/.bashrc
(3)验证anaconda是否安装乐成
anaconda -V#注意V是大写
如果体现出anaconda的版本,那么,恭喜家人们安装乐成!
(4)进入anaconda的base环境
source activate
(4)上传捏造环境

因为我们运行的项目一般来说都有一个专门的捏造环境来对应,捏造环境中有项目所需要的包。一般来说,一般的Linux服务器就可以直接自身创建一个捏造环境的,就是先下载anaconda的脚本文件,就是.sh结尾的那个东西,然后再用bash命令安装anaconda,接着就能创建一个捏造环境,然后再在捏造环境里下载torch了,最后再pip或者conda本身需要的包就OK了。BUT!!!海潮这个神奇的服务器竟然没联网(就连脾气这么好的我都想骂人)!
https://i-blog.csdnimg.cn/blog_migrate/8e9f20e56e73f61277cddf01fe514548.png
因此!!!只能在另一台Linux服务器上先创建好一个捏造环境,然后打包下载到本地,然后再本地上传到海潮再解压~~真的是离谱他妈给离谱开门,离谱抵家了。关键是我的实验室的服务器连磁盘空间都咩的了,连创建个捏造环境都没有space,还卡得一批……我真的会谢……
https://i-blog.csdnimg.cn/blog_migrate/6f9754451d2a84805c9e81472e7eb99c.png
因此,我计划在实验室服务器上将原本的不怎么常常用的捏造环境删掉,再创建一个新的捏造环境……创建个捏造环境都得这么麻烦,诶~
(1)先检察本身有哪些捏造环境:
conda env list

(2)然后删掉此中一个捏造环境(纯属是为了让出磁盘空间,家人们可以不用做这步):
conda remove -n 环境名称 --all
然后系统会提示是否要删除,输入yes就行啦
(3)创建一个新的捏造环境
conda create -n 环境名称 python=版本
但是又出现题目了!我可真是多苦多难的科研人啊~
https://i-blog.csdnimg.cn/blog_migrate/be999089827c7acf8529ff19d0df4473.png
我查阅了一下资料得出了题目的结论——根目录下的这些tmp目录没有磁盘空间……照旧老题目,
不过我接洽了一下服务器的管理员,他说可以先删掉一些缓存文件应下急,管理员人照旧蛮不错滴~
下图也是应证了我的结论。
https://i-blog.csdnimg.cn/blog_migrate/0367f5de4d3286dc6af5c8f6c4ceda7d.png
可以看到相应的目录下可用的磁盘空间为零……
OK,经过十分钟的等候后,磁盘空间腾出二十多G了,终于把捏造环境创建好啦,中央过程会有一个让大家输入yes的操纵。
https://i-blog.csdnimg.cn/blog_migrate/c678d514ad46a9b1b9a6063e053a772f.png
这个TransUNet就是我刚刚创建好的捏造环境~
那么接着需要在这个捏造环境里安装torch以及项目需要的包,那么来吧~
一般来说,我们起首需要先进入torch的官网举行torch的下载
torch官网的网址:https://pytorch.org/get-started/locally/
下载torch之前,我们先得弄清晰一些东西,那就是我们服务器的NVIDIA驱动版本以及对应的cuda版本,我们可以在shell中输入这个命令来检察:
nvidia-smi
结果就像这个样子:
https://i-blog.csdnimg.cn/blog_migrate/d2adc71461020ea2972b3f1095393eed.png
这里的Driver Version就是驱动版本,CUDA Version就是对应的cuda版本。我们下载的torch的cuda版本可以低于对应的cuda版本,所以我们一般会在服务器上装较高版本的NVIDIA驱动,这样对应的cuda版本也比较高,兼容性就比较高。
torch官网中下载torch:
https://i-blog.csdnimg.cn/blog_migrate/dee57d5d36e69c881ac73b7b25a15140.png
固然说如果这里没有对应的版本,那么可以到 Previous Pytorch Versions 中下载torch。
https://i-blog.csdnimg.cn/blog_migrate/38a273f4ad89fbaf923b3683ea40ee36.png
找到本身想要的版本的torch的时候,在shell中输入命令就可以啦。原来我的项目所需要的torch版本是1.4.0,torchvision的版本是0.5.0的,但是这两个版本都太老了,并且我一直下载不了,一直会报错。因此我咨询了一下我的同门和师兄,得出的结论似乎是:实验室服务器的cuda版本是11.7的,只能下载1.10.0以上版本的torch,并且高版本的torch是可以兼容低版本的torch的。所以我就下载了1.13.1版本的torch,对应的命令如下:
conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia
果然,高版本的torch就下载好了,哈哈。反正要是版本不兼容的话,后期再改吧,哈哈~
https://i-blog.csdnimg.cn/blog_migrate/d2b6a564b223a033ea86df4a8329ce63.png
接着就是下载项目所需要的其他的包就好了,发起都利用conda命令来下载,不要conda和pip混合利用,这样可能会导致包之间不兼容。这样环境就完成啦~
PS:如果有的包总是下载失败的话,可以尝试到anaconda官网去寻找相应的资源,详细可以参考这篇博客:https://blog.csdn.net/weixin_45552562/article/details/109668589
Anaconda官网:https://anaconda.org/
(4)打包创建好的环境
起首安装打包工具conda-pack:
conda install -c conda-forge conda-pack
之后进入到捏造环境,这里我需要进入的捏造环境就是TransUNet:
conda activate TransUNet
然后进入到捏造环境所在的目录:
cd /data/ubuntu/user/kzy/envs/
最后实验打包命令就可以了:
conda pack -n TransUNet -o TransUNet.tar.gz
这样就会在TransUNet捏造环境所在的同一目录下得到捏造环境的压缩包——TransUNet.tar.gz
之后点击下载,下载到本地就好。此时实验室服务器的工作就完成了,该把眼光转到那个连网络都没有的海潮服务器了。
(5)在海潮上配置捏造环境

(1)将捏造环境压缩包上传
在第(3)步中我们已经在海潮服务器上安装好了anaconda,并且进入到了base环境。接着我们就需要将本地的TransUNet.tar.gz(捏造环境压缩包)再次通过SFTP工具上传到海潮。
因为我们的anaconda在海潮上的目录是/root/anaconda3,所以本应该将TransUNet.tar.gz上传到/root/anaconda3/envs这个目录下的,但是我在SFTP工具上貌似没有找到这个目录,但是这个目录确实又存在,真是离谱,笑拉了哈哈~ 所以我只能先将TransUNet.tar.gz上传到用户目录下(就是和代码&数据集同一目录)。
上传后我又通过这个命令将用户目录下的TransUNet.tar.gz转移到/root/anaconda3/envs下:
mv 路径1 路径2 #将路径1的内容转移到路径2
这里我的就是这样:
mv */TransUNet.tar.gz /root/anaconda3/envs/TransUNet.tar.gz
这里的*表示大家本身的目录,各位家人根据本身的情况写哈~
之后可以进入到/root/anaconda3/envs这个目录下检察是否转移乐成:
cd /root/anaconda3/envs #进入环境目录
ls #查看当前目录下的所有文件
如果体现TransUNet.tar.gz的话,就表示转移乐成啦!
(2)创建一个环境目录
在/root/anaconda3/envs目录下创建一个目录用于存放解压后的捏造环境,因为我的捏造环境叫做TransUNet.tar.gz,因此我创建了一个环境目录名称也为TransUNet
cd /root/anaconda3/envs #先进入环境目录
mkdir TransUNet #创建目录
(3)解压捏造环境压缩包
tar -zxvf TransUNet.tar.gz -C TransUNet/ #将压缩包解压到刚刚创建的目录下
等候一段时间后,检察捏造环境,如果出现了TransUNet,那么就乐成啦!
conda env list

乐成!!!
https://i-blog.csdnimg.cn/blog_migrate/c58a516d7ad0b1d0e7a4187d894d177a.png
(6)运行代码

进入捏造环境后,进入代码目录,运行代码就可以了~
conda activate TransUNet
#激活捏造环境cd 目录 #进入代码目录python ~.py #运行代码 【注意】因为海潮服务器的网络题目,导致终端很不稳定,发起利用nohup命令,让程序后台运行,让结果保存在日记中:
nohup python ~.py > result.log&
至此大功告成,感谢家人们看到这里,不妨点个赞,关注一波噻~
https://i-blog.csdnimg.cn/blog_migrate/087da4bf79538fe4dcd61a0223c9752c.png

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: 部署海潮服务器AiStation