【常用bsub指令先容】使用bsub下令提交作业、开启交互式窗口,在集群服务器上用pdb举行代码调试 [复制链接]
发表于 2026-4-8 07:56:37 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×
1. LSF作业调理体系和服务器集群先容

在一个服务器集群中,有许多的人要使用,却只有很少的GPU。LSF作业调理体系则是对每个用户提交的作业和必要使用的GPU举行调理。一样平常使用bsub下令来将待运行的作业提交到集群上。
用bsub < run.sh提交了作业,一样平常是作业已经可以乐成跑起来,提交了作业后直接等作业运行竣事就行。但更多时间我们的代码大概会出现报错,必要举行调试。
一样平常环境下,我们会用pychram/ vscode等软件对代码打断点,举行调试。但使用的是当地的CPU资源,而不是服务器上的GPU。而且我们当地的电脑通常存储不敷,不能加载大模子,没有在GPU上提交作业加载模子的话也无法在当地举行调试。这就必要用bsub开启一个交互式的窗口举行调试。
2. bsub运行作业的两种方式

2.1 bsub直接提交作业

比力常用的一种方式。通常是把作业脚本和必要使用的gpu资源界说在sh文件里,然后用busb < run.sh 来提交文件。一个sh文件示比方下:
  1. #/bin/bash
  2. #BSUB -J job_name
  3. #BSUB -e /nfsshare/home/xxx/log/NAME_%J.err
  4. #BSUB -o /nfsshare/home/xxx/log/NAME_%J.out
  5. #BSUB -n 2
  6. #BSUB -q gpu
  7. #BSUB -R "rusage[ngpus_physical=2]"
  8. #BSUB -gpu "num=2:mode=exclusive_process"
  9. python file.py
复制代码
bsub参数阐明
     bsub参数    阐明    示例              -n : 提交一个并行作  
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!qidao123.com:ToB企服之家,中国第一个企服评测及软件市场,开放入驻,技术点评得现金
回复

使用道具 举报

登录后关闭弹窗

登录参与点评抽奖  加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表