Aladdin显卡多任务运行教程
Aladdin显卡多任务运行
- 任务场景
- 操作步骤
- 其他说明
任务场景
当我运行我的代码后发现80G的显存仅占用了46G左右,还有很大空间没有被使用,于是想着能不能把剩下的空间也利用起来,于是有了接下来的工作。
操作步骤
当我们使用GPU run/debug/Task,我这里使用的GPU run,如果你的代码正常运行且需要一定的时间才会结束,那么将会有一个session,如下图:
右键这个session后,可以看见terminal选项,点击这个选项即可打开终端,该终端是与session对应的。
打开终端后,使用nvidia-smi,可以看见你这张卡的占用情况。
同时你的root目录中的项目文件都在此处。
于是,我们可以在这个终端运行别的训练任务,比如我这里开始了我的第二个训练任务,大致如下,此处注意如果你自己有conda环境,注意切换conda环境:
可以看见上述任务是成功跑起来了的,再次查看显存占用情况,可以发现显存即将拉满。
另外的,如果第二个任务显存爆满,与第一个任务加起来超过总显存了,也不会影响第一个主任务的运行。
其他说明
1.此处通过session右键打开的终端不够稳定,经常卡死,需要重新打开终端。
2.要注意第一个任务也就是你创建session的任务是主任务,如果主任务结束了,第二个任务会被立即释放,所以第二个任务最好是先于第一个任务完成。
3.这种在一个session中同时运行多个任务,可以节省算力。