,请问超算上sbatch命令是有可能和别人共享一块gpu的对嘛?我们使用sbatch在1块GPU上运行一个7B的模型,遇到了OOM的问题。
“OOM”:out of memory
黄居耀
不会和别人共享gpu,但要确保代码是运行在gpu计算节点上而不是workstation上。
用户反馈是运行在公共集群里的,通过debug看了一下,应该是就bs设置太大了。