nvcc -V无问题,nvidia-smi无问题,import torch无问题,但在使用torch的时候(如torch.randn(100,100).to(0))报错/home/jason/c/vcuda-controller/src/smi_client.c:65 connect error,在本地容器并没有这个目录,在网络上搜索也搜不到相关问题,会是跟咱们超算中心的自己的一些配置有关吗?有人遇到同样的问题吗?
将资源从A800(0.5卡)更换为4090(1卡),问题已解决
好的,再观察看看