admin管理员组

文章数量:1530842

场景:

深度学习领域,使用GPU,使用pytorch框架


问题描述

做深度学习的小伙伴们可能都会在安装环境的时候经常遇到的cuda版本驱动版本以及和显卡是如何对应的,经常搞得特别糊涂,官网没有直接提供他们的对应关系,导致我们在升级显卡的时候发现原来的软件环境不兼容,出现各种奇奇怪怪的问题。


寻找对应关系:

1.不同的显卡有不同的算力,对cuda有着相应的版本要求,这种版本要求不明显,是通过算力间接要求的。如下图,显卡RTX3090算力要求是8.6,但只有cuda11.0以上的版本能提供这样的算力匹配,所以这种显卡实际上已经要求了cuda的版本。而且cuda版本和驱动版本有着显式的对应关系,接下。


2.cuda对显卡驱动也有特定的要求,见下图,从英伟达官网(参考cuda)继续寻找答案。此时驱动版本要和cuda版本匹配,如果驱动版本不高,但是使用了更高版本驱动对应的cuda,那么就会不匹配。高驱动版本对应的cuda是这种情况下可以接受的最高cuda版本,可以选择低于此最高cuda版本的一些cuda版本,但也要受到第一条的局限,不能低于此显卡的算力要求。


3.cuda版本确定后,pytorch要依赖此cuda版本,因为pytroch安装跟cuda对应的,比如下图,torch1.6.0只适配cuda10.2、10.1、9.2;不适配cuda11.0.


问题示例

这种情况就是显卡对算力有要求,即对cuda版本有要求,但是此时的pytorch所对应的cuda版本没达到故而有这种错误。想要解决只能升级pytorch版本,并选择适配cuda高版本的pytorch安装。


本文标签: 显卡驱动显卡版本关系CUDA