nvcc fatal : Unsupported gpu architecture ‘compute_86‘ CMake Error at Memory_Transfer_generated

admin管理员组
文章数量:1663028

问题分析

在编译CUDA代码时，应该选择只编译一个与常用GPU显卡匹配的’-arch’值，这将使得运行时更快，因为代码生成将在编译期间进行。如果只写了’-gencode’值而忽略了’-arch’，那么GPU代码将由CUDA驱动程序在JIT编译器上生成。

产生问题的原因是：CmakeList中 CUDA arch和CUDA gencode对应算力关系不匹配

解决方法

将CmakeList.txt中设置 GPU arch 和 code generation 参数.，使之和你的GPU显卡版本匹配。

常用的Nvidia GPU对应的算力flag

1. Fermi(CUDA 3.2 until CUDA 8) (deprecated from CUDA 9)：

SM20 or SM_20, compute_30 - Older cards such as GeForce 400,500,600, GT-630 (Completely dropped from CUDA 10 onwards)

2. Kepler(CUDA 5 and later)：

SM30 or SM_30, compute_30 - Kepler architecture(generic - Tesla K40/K80, GeForce 700, GT-730)

Adds support for unified memory programming. (Completely dropped from CUDA 11 onwards.)

SM35 or SM_35, compute_35 – More specific Tesla K40

Adds support for dynamic parallelism. (Deprecated from CUDA 11, will be dropped in future versions.)

SM37 or SM_37, compute_37 – More specific Tesla K80

Adds a few more registers. (Deprecated from CUDA 11, will be dropped in future versions.)

3. Maxwell(CUDA 6 until CUDA 11)：

SM50 or SM_50, compute_50 – Tesla/Quadro M series (Deprecated from CUDA 11, will be dropped in future versions)

SM52 or SM_52, compute_52 – Quadro M6000 , GeForce 900, GTX-970, GTX-980, GTX Titan X

SM53 or SM_53, compute_53 – Tegra (Jetson) TX1 / Tegra X1, Drive CX, Drive PX, Jetson Nano.

4. Pascal(CUDA 8 and later)：

SM60 or SM_60, compute_60 – GP100/Tesla P100 – DGX-1 (Generic Pascal)

SM61 or SM_61, compute_61 – GTX 1080, GTX 1070, GTX 1060, GTX 1050, GTX 1030, Titan Xp, Tesla P40, Tesla P4, Discrete GPU on the NVIDIA Drive PX2

SM62 or SM_62, compute_62 – Integrated GPU on the NVIDIA Drive PX2, Tegra (Jetson) TX2

5. Volta(CUDA 9 and later)：

SM70 or SM_70, compute_70 – DGX-1 with Volta, Tesla V100, GTX 1180 (GV104), Titan V, Quadro GV100

SM72 or SM_72, compute_72 – Jetson AGX Xavier, Drive AGX Pegasus, Xavier NX

6. Turing(CUDA 10 and later)：

SM75 or SM_75, compute_75 – GTX/RTX Turing – GTX 1660 Ti, RTX 2060, RTX 2070, RTX 2080, Titan RTX, Quadro RTX 4000, Quadro RTX 5000, Quadro RTX 6000, Quadro RTX 8000, Quadro T1000/T2000, Tesla T4

7. Ampere(CUDA 11 and later)：

SM80 or SM_80, compute_80 – NVIDIA A100 (the name “Tesla” has been dropped – GA100), NVIDIA DGX-A100

SM86 or SM_86, compute_86 – (from CUDA 11.1 onwards) Tesla GA10x cards, RTX Ampere – RTX 3080, GA102 – RTX 3090, RTX A6000, RTX A40, GA106 – RTX 3060, GA104 – RTX 3070, GA107 – RTX 3050

8. Hopper(CUDA 12[planned] and later)：

SM90 or SM_90, compute_90 - NVIDIA H100(GH100)

根据Nvidia官方介绍，在GCC编译时设置gencode和arch的基本规则如下：

Thearch=clause of the-gencode=command-line option tonvccspecifies the front-end compilation target and must always be a PTX version.

Thecode=clause specifies the back-end compilation target and can either be cubin or PTX or both. Only the back-end target version(s) specified by thecode=clause will be retained in the resulting binary; at least one must be PTX to provide Ampere compatibility.

-arch和-gencode flags在CUDA 10.1上的例子：

-arch=sm_50 \
-gencode=arch=compute_50,code=sm_50 \
-gencode=arch=compute_52,code=sm_52 \
-gencode=arch=compute_60,code=sm_60 \
-gencode=arch=compute_61,code=sm_61 \
-gencode=arch=compute_70,code=sm_70 \
-gencode=arch=compute_75,code=sm_75 \
-gencode=arch=compute_75,code=compute_75

比如我的CUDA Version: 11.6 属于 Ampere，算力flag=sm_80或sm_86，

本文标签： unsupported GPU nvcc FATAL Architecture

版权声明：本文标题：nvcc fatal : Unsupported gpu architecture ‘compute_86‘ CMake Error at Memory_Transfer_generated_me 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1729978059a1218262.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

nvcc fatal : Unsupported gpu architecture ‘compute_86‘ CMake Error at Memory_Transfer_generated_me

问题分析

解决方法

更多相关文章

21年 46篇神经架构搜索(Neural Architecture Search) ICCV CVPR Survey 笔记 (1-20)

nvcc fatal：Unsupported gpu architecture ‘compute_89‘

Undefined symbols for architecture arm64 symbol(s) not found for architecture arm64

MacOS编译错误：symbol(s) not found for architecture x86_64 || Undefined symbols for architecture x86_64:

[NAS]DARTS:Differentiable Architecture Search

C++: Undefined symbols for architecture x86_64:

Simulink 自动代码生成System Composer的使用Architecture Model

【配环境】make时报错：Value ‘sm_30‘ is not defined for option ‘gpu-architecture‘

llama_cpp_python运行Qwen2提示error loading model: unknown model architecture: ‘qwen2‘

【架构实践】架构解耦 Decoupling Architecture

解决“MAC M1 incompatible architecture“问题

Megatron-LM出现nvcc fatal: Unsupported gpu architecture ‘compute_90‘

Transformer - model architecture

unknown architecture of input file

ld: 2 duplicate symbols for architecture arm64

for architecture arm64clang:

Could not set up a toolchain for Architecture x64. Make sure you have the right build tools installe

Android Architecture Componets

nvcc fatal : Unsupported gpu architecture ‘compute_86‘问题解决

【问题解决】安装PCL报错：nvcc fatal : Unsupported gpu architecture ‘compute_30‘

发表评论

推荐文章

关于关闭代理软件后浏览器无法上网的解决办法

android基础知识32：android手机root后的安全问题 （二）

《柯南》剧场版里的物联网恐怖袭击，能成真吗？

云媒体服务器设置在哪个文件夹,安装和使用Jellyfin配置Linux媒体服务器

Architecture

热门文章

OpenGL超级第12章学习笔记：管线监控

LinuxAndroid CPU频率调节模式那些事

优启通桌面只有一个计算机,优启通图文详细使用教程,优启通使用教程

html5新媒体播放器标签video、audio 与embed、object

win8看不到win7局域网计算机名,Windows8系统搜索不到网络打印机如何解决

毕升Office

Camtasia喀秋莎2022经典版能编辑4K视频

解决Tuxera NTFS for Mac软件安装问题

盘点双十一最值得买的好物有哪些？盘点2024双十一超值好物推荐

被1.5W用户吐成翔的10大互联网产品，你躺枪了吗？

最新文章

如何在电脑上查看连接的WiFi密码？

中国十大IT论坛网站

soho

注意身体健康-转

程序员发展之路

催化剂，抑制剂和变压器：十大主导力量塑造技术

做技术的方向性讨论(论坛帖子整理)

程序员要注意健康一-避免罗京、李钰悲剧：改变我们的酸性体质

看了这篇你肯定瘦 全身上下想瘦哪就瘦哪 - 健康程序员，至尚生活！

免签出国,我们这些懒人的长假有救了

Windows查看连接WiFi密码

[转]明朝出了个张居正 作者：秋风浩荡 -3

什么是soho

看了这篇你肯定瘦 全身上下想瘦哪就瘦哪 - 生活至上，美容至尚！

成功经理人讲座

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

android基础知识32：android手机root后的安全问题（二）

看了这篇你肯定瘦全身上下想瘦哪就瘦哪 - 健康程序员，至尚生活！

[转]明朝出了个张居正作者：秋风浩荡 -3

看了这篇你肯定瘦全身上下想瘦哪就瘦哪 - 生活至上，美容至尚！

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载