torch.cuda.amp的使用|电子爱好者

admin管理员组
文章数量:1530282

今天看到师兄的代码里面用到了amp包，但是我在使用的时候遇到了apx无法使用的问题，后来知道pytorch已经集成了amp，因此学习了一下pytorch中amp的使用。

官网https://pytorch/docs/stable/amp.html?highlight=amp

torch.cuda.amp

作用：

torch.cuda.amp提供了可以使用混合精度的方便方法，以加速训练。在网络中，有一些操作，例如linear layer和convolution，在float16时会更加快速，而另外一些操作，例如reduction，会需要float32的动态范围，混合精度就是在尽可能地将每一种操作匹配到最合适的精度。

使用方法：

import torch.cuda.amp.autocast as aotucast

import torch.cuda.amp.GradScaler as GradScaler

Typical Mixed Precision Training

# create model and optimizer in default precision

model = Net().cuda()
optimizer = optim.SGD(model.patameters(), ...)

scaler = GradScaler()

for epoch in epochs:
    for input, target in data:
        optimizer.zero_grad()
        with aotucast():
            output = model(input)
            loss = loss_fn(output, target)
        
        scaler.scale(loss).backward()
        
        scaler.step(optimizer)
        
        scaler.update()

Working with unscaled Gradients

scaler = GradScaler()

for epoch in epochs:
    for input, target in data:
        optimizer.zero_grad()
        
        with aotucast():
            output = model(input)
            loss = loss_fn(output, target)
        scaler.scale(loss).backward()
        
        scaler.unscale_(optimizer)
        
        torch.nn.utils.clip_grad_norm_(model.parameters(), max_norm)
        
        scaler.step(optimizer)
        
        scaler.update()

Working with Scaled Gradients (gradient accumulation)

scaler = GradScaler()

for epoch in epochs:
    for i (input, target) in enumerate(data):
        with autocast():
            output = model(input)
            loss = loss_fn(output, target)
            loss = loss / iters_to_accumulate
        if((i+1)%iters_to_accumulate == 0):
            scaler.step(optimizer)
            scaler.update()
            optimizer.zero_grad()

Working with Multiple Models, Losses, and Optimizers

scaler = GradScaler()

for epoch in epochs:
    for input, target in data:
        optimizer0.zero_grad()
        optimizer1.zero_grad()
        with autocast():
            output0 = model0(input)
            output1 = model1(input)
            loss0 = loss_fn(2*output0 + 3*output1, target)
            loss1 = loss_fn(3*output0 - 5*output1, target)
        scaler.scale(loss0).backward(retain_graph = True)
        scaler.scale(loss1).backward()
        
        scaler.unscale_(optimizer0)
        scaler.step(optimizer0)
        scaler.step(optimizer1)
        scaler.update()

本文标签： torch CUDA amp

版权声明：本文标题：torch.cuda.amp的使用内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1725886995a1047133.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

【写博客常用】C盘满了怎么办&注意事项

5天前

C盘满了怎么办&注意事项下载dism软件选择空间回收全选扫描清理，结果非常Amazing啊！修改下载的默认路径下载dism软件首先看到的是这样一篇文章刚开始表示dism根本没

联想笔记本&台式机专用系统 GHOSTXPSP3 v2013.06 海量驱动DVD版

5天前

名称：联想笔记本&台式机专用系统 GHOSTXPSP3 v2013.06 海量驱动DVD版大小：1.01 GB 简介:联想笔记本&台式机专用系统 GHOSTXPSP3 v

【Win11】完美解决Win11烦人的右键菜单&任务栏问题

5天前

Win11中微软的某些骚操作确实令人费解，本人遇到的最大两个问题便是右键菜单和任务栏，目前已寻得完美解决方案，在此分享给大家。 PS：文章编辑于202

【唯美&&梦幻之境win7主题】_8.27

4天前

唯美梦幻之境电脑桌面壁纸下载《鼠标右键另存为本地》唯美梦幻之境电脑桌面主界面效果图唯美梦幻之境电脑桌面开始菜单效果图唯美梦幻之境电脑桌面图标效果图唯美梦幻之境电脑鼠标效果图唯美梦幻之境主题内容：唯美梦幻之境电

机器学习(Machine Learning)&深度学习(Deep Learning)资料

4天前

机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 1) 《Brief History of Machine Learning》介绍:这是一篇介绍机器学习历史的文章&#

cuda与GPU显卡驱动版本一览

4天前

每日一歌，分享好心情：骑在银龙的背上(中岛阿姨，墙推) 问： 在业务中怎样确定显卡驱动和cuda版本呢？ CUDA toolk

多块显卡时，指定使用某一张显卡(cuda)进行训练的代码

4天前

当我们有多块显卡时，可以使用以下代码，明确指定用哪一块显卡来训练数据(cuda:0 还是 cuda:1) devicetorch.device("cuda:0" if t

1.centos7 安装显卡驱动、cuda、cudnn

4天前

安装conda 参考 python包 2.安装conda python库-CSDN博客 3.Cenots Swin-Transformer-Object-Detection环境配置-CSDN博客 4.Swin Transformer目标

Ubuntu下的NVIDIA显卡【驱动&CUDA 安装与卸载】

4天前

0. 显卡GPU的基础知识1. 显卡安装2. Optional: 卸载显卡(当你要换显卡的时候)3. 安装CUDACUDA 11.1 Ubuntu 20.04 4. Optional: 卸载CUDA附：问题合集ubun

【精】拼多多2024官方校招 &amp；&amp； 2025届实习生招聘

4天前

拓竹科技前端一面 4.28 秋招投递记录（10.17） 秋招总结 5个月-82投30测40笔52面14offer 暑期实习一些面经和准备建议 3.20哈啰安卓一面牧野机床工艺一面

给VivoBook扩容&重装系统

3天前

现在笔记本重装系统都这么复杂吗？原谅我还是10年前的装机水平，折腾了一天终于把系统重新安装好了。笔记本： ASUS VivoBook 安装系统：

Win7 64位系统，VS2010环境下编译cuda-convnet指南

2天前

Win7 64位系统，VS2010环境下编译cuda-convnet指南注意： 1. 本文给出的方法的最低要求为win7 64位系统和vs2010，其他需要装的软件第三方

友华光猫超级密码获取——PT622&PT632

2天前

前言上上周家里宽带升级成了200M，原有的100M光猫不能用了，电信公司给换上了一个新的1000M光猫，同时也将网络连接方式给从原来的光猫桥接改成光猫路由了&#x

浏览器拦截跨域请求处理方法&前端解决跨域问题的8种方案

1天前

原文地址：https:wwwblogsPheonixHkbxoicp5760838.html 浏览器拦截跨域请求处理方法(已阻止跨源请求:同源策略禁止读取远程资源) 在浏览器请求中，

AI写代码修Bug画画写诗，ChatGPT&DALLE2试用攻略

1天前

ChatGPT简介 ChatGPT&DALLE2是OpenAI的最新研究成果，在量子位看到他的强大功能后，就自己试玩了一下，比如我让ChatGPT帮我写一个Grap

（笔记）Chrome浏览器&基于Chromium内核的浏览器解决卡顿的方法

17小时前

适用于Chrome浏览器和基于Chromium内核构建的浏览器。文中浏览器：Windows10下基于Chromium内核的Edge浏览器 1.通过网址栏快速重启浏览器当浏览器页面已经非常卡顿时&#xff0

CPU架构 && intel,amd和arm的关系

7小时前

1.指令集所谓指令集，是CPU中用来计算和控制计算机系统的一套指令的集合。指令的强弱是CPU的重要指标，指令集是提高微处理器效率的最有效工具之一。 CPU依靠指令来计算和控制系统&#xf

win10安装Tensorflow-cpu（AMD显卡） && keras

7小时前

安装环境：WIN10 AMD集显😭😭 Anaconda版本：Anaconda3-4.4.0 （64位）

python报错：torch-0.4.1-cp36-cp36m-win_amd64.whl is not a supported wheel on this platform.

7小时前

出现报错：torch-0.4.1-cp36-cp36m-win_amd64.whl is not a supported wheel on this platform. 1.查询自己的支持类型步骤如下&#

安装本地whl的时候报错：ERROR: torch-1.12.1+cu113-cp39-cp39-win_amd64.whl is not a valid wheel filename.

6小时前

很简单的原因，是python支持的文件和下载的文件名不一致导致的。在确认下载的whl版本正确的情况下执行一下操作： 1.打开cmd， 输入pip debug --ver

电子爱好者 - 最新技术资讯及电子产品介绍！

torch.cuda.amp的使用

更多相关文章

【写博客常用】C盘满了怎么办&amp;注意事项

联想笔记本&amp;台式机专用系统 GHOSTXPSP3 v2013.06 海量驱动DVD版

【Win11】完美解决Win11烦人的右键菜单&amp;任务栏问题

【 唯美&amp;&amp;梦幻之境win7主题】_8.27

机器学习(Machine Learning)&amp;深度学习(Deep Learning)资料

cuda与GPU显卡驱动版本一览

多块显卡时，指定使用某一张显卡(cuda)进行训练的代码

1.centos7 安装显卡驱动、cuda、cudnn

Ubuntu下的NVIDIA显卡【驱动&amp;CUDA 安装与卸载】

【精】拼多多2024官方校招 &amp;amp；&amp;amp； 2025届实习生招聘

给VivoBook扩容&amp;重装系统

Win7 64位系统，VS2010环境下编译cuda-convnet指南

友华光猫超级密码获取——PT622&amp;PT632

浏览器拦截跨域请求处理方法&amp;前端解决跨域问题的8种方案

AI写代码修Bug画画写诗，ChatGPT&amp;DALLE2试用攻略

（笔记）Chrome浏览器&amp;基于Chromium内核的浏览器 解决卡顿的方法

CPU架构 &amp;&amp; intel,amd和arm的关系

win10安装Tensorflow-cpu（AMD显卡） &amp;&amp; keras

python报错：torch-0.4.1-cp36-cp36m-win_amd64.whl is not a supported wheel on this platform.

安装本地whl的时候报错：ERROR: torch-1.12.1+cu113-cp39-cp39-win_amd64.whl is not a valid wheel filename.

发表评论

推荐文章

2024 年 8 款好用的 Adobe Photoshop 替代软件测评

转载GitHub28.7k星的更好地提问ChatGPT方法

安装window7系统

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频 华为小米苹果均适用...

amd r5 m330 linux驱动下载,AMDAMD Radeon(TM) R5 M330 14.502.1014.0000显卡驱动官方正式版下载，适用于win8.1-64-驱动精灵...

热门文章

学习笔记：吴恩达ChatGPT提示工程

Error in callback for immediate watcher “data“: “TypeError: Cannot read properties of null

Win10：将打开文件管理器快速访问改为我的电脑

Chrome浏览器开发者工具（F12）设置为中文

女生学计算机月薪过万的工作,做系统的工作月收入-女生，做什么工作能月收入1到2万？...

FT2004(D2000)开发实战之AMD R5 230显卡驱动适配

为什么amd显卡便宜却买的人少_这7张显卡现在最好不要买，千万不要花钱当冤大头...

win11安装WSL2（以拯救者游戏本为例，附可能出现的问题及解决）

暴风影音下载|暴风影音播放器下载

Windows10系统开启FTP服务--主机通过winscp互传文件

最新文章

计算机无法连接单片机,Win10系统识别不了51单片机怎么办？Windows10无法识别51单片机的解决方法...

win10计算机 权限,介绍电脑windows10管理员权限开启的4种方法

Eclipse详细安装步骤 适用于windows 10

Windows 10无法设置静态IP的解决办法

win11开始菜单怎么修改成win10风格 Windows11开始菜单修改成win10右键风格的设置方法

搜狗拼音输入法打开config.exe找不到kernel32.dll怎么办？全方位深入解决方案介绍

如何解决Windows 10中的LogonUI.exe错误

win10+ubuntu双系统下，ubuntu不能访问windows的磁盘分区

Windows10蓝牙驱动丢失，100%解决方案

windows10安装Ubuntu子系统

如何设置Windows10定时重启？

在Windows10家庭版安装Docker遇到问题的解决方法

windows10和fedora 23双系统安装，用easyBCD实现windows引导fedora

win台式找不到计算机管理,win10系统打开计算机管理提示windows找不到文件computer management.lnk的具体方案...

win10无法装载重装系统iso文件_Win10系统如何装载和弹出ISO镜像文件？

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

【写博客常用】C盘满了怎么办&注意事项

联想笔记本&台式机专用系统 GHOSTXPSP3 v2013.06 海量驱动DVD版

【Win11】完美解决Win11烦人的右键菜单&任务栏问题

【唯美&&梦幻之境win7主题】_8.27

机器学习(Machine Learning)&深度学习(Deep Learning)资料

Ubuntu下的NVIDIA显卡【驱动&CUDA 安装与卸载】

【精】拼多多2024官方校招 &amp；&amp； 2025届实习生招聘

给VivoBook扩容&重装系统

友华光猫超级密码获取——PT622&PT632

浏览器拦截跨域请求处理方法&前端解决跨域问题的8种方案

AI写代码修Bug画画写诗，ChatGPT&DALLE2试用攻略

（笔记）Chrome浏览器&基于Chromium内核的浏览器解决卡顿的方法

CPU架构 && intel,amd和arm的关系

win10安装Tensorflow-cpu（AMD显卡） && keras

手机服务器连接视频文件夹吗,巧用手机自带功能向电脑传输视频华为小米苹果均适用...

win10计算机权限,介绍电脑windows10管理员权限开启的4种方法

Eclipse详细安装步骤适用于windows 10

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载