扩散模型:方法和应用的综合综述Diffusion Models: A Comprehensive Survey of Methods and Applications|电子爱好者

admin管理员组
文章数量:1530078

扩散模型:方法和应用的综合综述Diffusion Models: A Comprehensive Survey of Methods and Applications

0.摘要
1.超级分辨率、修复和翻译
2.语义分割

0.摘要

扩散模型已经成为一个强大的深层生成模型的新家族，在许多应用中具有破纪录的性能，包括图像合成、视频生成和分子设计。在这个综述中，我们提供了一个关于扩散模型的快速扩展的工作的概述，将研究分为三个关键领域:有效抽样，改进的似然估计，和处理具有特殊结构的数据。我们还讨论了将扩散模型与其他生成模型相结合以增强结果的潜力。我们进一步回顾了扩散模型在计算机视觉、自然语言处理、时间数据建模等领域的广泛应用，以及在其他科学学科中的跨学科应用。本调查旨在提供一个背景化的、深入的扩散模型的状态，确定重点领域和指出进一步探索的潜在领域。Github: https://github/YangLing0818/Diffusion-Models-Papers-Survey-Taxonomy。

1.超级分辨率、修复和翻译

生成模型已用于处理各种图像恢复任务，包括超分辨率、修复和平移[10，47，61，103，137，174，187，282]。图像超分辨率旨在从低分辨率输入中恢复高分辨率图像，而图像修复则涉及重建图像中缺失或损坏的区域。
有几种方法利用扩散模型来完成这些任务。例如，通过重复细化的超分辨率（SR3）[202]使用DDPM来实现条件图像生成。SR3通过随机迭代去噪过程进行超分辨率处理。级联扩散模型（CDM）[91]由顺序排列的多个扩散模型组成，每个扩散模型生成分辨率不断提高的图像。SR3和CDM都直接将扩散过程应用于输入图像，这导致了更大的评估步骤。
为了允许在有限的计算资源下训练扩散模型，一些方法[198，234]使用预训练的自动编码器将扩散过程转移到潜在空间。潜在扩散模型（LDM）[198]简化了去噪扩散模型的训练和采样过程，而不牺牲质量
对于修复任务，RePaint[147]采用了一种增强的去噪策略，该策略使用重采样迭代来更好地调整图像（见图5）。同时，Palette[200]使用条件扩散模型为四个图像生成任务创建了一个开放的框架：着色、修复、取消剪切和JPEG恢复
图像翻译专注于合成具有特定期望风格的图像[103]。SDEdit[161]在提高保真度之前使用了一个随机微分方程（SDE）。具体来说，它首先向输入图像添加噪声，然后通过SDE对图像进行降噪。
[10]Georgios Batzolis, Jan Stanczuk, Carola-Bibiane Schönlieb, and Christian Etmann. 2021. Conditional image generation with score-based diffusionmodels.arXiv preprint arXiv:2111.13606(2021).
[47]Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei. 2009. Imagenet: A large-scale hierarchical image database. InIEEE Conferenceon Computer Vision and Pattern Recognition. 248–255
[61]Patrick Esser, Robin Rombach, and Bjorn Ommer. 2021. Taming transformers for high-resolution image synthesis. InIEEE Conference on ComputerVision and Pattern Recognition. 12873–12883.
[103]Phillip Isola, Jun-Yan Zhu, Tinghui Zhou, and Alexei A Efros. 2017. Image-to-image translation with conditional adversarial networks. InIEEEConference on Computer Vision and Pattern Recognition. 1125–1134
[147]Andreas Lugmayr, Martin Danelljan, Andres Romero, Fisher Yu, Radu Timofte, and Luc Van Gool. 2022. Repaint: Inpainting using denoisingdiffusion probabilistic models. InIEEE Conference on Computer Vision and Pattern Recognition. 11461–11471
[161]Chenlin Meng, Yutong He, Yang Song, Jiaming Song, Jiajun Wu, Jun-Yan Zhu, and Stefano Ermon. 2021. Sdedit: Guided image synthesis and editingwith stochastic differential equations. InInternational Conference on Learning Representations
[174]Muzaffer Özbey, Salman UH Dar, Hasan A Bedel, Onat Dalmaz, Şaban Özturk, Alper Güngör, and Tolga Çukur. 2022. Unsupervised Medical ImageTranslation with Adversarial Diffusion Models.arXiv preprint arXiv:2207.08208(2022).
[187]Aditya Ramesh, Mikhail Pavlov, Gabriel Goh, Scott Gray, Chelsea Voss, Alec Radford, Mark Chen, and Ilya Sutskever. 2021. Zero-shot text-to-imagegeneration. InInternational Conference on Machine Learning. 8821–883
[198]Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, and Björn Ommer. 2022. High-resolution image synthesis with latent diffusionmodels. InIEEE Conference on Computer Vision and Pattern Recognition. 10684–10695.
[200]Chitwan Saharia, William Chan, Huiwen Chang, Chris Lee, Jonathan Ho, Tim Salimans, David Fleet, and Mohammad Norouzi. 2022. Palette:Image-to-image diffusion models. InSpecial Interest Group on Computer Graphics and Interactive Techniques Conference Proceedings. 1–10.
[202]Chitwan Saharia, Jonathan Ho, William Chan, Tim Salimans, David J Fleet, and Mohammad Norouzi. 2022. Image super-resolution via iterativerefinement.IEEE Transactions on Pattern Analysis and Machine Intelligence(2022)
[234]Arash Vahdat, Karsten Kreis, and Jan Kautz. 2021. Score-based generative modeling in latent space. InAdvances in Neural Information ProcessingSystems, Vol. 34. 11287–1130
[282]Min Zhao, Fan Bao, Chongxuan Li, and Jun Zhu. 2022. Egsde: Unpaired image-to-image translation via energy-guided stochastic differentialequations.arXiv preprint arXiv:2207.06635(2022)

2.语义分割

语义分割旨在根据建立的对象类别来标记每个图像像素。生成预训练可以提高语义分割模型的标签利用率，最近的研究表明，通过DDPM学习的表示包含对分割任务有用的高级语义信息[9，76]。利用这些学习表示的少镜头方法的表现优于VDVAE[33]和ALAE[179]等替代方法。类似地，解码器去噪预训练（DDeP）[17]将扩散模型与去噪自动编码器[239]集成，并在标签高效语义分割方面提供了有前景的结果
[9]Dmitry Baranchuk, Andrey Voynov, Ivan Rubachev, Valentin Khrulkov, and Artem Babenko. 2021. Label-Efficient Semantic Segmentation with Diffusion Models. InInternational Conference on Learning Representations
[76]Alexandros Graikos, Nikolay Malkin, Nebojsa Jojic, and Dimitris Samaras. 2022. Diffusion models as plug-and-play priors. InAdvances in NeuralInformation Processing Systems.
[17]Emmanuel Asiedu Brempong, Simon Kornblith, Ting Chen, Niki Parmar, Matthias Minderer, and Mohammad Norouzi. 2022. Denoising Pretrainingfor Semantic Segmentation. InIEEE Conference on Computer Vision and Pattern Recognition. 4175–4186
[239]Pascal Vincent, Hugo Larochelle, Yoshua Bengio, and Pierre-Antoine Manzagol. 2008. Extracting and composing robust features with denoisingautoencoders. InInternational Conference on Machine Learning. 1096–1103.

本文标签：模型方法 Diffusion Models Applications

版权声明：本文标题：扩散模型:方法和应用的综合综述Diffusion Models: A Comprehensive Survey of Methods and Applications 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1725897627a1047845.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

扩散模型:方法和应用的综合综述Diffusion Models: A Comprehensive Survey of Methods and Applications

扩散模型:方法和应用的综合综述Diffusion Models: A Comprehensive Survey of Methods and Applications

0.摘要

1.超级分辨率、修复和翻译

2.语义分割

更多相关文章

Chrome浏览器配置阿里云DNS方法

如何防止chrome自动升级 chrome浏览器禁止自动升级设置方法

IDM激活方法

永久使用Beyond Compare4的方法

在公司局域网内安装无线路由器的连接设置方法

开机计算机无法启动修复工具栏,win7开机出现启动修复怎么办？解决win7开机出现启动修复的方法...

win11家庭版安装时如何跳过联网设置 windows11家庭版跳过联网设置的步骤方法

amd 服务器cpu型号怎么看,AMD CPU型号识别方法图解

amd显卡关闭垂直同步 linux,Windows8系统垂直同步怎么关？IntelAMDNVIDIA显卡关闭方法...

centos7.2安装五笔输入法的方法

电脑开机太慢？这5个方法瞬间提升你的电脑速度

电脑开机启动项在哪里设置？3个方法教你轻松找到！

WIN10下安装Ubuntu18.04.5双系统+RTX3070独显不太成功安装方法（可参考）

解决win7开机黑屏方法

超详细的免费下载论文方法

linux下暴风影音安装方法

去除暴风影音2009广告的方法！

自己动手去除暴风影音2012广告方法，这样才安全

多模态大模型总结

一口气了解大模型相关通识，基础笔记！_大模型数据

发表评论

推荐文章

电脑卡顿是什么原因导致的？一招解决电脑卡顿 恢复系统顺畅！

【ArcGIS微课1000例】0100：ArcGIS for CAD软件下载与安装（附安装包）

如何一键装win7系统,一键装机win7系统教程

你的Chrome浏览器不可以长截图？

Diffblue Cover AI Java：Difflane如何利用Diffblue Cover AI实现Java自动化的单元测试（Diffblue Cover快速入门）

热门文章

This application has requested the Runtime to terminate it in an unusual way. Please contact the app

Python密码本连接wifi

mysql怎么卸载_怎样把mysql卸载干净？Mysql怎么卸载干净重装？

深圳大学使用路由器登陆校园网，openwrt登陆drcom，d版教程

不用再找了，ChatGPT 3.54.0新手使用手册~ （论文润色、降重、扩写指令）【亲测好用】

Agricultural Bank of China Changde branch commitment 6 years after the cash Jin Jian rice of large s

WIN10下使用ISE14.7

创建虚拟机遇到: 此主机支持AMD-V,但AMD-V处于禁用状态

横空出世-轰炸手机在线使用-小白网安笔记

linux有k歌软件吗,在Linux下可用Wine安装和运行暴风影音16、全民K歌

最新文章

IntelliJ IDEA下载安装

idea系列之-2019.3版本新特性及安装一

2021.3.1idea(jdk+tomcat+maven)安装与配置

IPC，一直被人们忽视的“东西”。

2008R2 WDS (五）--实现win7客户端无人值守安装

c#物联网_C# 基础知识系列- 16 开发工具篇

Python环境搭建

PHP环境搭建

Java学习Day_01

Keil MDK最新版 5.25介绍及下载地址

IntelliJ IDEA（2018.2.5版本）安装和破解

nextCloud集成至APP端可行性报告

IDEA使用教程汇总

（附源码）ssm网上零食销售系统 毕业设计 180826

linux下访问windows的共享

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

电脑卡顿是什么原因导致的？一招解决电脑卡顿恢复系统顺畅！

（附源码）ssm网上零食销售系统毕业设计 180826

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载