gan 5小时速成|电子爱好者

admin管理员组
文章数量:1593971

名词解释

多模态学习：每一种信息的来源或者形式，都可以称为一种模态；多模态机器学习，旨在通过机器学习的方法实现处理和理解多源模态信息的能力；比较热门的研究方向是图像、视频、音频、语义之间的多模态学习

图像标记：用词语对图像中不同内容进行多维度表述

图像描述：把一幅图片翻译为一段描述文字获取图像的标记词语理解图像标记之间的关系
生成人类可读的句子

词向量模型：Word2Vec是从大量文本语料中以无监督的方式学习语义知识的一种模型
通过词的上下文得到词的向量化表示，使得语义上相似的单词在向量空间内距离也很近
来源于2013年的论文《Efficient Estimation of Word Representation in Vector Space》
有两种方法：CBOW（通过附近词预测中心词）和SKIp-gram（通过中心词预测附近的词）

结构loss

图像建模的结构化损失图像到图像的转换问题通常被表述为逐像素分类或回归。这些公式将输出空间视为“非结构化”，因为在给定输入图像的情况下，每个输出像素都被认为有条件地独立于所有其他像素。有条件的gan相反地学习一个结构损失，结构损失惩罚输出的联合配置。

Structured losses for image modeling Image-to-image translation problems are often formulated as per-pixel classification or regression. These formulations treat the output space as "unstructured" in the sense that each output pixel is considered conditionally independent from all others given the input image. Conditional GANs instead learn a structured loss, Stryctured losses penalize the joint configuration of the output.

unet

基于经典的Encoder-decoder结构在很多图像翻译任务中，输出和输出图像外观看起来不同，但结构信息是相同的在Encode过程中，feature map的尺寸不断减小，低级特征将会丢失
在第1层与第n-i层间加入skip-connection，把i层的特征直接传到第n-i层

patchgan

PatchGAN像素级的1 loss能很好的捕捉到图像中的低频信息，GAN的判别器只需要关注高频信息把图像切成N"N的patch，其中N显著小于图像尺寸假设在大于N时，像素之间是相互独立的，从而可以把图像建模成马尔科夫随机场把判别器在所有patch上的推断结果，求平均来作为最终输出可以把PatchGAN理解为对图像纹理/style损失的计算PatchGAN具有较少的参数，运行得更快，并且可以应用于任意大的图像

前置知识

1.数字图像：

有什么用：最早海底电缆传输图像，数字图像可以加快传输

是什么：用矩阵表示图像

怎么形成数字图像：物体发送电磁波被设备接收形成数字图像

例子：x射线成像

人体密度高的地方（骨头）对x射线吸收多吸收的能量多，就发白

人体密度低的地方，x射线直接穿透，就发黑

紫外线波段成像

展示细胞

可见光波段成像：物体反射可见光进入人眼

数字图像的任务

输入/输出	图像	知识
图像	数字图像处理	计算机视觉
知识	计算图形学	人工智能

2.图像处理，机器视觉，人工智能关系

图像处理的输出还是图像

机器视觉包括图像处理，目标是理解图像

人工智能实现机器视觉理解图像的目标

3.opencv c实现提供python接口的计算机视觉工具包

4.图像属性

图像格式

bmp,tiff原图

gif可静可动

图像尺寸：表征图像的长宽

像素：像素=细胞每个像素有个强度值（对应能量的强度值）

5.图像直方图

统计不同像素亮度的直方图，左侧为黑的点，右侧为亮的点

6.颜色空间

7.opencv画图

8.图像的缩放

下采样：缩小图像

上采样：放大图像

计算机视觉背景知识

模型结构设计：

1.堆积使用小卷积核（3*3卷积）

2.分辨率减半，通道数加倍

3.卷积分解：7*7卷积用3*3卷积代替

非对称卷积 n*n 卷积 = 1*n卷积+n*1卷积这个在网络后半段效果比较好

4.辅助分类层：

是什么？中间的特征图用于分类的结构

有什么用？可以起正则作用，并不能提升底层的特征提取能力

5.特征图下降策略

因为池化后存在信息瓶颈，所以需要特征图下降策略

inception采用一半卷积一半池化的方式，拼接特征图

怎么做：选择步长为2的卷积核，可以将特征图缩小为原来一半

6.标签平滑

7.低分辨率图像分类

vgg的训练技巧:

1.尺度扰动

2.预训练模型初始化

vgg的测试技巧：

多尺度测试

dense测试

muti-crop测试

多模型融合

背景知识

1.图像描述：将图像描述为一段文字，理解标记间的关系从而生成人类可读的句子

2.多模态学习用机器学习方法理解多模态信息

3.表征学习得到好的特征

表征学习的方式

有监督的表示学习

无监督的表示学习

4.纳什均衡

又称为非合作博弈均衡，对于一个策略组合，当其他所有人都不改变策略日没有人会改变自己的策略，则该策略组合就是一个纳什均衡又称为非合作博弈均衡，对于一个策略组合，当其他所有人都不改变策略日没有人会改变自己的策略，则该策略组合就是一个纳什均衡

5.半监督学习

在特征空间中位置相近的无标签样本默认和有标签样本一个标签

6.图像翻译

图像与图像之间以不同形式的转换。根据source domain的图像生成target domain中的对应图像，约束生成的图像和source图像的分布在某个维度上尽量一致

7.图像质量评价（image Quality Assessme

本文标签：小时 GAN

版权声明：本文标题：gan 5小时速成内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728178876a1148197.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

gan 5小时速成

名词解释

前置知识

计算机视觉背景知识

背景知识

更多相关文章

min是分还是秒min是分或者是秒

1s=多少ms

2022人教版六年级上册数学期中考试试卷含答案下载

西安免费及收费停车场汇总

小病无忧,大病可治,《选择中医》效方精华(二)

10m3每小时MBR设计方案

2024年人教版四4年级下册数学期末解答质量监测试卷含答案

列车时刻表

北京列车时刻表

台式机是不是很费电

笔记本电脑没有WiFi选项，3个小时，我试了以下N种方法，终于出现网络了！

如何设置计划任务程序 每6小时运行一次_6步加快开机速度，来比比谁更快？

台式计算机一小时功率,电脑电源功率如何选？电脑1小时能耗多少电？

windows访问ftp文件显示的时间跟实际实际相差8小时

小米十周年，雷军做了一场 4 小时的走心演讲（实录）

3小时零基础入门微信小程序开发2024年最新版

Linux60个小时速成

用Excel做了7天报表，这个领导喜欢的可视化工具，只用了7小时

GAN上的水印，神经网络的IP验证

Windows10时间设置24小时制的方法

发表评论

推荐文章

特洛伊木马

Android平台挖矿木马研究报告

桌面文件不见了怎么办？3个详细教程

【快速解决】Win10系统Win键没反应？教你轻松修复！

新东方四六级写作

热门文章

Paper：《GPT-4 Technical Report》的翻译与解读

Ubuntu 重置密码

CorelDRAW2024注册机，一键免费激活！

windows系统搭建locust环境

在家上网IP地址是固定的吗？

[Android] 虚拟大师“安卓模拟安卓”实现root 应用分身

android4.1.2权限,Android AVD emulator模拟器获取root权限（4.1.2以下）

如何免费pdf全部转化为word版

Android系统 init.rc开机执行shell脚本

跟《经济学人》学英文：2024年08月17日这期 Winston Churchill’s urinal shows Britain’s hang up with heritage

最新文章

8种企业赢利模式

无线增值宝典

【精品，你所不知道的IT高薪】【转贴】清华生7天猎头生活的发现!

凉宫春日的忧郁第二章

计算机科学与技术学习心得

净室软件工程随笔 ----《零缺陷程序设计》读书笔记

深入浅出软件开发技术名词_1

强烈建议每一个想成功的程序员读一读此文章

富爸爸,穷爸爸

管理小故事精髓 100例(转)

创业者怎样才能赚到钱？八种最有效创业赢利模式

软件本地化与汉化

创业知识

管理小故事精髓 100例

50个最好的firefox扩展让你尽情冲浪

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何设置计划任务程序每6小时运行一次_6步加快开机速度，来比比谁更快？

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载