Adversarial learning for semi-supervised semantic segmentation|电子爱好者

admin管理员组
文章数量:1658762

GAN生成对抗网络：由两个子网络组成，generator和discriminator,在训练过程中，这两个子网络进行着最小最大值机制，generator用随机向量输出一个目标数据分布的样例，discriminator从目标样例中区分出生成器生成的样例。generator通过后向传播混淆discriminator，依此generator生成与目标样例相似的样例。

这篇论文中，将generator换成一个分割网络(可以是任意形式的分割网络，如：FCN,DeepLab，DilatedNet……,输入是H*W*3,依次是长宽，通道数，输出概率图为H*W*C,其中C是语义种类数),这个网络对输入的图片分割输出一个概率图，使得输出的概率图尽可能的接近ground truth。其中discriminator采用了全卷积网络（输入为generator或ground truth得到的概率图，输出位空间概率图H*W*1,其中其中像素点p代表这个来自gournd truth(p=1)还是generator(p=0)。

代码

在训练中，用半监督机制，一部分是注解数据，一部分是无注解数据。
当用有注解数据时，分割网络由基于ground truth的标准交叉熵损失和基于鉴别器的对抗损失共同监督。注意，训练discriminator只用标记数据。

当用无注解数据时，用半监督方法训练分割网络，在从分割网络中获取未标记图像的初始分割预测后，通过判别网络对分割预测进行传递，得到一个置信图。我们反过来将这个置信图作为监督信号，使用一个自学机制来训练带masked交叉熵损失的分割网络。置信图表示了预测分割的质量。

对抗网络的半监督训练

输入图像 $x_n$ 大小为H*W*3, 分割网络表示为 $s(·)$ ,预测概率图为 $s(x_n)$ 大小为H*W*C。全卷积discriminator表示为 $D(·)$ ,其输入有两种形式：分割预测 $s(x_n)$ 和one-hot编码的gournd truth $Y_n$ .

训练discriminator网络：

最小化空间交叉熵损失 $L_D$ ,其表示为：

LD=−∑h,w(1−yn)log(1−(s(xn))(h,w))+ynlog(D(Yn)(h,w)) L D = − ∑ h , w ( 1 − y n ) l o g ( 1 − ( s ( x n ) ) ( h , w ) ) + y n l o g ( D ( Y n ) ( h , w ) ) $L_D=-\sum_{h,w} (1-y_n)log(1-(s(x_n))^{(h,w)})+y_nlog(D(Y_n)^{(h,w)})$
当输入来自分割网络时 yn=0 y n = 0 $y_n=0$ ,若来自ground truth则为 yn=1 y n = 1 $y_n=1$ .
为了将ground truth转换为C通道的概率图，我们用one-hot机制进行编码，即如果像素 x(h,w)n x n ( h , w ) $x_n^{(h,w)}$ 输入类C，则取1，否则为0.

训练分割网络：

这里使用的损失是多任务损失：

Lseg=Lce+λadvLadv+λsemiLsemi L s e g = L c e + λ a d v L a d v + λ s e m i L s e m i $L_{seg}=L_{ce}+λ_{adv}L_{adv}+λ_{semi}L_{semi}$
其中 Lce L c e $L_{ce}$ ， Ladv L a d v $L_{adv}$ 和 Lsemi L s e m i $L_{semi}$ 分别代表 multi-class cross entropy loss, the adversarial loss,和the semi-supervised loss，这里的 λadv λ a d v $λ_{adv}$ 和 λsemi λ s e m i $λ_{semi}$ .
这里先考虑用有注解的数据，则：
Lce=−∑h,w∑cϵCY(h,w,c)nlog(s(xn)(h,w,c)) L c e = − ∑ h , w ∑ c ϵ C Y n ( h , w , c ) l o g ( s ( x n ) ( h , w , c ) ) $L_{ce}=-\sum_{h,w}\sum_{c\epsilon{C}}Y_n^{(h,w,c)}log(s(x_n)^{(h,w,c)})$
Ladv L a d v $L_{adv}$ 表示为：
Ladv=−∑h,wlog(D(S(XN))(h,w)) L a d v = − ∑ h , w l o g ( D ( S ( X N ) ) ( h , w ) ) $L_{adv}=-\sum_{h,w}log(D(S(X_N))^{(h,w)})$

用无标签数据训练

由于没有ground truth,因此这里不能使用 $L_{ce}$ ,这里提出了用自学机制在无注解数据中利用被训练的discriminator，大意是被训练的discriminator可以生成一个置信图,即 $D(S(X_n))^{(h,w)}$ ,这个公式用来推断预测结构足够接近gournd truth的区域。这里用一个阈值来二值化置信图， $\hat{Y}=argmax(s(x_n))$ ,使用二值化置信图，半监督损失可以定义为：

Lsemi=−∑h,w∑cϵCI(D(S(xn))(h,w)>Tsemi)∙Y^(h,w,c)nlog(s(xn)(h,w,c)) L s e m i = − ∑ h , w ∑ c ϵ C I ( D ( S ( x n ) ) ( h , w ) > T s e m i ) ∙ Y ^ n ( h , w , c ) l o g ( s ( x n ) ( h , w , c ) ) $L_{semi}=-\sum_{h,w}\sum_{c\epsilon{C}}I(D(S(x_n))^{(h,w)}>T_{semi)}\bullet\hat{Y}_n^{(h,w,c)}log(s(x_n)^{(h,w,c)})$
其中 I(∙) I ( ∙ ) $I(\bullet)$ 是指示函数， Tsemi T s e m i $T_{semi}$ 是阈值，注意在训练期间，自学目标值 Y^n Y ^ n $\hat{Y}_n$ 和指示函数的值为常量，因此上式可以简单看做空间交叉熵损失。

本文标签： Semi Learning ADVERSARIAL Segmentation Semantic

版权声明：本文标题：Adversarial learning for semi-supervised semantic segmentation 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1729813978a1213678.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Adversarial learning for semi-supervised semantic segmentation

对抗网络的半监督训练

训练discriminator网络：

训练分割网络：

用无标签数据训练

更多相关文章

M5Product: Self-harmonized Contrastive Learning for E-commercial Multi-modal Pretraining 论文解读

Keep learning, be curious！目标就在前方，努力就对了。

Statistical Machine Learning GR5241 Spring 2023 Homework 5Python

【主动学习 01】经典综述-Active Learning Literature Survey-Burr Settles(2009)

【论文精读】Deep Learning and the Information Bottleneck Principle

论文分享：Learning Discrete Representations via Information Maximizing Self-Augmented Training

联邦学习笔记—《Communication-Efficient Learning of Deep Networks from Decentralized Data》

Review 4995 Applied Machine Learning

[论文] Feature Squeezing:Detecting Adversarial Examples in Deep Neural Networks

Learning to Rank: From Pairwise Approach to Listwise Approach论文笔记

论文阅读：HybridAlpha: An Efficient Approach for Privacy-Preserving Federated Learning

Learning to Know Where to See: A Visibility-Aware Approach for Occluded Person Re-identification阅读记录

A Spatiotemporal Deep Learning Approach for Unsupervised Anomaly Detection in Cloud Systems

ACTIVE LEARNING FOR CONVOLUTIONAL NEURAL NETWORKS : A CORE -SET APPROACH阅读笔记

VizML: A Machine Learning Approach to Visualization Recommendation

图像语义分割综述（semantic segmentation) 上篇

Conservative Q-Learning(CQL)保守Q学习(一)-CQL1(下界Q值估计)

论文阅读--Conservative Q-Learning for Offline Reinforcement Learning

【论文合集】Semi-Supervised Semantic Segmentation

maching learning入门（四）

发表评论

推荐文章

linux开发板找不到sd卡 需要手动挂载 流程记录（SD卡、TF卡、U盘 ）

苹果TestFlight测试操作图文教程（测试后提交App Store审核）

3d设计计算机配置,专业设计师选什么电脑配置？2018年专业3D建模渲染电脑配置推荐(2)...

oracle安装后，电脑变得很卡，解决办法(安装的是oracle11g)

ESXi直通SATA控制器导致系统盘无法访问的解决办法

热门文章

stm32+ESP8266实现最简单的手机控制LED灯

无法识别U盘解决方案

Windows10修改本地hosts文件

手把手教小白学CSS3,一文就够了

联筑赚：我国盘扣式脚手架行业发展概况与展

App跳转到与手机版QQ公众服务号聊天界面

Docker部署ELK

Temporary表空间100%解决方案(原创)

中国注册税务师协会计算机考试题,2020税务师考试答题方式可以携带计算机进考场吗？...

一点点读懂cpufreq（一）

最新文章

微软网站打不开_WIN系统必备，微软常用运行库合集2018（x86x64）

w ndows7升级的通知,坚持不升级的Win7 用户注意了，微软将这样对付你

linux换win7设置bios,预装win8win8.1改win7设置BIOS步骤方法汇总

计算机丢失120.dll,win7 64位旗舰版系统运行游戏提示计算机丢失mxvcp120.dll的解决方法...

kernelbase.dll故障如何修复，win7故障模块kernelbase的快速处理技巧

怎样给路由器设置密码

电脑win7语音怎么测试软件,win7话筒怎么测试 win7话筒测试方法【图文】

win7点击右键不能新建文件夹怎么办？win7右键不能新建文件夹解决方法

win7现在还能用吗_哪些配置的电脑还可以安装win7系统

win7未更新版本安装jdk8及以上版本报错

win7安装vs2015问题总结

win7下计算机假死,Win7系统电脑经常发生假死现象的五种情况及解决方法

Win7 无法远程桌面 Windows Sever 2012 R2

微软停止为win10服务器,一切为了Win10 微软停售Windows 7和8.1

Win7系统.net framework 安装未成功（内含关键点）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

linux开发板找不到sd卡需要手动挂载流程记录（SD卡、TF卡、U盘）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载