Distilling Object Detectors with Fine-grained Feature Imitation论文解读|电子爱好者

admin管理员组
文章数量:1650774

论文链接

文章目录

1.简介
2.方法
- 2.1 模仿区域的估计
- 2.2 细粒度特征模仿

1.简介

对于以往应用于知识蒸馏的目标检测存在两种方法。第一种来自于论文FitNets: Hints for Thin Deep Nets，是一种基于特征模仿的方法，单纯基于特征模仿的方法，论文中表述为Hint learning的方法会导致性能下降，因为检测模型不同于分类模型，检测模型的检测器更关注实际目标所覆盖的局部区域，而分类模型更专注于全局的纹理。因此，使用特征模仿的方法会导致引入检测模型原本不需关注区域的噪声，从而导致检测性能下降。
整体框架如图1所示：

对于上图1，图中红框和绿框都是预先设定的锚框，红框与标签框有更大的重合度，而绿框则代表附近的目标样本。目标锚框位置附近特征响应的差异代表着教师网络的泛化性能。比如教师网络在互相交叠目标上以及在单个目标上面的响应反应了其如何分离和检测这些拥挤的实例。该论文的方法就是首先去定位这些拥有复杂知识的区域，然后让学生模型在这些区域去模仿教师网络的高级特征。
总结来说，主要贡献有三点：
1）不依赖于教师网络的输出的软标签，而是采用教师高级特征中内部定位的差异。
2）在分类及定位之前进行精细的特征模仿
3）避免了整体特征学习所带来的对背景噪声信息的学习导致的性能下降。

2.方法

整体框架图：

如上图2所示，学生网络通过真实标签和目标anchor附近教师的特征响应进行训练。所设计的特征适应层（feature adaption layer）让学生所引导的特征与教师进行匹配。为了区分这些带信息的位置，我们迭代的计算每一个gtbox和anchor框的IOU map，通过滤除和合并，得到最后生成的模仿掩膜。

2.1 模仿区域的估计

正如图1所示，目标anchor位置附近为每一个目标形成了局部特征区域。对于每一幅图，我们采用gtbox和预先设定的anchor去计算这些区域并形成mask I，并通过参数 ϕ \phi ϕ来控制区域的尺寸。
如图2所示，对于每一个gt框，我们计算其与所有anchor的IOU，其构成了 W × H × K W \times H \times K W×H×K IOU图m。其中，W和H代表特征图的宽和高，K代表预先设定的锚框数量。然后我们找到具有最大IOU值M=max(m)，其乘上阈值因子 ϕ \phi ϕ得到最后的滤波阈值 F = ϕ ∗ M F=\phi * M F=ϕ∗M。对于大于F的IOU图，对其进行或操作得到 W ∗ H W*H W∗H大小的掩膜。
此时分几种情况：
当 ϕ = 0 \phi = 0 ϕ=0的时候，生成的掩膜涵盖特征图的所有位置
当 ϕ = 1 \phi = 1 ϕ=1的时候，生成的掩膜则不包含模仿区域
在试验中，使用 ϕ = 0.5 \phi=0.5 ϕ=0.5可以得到最好的蒸馏效果。

2.2 细粒度特征模仿

图2所示的全卷积适应层（full convolution adaption layer）应用于计算学生和老师特征响应的距离之前。其主要原因有两个：（1）学生的特征通道数量可能跟教师模型的不兼容，使用全卷积适应层可以让他们在进行距离计算的时候更加兼容。（2）即使学生特征通道与教师模型特征通道数量相等，强制学生模型与教师模型进行近似也没办法得到很好的效果。
如公式（1）所示，s代表学生模型所引导的特征，t代表对应教师的特征图。对于长宽分别为W和H的特征图，锚框附近的位置(i,j)可以通过loss进行最小化学生与教师之间的距离：
l = ∑ c = 1 C ( f a d a p ( s ) i j c − t i j s ) 2 l=\sum\limits_{c=1}^{C}(f_{adap}(s)_{ijc}-t_{ijs})^2 l=c=1∑C(fadap(s)ijc−tijs)2 （1）
对于所有特征通道的所有模仿区域（即2.1小节中计算的模仿掩膜I），蒸馏的loss定义为公式（2）：
L i m i t a t i o n = 1 2 N p ∑ i = 1 W ∑ j = 1 H ∑ c = 1 C I i j ( f a d a p ( s ) i j c − t i j s ) 2 L_{imitation}=\frac{1}{2N_p}\sum\limits_{i=1}^{W}\sum\limits_{j=1}^{H}\sum\limits_{c=1}^{C}I_{ij}(f_{adap}(s)_{ijc}-t_{ijs})^2 Limitation=2Np1i=1∑Wj=1∑Hc=1∑CIij(fadap(s)ijc−tijs)2
其中， N p = ∑ i = 1 W ∑ j = 1 H I i j N_{p}=\sum\limits_{i=1}^{W}\sum\limits_{j=1}^{H}I_{ij} Np=i=1∑Wj=1∑HIij （2）
因此便可以定义学生模型的loss为公式(3)：
L = L g t + λ L i m i t a t i o n L=L_{gt}+ \lambda L_{imitation} L=Lgt+λLimitation (3)
其中， L g t L_{gt} Lgt为检测头训练的loss， λ \lambda λ为平衡参数。

本文标签：论文 Detectors object Distilling Fine

版权声明：本文标题：Distilling Object Detectors with Fine-grained Feature Imitation论文解读内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729532668a1205007.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Distilling Object Detectors with Fine-grained Feature Imitation论文解读

文章目录

1.简介

2.方法

2.1 模仿区域的估计

2.2 细粒度特征模仿

更多相关文章

[论文笔记] Exploring service-oriented system engineering challenges: a systematic literature review (SOC...

AI医药方向论文总结（包含DDI和DDS，重点分析药物联合预测）

推荐系统论文笔记（1）:Hybrid Recommender Systems:Survey and Experiments

[论文阅读] (23)恶意代码作者溯源(去匿名化)经典论文阅读：二进制和源代码对比

Dapper Object must implement IConvertible.

关于TypeError: ‘append‘ called on an object that does not implement interface FormData

At least one object must implement IComparable

Axis2 服务器端抛出ServiceClass object does not implement问题解决方法

深度学习论文: Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions

BirdNet: a 3D Object Detection Framework from LiDAR information

研究生新生要怎么看论文？

看英文文献论文方法

Java AQS论文翻译

如何在手机上阅读caj格式论文

浅谈feature-based 和 fine-tune

【论文笔记】Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution

论文笔记：AugFPN: Improving Multi-scale Feature Learning for Object Detection

【论文阅读】【三维目标检测】PV-RCNN: Point-Voxel Feature Set Abstraction for 3D Object Detection

【论文笔记】视频物体检测(VID)系列 FGFA：Flow-Guided Feature Aggregation for Video Object Detection

论文阅读笔记之——《Recovering Realistic Texture in Image Super-resolution by Deep Spatial Feature Transform》

发表评论

推荐文章

惠普战66笔记本进PE系统无硬盘解决方法

Residual Feature Aggregation Network for Image Super-resolution 论文解读

学习笔记 | Feature Toggle

解决UOS家庭版桌面图标消失，文件管理器进不去

计算机上的酷狗音乐被锁定,Win10系统酷狗音乐锁定、解锁歌词图文教程

热门文章

【C++二分查找】2271. 毯子覆盖的最多白色砖块数

基于SSM实现的简易员工管理系统（基于阿里云的网站上线篇）

JetBrain 登录提示JetBrains Account connection error: Connection refused: connect 的解决办法

前端 PDF 预览技巧：标签 vs 插件，如何优雅地展示 PDF 文件

FL Studio 24汉化破解版 v24.4.1.4285(附汉化破解补丁)

永久专业版 | 号称世界上最快的优化，清理，加速，杀毒工具！

[机器学习速成课程]特征组合 (Feature Crosses)-学习笔记

Faster RCNN的检测蒸馏（分类、回归、Feature-level、Feature-level＋Mask）

Python数据处理025：自动特征工具包featuretools的使用方法

认识计算机硬件实验项目,实验1认识计算机的硬件.doc

最新文章

转载win7(windows7旗舰版)声卡High Definition Audio驱动不能安装(安装失败）解决方案

服务器如何开启电脑的虚拟化技术,win7怎么打开vt虚拟化技术|win7在bios开启vt虚化的方法...

windows7的用户账户控制每次重启计算机时都会被关闭,win7系统更改设置总是弹出用户账户控制的解决方法...

驰为vi10旗舰版linux,驰为Vi10平板电脑完全安装Win10步骤 BY Chinasred

windows7系统屏幕一直闪屏的解决教程

win7系统打印机开启服务器,开启打印机服务【设置模式】

服务器真在运行中,win7电脑服务器正在运行中的解决教程

windows 从命令行启动进入系统

计算机文件预览取消,关闭视频文件预览，保留图片文件预览（windows7） -电脑资料...

Win7 64位旗舰版系统取消电脑开机自动检测硬盘的方法

iwork8旗舰版 android,小身材大不凡 酷比魔方iWork8旗舰版评测

windows7 64位旗舰版 完美安装64位Oracle11g+32位plsql

windows7现实计算机内存不足,win7 64位有剩余空间却提示内存不足的解决方法

Windows7共享文档—开启方法及用户权限设置

计算机管理记事本,win7旗舰版系统下自带记事本的强大功能汇总【图文详解】...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

iwork8旗舰版 android,小身材大不凡酷比魔方iWork8旗舰版评测

windows7 64位旗舰版完美安装64位Oracle11g+32位plsql

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载