达摩院榜首模型人脸检测MogFace CVPR论文深入解读|电子爱好者

admin管理员组
文章数量:1606758

团队模型、论文、博文、直播合集，点击此处浏览

一、开源

1.）论文链接：MogFace: Towards a Deeper Appreciation on Face Detection

2.）模型&代码：https://modelscope/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

3.）简易应用：https://modelscope/studios/damo/face_album/summary

二、背景

人脸检测算法是在一幅图片或者视频序列中检测出来人脸的位置，给出人脸的具体坐标，一般是矩形坐标。它是人脸关键点、属性、编辑、风格化、识别等模块的基础。本文通过实验观察发现，对应设计出如下三个模块构建出一个高性能的人脸检测器MogFace：1.）动态标签分配策略（dynamic label assignment），2.）误检上下文相关性分析（FP context analysis），3.）金字塔层级监督信号分配（pyramid layer level GT assignment）。该方法的模型在WIDER FACE榜单上取得了截止目前将近两年的六项第一。

三、观察

1.1 动态标签分配策略（dynamic label assignment）

为每个anchor点定义cls和reg目标是训练检测器的必要过程，在人脸检测中这个过程称之为标签分配（Label Assignment）。最近，标签分配吸引了诸多研究人员的注意，在人脸检测及通用物体检测领域提出了一系列方法，例如：OTA、PAA，ATSS以及HAMBox。如示例图(a)，标签分配过程依赖4个元素。分别是：1.）offline information: a.）IoU (anchor与ground-truth框的IoU) ， b.）CPD (anchor与ground-truth中心点的距离) ，2.）online information: a.）PCS (cls分支对anchor的前景分类概率值) ，b.）PLC (reg分支对anchor的预测坐标值)。

但是，目前的标签分配方法存在三个问题。1.）若只用offline information做静态标签分配，那么会有很多具备更强回归能力的negative anchor无法被有效利用起来，会导致标签分配策略欠饱和。2.）若过度信任online information动态调整正负anchor时（如OTA和Hambox），由于online information属于预测信息可信度不高，会导致标签分配策略错误多，极端情况下会陷入trivial 的分配结果。 3.) 若引入大量超参（K in ATSS, alpha in OTA）做标签分配，则当数据集分布发生变化时，需要大量的调参时间。

1.2 误检上下文相关性分析（FP context analysis）

在实际应用中，人脸检测器并不会十分care AP的指标，而对误检（false positive [FP]）的数量十分敏感。针对这个问题，目前的做法是收集大量带有FP的图片去fine-tune或者from scratch训练检测器，来帮助检测器了解更多范式的FP，但是我们发现有些频繁出现在训练集中的的FP在这种策略下无法有效解决。这篇文章，我们发现了一个有趣的现象：对于同一个FP，当它的context发生变化时，对于同一个检测器来说它可能就不是FP了。如下图(c)，最左面的图片里日历是FP，剩余两张日历都不是FP。

1.3 金字塔层级监督信号分配（pyramid layer level GT assignment）

scale-level 数据增强策略常常作通用物体检测以及人脸检测中解决scale variance主要手段。如图(b)所示，相对于COCO，人脸检测数据集Wider Face 中人脸的尺度分布更为严峻。为此，我们分提出了一个新的问题，如何合理的分配ground-truth 在不同pyramidlayer上的分布？即检测器的性能与每个pyramidlayer匹配ground-truth的个数之间的关系是什么？是否越多越好？通过严格的对比实验我们发现：“对于所有的pyramid layer来说，并不是这个pyramid layer匹配到越多的ground-truth就越好”。这说明要挖掘每一个pyramidlayer的最好性能，需要控制在这个pyramidlayer上的ground-truth分配的比例。

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

针对上述“动态标签分配策略（dynamic label assignment）”观察分析，本文提出了在里面一种自适应的在线增量锚挖掘策略（Ali-AMS），它基于standard anchor matching 策略，并进一步adaptive 帮助outlier face匹配anchor。如下：

2.2 Hierachical Context-Aware Module (HCAM)

基于上述“误检上下文相关性分析（FP context analysis）”观察分析，发现“对于同一个FP，当它的context发生变化时，对于同一个检测器来说他可能就不是FP了”，我们进一步提出了一个two-step的模块来显示的encode context 信息来帮助区分FP和TP，显著减少了FP的数量。

2.3 Selective Scale Enhancement Strategy （SSE）

基于上述的“金字塔层级监督信号分配（pyramid layer level GT assignment）”观察分析，发现“对于所有的pyramid layer来说，并不是这个pyramid layer匹配到越多的ground-truth就越好”，我们提出通过控制pyramid layer 匹配的ground-truth的数量来最大化pyramid layer 的性能。

五、实验

3.1 Ablation Study

3.2 Comparison with sota

六、应用

接下来给大家介绍下我们研发的各个域上的开源免费模型，欢迎大家体验、下载（大部分手机端即可体验）：

https://modelscope/models/damo/cv_resnet50_face-detection_retinaface/summary

https://modelscope/models/damo/cv_resnet101_face-detection_cvpr22papermogface/summary

https://modelscope/models/damo/cv_manual_face-detection_tinymog/summary

https://modelscope/models/damo/cv_manual_face-detection_ulfd/summary

https://modelscope/models/damo/cv_manual_face-detection_mtcnn/summary

https://modelscope/models/damo/cv_resnet_face-recognition_facemask/summary

https://modelscope/models/damo/cv_ir50_face-recognition_arcface/summary

https://modelscope/models/damo/cv_manual_face-liveness_flir/summary

https://modelscope/models/damo/cv_manual_face-liveness_flrgb/summary

https://modelscope/models/damo/cv_manual_facial-landmark-confidence_flcm/summary

https://modelscope/models/damo/cv_vgg19_facial-expression-recognition_fer/summary

https://modelscope/models/damo/cv_resnet34_face-attribute-recognition_fairface/summary

本文标签：达摩榜首模型论文 CVPR

版权声明：本文标题：达摩院榜首模型人脸检测MogFace CVPR论文深入解读内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728512011a1161643.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

达摩院榜首模型人脸检测MogFace CVPR论文深入解读

团队模型、论文、博文、直播合集，点击此处浏览

一、开源

二、背景

三、观察

1.1 动态标签分配策略（dynamic label assignment）

1.2 误检上下文相关性分析（FP context analysis）

1.3 金字塔层级监督信号分配（pyramid layer level GT assignment）

四、方法

2.1 Adaptive Online Incremental Anchor Mining Strategy (Ali-AMS)

2.2 Hierachical Context-Aware Module (HCAM)

2.3 Selective Scale Enhancement Strategy （SSE）

五、实验

3.1 Ablation Study

3.2 Comparison with sota

六、应用

更多相关文章

谣言检测论文精读——4.WWW2019-Detect Rumors on Twitter by Promoting Information Campaigns with GAN

轮廓检测论文解读 | Richer Convolutional Features for Edge Detection | CVPR | 2017

Uber Thomas 论文整理

win10环境配置ollama-ui运行llama3模型

谷歌三维模型下载以及必备软件介绍

谷歌Gemini AI模型使用指南

CVPR 2022 | 基于稀疏 Transformer 的单步三维目标识别器

基于SSM的献血管理系统设计与实现(论文+源码)_kaic

论文翻译：OK-Robot: What Really Matters in Integrating Open-Knowledge Models for Robotics

教程：结合大语言模型和知识图谱减少问答系统中的幻觉现象

深度学习论文阅读目标检测篇（一）：R-CNN《Rich feature hierarchies for accurate object detection and semantic...》

高效使用chatGPT等大模型方法

教你三招，玩转AI通用大模型ChatGPT

2023年系统分析师论文模拟题--押题

使用ollama，MacOS也能轻松玩转大语言模型

开源大语言模型完整列表

linux下虚拟安装cad,LeoCAD下载 LeoCAD(虚拟乐高模型创建工具) 32位64位 Linux版 v18.01 官方英文安装版 下载-脚本之家...

BeMapNet：End-to-End Vectorized HD-map Construction with Piecewise Be ́zier Curve——论文笔记

将PDF论文的公式截图后转成Word可编辑公式

AutoDL如何下载huggingface模型

发表评论

推荐文章

v880+ 手机自用软件介绍

【经典再现】风车动力 ghost xp sp3 老机专用第五版V5.0

King3399 SDK（ubuntu文件系统）编译简明教程

HTTPS从认识到线上实战全记录

edge java_在Windows 10上，Edge浏览器不支持插件，因此Java无法运行

热门文章

【★老机首选☆值得信赖★】老机专用 GhostXP SP3 专业装机通用版 V2011.04

Windows经常蓝屏 启动速度慢 经常死机 +常用dos命令（win10、win11适用）

火绒安全软件 5.0.59.0 官方版

失败的程序员生涯系列（3）——第一次搭建商业化系统

谷歌play服务已停止运行_停止Google Play将图标添加到已安装应用的主屏幕

十大ios开发者喜爱的开源库

php显示word,php 浏览word

Onekey Ghost找不到硬盘分区怎么办

月活超抖音的这款App 除了“盗取信息”还有什么猫腻？

微软疑断自由软件开发者“活路”，禁止在微软商店发布商业开源

最新文章

你真的了解Linux(Deepin)的软件商店吗？（内附极力推荐的软件）

iPhone官方商店软件下载---免费看各种剧第①弹【iOS版包括iPad】

linux系统商店下载的软件到哪了,linux下使用第三方商店安装应用

联想软件商店默认安装及下载路径在哪里，是否可以更改？

麒麟桌面操作系统V10 软件商店下载软件失败

苹果商店下载不了软件怎么办？这几招可以试试看

android 平板端应用商店,安卓平板电脑软件商店--乐商店是目前最安全的Android应用商店...

联想软件商店安装教程

麒麟V10系统-如何获取软件商店下载的安装包

联想电脑管家-应用商店下载软件提示失败，如何处理

银河麒麟里面的软件商店无法下载安装软件报错#0002

解决Ubuntu软件商店无法更新问题

ubuntu20解决软件商店不可以问题

Ubuntu下使用优麒麟软件商店下载安装并使用微信

麒麟软件商店报错误代码0006的解决方法

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

linux下虚拟安装cad,LeoCAD下载 LeoCAD(虚拟乐高模型创建工具) 32位64位 Linux版 v18.01 官方英文安装版下载-脚本之家...

Windows经常蓝屏启动速度慢经常死机 +常用dos命令（win10、win11适用）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载