超越YOLOv5！PP-YOLOv2：更快更好的目标检测网络|电子爱好者

admin管理员组
文章数量:1558951

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

本文转载自：AI人工智能初学者

PP-YOLOv2: A Practical Object Detector

论文：https://arxiv/abs/2104.10419

代码链接：https://github/PaddlePaddle/PaddleDetection

表现SOTA！AP和速度的综合性能优于YOLOv5、EfficientDet等网络，其中一版本可达50.3%AP，50.3 FPS！代码刚刚开源！
作者单位：百度, 早稻田大学

1 简介

注：想了解去年的PP-YOLO一代，详情可见：超越YOLOv4！PP-YOLO：更快更好的目标检测网络

为了解决效率和性能这两个问题，本文全面评估了一系列现有改进，以提高PP-YOLO的性能，同时几乎保持推理时间不变。本文将分析一系列改进，并通过增量消融研究从经验上评估它们对最终模型性能的影响。

通过结合多项有效的改进，在COCO2017上将PP-YOLO的性能从45.9％mAP提升到49.5％mAP。称之为PP-YOLOv2。

在速度方面，PP-YOLOv2在640x640输入尺寸下以68.9FPS的速度运行。具有TensorRT，FP16精度和Batch=1的Paddle推理引擎进一步提高了PP-YOLOv2的推理速度，达到了106.5 FPS。这样的性能超过了具有大致相同数量的参数（即YOLOv4-CSP，YOLOv5l）的现有目标检测器。此外，带有ResNet101的PP-YOLOv2在COCO2017测试开发上达到了50.3％的mAP。

2 PP-YOLO回顾

2.1 Pre-Processing

应用从分布中采样的权重MixUp，其中。

然后，RandomColorDistortion, RandomExpand,RandCrop和RandomFlip以0.5的概率依次应用。

将RGB通道分别减去0.485、0.456、0.406、0.229、0.224、0.225进行归一化处理。

最后，输入大小从[320,352,384,416,448,480,512,544,576,608]均匀抽取。

2.2 Baseline Model

Baseline Model是PP-YOLO，它是YOLOv3的一个增强版本。具体来说，它首先取代ResNet50-vd的BackBone。之后增加了10个几乎可以在不损失效率的情况下提高YOLOv3性能的技巧，如Deformable Conv、SSLD、CoordConv、DropBlock、SPP等。

2.3 Training Schedule

在COCO train2017上，使用随机梯度下降(SGD)对网络进行500K迭代训练，使用分布在8上的96张图像的小批量训练gpu。学习率从0线性增加到4K迭代时为0.005，分别在400K和450K迭代时除以10。Weight decay设为0.0005，动量设为0.9。最后采用梯度裁剪来稳定训练过程。

3 PP-YOLO v2改进点

3.1 Path Aggregation Network

在不同尺度下检测任务是目标检测的一个基本挑战。在实践中，作者开发了一个检测neck，用于构建所有尺度的高级语义特征map。在本文中PP-YOLO采用FPN来组成自底向上的Path。

最近，一些FPN的变体被提出以提高金字塔表征的能力。例如，BiFPN,PAN,RFP等。我们遵循PAN的设计来聚合自顶向下的信息。PAN的详细结构如图2所示。

def pan_module(self, input, filter_list, name=None):
        for i in range(1, len(input)):
            ch_out = input[i].shape[1] // 2
            conv_left = self._conv_bn(
                input[i],
                ch_out=ch_out,
                filter_size=1,
                stride=1,
                padding=0,
                name=name + '.{}.left'.format(i))
            ch_out = input[i - 1].shape[1] // 2
            conv_right = self._conv_bn(
                input[i - 1],
                ch_out=ch_out,
                filter_size=1,
                stride=1,
                padding=0,
                name=name + '.{}.right'.format(i))
            conv_right = self._upsample(conv_right)
            pan_out = fluid.layers.concat([conv_left, conv_right], axis=1)
            ch_list = [pan_out.shape[1] // 2 * k for k in [1, 2, 1, 2, 1]]
            input[i] = self.stack_conv(
                pan_out,
                ch_list=ch_list,
                filter_list=filter_list,
                name=name + '.stack_conv.{}'.format(i))
        return input

3.2 Mish Activation Function

其实Mish激活函数已在YOLOv4、YOLOv5等中被证明是有效的。Backbone采用mish激活函数。然而，作者更喜欢使用预先训练的参数，因为有一个强大的模型（在ImageNet上达到了82.4%的top-1精度）。

为了保持Backbone不变，作者将mish激活函数应用于检测neck而不是Backbone。

def mish(x):
    return x * paddle.tanh(F.softplus(x))

3.3 Larger Input Size

增加输入大小可以扩大目标被感知面积。这样，小尺度的物体信息将比以前更容易被保存。因此，性能将得到提高。

然而，更大的输入大小会占用更多的内存。要应用这个技巧需要减少Batch Size。更具体地说，将Batch Size从每个GPU24张图像减少到每个GPU12张图像，并将最大输入大小从608张扩展到768张。输入大小均匀地从[320,352,384,416,448,480，512、544、576、608、640、672、704、736、768]获取。

3.4 IoU Aware Branch

在PP-YOLO中， IoU aware loss 的计算采用了soft weight format，这与最初的意图不一致。因此改进为应用soft label format。以下是IoU aware loss:

其中t为锚点与ground-truth-bounding box之间的IoU，p为IoU aware branch的原始输出，为sigmoid激活函数。注意，只计算阳性样本的IoU aware loss。通过替换损失函数IoU aware branch比以前更好。

@register
@serializable
class IouAwareLoss(IouLoss):
    """
    iou aware loss, see https://arxiv/abs/1912.05992
    Args:
        loss_weight (float): iou aware loss weight, default is 1.0
        max_height (int): max height of input to support random shape input
        max_width (int): max width of input to support random shape input
    """

    def __init__(self, loss_weight=1.0, giou=False, diou=False, ciou=False):
        super(IouAwareLoss, self).__init__(
            loss_weight=loss_weight, giou=giou, diou=diou, ciou=ciou)

    def __call__(self, ioup, pbox, gbox):
        iou = bbox_iou(
            pbox, gbox, giou=self.giou, diou=self.diou, ciou=self.ciou)
        iou.stop_gradient = True
        loss_iou_aware = F.binary_cross_entropy_with_logits(
            ioup, iou, reduction='none')
        loss_iou_aware = loss_iou_aware * self.loss_weight
        return loss_iou_aware

4 不确定Work的Tricks

这里就简单列举一下吧！具体的分析大家去看论文即可：

Cosine Learning Rate Decay
Backbone Parameter Freezing
SiLU Activation Function

5 实验

5.1 Ablation Studies

可以看出这些Trick的加入对于推理时间虽然有所下降，但是影响并不是非常的大，但是mAP提升是很明显的。

5.2 SOTA对比

论文PDF和代码下载

后台回复：PPYOLOv2，即可下载上述论文

后台回复：CVPR2021，即可下载CVPR 2021论文和代码开源的论文合集

后台回复：Transformer综述，即可下载最新的两篇Transformer综述PDF

重磅！Transformer交流群成立

扫码添加CVer助手，可申请加入CVer-Transformer 微信交流群，方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如Transformer+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲长按加小助手微信，进交流群

▲点击上方卡片，关注CVer公众号

整理不易，请给CVer点赞和在看

本文标签：更快目标网络 PP

版权声明：本文标题：超越YOLOv5！PP-YOLOv2：更快更好的目标检测网络内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727404963a1113269.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

超越YOLOv5！PP-YOLOv2：更快更好的目标检测网络

1 简介

2 PP-YOLO回顾

2.1 Pre-Processing

2.2 Baseline Model

2.3 Training Schedule

3 PP-YOLO v2改进点

3.1 Path Aggregation Network

3.2 Mish Activation Function

3.3 Larger Input Size

3.4 IoU Aware Branch

4 不确定Work的Tricks

5 实验

5.1 Ablation Studies

5.2 SOTA对比

更多相关文章

搭建linux服务器网络代理

远端服务器无响应 请联系网络供应商腾达,移动宽带连接腾达路由器显示 远端服务器无响应。请联系您的网络运营...

Cisco Packet Tracer下载和安装、构建网络拓扑、配置网络设备、跟踪数据包、查看数据包

【OCP】小麦苗OCP（包括11g、12c、18c、19c等）网络班早已开讲，注重实践，报名一次，终身可免费升级学习，推荐有红包...

深度学习目标检测：YOLOv5实现红绿灯检测(含红绿灯数据集+训练代码)

解决win10服务主机：网络服务占用网络宽带的方法（自测有效）

win10笔记本显示网络正常，但是无法使用QQ、微信、不能浏览网页，怎么办？

pp助手苹果版_PP助手将下架？越狱时代已经过去，到底是该喜该悲

手移动网络显示无法连接服务器,为什么我的pp助手显示无法连接网络？

PP助手类应用探究

通过PP助手安装软件

pp助手苹果版_吃药提醒助手ios版下载-吃药提醒助手苹果版下载v1.0

PP越狱助手官方最新版 v1.6.0 绿色版

PP苹果助手 v2.3.0 官方版

PP-ChatOCRv2赋能金融报告信息智能化抽取，新金融效率再升级

从52%到10%‼️pp论文修改助手注册码是多少

Win11有网络，但其他软件都可以正常使用，唯独浏览器上不了网，解决方案

通过脚本的方式让电脑定时检查自己的网络并重连wifi

windows11网络连接正常，但是浏览器打不开的解决办法

网络 启动计算机,电脑进入bios怎么设置网卡启动

发表评论

推荐文章

掌握多屏幕大屏幕的快捷键主要是win键，大大提高工作效率

Cherry键盘-windows键-没反应

【Keil最新注册机】

电脑端微信截图文字识别功能效率更高了

Android开发移动网络连不上后台，wifi却可以问题查找解决；

热门文章

mastercam9.1按alt键卡机，mastercam输入参数卡机需要win10输入法兼容性设置

Ctrl +Tab；Alt +Tab；Win +Tab；Ctrl + Win +左右键

linux 鼠标中键不能用了,如何解决Win10鼠标中键无法正常使用--win10专业版

SSH与FTP跳转到其他服务器的几种方式

kali下安装qqtim最新版

The Market Competition of Domestic Crusher is Intensified in 2014

纯JS解决内嵌iframe全屏（兼容IE火狐谷歌）

2024 FRP内网穿透实现远程桌面

snipaste滚动截图方法_Snipaste——这是我用过最好用的截图贴图工具！

go 电脑屏幕截图，二维码识别 示例

最新文章

对接腾讯企业邮箱（授权免登，获取未读邮件数量）

SpringBoot 腾讯企业邮箱

SpringBoot+JavaMailSender+ 腾讯企业邮箱配置

Spring Boot 使用腾讯QQ邮箱发送邮件

阿里云域名购买、认证、解析腾讯企业邮箱注册、解析

Python3+Scrapy+Selenium腾讯企业邮箱的指定邮件读取功能

Java使用腾讯企业邮箱 、javamail 、 SSL 发送邮件群发

利用python 删除腾讯企业邮箱中多余的邮件

springboot腾讯企业邮箱发送邮件的yml配置

phpmailer发送邮件(QQ企业邮箱和163邮箱)

python 发送邮件 &lt;QQ+腾讯企业邮箱&gt;

python程序下载腾讯企业邮箱附件_python3使用腾讯企业邮箱发送邮件的实例

JAVA实现腾讯企业邮箱发邮件

工作小常识--腾讯QQ企业邮箱POP3SMTP设置

自定义邮箱(腾讯企业邮箱)免费只需一个域名

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

远端服务器无响应请联系网络供应商腾达,移动宽带连接腾达路由器显示远端服务器无响应。请联系您的网络运营...

网络启动计算机,电脑进入bios怎么设置网卡启动

go 电脑屏幕截图，二维码识别示例

Java使用腾讯企业邮箱、javamail 、 SSL 发送邮件群发

python 发送邮件 <QQ+腾讯企业邮箱>

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载