Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪|电子爱好者

admin管理员组
文章数量:1584188

泡泡点云时空，带你精读点云领域顶级会议文章

标题：Complexer-YOLO: Real-Time 3D Object Detection and Tracking on Semantic Point Clouds

作者：Martin Simon, Karl Amende, Andrea Kraus, Jens Honer,Timo S¨ amann, Hauke Kaulbersch and Stefan Milz Valeo Schalter und Sensoren GmbH

来源：arxiv 2021

编译：黄群军

审核：lionheart

转载：泡泡机器人SLAM

摘要

Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪三维目标的精确检测是计算机视觉中的一个基本问题，在自动驾驶、AR/VR以及机器人领域中都起到巨大的作用。在本文中，基于自动驾驶领域最为先进的3D目标检测与视觉语义分割技术，我们提出了一种新的融合神经网络。此外，我们还引入了尺度旋转平移分子（SRTs），这是一种快速且高度参数化的对比目标检测效果的评估指标，它将我们的推理时间提高了20%同时促使训练时间减半。在此基础上，我们将最先进的在线多目标特征跟踪技术应用于目标测量中，进一步提高了利用时间信息的准确性和鲁棒性。我们在KITTI上的实验表明，我们在所有相关类别中都取得了与最新技术相同的结果，同时保持了性能和准确性的折衷，并且仍然实时运行。此外，我们的模型是第一个融合视觉语义和三维目标检测的模型。

主要贡献

1. 视觉类特征：结合了基于相机的快速语义分割生成的可视逐点类特征

2. 体素化输入：扩展Complex-YOLO处理具有可变尺寸深度而不是固定RGB贴图的体素化输入特征

3. 真正的3D预测：扩展回归网络以预测3D框的高度和z偏移，以在三个维度上处理目标。

4.刻度-旋转-平移分数（SRT）：考虑到检测到的对象的3DoF姿势（包括偏航角，例如宽度，高度和长度），我们引入了SRT，这是一种用于3D盒子的新验证指标，明显比IoU更快。

5.多目标跟踪：在线特征跟踪器的应用与检测网络分离，可以基于实际的物理假设进行结合时间的跟踪和目标实例化。

6.实时功能：尽管语义分割，3D对象检测（例如多目标跟踪）方面有最新的成果，但我们提供了新的具有出色的全面实时功能的跟踪管道。可以将管道直接引入感知城市风光的每辆自动驾驶汽车中。

算法结构

下图为Complexer-YOLO处理管道：

A.点云预处理

每个体素，在其3D空间中至少存在一个点，并且对前置相机可见，每个体素都填充有从范围[1、2]中的语义映射中提取的归一化类值。

B.深度和颜色渲染

通过步长2的卷积来替换最大池化层，并添加残差联接层。总共有49个卷积层。此外，我们加入目标高度h和地面偏移z作为目标回归参数，并将二者合并到多单元损失函数中。

在训练过程中，通常使用IoU来对比检测值和地面真值。但是，在比较旋转边框时，以上参考值存在缺点。如果两个边框的大小和位置相同，角度相差π 这两个边框之间的IoU是1，这意味着它们完全匹配。显然不是这样，因为两个边框之间的角度存在最大的差异。因此，在训练一个网络时，它不会因为预测这样的边框而受到惩罚甚至鼓励。这将导致对目标方向的错误预测，同时计算三维空间中旋转边框的精确IoU也是一项耗时的任务。

为了克服这两个问题，我们引入了一个新的高度参数化的简单评价指标称为缩放旋转平移分数（SRTs）。

所有之前的分数都在区间[0，1]内，可以使用简单的加权平均值和惩罚点组合成最终分数（Ssrt）。

SRT与网络必须完成的三个子任务（旋转、位置、大小）完美地结合在一起，以便预测具有偏航角的3D边框。

C.LMB RFS中的扩展目标模型

在LMB更新步骤中，每个预测目标与时间步的每个测量相关联，并且根据所定义的测量模型执行更新。

主要结果

Abstract

Complexer-YOLO: Real-Time 3D Object Detection and Tracking on Semantic Point Clouds Accurate detection of 3D objects is a fundamental problem in computer vision and has an enormous impact on autonomous cars, augmented/virtual reality and many applications in robotics. In this work we present a novel fusion of neural network based state-of-the-art 3D detector and visual semantic segmentation in the context of autonomous driving. Additionally, we introduce Scale-Rotation-Translation score (SRTs), a fast and highly parameterizable evaluation metric for comparison of object detections, which speeds up our inference time up to 20% and halves training time. On top, we apply state-of-the-art online multi target feature tracking on the object measurements to further increase accuracy and robustness utilizing temporal information. Our experiments on KITTI show that we achieve same results as state-of-the-art in all related categories, while maintaining the performance and accuracy trade-off and still run in real-time. Furthermore, our model is the first one that fuses visual semantic with 3D object detection.

本文仅做学术分享，如有侵权，请联系删文。

下载1

在「3D视觉工坊」公众号后台回复：3D视觉，即可下载 3D视觉相关资料干货，涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复：3D视觉github资源汇总，即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复：相机标定，即可下载独家相机标定学习课件与视频网址；后台回复：立体匹配，即可下载独家立体匹配学习课件与视频网址。

重磅！3DCVer-学术论文写作投稿交流群已成立
扫码添加小助手微信，可申请加入3D视觉工坊-学术论文写作与投稿微信交流群，旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群，目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注：研究方向+学校/公司+昵称，例如：”3D视觉 + 上海交大 + 静静“。请按照格式备注，可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号

3D视觉从入门到精通知识星球：针对3D视觉领域的视频课程（三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程）、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕，更有各类大厂的算法工程人员进行技术指导。与此同时，星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息，打造成集技术与就业为一体的铁杆粉丝聚集区，近2000星球成员为创造更好的AI世界共同进步，知识星球入口：

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~

本文标签：语义实时目标 Complexer Yolo

版权声明：本文标题：Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1727933224a1138638.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Complexer-YOLO：基于语义点云的实时三维目标检测与跟踪

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款 圈里有高质量教程资料、可答疑解惑、助你高效解决问题觉得有用，麻烦给个赞和在看~

更多相关文章

amd的cpu跑python_Windows下用cpu模式跑通目标检测py-faster-rcnn 的demo.py

【基于Ubuntu下Yolov5的目标识别】保姆级教程 | 虚拟机安装 - Ubuntu安装 - 环境配置(AnacondaPytorchVscodeYolov5) |全过程图文by.Akaxi

【语义分割】1、语义分割超详细介绍

Python Apex YOLO V5 6.2 目标检测 全过程记录

oracle 数据实时同步方案,ORACLE数据库热备方案

一种实时镜像的服务器数据在线备份方法与流程

目标跟踪OTB、VOT、UAV123、TC128、GOT-10k、LaSOT和TrackingNet数据集百度云下载

案例：vivo基于Java技术栈的实时监控系统

基于yolo v3的交通灯识别系统

计算机网络，ping连接同一个WiFi的电脑，回复无法访问目标主机，但是数据包已接收（防火墙已关）

群晖能不能像服务器一样共享桌面,电脑桌面与群晖NAS双向实时同步

探索高效目标检测新境界：PyTorch版PP-YOLOE全面解析与应用指南

Cognitive Semantic Communication Systems Driven by Knowledge Graph——使用描述语义信息的三元组构建语义知识图

Vue3 - [兼容PC和手机H5] 详细监听浏览器刷新关闭前进后退事件，用户点击关闭和刷新页面前 “拦截“ 操作并弹出提示框（实时监听用户关闭或刷新网页，触发时文字提醒并执行自定义操作）

使用react+node调用科大讯飞api实现实时语音听写（流式版）

基于MATLAB GUI界面的MCU串口实时绘图设计

关于vue项目移动端实时调试无法启用所踩的坑

【云计算学习教程】软件（程序）是什么？_实时输入 输出是指 cpu 执行输入 输出步骤时,立即完成输入 输出动作

如何在手机APP中通过H5方式集成监控摄像头实时直播画面

YOLOv5永不缺席 | YOLO-Pose带来实时性高且易部署的姿态估计模型！！！

发表评论

推荐文章

Photoshop CC2015软件安装教程

友盟+u-apm：卡顿分析及优化卡顿的工具

CasaOS玩客云本地部署AList网盘神器并实现远程管理下载任务

Typora+PicGo+七牛图床+百度网盘组合最好用的markdown编辑、分享功能

win7计算机配置查询,win7电脑配置怎么看_win7电脑配置怎么查-win7之家

热门文章

⚡【C++要笑着学】(26) 继承：子类默认成员函数 | 单继承与多继承 | 钻石继承 | 虚拟继承 | 继承和组合

【渗透测试实战】PHP语言有哪些后门？以及利用方法

浩辰CAD软件适配国产麒麟系统获得认证！

Win10电脑Task Host Window阻止关机的解决方法

手机联系人不见了怎么恢复，试下这2招

Android模仿QQ音乐播放旋转的圆形ImageView

实现音乐自由——免费听（全网音乐）+歌单批量下载MP3方法（某易云）

Python爬虫案例：下载酷某音乐文件

Which organization earns the most revenue through the Olympic Games?

如何给文件夹设置密码——电脑文档怎么加密?分享文件加密四个方法

最新文章

编曲软件FL Studio 20.99中文版2023最新免费下载

python3中文版下载手机版,python3.0中文版下载

第五章 Windows 7备份与恢复

win10和win7游戏测试软件,Win10系统和Win7玩游戏哪个更快？评测在这里！

在计算机上怎么搜共享打印机,如何共享电脑中的打印机？共享电脑打印机步骤...

硬盘恢复工具汇总6款，如得神力，助你轻松找回丢失文件！

python3手机中文版下载,python中文手机版安装

手机版腐蚀rust_腐蚀Rust下载腐蚀Rust中文版下载-游迅网

一键GHOST 硬盘版的安装运行教程

计算机无法安装hp网络打印机,安装HP网络打印机步骤

适用于 Windows 的 8 大数据恢复软件

python中文版下载官网-Python下载 v3.8.3 官方中文版

python3ide下载手机安卓版,python3ide下载安卓中文版

一键硬盘安装ghost win10系统

服务器系统比win10流畅么,win10比win7快吗_win7跟win10哪个更流畅一些

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

学习3D视觉核心技术，扫描查看介绍，3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用，麻烦给个赞和在看~

Python Apex YOLO V5 6.2 目标检测全过程记录

【云计算学习教程】软件（程序）是什么？_实时输入输出是指 cpu 执行输入输出步骤时,立即完成输入输出动作

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载