ICCV 2019 |Deep Contextual Attention for Human-Object Interaction Detection论文阅读笔记|电子爱好者

admin管理员组
文章数量:1589780

人物交互检测是视觉关系检测任务中非常重要的一类任务，对于场景的深入理解至关重要，现在很多方法将其分解为目标定位与交互识别，尽管取得了一定的进展，但是这些方法仅仅依赖于人和物体的外观而忽略掉有效的上下文信息，但是这些信息对于捕获他们之间的细微交互是非常重要的。本文提出了一个用于人物交互检测的上下文注意力框架，该方法通过学习实例的上下文感知外观特征来利用上下文信息，然后使用注意力模块自适应的选择与实例相关的上下文信息，以突出可能包含人物交互的图像区域。该方法在V-COCO上获得了4.4%的mAProle的提高，达到47.3%.

论文地址：https://arxiv/pdf/1910.07721v1.pdf

文章目录

研究背景
研究内容
研究方法
实验
结论

研究背景

近年来，以实例为中心的识别任务取得巨大的进展，如目标检测和分割，其在机器人，自动驾驶，监控等领域有着很多的应用，然而这些应用需要对超过实例级任务的场景语义具有更加深入的理解，例如对目标对之间的视觉关系的推理，HOI（human-object interactions detection,人物交互检测）是视觉关系检测的一种，当给出一张图片，其目标不仅仅是定位出人和物体，并且需要识别出他们之间的交互关系，可以归结为检测<人，动作，物体>三元组。由于该问题需要关注带有细粒度动作的以人为中心的交互（如骑马与喂马）还需要关注多个动作同时发生的情况（坐在椅子上一边吃东西一边玩电脑），因此具有很大的挑战性。
以前的方法主要是将其分为为两个部分：目标定位与交互识别。在第一阶段使用两阶段的目标检测器对图像中的人体和物体实例进行定位，第二阶段，在一个多流网络结构中分别检测人体实例和物体实例以及他们之间的两两交互。一些方法通过将结构信息，目光，姿势等线索整合在一起获得了一定的性能提升，但是比起像目标检测实例分割这些视觉任务，HOI检测的效果还远不如人意。
目前的HOI 检测方法趋向于关注人物实例的外观特征，这些特征对于人物交互的评分至关重要，以此来识别三元组。然而一些在不同的图像粒度上容易获得的有效的辅助信息（如上下文信息）却被忽略了。上下文信息对于一些计算机视觉任务的性能提高具有很重要的作用，然而对于HOI检测人物，其探索仍然相对不足。被检测区域周围的上下文消息可能会对标准边界框的外观特征提供补充信息，全局的上下文信息能够对确定某个特定目标种类的存在或缺失提供有价值的图像级的信息。如当检测驾船时，人，船，水可能都出现在图片中，当检测驾车时，仍然存在驾驶的动作，但是上下文信息（水）发生了改变。除了全局的上下文信息，每个人/物实例附近的信息对于区分不同的交互也提供了一些线索。比如包含同一物体的各种交互，吃苹果的动作周围应该是一个脸，切苹果的动作可能是手的一部分。在本文中，将上下文信息利用到HOI 检测中。

相关工作
目标检测：目标检测的发展主要依赖于CNN网络，基于CNN的目标检测器可以分为两阶段和

本文标签：笔记论文 Deep Contextual ICCV

版权声明：本文标题：ICCV 2019 |Deep Contextual Attention for Human-Object Interaction Detection论文阅读笔记内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728076226a1144509.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

ICCV 2019 |Deep Contextual Attention for Human-Object Interaction Detection论文阅读笔记

文章目录

研究背景

更多相关文章

互联网盈利模式研习笔记之一：流量变现

OS和Linux笔记

2022前端笔记

Linux笔记总结 _ 一.常用命令

0.linux笔记.....持续更新...

用iscsi和DHCP搭建一个windows无盘系统站【笔记】

人物交互（human object interaction）论文汇总-2020年

《GRIP++: Enhanced Graph-based Interaction-aware TrajectoryPrediction for Autonomous Driving》论文精读

阅读笔记《Changer: Feature Interaction is What You Need for Change Detection》

论文笔记：Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a Tracker

ICCV 2019 |Deep Contextual Attention for Human-Object Interaction Detection论文阅读笔记

论文笔记 ACL 2021|Capturing Event Argument Interaction via A Bi-Directional Entity-Level Recurrent Decod

【论文阅读】Hierarchical Alternate Interaction Network for RGB-D Salient Object Detection

AI医药论文笔记--MUFFIN: multi-scale feature fusion for drug–drug interaction prediction

论文笔记 ACL 2021|Document-level Event Extraction via Heterogeneous Graph-based Interaction Model with a

读论文，第十三天：DualRing: Enabling Subtle and Expressive Hand Interaction with Dual IMU Rings

《Bilateral Knowledge Interaction Network for Referring Image Segmentation》论文笔记

16.Modularized Interaction Network for Named Entity Recognition 阅读笔记

论文翻译：GraphTCN: Spatio-Temporal Interaction Modeling for Human Trajectory Prediction（行人轨迹预测2020）

【论文阅读】AutoInt: Automatic Feature Interaction Learning via Self-Attentive Neural Networks(CIKM,19)

发表评论

推荐文章

激活ltsb2016_win10 企业版ltsb 2016有方法激活吗

Java代码生成器，一键在线生成，支持自定义模板

Linux常用命令工具

Windows 系统安装

修复 win10 打印服务器失败,win10专业版中使用这些解决方案修复打印机系统错误1797...

热门文章

在线中英文符号转换工具

硬盘提示无法访问此卷不包含可识别的文件系统的资料找回法子

win7修复计算机界面,win7系统软件界面显示不全怎么回事？win7系统软件界面显示不全的修复方法...

电脑回收站删除的文件怎么恢复？小白也能轻松使用的7个方法！

回收站删除的文件怎么恢复

Linux驱动面试题

Windows技巧之注册表

MySQL卸载、安装以及连接Navicat

嵌入式Linux应用开发零基础到就业学习路线，小白到高薪就业，看这一篇就够了！

win10系统开机自动登录的操作方法

最新文章

windows server安装 ssh serverfreesshd通过winscp 传文件

2024年最新HTB靶机渗透之headless(linux-easy)_headless htb(1)，2024年最新斗鱼Linux运维开发二面被刷

双语阅读|South Korea’s fertility rate sinks to record low despite $270bn in incentives

Spring Boot 2.6.1 GA

C++备忘录070：benchmark 说传参时引用是好的

Samba远程Shell命令注入执行漏洞（CVE-2007-2447）

gre 填空错题整理

Why and How zk-SNARK Works 1: Introduction &amp; the Medium of a Proof

第三章 spring-bean之FactoryBeanRegistrySupport（4）

该文件未上传到服务器是怎么回事,WinSCP错误“没有这样的文件”，当上传文件到服务器...

Windows 部署SFTP服务端

【渝粤题库】陕西师范大学201661英语阅读（二）作业（高起专）

现代大学英语精读第二版（第五册）学习笔记（原文及全文翻译）——9 - Al Gore‘s Nobel Peace Prize Acceptable Speech（阿尔·戈尔诺贝尔和平奖获奖感言）

解决springboot 循环依赖

gitlab-runner 进行 npm run build 一直失败

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Why and How zk-SNARK Works 1: Introduction & the Medium of a Proof

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载