爱奇艺多模态视频人物识别挑战赛项目总结|电子爱好者

admin管理员组
文章数量:1659318

文章目录

一：任务目标
二：主要思路
三：实验细节
- 3.1数据集介绍
- 3.2人脸提取与去噪
- 3.3网络结构
- - Deep Residual Learning for Image Recognition（CVPR 2016最佳论文）
  - ArcFace:Additive Angular Margain Loss for Deep Face Recogniton（CVPR 2018）
四：实验结果

一：任务目标

爱奇艺联合中国模式识别与计算机视觉大会（PRCV2018）共同举办“多模态视频人物识别挑战赛”。爱奇艺将面向参赛者开放目前全球最大的明星视频数据集（iQIYI-VID），参赛者使用提供的数据集，本地调试模型，然后使用训练好的人物识别模型，预测视频测试集中出现的人物身份，比赛采用MAP@100作为评价标准

二：主要思路

使用MTCNN网络对每个视频逐帧进行抽取人脸抽取与校正，并对抽取的人脸图片进行筛选与去噪工作，将清理好的图片根据比赛提供的label文件放入到以ID命名的文件夹下，将整理好的图片放入网络进行训练模型，最后根据调试好的模型进行预测测试视频每帧图像的ID，使用投票法判断视频属于哪个人物ID。

三：实验细节

3.1数据集介绍

4934个人物
视频片段总数565372条，其中训练集219677，验证集172860，测试集172,835
源视频文件大小训练集125G，测试集167G

3.2人脸提取与去噪

下图是我们对其中part1数据集做的一个分析，可以发现人脸数量服从从未分布，人脸数量很少的视频也是存在的

所以我们做了如下操作
第一次操作：将训练集视频，每5帧抽取图像，MTCNN阈值设置为了0.8，0.95，0.98。
第一次操作后，结果发现，有559个ID下的图像不足100。
第二次操作：删除了上述的559个ID，从训练集视频中，重新抽取（由于这些ID视频数量较少，因此耗费时间很少）。每两帧抽取，MTCNN阈值设置为了0.8，0.9，0.95。第二次操作后，结果发现，仍有267个ID下的图像不足100。
第三次操作：删除上述的267个ID，设置为不隔帧抽取，其余如第二次操作。
目的：去除噪声，提供均衡数据。

3.3网络结构

对于网络结构的构建，我们小组查阅了一下两篇论文：

Deep Residual Learning for Image Recognition（CVPR 2016最佳论文）

ArcFace:Additive Angular Margain Loss for Deep Face Recogniton（CVPR 2018）

Deep Residual Learning for Image Recognition
1.提出问题：之前文章谈到GoogLeNet和VGG，人们开始认为增加网络的层数，即让网络变深似乎能进一步提高分类任务的准确性。于是，微软研究院的何凯明团队提出了这样一个问题：学些更好的网络是否像堆叠更多的层一样容易？当更深的网络能够开始收敛时，暴露了一个退化问题：随着网络深度的增加，准确率达到饱和（这可能并不奇怪）然后迅速下降。意外的是，这种下降不是由过拟合引起的，并且在适当的深度模型上添加更多的层会导致更高的训练误差，正如[10, 41]中报告的那样

图1 20层和56层的“简单”网络在CIFAR-10上的训练误差（左）和测试误差（右）。更深的网络有更高的训练误差和测试误差。
2.提出残差网络idea

他为什么有效：比如说有一种解释是通过跨层（skip-layer）可以把loss反传到中间的很多层，解决了梯度传播的问题。另一种解释认为ResNet通过skip-layer，可以做到深度方面的多模型融合。
3.取得的成就
他为什么有效：比如说有一种解释是通过跨层（skip-layer）可以把loss反传到中间的很多层，解决了梯度传播的问题。另一种解释认为ResNet通过skip-layer，可以做到深度方面的多模型融合。

ArcFace:Additive Angular Margain Loss for Deep Face Recogniton（CVPR 2018）

目前深度卷积神经网络在人脸识别任务上取得了很好的效果，不同的神经网络主要在训练数据集、网络设置和损失函数三种属性有所区别，
文章据此做了相关改进，并主要有以下四个贡献
1.清洗了最大人脸公共训练数据集（MS1M）和测试数据集（MegaFace）
2.探索不同网络设置，并分析精度与速度之间的关系
3.提出了一种几何可解释的损失函数ArcFace，并优于softmax，SphereFace和CosineFace
4.在MegaFace人脸数据集上取得了最先进的表现
1.从softmax到arcFace

令偏置b为0，然后权重和输入的内积用上面式子表示，用L2正则化处理Wj使得||Wj||=1，L2正则化就是将Wj向量中的每个值都分别除以Wj的模，从而得到新的Wj，新的Wj的模就是1。

然后一方面对输入xi也用L2正则化处理，同时再乘以一个scale参数s；另一方面将cos(θyi)用cos(θyi+m)，

2.使用二分类进行损失函数的几何解释
这是决策边界函数

这是决策边界图像

在ArchFace中是直接在角度空间（angular space，也就是横纵坐标是角度θ1和θ2，不是softmax或CosineFace中的cosθ1和cosθ2）中最大化分类界限。
3.实验证明arcface损失函数缺失表现很好

最后我们使用Mxnet框架，使用ResNet作为基础网络结构，ArcFace作为损失函数。在四块Tesla k40显卡进行训练网络
训练时，我们通过设置不同参数（如ArcFace的m值）来进行优化网络
预测时，我们采用两种方式，
一种是通过直接通过训练好的网络的具有4934个节点的全连接层传入softmax进行预测
一种是抽取网络中提取的人脸512维特征使用聚类算法聚出4934个类中心进行预测

四：实验结果

我们对训练的模型进行了提交，其中最好的模型，我们排33名（总共397只队伍参加）

本文标签：挑战赛多模人物项目视频

版权声明：本文标题：爱奇艺多模态视频人物识别挑战赛项目总结内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729833453a1214239.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

爱奇艺多模态视频人物识别挑战赛项目总结

文章目录

一：任务目标

二：主要思路

三：实验细节

3.1数据集介绍

3.2人脸提取与去噪

3.3网络结构

Deep Residual Learning for Image Recognition（CVPR 2016最佳论文）

ArcFace:Additive Angular Margain Loss for Deep Face Recogniton（CVPR 2018）

四：实验结果

更多相关文章

爱奇艺多模态视频人物识别挑战赛项目总结

两行代码下载网页视频~

爱奇艺视频网站数据清洗整理和结论研究

【web逆向】*qiyi视频签名vf逆向分析

利用爱奇艺开放平台实现视频托管回调播放（一）——获取授权

MAC下downie下载网页视频报错“转换错误”解决方案

获取优酷(youku)，土豆(tudou)，乐视(letv)，爱奇艺(iqiyi)等HTML5页面上的视频真正地址

免费报名 | 爱奇艺ZoomAI视频增强技术的应用

下载netflix视频linux,Netflix的正版视频可以离线下载到手机上了

爱奇艺手机客服端储存的视频，如何在手机文件夹里面找到啊？

自媒体批量下载短视频软件，批量下载短视频有诀窍

Downie 4 for Mac(最好用的视频下载软件)

android html5播放器,用 HTML5 播放器在 iOS 或 Android 等移动设备上播放视频

安卓开原项目汇总

逆向PPTV视频真实播放地址全过程（Java版）

很酷,酷播wordpress视频插件(支持PC安卓苹果跨平台播放)

手机端网页视频不显示缩略图HTML,移动端H5视频页面部分体检兼容问题

Android开发基于rtmp实现视频直播

Android视频直播的实现（包括服务器搭建）

Android视频直播的实现（推流完整实现001）

发表评论

推荐文章

跟着博主玩转计算机组成结构--中央处理器CPU（不知道CPU干啥的小伙伴看过来）

cad卸载不干净_【实用】流氓软件卸载不干净？

增霸卡传输掉线无法登录再次登录时间长

win10笔记本打开只有飞行模式的解决方法

Python学习之路(Win7)之简明python教程

热门文章

fiddler抓包工具安装以及初级使用教程——windows系统

[深度学习] loss不下降的解决方法

Apple设计中的黄金分割

小红书 标签 HTML5,html5仿小红书的图片标签功能

【漫事杂谈003】电脑弹出2345热点资讯的处理办法

matlab吃cpu还是显卡_老电脑该升级CPU、硬盘还是内存、显卡？大白话告诉你该怎么做...

计算机用户无法删除文件,Win7电脑有些文件删不掉怎么办？

KMS激活工具的工作原理

livp图片怎么打开以及怎么转换成jpg格式教程

爱奇艺如何设置最小化显示在托盘

最新文章

解决 windows 下浏览器无法上网，QQ微信正常上网

CentOS 7配置静态IP后，却无法上网

解决Linux系统不能上网问题

微信能上但浏览器无法上网

虚拟机可以连接，但是不能上网

浏览器无法上网，其他软件可以

树莓派做旁路网关 及 无法上网解决

Windows TUN模式无法上网CPU占用100%问题

打开fiddler 电脑无法上网问题

笔记本计算机被限制无法上网,电脑上网受限制或无法连接怎么办 电脑上网受限制或无法连接的解决方法...

Ubuntu20.04安装后无法上网解决办法。

virtual box Nat无法上网原因

能PING 同外网但是无法上网的解决方法

解决KVM虚拟机使用NAT网络配置无法上网问题

Ubuntu更改内核版本后无法上网

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

小红书标签 HTML5,html5仿小红书的图片标签功能

树莓派做旁路网关及无法上网解决

笔记本计算机被限制无法上网,电脑上网受限制或无法连接怎么办电脑上网受限制或无法连接的解决方法...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载