爱奇艺视频拷贝(版权)检测算法|电子爱好者

admin管理员组
文章数量:1659742

向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程公众号：datayx

随着移动互联网的发展和智能手机的普及，短视频已经成为重要的信息传播媒介，与此同时也带来了大量针对版权长视频的侵权行为。为了保护视频制作公司及原创者权益，需要通过自动化方式进行针对短视频的侵权行为检测。当前的侵权行为出现多样化及规模化特点，侵权视频多经过复合变换，要求算法模型中图像特征具有一定鲁棒性，并且有较快执行速度和并发能力。

本次任务将考察经过复合变换后的短视频关联到对应长视频的算法效果，其中不仅要找到短视频的原始长视频，还要计算出对应的时间段。过程中可能包括视频解码抽帧、视频或图像特征及指纹、视频相似检索等相关算法及技术方案。

数据简介

本次竞赛使用数据分为两部分：版权长视频和侵权短视频。

版权长视频由爱奇艺自制视频组成，版权归爱奇艺所有，侵权短视频由版权长视频经过变换制作生成。

假设版权长视频集合A，经过截取生成视频片段集合B，将B经过变换，得到视频片段集合B‘，将视频片段集合B‘合成到短视频集合C中，得到侵权短视频数据集合D，其中C和A不相交（A∩C =Ø）

其中短视频变换包括但不限于以下形式：

数据说明

训练数据集分为3个部分：

• query文件夹，其中包括3000个视频，为侵权视频训练集，格式为mp4，文件名为视频id，例如：b394c1e0-afd9-11e9-a9d1-fa163ee49799.mp4,其中b394c1e0-afd9-11e9-a9d1-fa163ee49799为视频id，与文件train.csv中字段对应

• refer文件夹，其中包括200个视频，为版权长视频视频集，格式为mp4，文件名为视频id，例如，2528707200.mp4，2528707200表示视频id，与文件train.csv中字段对应

• train.csv文件，记录侵权视频和版权长视频对应的关系及具体匹配时间，其中每列有8个空格分隔，具体字段说明参见下表：

本文相关代码项目获取方式：

关注微信公众号 datayx 然后回复 视频检测 即可获取。

AI项目体验地址 https://loveai.tech

当前思路

提取视频关键帧；
通过resnet18提取关键帧特征；
对特征进行PCA降维（失败中）和L2正则化；
所有视频两两计算得相似度矩阵（余弦相似度）；
对于相似度top-K视频对，进行帧级匹配（按相似度建图，跑最长路）。

一些经验

特征不宜过细，采用resnet50提取特征的效果比resnet18差10~20个点；
当前算法对参数比较敏感，目前取相似度前K=20视频进行帧级匹配，帧级匹配阶段，帧间相似度阈值0.85，最大跨度为10帧；
主要瓶颈在于视频级匹配，只要目标视频落入Top-K视频，基本可以得到正确的帧匹配；
query与refer抽帧密度接近可能较好，也可能是抽帧不易过密。进行了query一秒五帧，refer一秒一帧与它们都一秒一帧两组测试，结果一秒一帧不仅运行速度快，而且得分大大高于另一组。

TODO

细粒度抽帧（当前1s抽一帧，感觉已经足够了）；
代码重构（还差video_retrieval）；
继续case analysis（不同视频，相同位置、角度与表情的大妈和男生的相似度竟然有85%，特征提取要继续研究）。

阅读过本文的人还看了以下文章：

【全套视频课】最全的目标检测算法系列讲解，通俗易懂！

《美团机器学习实践》_美团算法团队.pdf

《深度学习入门：基于Python的理论与实现》高清中文PDF+源码

python就业班学习视频，从入门到实战项目

2019最新《PyTorch自然语言处理》英、中文版PDF+源码

《21个项目玩转深度学习：基于TensorFlow的实践详解》完整版PDF+附书代码

《深度学习之pytorch》pdf+附书源码

PyTorch深度学习快速实战入门《pytorch-handbook》

【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》

《Python数据分析与挖掘实战》PDF+完整源码

汽车行业完整知识图谱项目实战视频(全23课)

李沐大神开源《动手学深度学习》，加州伯克利深度学习（2019春）教材

笔记、代码清晰易懂！李航《统计学习方法》最新资源全套！

《神经网络与深度学习》最新2018版中英PDF+源码

将机器学习模型部署为REST API

FashionAI服装属性标签图像识别Top1-5方案分享

重要开源！CNN-RNN-CTC 实现手写汉字识别

yolo3 检测出图像中的不规则汉字

同样是机器学习算法工程师，你的面试为什么过不了？

前海征信大数据算法：风险概率预测

【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目，让你掌握深度学习图像分类

VGG16迁移学习，实现医学图像识别分类工程项目

特征工程(一)

特征工程(二) :文本数据的展开、过滤和分块

特征工程(三):特征缩放,从词袋到 TF-IDF

特征工程(四): 类别特征

特征工程(五): PCA 降维

特征工程(六): 非线性特征提取和模型堆叠

特征工程(七)：图像特征提取和深度学习

如何利用全新的决策树集成级联结构gcForest做特征工程并打分？

Machine Learning Yearning 中文翻译稿

蚂蚁金服2018秋招-算法工程师（共四面）通过

全球AI挑战-场景分类的比赛源码(多模型融合)

斯坦福CS230官方指南：CNN、RNN及使用技巧速查（打印收藏）

python+flask搭建CNN在线识别手写中文网站

中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程

不断更新资源

深度学习、机器学习、数据分析、python

搜索公众号添加： datayx

长按图片，识别二维码，点关注

机器学习算法资源社群

不断上传电子版PDF资料

技术问题求解

QQ群号： 333972581

长按图片，识别二维码

本文标签：算法版权视频爱奇艺

版权声明：本文标题：爱奇艺视频拷贝(版权)检测算法内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1729834486a1214308.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

爱奇艺视频拷贝(版权)检测算法

当前思路

一些经验

TODO

更多相关文章

爱奇艺VR完成数亿元B轮融资

爱奇艺 MySQL 高可用方案到底有多牛？

爱奇艺网络协程编写高并发应用实践

小白勿进！2021最新爱奇艺Java社招面试题目，全网独家首发！

爱奇艺私有云Serverless实践

使用nginx分流虎牙爱奇艺同时直播

iCartoonFace：爱奇艺的动漫人脸数据集

爱奇艺加入龙蜥社区，携手打造多元化视频生态底座

爱奇艺视频生产 Kubernetes 集群优化实践：感知业务优先级

QiYi视频评论信息采集

《爱奇艺安全应急响应中心漏洞评分标准2021》来了！

下载 m3u8 视频脚本

面试真题纠错（京东、爱奇艺）

html 安卓 视频加载错误,javascript – html5视频无法在Android webview中播放,但适用于(移动)Chrome...

【视频音频】雷霄骅开源视音频项目汇总

逆向PPTV视频真实播放地址全过程（Java版）

手机端网页视频不显示缩略图HTML,移动端H5视频页面部分体检兼容问题

android WebView加载网页视频

度盘视频视频网页倍速播放？一行代码就够了

H5前端视频方面

发表评论

推荐文章

这些牛逼的 App 都是 Python 开发的

Vysor安装使用全攻略

MATLAB启动慢解决方案

酷睿i9 12900h和i7 11800h差距 i912900h和i711800h对比

Android 动画实现方式以及对比（GIF和WebP，Lottie和SVGA，原生动画）

热门文章

新买的Mac，发热严重，耗电快，活动监视器打不开

米哦啾｜meoqo 使用介绍

自学Python的最佳实践教程，零基础入门看这篇真的就够了_自学python入门(4)

呕心沥血为小白总结13个学习网站-错过了你注定绕弯！

pg12新特性-新增 pg_promote() 函数用于激活备库

解密Android7.0 8.0进程保活与拉活的实现方式 如何才能让APP常驻内存 躲避系统的追杀

新手要想学好Linux系统就必须做好这四件事情

heic格式批量转化jpg，图文教程，推荐5款HEIC图片转换器（2024）

极点五笔设置经验

解决虚拟机CentOS8无法上网的问题

最新文章

WinRAR 激活码（KEY）

基于 Python 实现的硬件信息注册码生成器

winrar注册码激活码

Windows 11 24H2 v26100.1742 官方简体中文版

CorelDRAW2023序列号是多少?如何领取软件激活码

PowerDesigner16.7 安装与配置

CorelDRAW2021终身免费无需激活版下载+序列号

win同台电脑中配置多个密钥

coreldraw2023standard 序列号+激活码

Camtasia2024破解版+有效激活秘钥+激活码+注册机

Zend Studio 13.6.1版本的安装和注册码问题 总结

MathType7.3.0.426英文安装特别版(附破解补丁注册码+激活方法)

matlab2016 b 安装详细教程正版中文密钥

windows系统怎么改成win7正版系统

vs2015(激活密钥)

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

html 安卓视频加载错误,javascript – html5视频无法在Android webview中播放,但适用于(移动)Chrome...

解密Android7.0 8.0进程保活与拉活的实现方式如何才能让APP常驻内存躲避系统的追杀

Zend Studio 13.6.1版本的安装和注册码问题总结

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载