“以图搜图”,背后的原理你不懂|电子爱好者

admin管理员组
文章数量:1531660

2024年7月12日发(作者：)

“以图搜图”，背后的原理你不懂

Google '相似图片搜索'：你可以用一张图片，搜索互联网上所有与它相似的图片。

打开Google图片搜索页面：

点击【相机】使用上传一张《深度学习》的原图：

点击搜索后，Google会出现外观类似的图片，相似度越高，图片越靠前。

这种技术的原理是什么？计算机怎么知道两张图片相似呢？

为了满足大家的好奇心，下面我来讲一下“以图搜图”背后的故事。

01相似图像搜索引擎

“以图搜图”正式的名称应该叫“相似图像搜索引擎”，也称为“反向图片搜索引

擎”。最初的图像搜索引擎是基于文本关键字检索的。早期的Altavista、Lycos等搜索引

擎正是利用图像的文件名和路径名、图像周围的文本，以及Alt标签中的注释索引和搜索

相关图像的。从本质上来说，这样的图像搜索引擎其实还是基于文本搜索引擎的。有时图

像周边的这些文本信息和图像并没有关系，会造成搜索出来的部分图像结果和查询关键词

并不一致。为了避免这种问题，有些搜索引擎采用人工的方式对图像进行标注索引。虽然

人工标注保证了搜索引擎的查准率，但是它限制了图像索引的规模，不可能有很好的查全

率。而有时，图像的内容是很难用几个关键词就能完整描述出来的。在某种情况下，无论

是利用图像网页相关文本信息，还是人工标注文字说明，都很难做到较高的搜索准确度。

1992年，T. Kato提出了基于内容的图像检索（CBIR）的概念，它使用图像的颜色、

形状等信息作为特征构建索引以实现图像检索，即我们通常所说的“以图搜图”。基于这

一概念，IBM开发了第一个商用的CBIR系统QBIC（Query By Image Content），用户

只需输入一幅草图或图像，便可以搜索出相似的图像。同一时期，很多公司也将这一技术

引入搜索引擎。哥伦比亚大学开发的WebSEEK系统不仅提供了基于关键词的图像搜索和

按照图像类目的主题浏览，还可以利用图像的颜色信息进行基于内容的图像搜索。Yahoo

的ImageSurfer也提供了使用例图的颜色、形状、纹理特征，以及它们的组合来进行基

于内容的图像搜索功能。随着视觉技术的进步和发展，越来越多的搜索引擎采用这一方式

来进行图像搜索，并在此基础上不断演进。

早期曾使用过“以图搜图”方式进行图像搜索的读者可能会有这样的印象，这种图像

搜索方式在返回的结果的准确度往往不太令人满意。为此，很多视觉研究人员、图像技术

开发者不断提出新的图像特征表示算法。虽然准确率在一点点提高，但是并未根本性地解

决准确度问题。这究竟是什么原因呢？原因在于无论是图像的颜色、纹理、形状这些全局

信息，还是后来的SIFT等局部图像信息，都是人为设计的硬编码，还不能完整地表达人

类对整幅图像内容的理解。

那图像搜索的准确率还能提高吗？随着人工智能（特别是深度学习理论和技术）的发

展，人们逐步找到了解决方案。深度学习技术极大地提高了图像表达的准确性。诸多主流

图像搜索引擎纷纷引入了深度学习算法来提高图像搜索的准确率。

如今我们日常使用的百度、搜狗等通用搜索引擎均提供了相似图像检索功能。淘宝、

京东等电商平台也利用自己庞大的商品图像库开发了垂直领域内的图像检索功能来满足消

费者们不易用文字描述的商品搜索需求。有更多的创业公司在各自的领域内使用相似图像

搜索技术来满足形形色色图像检索需求，服务于更多的行业和消费者。

虽然图像检索技术已广泛应用于我们的生活当中，但目前这一技术还未完全成熟，仍

有许多问题需要解决，改进和提高的空间还很大。搜索的结果和用户的期望还有一些距离，

存在一定的图像语义鸿沟。这也是从事这项技术研究与开发的人员不断进步的源动力。

02搜索引擎的一般结构

根据一般的抽象方法，我们可以把事物非关键性的特征剥离出来，而只保留其最为本

质的特征。对于现有技术条件下的搜索引擎，必须事先生成索引库，再在其上进行搜索查

询。

如图所示，首先需要对输入数据进行一定的预处理，以使我们可以对其进行进一步分

析。接下来，把文本搜索引擎的词法、语法分析等语言处理阶段抽象为对输入数据的特征

提取，一个个提取出来的词就是构成一个文档特征向量的基本元素，反向索引库就是特征

和文档对应关系的集合。对于查询数据，我们也要抽取其特征，然后计算它的特征向量与

索引库中所有特征向量的相似度，最终返回规定数量的相似结果。

抽象搜索引擎结构

03自制AI图像搜索引擎

为了彻底弄清楚这类图像搜索引擎的技术原理，我反复查找和阅读当时互联网上甚为

稀缺的相关资料，但收效甚微。直到后来，我遇到了一个叫作LIRE的开源项目，它让我

初步理解了图像搜索引擎的技术原理。但是在实际应用中，LIRE的效果并不是太好。为了

解决这个问题，我又找到“深度学习”这个强有力的助手。

在探索原理的过程中，我发现国内几乎找不到一本介绍图像搜索引擎基本原理和实现

的书，这也成了《自制AI图像搜索引擎》诞生的缘由。

《自制AI图像搜索引擎》

作者：明恒毅

图像搜索引擎有两种实现方式——基于图像上下文文本特征的方式和基于图像视觉内

容特征的方式。本书所指的图像搜索引擎是基于内容特征的图像检索，也就是通常所说的

“以图搜图”来检索相似图片。本书主要讲解了搜索引擎技术的发展脉络、文本搜索引擎

的基本原理和搜索引擎的一般结构，详细讲述了图像搜索引擎各主要组成部分的原理和实

现，并构建了一个基于深度学习的Web图像搜索引擎。

为什么要读《自制AI图像搜索引擎》？

业内仅此一本，你还在等什么?

目前在国内计算机专业图书市场上，有关图像检索的书籍甚为稀缺。据我所知，仅有

两本中文专业书籍，分别是：科学出版社出版的清华大学章毓晋教授的《基于内容的视觉

信息检索》，清华大学出版社出版的北师大周明全教授等人著的《基于内容图像检索技

术》。这两本书均是纯正的学术著作，理论丰富，但实践相对不足。此外，这两本书均出

版于本世纪初，也就是深度学习技术开始风靡之前，故两本书中均未包含将深度学习应用

于图像检索的内容。

《自制AI图像搜索引擎》由一线开发人员所著，偏重实践，兼有传统和现代方法，

可以说是目前市场上唯一一本有关AI图像检索的图书。

将深度学习理论和应用场景紧密结合，有技术、能落地

自2016年AlphaGo以4:1的比分战胜世界顶级围棋棋手李世石以来， AlphaGo所

依赖的深度学习算法在公众中得到了快速的科普。与此同时，各大科技公司也纷纷在深度

学习领域投入重金，开始高薪聘请首席科学家、算法研究员和工程师。图书市场也纷纷推

出各种有关深度学习的理论书籍。但随着时间的推移，很多理论缺乏应用场景，并未产生

实际效用。不同于其他的理论和技术，AI图像检索技术有着明确的应用场景和目标市场，

能够紧密地将深度学习理论和应用场景相结合，可谓“有技术、能落地”。

用理论指导编码，用代码阐释理论，相得益彰

《自制AI图像搜索引擎》一书的每有个图像检索的理论都配有一段Java代码，使读

者既能深刻地理解理论，又能将理论转变为编码实现。无论是对理论功底强、实践能力弱

的学术读者，还是对实践能力强、理论功底弱的开发者，本书都能提供有针对性的指导。

循序渐进，深入浅出，适合各层次开发人员入手

《自制AI图像搜索引擎》一书采用循序渐进的叙述方式，沿着历史和技术发展的脉

络，由文本搜索引擎的基本原理逐步抽象出搜索引擎的一般结构，进而由文本演进到图像。

结合具体实现代码，全面讲述了图像搜索引擎中各个组成部分的基本原理。任何愿意了解

和学习AI图像搜索引擎的读者在研读此书后，都能在理论与实践方面收获满满。

提供从零开始构建AI图像搜索引擎的案例教程，即学即用

《自制AI图像搜索引擎》一书在最后一章提供了一个从零开始构建一个基于深度学

习的Web图像搜索引擎的教程和相应的可实际运行的项目代码，真正做到了即学即用。

读者既可以先尝试一下运行效果，而后带着小小的成就感来学习相关的理论和技术，也可

以在学习完相关的理论和技术后，再研究最后一章的代码与实现过程。

轻松学《自制AI图像搜索引擎》你需要掌握：

本文标签：图像搜索引擎技术搜索

版权声明：本文标题：“以图搜图”,背后的原理你不懂内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1720771797a842096.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

电子爱好者 - 最新技术资讯及电子产品介绍！

“以图搜图”,背后的原理你不懂

更多相关文章

ElasticSearch分布式搜索引擎安装教程

2016 上海 Qcon 值得关注的技术

广域网宽带接入技术一

anycast技术

Docker技术 ( 容器虚拟化技术 )

Recorder︱图像特征检测及提取算法、基本属性、匹配方法

web开发技术和技术分享_2020年将改变Web开发的顶级技术

2011 年 IT 行业十大热门技术领域

PhotoZoom Pro 9.0.4中文破解版：图像放大的艺术新境界

miui系统备份恢复失败（一招解决，，无需技术也行）

Yandex：你不可错过的全能搜索引擎

ChatGPT之图像生成

chatGPT 背后的技术 之 Transformer 详解

【新版Bing】集成chatGpt4的搜索引擎

《工作碰上的技术问题及处理经验》（四）

ai芯片fpga_AI芯片技术趋势景观GPU TPU FPGA初创公司

amd插帧技术如何开启_玩家真谛：通过AMD的 专属福利“插帧补帧”技术了解播放器原理...

amd显卡Linux查看显存,通过软件查看显存参数_显卡_显卡技术应用-中关村在线

密码安全攻防技术精讲

基于AI的恶意软件分析技术（3）

发表评论

推荐文章

修改host后chrome浏览器不能及时生效的解决办法

关于AMD核显输出显示器“超出范围”问题的解决思路

arm64以及amd64和龙芯4000下安装pyqt：

昨晚破解隔壁少妇的WIFI，看到密码后我果断敲门！（详细图文教程）

win10读取linux硬盘,win10怎么读取lxext4格式硬盘

热门文章

亲测好用，ChatGPT 3.54.0新手使用手册，最全论文指令手册~ 【2024年9月 更新】

VMware12虚拟机安装指导（适用于Win7版本超详细教程）

【物流及供应链管理】北邮国际学院大三下期末复习

amd860k能装黑苹果吗_给大家整理了一下支持黑苹果的AMD处理器

GPU指令集技术分析

过年装逼小技能-ESP8266实现连接WiFi自动跳出浏览器界面~

计算机硬盘的参数错误,电脑提示移动硬盘参数错误的解决方法

磁盘问题——外部、动态，无法读取

Data Security and Privacy数据安全与隐私重要知识点

英语语法笔记——并列句（二）

最新文章

系统安装-SSD装win8.1操作指南（win7相同，内含win8、win7的iso镜像文件下载地址）

The Little Prince

SCI论文写作常用表达整理

Spring官方文档（中文版！！！）

Improvements in Deep Q Learning: Dueling Double DQN, Prioritized Experience Replay, and fixed…

PD虚拟机镜像文件无法检测操作系统怎么办 PD虚拟机镜像恢复时间多久 虚拟机无法识别windows镜像文件怎么办

windows11的镜像下载

英语易混淆词语：四六级，考研均适用（持续更新中~）

Spring核心接口之Ordered

电子专业 英语词汇大全（持续更新）

服务器虚拟机怎么选择iso文件位置,Hyper-V 虚拟机的光盘镜像文件路径 (.ISO) 不支持网络映射盘符或 UNC 路径？...

大学英语六级考试题型分值分配、时间分配、做题策略

EnjoyToShare | 考研英语复试口语

linux kernel调试

irene换脸资源_电线之间：数据可视化科学家艾琳·罗斯（Irene Ros）的访谈

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

chatGPT 背后的技术之 Transformer 详解

amd插帧技术如何开启_玩家真谛：通过AMD的专属福利“插帧补帧”技术了解播放器原理...

亲测好用，ChatGPT 3.54.0新手使用手册，最全论文指令手册~ 【2024年9月更新】

PD虚拟机镜像文件无法检测操作系统怎么办 PD虚拟机镜像恢复时间多久虚拟机无法识别windows镜像文件怎么办

电子专业英语词汇大全（持续更新）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载