大白话分析SIFT中的边缘抑制|电子爱好者

admin管理员组
文章数量:1622541

1. 起因

起因是最近有个小朋友同事，把SIFT边缘响应抑制的阈值设置成了4，导致没有任何一个关键点可以通过筛选。帮她把来龙去脉搞清楚了之后，自然知道了阈值应该如何设置。顺便和大家分享一下，也考虑到这不算什么公司机密，都是二十年前的算法了。

2. 原文引用

在SIFT的文章^{1中，边缘响应抑制的段落是4.1节。鉴于本身段落比较独立的，先在这里引用如下，后面会拆解分析。}

2.a For stability, it is not sufficient to reject keypoints with low contrast. The difference-of-
Gaussian function will have a strong response along edges, even if the location along the
edge is poorly determined and therefore unstable to small amounts of noise.
2.b A poorly defined peak in the difference-of-Gaussian function will have a large principal
curvature across the edge but a small one in the perpendicular direction. The principal curva-
tures can be computed from a 2x2 Hessian matrix, H, computed at the location and scale of
the keypoint:
H = [ D x x D x y D x y D y y ] H=\left[ {\begin{array}{c} {D_{xx} } & {D_{xy} } \\ {D_{xy} } & {D_{yy} } \\ \end{array}} \right] H=[DxxDxyDxyDyy]
The derivatives are estimated by taking differences of neighboring sample points.
2.c The eigenvalues of H are proportional to the principal curvatures of D. Borrowing from
the approach used by Harris and Stephens (1988), we can avoid explicitly computing the
eigenvalues, as we are only concerned with their ratio. Let α be the eigenvalue with the
largest magnitude and β be the smaller one. Then, we can compute the sum of the eigenvalues from the trace of H and their product from the determinant:

T r ( H ) = D x x + D y y = α + β D e t ( H ) = D x x D y y − ( D x y ) 2 = α β Tr\left( {\rm{H}} \right) = D_{xx} + D_{yy} = \alpha + \beta \\ Det\left( {\rm{H}} \right) = D_{xx} D_{yy} - \left( {D_{xy} } \right)^2 = \alpha \beta Tr(H)=Dxx+Dyy=α+βDet(H)=DxxDyy−(Dxy)2=αβ
2.d In the unlikely event that the determinant is negative, the curvatures have different signs so the point is discarded as not being an extremum. Let r be the ratio between the largest magnitude eigenvalue and the smaller one, so that α = rβ. Then,
T r ( H ) 2 D e t ( H ) = ( α + β ) 2 α β = ( r α + β ) 2 r β 2 = ( r + 1 ) 2 r \frac{{Tr\left( {\rm{H}} \right)^2 }}{{Det\left( H \right)}} = \frac{{\left( {\alpha + \beta } \right)^2 }}{{\alpha \beta }} = \frac{{\left( {r\alpha + \beta } \right)^2 }}{{r\beta ^2 }} = \frac{{\left( {r + 1} \right)^2 }}{r} Det(H)Tr(H)2=αβ(α+β)2=rβ2(rα+β)2=r(r+1)2
2.e which depends only on the ratio of the eigenvalues rather than their individual values. The
quantity ( r + 1 ) 2 r \frac{{\left( {r + 1} \right)^2 }}{r} r(r+1)2 is at a minimum when the two eigenvalues are equal and it increases with r. Therefore, to check that the ratio of principal curvatures is below some threshold, r, we only need to check

T r ( H ) 2 D e t ( H ) < ( r + 1 ) 2 r \frac{{Tr\left( {\rm{H}} \right)^2 }}{{Det\left( H \right)}} < \frac{{\left( {r + 1} \right)^2 }}{r} Det(H)Tr(H)2<r(r+1)2

2.f This is very efficient to compute, with less than 20 floating point operations required to
test each keypoint. The experiments in this paper use a value of r = 10, which eliminates
keypoints that have a ratio between the principal curvatures greater than 10.

3. 鞍点的排除

首先，我们来看一下原文的这句话：In the unlikely event that the determinant is negative, the curvatures have different signs so the point is discarded as not being an extremum. （我标记为2.d节）。原文的一整段都是在说边缘响应的抑制，但这里的这句话，描述的是鞍点的排除。
在高等数学的二维微积分中，判断一个点是鞍点还是极值点的依据，如下列出：
D=fxx(x0,y0)⋅fyy(x0,y0)−[fxy(x0,y0)]2
如果 D>0 且 fxx(x0,y0)>0，则 (x0,y0) 是局部极小值点。
如果 D>0 且 fxx(x0,y0)<0，则 (x0,y0) 是局部极大值点。
如果 D<0，则 (x0,y0) 是鞍点。
如果 D=0，则需要进一步分析（例如，通过更高阶导数或泰勒展开）来确定临界点的类型。
而D其实就是2节中Hessian矩阵H的行列式（determinant）。

4. 主曲率,边缘和关键点

4.1 什么是主曲率

过曲面上某个点上具有无穷个正交曲率，其中存在一条曲线使得该曲线的曲率为极大，这个曲率为极大值Kmax ，垂直于极大曲率面的曲率为极小值Kmin。这两个曲率属性为主曲率。他们代表着法曲率的极值。
法曲率的定义有点复杂，后续有机会再补吧（TODO），反正大家定性地知道，主曲率是一组曲率（有两个值），方向是互相正交的，一个代表着当前点的极大曲率，一个代表着当前点的极小曲率。

4.2 主曲率和边缘

对于上图这样的边缘，假定它是8位图像。那么主曲率很显然，一个水平方向的0，一个是竖直方向的255。
根据2.c节中的第一句话，主曲率的比值等于H矩阵（Hessian矩阵）特征值的比值，则有(2.d节中)α和β的比值r=255/0(无穷大)，或者0/255（接近0），总之会非常远离1，因为1的时候，α和β是相等的。由于我们同时考虑了r=255/0(无穷大)，或者0/255（接近0），所以刚才的讨论是兼容旋转的。

4.3 主曲率和关键点

我们知道，SIFT的关键点提取，归根结底，使用的是二维Laplace滤波核，在与图像做相关性。
一维的Laplace滤波核是两边凸起来，那么二维的就是一维的转一圈，是一个圆环。

所以，理论上想要SIFT提取出来的关键点，应该是比较中心对称的，而中心对称的图像，主曲率的两个值是比较接近，也就是2.d节说到的α = rβ中的r接近1.

5. 减小主曲率之比的计算量

据4节中的讨论，Hessian矩阵的特征值的比r，越接近1，则越不是边缘；越远离1，则越是边缘。在实际的运算中，求矩阵特征值的运算量是比较大的，能避免就避免。于是SIFT的作者（确切的说是他们引用的Harris角点的作者）就想了一个办法，找到了一个表达式。这个表达式score在r=1时取极小值，r->0或r->∞时取另一个”极大值”:
s c o r e = ( r + 1 ) 2 r = 2 + r + 1 r , r ∈ [ 0 , ∞ ] score = \frac{{\left( {r + 1} \right)^2 }}{r} = 2 + r + \frac{1}{r},r \in \left[ {0,\infty } \right] score=r(r+1)2=2+r+r1,r∈[0,∞]
求导可知，score的值在r=1时，取最小值4，此时完全不是边缘；随着r远离1，开始趋向∞，达到∞时完全是边缘。 所以我们的小朋友同事，写了一个score<Threshold=4才不算边缘，那就是要求比理论最小值更小，自然没有任何一个点能通过测试。
而score的计算量很小，等于Hessian矩阵的迹的平方/行列式。
T r ( H ) 2 D e t ( H ) = ( α + β ) 2 α β = ( r α + β ) 2 r β 2 = ( r + 1 ) 2 r \frac{{Tr\left( {\rm{H}} \right)^2 }}{{Det\left( H \right)}} = \frac{{\left( {\alpha + \beta } \right)^2 }}{{\alpha \beta }} = \frac{{\left( {r\alpha + \beta } \right)^2 }}{{r\beta ^2 }} = \frac{{\left( {r + 1} \right)^2 }}{r} Det(H)Tr(H)2=αβ(α+β)2=rβ2(rα+β)2=r(r+1)2
对于一个2*2矩阵来说，计算量非常小。

Distinctive Image Features from Scale-Invariant Keypoints ↩︎

本文标签：大白话抑制边缘 SIFT

版权声明：本文标题：大白话分析SIFT中的边缘抑制内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728871703a1177343.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

大白话分析SIFT中的边缘抑制

1. 起因

2. 原文引用

3. 鞍点的排除

4. 主曲率,边缘和关键点

4.1 什么是主曲率

4.2 主曲率和边缘

4.3 主曲率和关键点

5. 减小主曲率之比的计算量

更多相关文章

莫雷蒂“中心—(半边缘)—边缘”系统探析

【慧峰边缘计算中心系统】慧峰边缘计算中心系统 V16.9.8.0官方版官方免费下载

D-Link交换机安全性功能配置手册

Photoshop中的羽化边缘与矩形圆角技巧

最新整理ps怎么使用滤镜来抠图

【精】景观常用规范及尺度整理(坡度)

用PhotoShop给照片换背景 四种抠图方法详解

什么是边缘CDN和虚拟CDN(vCDN)?

Gartner发布物联网技术十大趋势，人工智能的最后一公里是边缘计算

禁用win10触摸屏手势_禁用和启用Win10平板边缘滑动手势的详细方法

android 屏幕底部有黑边,问题来了，手机屏幕边缘的黑边到底是什么？

边缘融合 边缘计算_生活在科技边缘

边缘计算：发展与挑战

初识Docker，大白话理解Docker。Docker Windows Desktop的安装以及阿里云镜像加速。在Docker中运行Redis、MongoDB、MySQL

编程十年 (5)：站在网络边缘，却陷入信息孤岛

SIFT: Distinctive Image Features from Scale-Invariant Keypoints

图像处理——SIFT算法

【特征匹配】PCA-SIFT原理及源码解析

在OpenCV里使用SIFT

Notes for SIFT algorithm

发表评论

推荐文章

java使用佳博打印机打印标签

java 开发工具包 jdk 64位 jdk-8u221-windows-x64.exe 迅雷下载

《Windows办公指南》Windows 10家庭版如何自定义Google Chrome浏览器安装路径

运维必须掌握的27道Linux面试题

也谈搜狗云输入法

热门文章

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍 云顶之弈什么时候可以玩_18183云顶之弈专区...

谷歌浏览器（Google Chrome）清除密码等缓存记录

Google Chrome Windows平台稳定版离线安装包下载

esp32 wifi部分总结 sta模式下常用的和能够实现的功能

Netkeeper强制升级，第三方wifi共…

三笔输入法 开发过程记录

几分钟计算机不操作就注销,win10系统长时间不操作就自动注销的方案

设计模式-中介者模式

怎样量产U盘，和量产之后怎么还原到普通U盘

Distinctive Image Features from Scale-Invariant Keypoints（个人翻译+笔记）-介绍

最新文章

戴尔i3 10100处理器装win7系统及bios设置教程(支持集显安装)

Win10 linux子系统文件位置

网络发现不了其他计算机,win10网络发现不了其他电脑怎么办_win10网络里找不到其他电脑如何处理...

win10删除右键菜单多余项

Win10的投屏功能无法使用问题解决思路

服务器不能用pe安装win7系统安装,PE安装win7系统失败的完美解决方案

win10更新系统后，键盘和触摸板不能用的问题

win10 自带的远程桌面连接怎么用？

关于win10系统还原报错的解决方案

计算机怎样设置默认美式键盘,完美：如何在win10系统中将默认输入法设置为美式键盘...

win10右键文件夹无反应

解决win10右下角输入法出现一个‘拼’字图标

WIN10下ADB工具包安装的教程和总结--201809

win10设置为高性能之后，字体模糊有锯齿

win10打开软件总是弹出用户帐户控制怎么办

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

用PhotoShop给照片换背景四种抠图方法详解

边缘融合边缘计算_生活在科技边缘

云顶之弈服务器维护多长时间,英雄联盟3.17更新维护时间介绍云顶之弈什么时候可以玩_18183云顶之弈专区...

三笔输入法开发过程记录

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载