Critical Point ( local minima && saddle point)|电子爱好者

admin管理员组
文章数量:1534803

当我们训练模型的时候，随著参数不断的 update，training 的 loss 不会再下降，但这时候的 loss 还没有到我们希望看到的样子，那很有可能是 deep network，没有发挥它完整的力量，所以 Optimization 显然是有问题的。

但是不管我们怎么 train 我们的模型，loss 迟迟不下降，就会猜想可能 loss 在下降的过程中遇到了微分为 0 的点，卡住了。每到这时，大家总会说这是 local minima 局部最小点，但是除了 local minima 以外，saddle point 鞍点也可能会造成微分为 0 。把梯度为 0 的点，我们统称 Critical Point 。

对于 local minima 和 saddle point 来说，虽然同样都是梯度为 0 ，但是：

因為如果是卡在local minima，那可能就没有路可以走了,因為四周都比较高,你现在所在的位置已经是 loss 最低的点，四周的 loss 都会比较高。
如果今天是卡在 saddle point 的话，saddle point 旁边还是有路可以让 loss 更低的。

所以鉴别今天我们走到 critical point 的时候，到底是 local minima 还是 saddle point 是一个值得去探讨的问题。

如果我们知道了 loss function 的形状，像上面那个图一样，我们就可以轻易看出是哪种类型。但是 deep learning 是非常复杂的，参数的维数是几百万甚至上亿，我们就没有办法画出 loss 的形状。

我们根据泰勒展开式，如果给定一个点，那在附近的函数是可以写出来的：

第一项说明当与比较接近时，。
第二项，用绿色的这个 g 来代表 gradient ，这个gradient会来弥补与之间的差距。
第三项是弥补加上 gradient 后，和真实的差距，H 是 Hessian矩阵。

如果我们今天走到的一个 critical point ，那么 gradient 为 0 ，第二项就消失了。所以我们可以通过判断来区分 local minima 还是 saddle point 。

其实《最优化》中也学过这个，通过判断 Hessian 矩阵正定 -> 极小值(local minima)；负定 -> 极大值；不定 -> 非极值点(saddle point)。

当然计算 H 的开销是非常昂贵的，这里我们只需要看其特征值，特征值全正就是 local minima；特征值全负就是 local maxima；特征值有正有负就是 saddle point 。

那 saddle point 不一样也会让训练停止，就算搞清楚是哪种 critical point 有什么意义？不用担心，其实 Hessian 矩阵暗指了 update 的方向。

这里代表 H 的特征向量，代表对应的特征值，就有：，当为负时，这一项整体为负。假如，那么就会有。这样我们就可以说当遇到 saddle point 时，只需要沿着特征值为负的特征向量方向 update 就可以让 loss 降低。

那实际情况中 saddle point 多还是 local minima 多呢？先说结论，local minima 更少！举例：当处于一维空间中，或许处处是 local minima ，但是如果当参数变成两个，二维情况下或许原本的 local minima 就变成了 saddle point 。

由于我们现在网络的参数都是百万千万级别的，所以 local minima 真的很少见！看图说话。

横轴的部分是 minimum ratio，是正的 eigen value 的数目和所有 eigen value 的数目之比。如果所有的 eigen value 都是正的，代表我们今天的 critical point 是 local minima 。如果有正有负代表 saddle point，那在实际上会发现说，几乎找不到完全所有 eigen value 都是正的 critical point。这个例子中 minimum ratio 最大也不过 0.5 到 0.6 间而已，代表说只有一半的 eigen value 是正的，还有一半的 eigen value 是负的。

所以从经验上看起来，其实 local minima 并没有那么常见。多数时候觉得 train 到一个地方 gradient 真的很小，然后所以参数不再update，往往是因为卡在了一个 saddle point 。

本文标签： Local Point Critical minima

版权声明：本文标题：Critical Point ( local minima && saddle point) 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1726269093a1063597.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Critical Point ( local minima &amp;&amp; saddle point)

更多相关文章

Critical error detected 内存异常的一种原因

开机报错0190: critical low-battery error的解决方案

Critical dependency: the request of a dependency is an expression（import）

联想电脑开机报错0190：Critical low-battery error

kubernetes：Critical Pod

CRITICAL:yum.cli:Config error: Error accessing file for config file:opt++

解决Faceswap报错CRITICAL An unexpected crash has occurred.You MUST provide this file if seeking assistan

Twisted Critical问题解决

vue-cli 引入jsdomCritical dependency: the request of a dependency is an expression 问题

vivado报位置约束指令的critical warning

found 84 vulnerabilities (65 low, 7 moderate, 11 high, 1 critical) vue使用时提示有漏洞

jmeter-Critical Section Controller （临界部分控制器）用法

Angular出现“Critical dependency: the request of a dependency is an expression”的警告

Windows Using Critical Section Objects

GLib-CRITICAL **: g_main_context_pop_thread_default: assertion `g_queue_peek_head (stack) == context

[并发并行]_[线程同步]_[pthread和win32的临界区(Critical Section)比较]

exynos5410 TMU系统的critical情况处理方法

HTML Critical Webpack Plugin 使用教程

OpenMP critical Lock() atomic 3种锁的比较

【FedCom】A Byzantine-Robust Local Model Aggregation Rule Using Data Commitment for Federated Learning

发表评论

推荐文章

一口气了解大模型相关通识，基础笔记！_大模型数据

CentOS 8在物理机上通过U盘启动并安装

【雕爷学编程】Arduino智能家居之基于WiFi的无线报警系统

NTBACKUP恢复

Google Interview Questions: Software Engineer

热门文章

固态硬盘的保养

移动硬盘已连接USB我的电脑不显示的全网最细汇总多种解决方法（保姆级图文详细步骤）

搭建嵌入式GDB调试环境以及VSCode+gdbserver 图形化调试

使用Awesome ChatGPT开源项目构建聊天机器人指南

【期末指北】嵌入式系统——选择题（feat. ChatGPT）

树莓派-树莓派系统的备份与还原（4）

NoteExpress2 破解版——word插件过期解决办法（转）

windows下搭建appium+android测试环境（node.js样例）

一封来自前ThoughtWorks总监咨询师、致国内程序员的一封信

win8和win8.1升级win10预览版图文教程

最新文章

笔记本Ctrl键突然失灵是什么原因？

计算机键盘切换,笔记电脑键盘怎么切换_笔记本小键盘怎么切换-win7之家

怎样截屏计算机桌面,电脑怎么截图？常见的电脑截图方法

【Ware】VirtualBox的HOST键（主机键）是什么按键？

向日葵远程控制电脑时候键盘按键突然失灵【已解决】

linux虚拟机按键不好用,虚拟机(vmware)linux中ctrl按键失灵 解决办法

电脑剪切,电脑剪切快捷键

电脑桌面切屏的快捷键

电脑ctrl和alt经常键自动按住--答案是QQ2012的Bug

计算机空格键作用,电脑键盘空格键的使用方法及技巧

计算机主机上有几个按钮,电脑键盘各个按键有哪些作用 电脑键盘各个按键作用介绍...

电脑截图的4种常用方法

“ctrl”+“windows”+“c”三个键,屏幕变灰，像黑白电视一样

我的世界电脑服务器怎么显示键盘,我的世界电脑版操作按键

计算机关闭应用程序的快捷键,关闭电脑程序的快捷键是什么

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

Critical Point ( local minima && saddle point)

linux虚拟机按键不好用,虚拟机(vmware)linux中ctrl按键失灵解决办法

计算机主机上有几个按钮,电脑键盘各个按键有哪些作用电脑键盘各个按键作用介绍...

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载