优化算法中的零次优化详解|电子爱好者

admin管理员组
文章数量:1660221

零次优化公式算法收敛

无梯度优化

m i n f ( x ) minf(x) minf(x)
无梯度方法适用于梯度难以得到、获得昂贵

传统无梯度方法：

基于直接搜索的方法：坐标搜索，广义模式搜索和网格自适应直接搜索
基于模型的方法：隐式过滤，信任区域方法
贝叶斯方法

通过随机梯度估计的零次优化：

模仿一阶方法，但使用函数值的有限差分来估计梯度
优点：易与操作、收敛保证、函数查询效率

黑箱攻击的基本问题：

收敛
查询无效

ZOO方法综述：

Unconstrained ZOO

梯度估计（ZOO）：

One-point gradient estimate
∇ ^ f ( x ) = ( d / μ ) [ f ( x + μ u ) − f ( x ) ] u \hat{\nabla} f(\mathbf{x})=(d / \mu)[f(\mathbf{x}+\mu \mathbf{u})-f(\mathbf{x})] \mathbf{u} ∇^f(x)=(d/μ)[f(x+μu)−f(x)]u
其中 u u u是从单位球的球面均匀绘制的随机向量，有些地方 u u u来着标准高斯分布，在这里，使用均匀分布可确保在有界空间而不是高斯所需的整个实际空间中定义ZO梯度估计，并且 µ > 0 µ> 0 µ>0是一个小的步长，称为平滑参数
Two-point gradient estimate
g μ ( x ) = f ( x + μ u ) − f ( x ) μ ⋅ B u g ^ μ ( x ) = f ( x + μ u ) − f ( x − μ u ) 2 μ ⋅ B u \begin{aligned} &g_{\mu}(x)=\frac{f(x+\mu u)-f(x)}{\mu} \cdot B u\\ &\hat{g}_{\mu}(x)=\frac{f(x+\mu u)-f(x-\mu u)}{2 \mu} \cdot B u \end{aligned} gμ(x)=μf(x+μu)−f(x)⋅Bug^μ(x)=2μf(x+μu)−f(x−μu)⋅Bu
上式第一项称为Forward difference，第二项称为Central difference
Gradient sign estimate
sign ⁡ ( f ( x + μ u ) − f ( x ) μ u ) (use sign as descent direction) \operatorname{sign}\left(\frac{f(x+\mu u)-f(x)}{\mu} u\right) \quad \text { (use sign as descent direction) } sign(μf(x+μu)−f(x)u) (use sign as descent direction)
梯度符号的估计对梯度估计噪声更鲁棒。例如 g = [ 5 , − 0.5 ] T , g ^ = [ 0.5 , − 5 ] , but sign ⁡ ( g ) = [ 1 ， − 1 ] = sign ⁡ ( g ^ ) g=[5,-0.5]^{T}, \hat{g}=[0.5,-5], \text { but } \operatorname{sign}(g)=[1，-1]=\operatorname{sign}(\hat{g}) g=[5,−0.5]T,g^=[0.5,−5], but sign(g)=[1，−1]=sign(g^)

Unconstrained ZOO: Optimality Measures
在ML应用中，最大程度地减少经验平均损失
minimize ⁡ x ∈ R d f ( x ) = 1 n ∑ i = 1 f i ( x ) , f i ( x ) : = f ( x ; w i ) \underset{x \in R^{d}}{\operatorname{minimize}} f(x)=\frac{1}{n} \sum_{i=1} f_{i}(x), \quad f_{i}(x):=f\left(x ; w_{i}\right) x∈Rdminimizef(x)=n1i=1∑fi(x),fi(x):=f(x;wi)

x ∈ R d x \in R^{d} x∈Rd 指优化变量， w i w_{i} wi第i个数据样本， f i ( x ) f_{i}(x) fi(x)是cost函数单数非凸

对于凸问题，将追踪
h T : = E [ f ( x T ) ] − f ∗ ≤ ϵ h_{T}:=\mathbb{E}\left[f\left(x_{T}\right)\right]-f^{*} \leq \epsilon hT:=E[f(xT)]−f∗≤ϵ
对于非凸问题，将追踪
h ~ T : = E [ ∥ ∇ f ( x T ) ∥ 2 ] ≤ 6 \tilde{h}_{T}:=\mathbb{E}\left[\left\|\nabla f\left(x_{T}\right)\right\|^{2}\right] \leq 6 h~T:=E[∥∇f(xT)∥2]≤6

讨论收敛速度

Sign-Based Methods能更快收敛，而为什么？
x k + 1 = x k − δ k sign ⁡ ( g ^ k ) , where sign ⁡ ( x ) takes element-wise signs of x \mathbf{x}_{k+1}=\mathbf{x}_{k}-\delta_{k} \operatorname{sign}\left(\hat{\mathbf{g}}_{k}\right), \quad \text { where } \operatorname{sign}(\mathbf{x}) \text { takes element-wise signs of }\mathbf{x} xk+1=xk−δksign(g^k), where sign(x) takes element-wise signs of x

符号算子导致了自适应学习率， δ k sign ⁡ ( g ^ k ) = δ k g ^ k ⋅ / ∣ g ^ k ∣ , δ k / ∣ g ^ k ∣ \delta_{k} \operatorname{sign}\left(\widehat{\boldsymbol{g}}_{k}\right)=\delta_{k} \widehat{\boldsymbol{g}}_{k} \cdot /\left|\widehat{\boldsymbol{g}}_{k}\right|, \delta_{k} /\left|\widehat{\boldsymbol{g}}_{k}\right| δksign(g k)=δkg k⋅/∣g k∣,δk/∣g k∣指自适应率，其中 g ^ k = ∇ x = x k f i ( x ) \widehat{\boldsymbol{g}}_{k}=\nabla_{\boldsymbol{x}=\boldsymbol{x}_{\mathbf{k}}} f_{i}(\boldsymbol{x}) g k=∇x=xkfi(x)
梯度算子对nosie有更大的容错性

总结：

ZO-SGD相比于ZO-signSGD收敛有更好的准确性（loss更小），但ZO-signSGD能更快收敛。
而后面提到ZO-AdaMM能包含ZO-SGD和ZO-signSGD两种情况（这两种为ZO-AdaMM的特殊情况）

Constrained ZOO

（上图中Unconstrained改为constrained）
Constrained ZOO:

Alternating direction method of multipliers (ADMM): A general optimization solver
ZO Stochastic Projected Gradient Descent (ZO-SPGD)
ZO Adaptive Momentum Method (ZO-AdaMM)类似于Adam方法（结合了Momentum和自适应学习率）

总结：

Min-max ZOO

总结

ZOO 优化总结：

使用客观评估估算梯度信息
收敛到解决方案的可能邻域（消除在随机环境设置的随机小批量所产生的偏差）

Zeroth Order for Adversary ML

零次攻击(Zeroth Order Optimization (ZOO) Attack)

ZO by Natural Evolution Strategy (NES)

ZO-AdaMM：

ZO-AdaMM作为一种特殊情况涵盖了ZO-signSGD
ZO-AdaMM具有自适应学习率和梯度平均的优势

Data poisoning attacks:

injecting poisoned data (eg, with designed backdoor trigger) into training phase

零次优化方法对于梯度为以下的问题很有用：
不可用：黑匣子攻击（主要是这一点）
不可计算：封闭形式不可计算的梯度，例如AutoML中的超参数优化
不方便：梯度可计算，但其形式评估成本很高，例如，涉及梯度计算中矩阵求逆，通过梯度或曲率正则化进行对抗防御的资源管理
隐私权要求：隐私权保护条件，例如，隐私权保护的分布式计算

总结

当没有梯度时，ZO方法是一阶方法的通用替代方法
收敛速度受尺寸依赖的减慢效应的影响，但是如果具有适当的最小批处理大小，则它对一阶方法具有竞争力
ZO优化在数据挖掘，机器学习，计算机视觉尤其是对抗性鲁棒性中的新兴应用

传统的derivative-free optimization(DFO)方法可以分为

基于直接搜索的方法和基于模型的方法。两种方法都都是迭代方法区别在于，基于直接搜索的方法直接基于查询的函数值来优化其搜索方向，而基于模型的方法则建立一个模型，该模型逼近要优化的函数并基于该模型更新搜索方向

本文标签：算法详解

版权声明：本文标题：优化算法中的零次优化详解内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1729851489a1215474.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

优化算法中的零次优化详解

零次优化公式算法收敛

Unconstrained ZOO

Constrained ZOO

Min-max ZOO

总结

Zeroth Order for Adversary ML

总结

更多相关文章

【转载】CPU散热器详解

神经网络算法用什么软件,神经网络计算机应用

多图详解！10大高性能开发核心技术

一篇由简到难的 Vue 面试题+详解答案

Vue2 - 详解实现网站接入微信扫码登录功能，微信授权生成登录二维码用户用手机扫描二维码登陆，微信扫描二维码登录详细流程及示例代码，支持弹框式、浏览器单独新开页显示，最新vue集成微信扫码授权登录！

Android Download机制详解（一）DocumentUI部分

C 字符串函数 sprintf()、snprintf() 详解

【路径规划】move_base、路径规划算法、局部避障算法介绍

PHP7垃圾回收算法

In Search of an Understandable Consensus Algorithm(寻找可理解的共识算法)

ROS-基于已知地图的无人机路径规划算法仿真

爱奇艺视频拷贝(版权)检测算法

Adobe Flash Builder 4.6 开发环境详解

ADB详解与fastboot以小米为例

FFmpeg入门详解之99：基于nginx的rtmp直播服务器（nginx-rtmp-module实现）

信号处理算法（4）：全球最快的傅里叶变换算法（FFTW）

基于Amos的路径分析与模型参数详解

cartographer-ros阅读梳理（六）后端部分-关于回环检测搜索算法SubmapScanMatcher与后端优化器optimization_problem_

python 实现用蒙特卡洛方法计算圆周率PI算法

#通俗理解# 从极大似然估计（MLE）到最大期望（EM）算法

发表评论

推荐文章

基于vue2的uniapp 微信一键登录，获取手机号

卸载网卡驱动

2019年计算机无纸化试题,2019年中级会计无纸化考试操作全攻略！机考常见问题大合集！...

Adobe Flash Player for Android11.0.1[Android 机器要装这个才能在浏览器中看 flash]

揭开真相：恢复出厂设置会清除所有内容吗？

热门文章

开发者们都在关注的网站

ERP打假：九大缺陷揭露 (转)

huawei USG6001v1学习---信息安全概念（2）

立创EDA网页标准版元件多太卡解决方法

打开计算机读取硬盘慢,机械硬盘读写速度慢几招优化方法提升！

win10无损升级到win11

RDF 格式之间的转换

C盘爆满清理

神州网信版windows10可以上网，但是网络显示无法连接到Internet

python频域分析,Python频谱分析

最新文章

Linux系统基础-2018-用户和组群账号管理

Microsoft RMS操作简要说明

openwrt路由表设置_怎样设置openwrt无线路由器

校园网用户设置无线路由器

广电网设置无线路由器

python操作word.7.19笔记

MySQL学习

路由器WIFI上网怎样设置固定IP

微知-梅林系统设置无线桥接模式后如何登录梅林路由器？

如何设置无线路由器上网？

一粒云使用指南

windows FAQ

设置无线路由器与有线网络在同一网段

无线路由器接网线上网如何设置？

教你如何设置无线路由器

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载