可解释性机器学习|电子爱好者

admin管理员组
文章数量:1609966

可解释性机器学习

背景

写这篇文章的背景就是可解释性机器学习在中文领域资料非常少，有一些零散的资料也不成系统，笔者根据这两个月的整理现阶段的一些可解释性的资料，可常用的代码和库，希望为大家尽一份力。文章分成，原理讲解，论文解析，代码整理，衡量特征重要性的度量四个部分。

Model-Agnostic Methods

找到所有模型都通用的检验方法，也成为post hoc interpretation。

模型解释分为两类，一类是全局的解释性（global），衡量特征在模型中起的整体作用，另一类是局部的解释性(local)，目的是对一个特定的预测条目，衡量该条样本预测分高的原因。

两类解释具有较大区别，以线性模型的解释为例，对于进行了归一化处理后的特征而言，最终的模型权重绝对值即为全局的特征重要性，因为权值越大该特征对最终分值影响越大，而对于一个取得高分的具体预测实例而言，可能在全局最重要的特征上，其分值较小，在该条样本的得分计算上并无多大贡献，因此对于线性模型单条样本的局部解释性，会使用权值乘以特征值来作为该维特征的贡献度，从而得到各个特征间的重要性排序。

Local的解释性可以通过两种方式来实现：

通过在一个instance的领域取点，通过简单的可解释性模型来学习complex模型的这个特定instance周边的关系。
用Surrogate方式。

PDP, Feature Importance, 是Global的解释方法。ICE, LIME, ALE, Anchors是local的解释方法。 Shap是既可以local又可以global。

PD & ICE

Partial Dependence和ICE通常放置在一起用，原理是对给定instance，固定除选择的特征外的其它特征值，然后对选择的特征列进行分箱迭代，每次迭代将选择的特征列全部赋予同一个值，从小到大，如果是PDP，则平均所有样本的预测值。
能展示预测值和特征之间的关系是线性的，单调性的，还是更复杂的。

For a selected predictor (x)
1. Determine grid space of j evenly spaced values across distribution of x
2: for value i in {1,...,j} of grid space do
     | set x to i for all observations
     | apply given ML model
     | estimate predicted value
     | if PDP: average predicted values across all observations
   end

def par_dep(xs, frame, model, resolution=20, bins=None):
	'''
		xs: 列名
		frame: Dataframe
		model: xgboost, lightgbm
		resolution: 分箱的精度
	'''
    pd.options.mode.chained_assignment = None
    par_dep_frame = pd.DataFrame(columns=[xs, 'partial_dependence'])    
    # 保留特定列
    col_cache = frame.loc[:, xs].copy(deep=True)  
    # 确定PD图x轴需要计算值
    if bins == None:
        min_ = frame[xs].min()
        max_ = frame[xs].max()
        by = (max_ - min_)/resolution
        bins = np.arange(min_, max_, by)  
    # 设置列为一个常数j，j按bins取值。i为总体预测的y值，j为i的均值。      
    for j in bins:
        frame.loc[:, xs] = j
        dframe = xgb.DMatrix(frame)
        par_dep_i = pd.DataFrame(model.predict(dframe))
        par_dep_j = par_dep_i.mean()[0]
        par_dep_frame = par_dep_frame.append({
   xs:j,
                                              'partial_dependence': par_dep_j}, 
                                              ignore_index=True)
    # 将特定列返回
    frame.loc[:, xs] = col_cache
    return par_dep_frame

ALE

主要解决特征间相互依赖问题。比如预测房子价格，特征-房间数量和特征-房子大小，比如PD会固定住房间大小，增加房间数量来画PD图，但这两个变量明显是有相关性的。ALE希望反映特征效果的相关性。通过找特征的条件分布的均值，我们平均了相似的x1值的instances的预测值。M-Plots避免平均不相似的数据的instances，但是他们混合了一个特征和其它相关特征的效果，其实就是画出两个变量的条件概率的分布。ALE通过计算预测值之间的差值，而不是求平均。比如，对于面积30m的，ALE用所有30m的例子，假装这批房子是31m和29m，用模型预测后做差。这样给了我们纯粹的面积的效果，而没有混合其它相关的特征。简单来说
，PDP和ALE都是计算了一个特征在某个格点值v时的效果。

PDP展示的是，模型的平均预测值，在数据的instance对应想要知道的特征，都赋予选定同一个格点值v，。
ALE是展示模型预测值在small window的变化。也就是用特征在格点值v的附近的small window的变化值。用small window的upper and lower limit of the interval来输入模型中预测后相减得到差值。

For a selected predictor (x)
1. Determine grid space of j evenly spaced values across distribution of x
2: for value i_lower, i_upper in {1,...,j} of grid space do
	   if x in (i_lower, i_upper)
	     | set x to i for all observations
	     | apply given ML model
	     | estimate difference between predicted value i_lower and i_upper
   end

Feature Interaction

通过H-statistic来衡量特征与其它特征的interaction的强度，H-statistic能够衡量根据预测结果中的特征间交互程度的方差。一般的工作流程是，先衡量interaction的强度，然后画出2D-PDP来检验interaction。
例子1: 衡量两个特征之间的Interaction程度。若两个特征之间没有interaction，则
P D j k ( x j , x k ) = P D j ( x j ) + P D k ( x k ) P D_{j k}\left(x_{j}, x_{k}\right)=P D_{j}\left(x_{j}\right)+P D_{k}\left(x_{k}\right) PDjk(xj,xk)=PDj(xj)+PDk(xk)
H j k 2 = ∑ i = 1 n [ P D j k ( x j ( i ) , x k ( i ) ) − P D j ( x j ( i ) ) − P D k ( x k ( i ) ) ] 2 / ∑ i = 1 n P D j k 2 ( x j ( i ) , x k ( i ) ) H_{j k}^{2}=\sum_{i=1}^{n}\left[P D_{j k}\left(x_{j}^{(i)}, x_{k}^{(i)}\right)-P D_{j}\left(x_{j}^{(i)}\right)-P D_{k}\left(x_{k}^{(i)}\right)\right]^{2} / \sum_{i=1}^{n} P D_{j k}^{2}\left(x_{j}^{(i)}, x_{k}^{(i)}\right) Hjk2=i=1∑n[PDjk(xj(i),xk(i))−PDj(xj(i))−PDk(xk(i))]2/i=1∑nPDjk2(xj(i),xk(i))

PD指partial dependence function。

1: for variable i in {1,...,p} do
     | f(x) = estimate predicted values with original model
     | pd(x) = partial dependence of variable i
     | pd(!x) = partial dependence of all features excluding i
     | upper = sum(f(x) - pd(x) - pd(!x))
     | lower = variance(f(x))
     | rho = upper / lower
   end
5. Sort variables by descending rho (interaction strength)

例子2:衡量一个特征与其余特征之间的Interaction程度。

f ^ ( x ) = P D j ( x j ) + P D − j ( x − j ) \hat{f}(x)=P D_{j}\left(x_{j}\right)+P D_{-j}\left(x_{-j}\right) f^(x)=P

本文标签：解释性机器

版权声明：本文标题：可解释性机器学习内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dianzi/1728576427a1164523.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

可解释性机器学习

可解释性机器学习

背景

Model-Agnostic Methods

PD & ICE

ALE

Feature Interaction

更多相关文章

医院机器的配置

【机器学习】模糊认知图（Fuzzy Cognitive Map, FCM）概念介绍

x86机器PC机改造成云终端瘦终端教程

【人工智能】想要入坑机器学习？这是MIT在读博士的AI心得

Python机器学习、深度学习库总结（内含大量示例，建议收藏）

华硕天选笔记本电脑启动机器后搜索不到网络

机器学习基石HOW BETTER部分(1)

linux 最牛机器,最牛B的 Linux Shell 命令（二）

常用十大python机器学习库

快速找出你机器中的“木马”

【机器学习中的公平性】Fairness in Machine Learning

数独难题_如何玩和赢得数独-使用数学和机器学习解决每个数独难题

美国500万个工作已被机器取代！超级AI会让人类永生还是灭亡？

数据智能，机器为师

[网络安全自学篇] 十.论文之基于机器学习算法的主机恶意代码

固态硬盘比机器硬盘好很多吗？

从Pipenv到Luminoth，盘点2017年最受欢迎的十大机器学习Python库

从零搭建机器学习平台Kubeflow

机器学习（五）——概率解释（Probabilistic interpretation）

可解释性机器学习

发表评论

推荐文章

WiFi共享精灵自身存在的优势

微软谈&quot;开源&quot;、&quot;赦&quot;盗版背后的商业逻辑

文件夹怎么加密设置密码（文件夹如何加密码?）

我的手机设置

华为手机usb调试打开后自动关闭怎么办？华为手机 usb调试为什么自动关闭？usb调试老是自动关闭怎么回事?...

热门文章

Java常用框架

免费下载IEEE标准的途径

iphone导出视频 无法连接到设备_如何解决爱思助手无法识别设备或连接超时等故障？...

LLM-2022：PaLM【参数量：5400亿（540B）；训练集token数量：780B】【①SwiGLU激活函数、②RoPE旋转位置编码】【基于Pathways的大语言模型】

SpringCloud学习笔记，课程源自黑马程序员，笔记持续更新中...

win10专业版没有触摸板选项_win10鼠标光标不见了触摸板没反应的具体解决办法...

java如何打开hprof,安卓：打开.hprof文件在Eclipse中

win10家庭中文版添加Hyper-V虚拟机

分段线性分类器：DNN的一种可视化解释

第十一章 迁移学习-实战宝可梦精灵

最新文章

[学习笔记]2020年win10最常用dos命令以及win+R即可运行的命令（使用命令打开自己想要的内容，总比找不到更好，赶快收藏）

史上最详细的Studio One 6.6.2破解版2024最新图文安装激活教程（附Crack下载）

WIN2012远程桌面授权服务器许可证问题解决方法

机器学习环境的搭建和使用----anacondajupytertensorflow-gpu opencv等 win10安装和常用使用方法总结

CorelDRAW2024精简版安装包下载包含CDR2024绿色永久激活码

win10系统连接wifi后可以上网但是显示【无Internet，安全】解决 and Maple初始化失败问题

EditPlus激活码

Xshell完美连接win10 Linux子系统

win10上成功运行faster-rcnn.pytorch-1.0

Beyond Compare 软件如何永久试用？

Office激活后还是弹激活窗口解决办法

typroa的永久使用

Win10下安装OpenVINO

【关闭个人数据跨境传输】

2024年手把手教你下载、安装和激活Guitarpro8中文永久破解版（附Crack）

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

微软谈"开源"、"赦"盗版背后的商业逻辑

iphone导出视频无法连接到设备_如何解决爱思助手无法识别设备或连接超时等故障？...

第十一章迁移学习-实战宝可梦精灵

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载