admin管理员组

文章数量:1609966

【论文解读+代码实现】Neural Response Interpretation through the Lens of Critical Pathways

  • 摘要:
  • 介绍:
  • 相关工作:
  • 关键途径的选择:
    • 设置和符号:
    • 通过修剪目标选择:
    • 神经元贡献选择:
    • 路径选择实验:
  • 通过关键途径解释响应:
    • 关键神经元通路的局部线性关系:
    • 通过关键路径对输入特征归因:
    • 特征归因评估实验:
  • 代码介绍:
    • 代码地址:
    • 项目地址:
    • 关键路径分析:
    • 使用 PathwayGrad 进行显著性分析(特征归因):
      • 完整性检查:
      • ROAR 和 LeRF:
  • 复现结果:

摘要:

关键的输入信息是否编码在神经网络中特定的稀疏路径中?在这项工作中,我们讨论了识别这些关键路径的问题,并随后利用它们来解释网络对输入的响应

剪枝目标——选择响应与原始网络相同的最小神经元组——之前已经被提出用于识别关键路径,我们证明了从剪枝中得到的稀疏路径并不一定编码关键的输入信息

为了确保稀疏路径包括编码输入信息的关键片段,我们提出了通过神经元对响应的贡献进行路径选择,并继续解释了关键的路径如何揭示关键的输入特征

我们证明了通过神经元贡献选择的路径是局部线性的(在l2球中),我们利用这一特性来提出一种特征归因方法:“路径梯度”

我们使用主流的评价实验验证了我们的解释方法,通路梯度解释方法的验证进一步证实了使用神经元贡献选择的通路对应于关键的输入特征

介绍:

在这项工作中,我们将讨论在给定特定输入时负责网络响应的路径(或者说子网),但我们如何识别这些路径呢?

例如深度整流神经网络(deep rectified neural networks)使用一组稀疏的主动神经元对输入信息进行编码,其推理可以被视为稀疏编码的求解算法,其他的剪枝算法也可以看做是查找稀疏的路径

作者首先了研究,这些来自修剪目标的高

本文标签: 代码论文neuralresponsePathways