admin管理员组

文章数量:1590151

研究问题

研究了实体嵌入和关系嵌入之间的交叉交互问题,并试图为三元组提出可依赖的解释

背景动机

  • 之前的基于嵌入的模型没有把crossover interactions纳入考虑,即从实体到关系的交互和从关系到实体的交互(大部分模型没有考虑这二者的交互,少部分模型只考虑了从关系到实体的交互)

  • 论文举了一个例子,假设上图中的实线是已知三元组,虚线是未知三元组,目标是预测。则关系到实体的交互可以定义为“要预测的关系会影响到实体的信息筛选”,也就是预测时选择红色的线而非蓝色的线作为输入信息;而实体到关系的交互定义为“实体所拥有的信息会影响关系的推理路径的选择”,也就是选择右边的浅红色推理路径。

模型思想

每一个实体和关系都由多个嵌入来表征,一部分是general嵌入,保留着high-level属性;还有一部分是interaction嵌入,保留着交叉相互作用的specific属性。交互嵌入通过计算general嵌入和交互矩阵C的哈达玛积来得到。

模型框架

  • 总体框架

  • 链路预测的计算过程

假设实体对应的嵌入矩阵为,关系嵌入矩阵为,交互矩阵为,对于给定的三元组h,t,r,其对应的one-hot编码分别为和

嵌入的计算公式为

则实体的交互嵌入计算为

关系交互嵌入计算为

二者的非线性结合表示为

得分函数定义为

crossE的得分函数可以展开为

作为对比,crossES移除了交互部分,其得分函数为

  • 可解释性的计算过程

作者将可解释性定义为推理路径的查找,比如说下图中,左侧是推理路径或者说前提,右侧是结论,左侧就是对右侧的一个解释

可解释性算法分为以下步骤:

  • 寻找相似的关系:对于关系r,其相似关系的集合定义为
  • 搜索h和t之间的路径:这里的路径长度最多为2,穷举法在上面定义的候选关系集合内部搜索以下几种情况
  • 搜索相似节点:对于实体h,其相似实体的集合定义为
  • 搜索相似结构:

总体流程如下

一些实例如下

实验部分

  • 链路预测对比实验

hit10结果对比

这个实验结果很有意思,模型在WN18数据集上的效果并不出色,但是FB15k上远超其他模型,说明模型更适合于复杂的数据集

  • 可解释性实验

论文提出了两种评价模型提供解释的能力的指标,Recall 和 AvgSupport,其中 Recall 指的是通过类比结构能够提供解释的预测结果占总预测结果的比例,AvgSupport 是指能提供解释的预测结果的平均的支持度, 支持度是指知识图谱中存在的头尾实体之间的相似结构的实例个数。这两个指标越高,说明模型的可解释性越好。

评价

这篇文章的亮点主要在对实体和关系的交互建模,以及对嵌入的可解释性做了深入的探究。两个结论也很有意思,一个是模型在简单数据集上效果很差而在复杂数据集上效果很好;另外一方面,嵌入模型的预测能力和提供解释的能力并没有直接关联,具有较好预测能力的模型并不一定也具有较好的提供解释的能力,这是两个不同的评估维度。

本文标签: predictionEmbeddingsInteractionGraphsKnowledge