admin管理员组文章数量:1590151
研究问题
研究了实体嵌入和关系嵌入之间的交叉交互问题,并试图为三元组提出可依赖的解释
背景动机
- 之前的基于嵌入的模型没有把crossover interactions纳入考虑,即从实体到关系的交互和从关系到实体的交互(大部分模型没有考虑这二者的交互,少部分模型只考虑了从关系到实体的交互)
- 论文举了一个例子,假设上图中的实线是已知三元组,虚线是未知三元组,目标是预测。则关系到实体的交互可以定义为“要预测的关系会影响到实体的信息筛选”,也就是预测时选择红色的线而非蓝色的线作为输入信息;而实体到关系的交互定义为“实体所拥有的信息会影响关系的推理路径的选择”,也就是选择右边的浅红色推理路径。
模型思想
每一个实体和关系都由多个嵌入来表征,一部分是general嵌入,保留着high-level属性;还有一部分是interaction嵌入,保留着交叉相互作用的specific属性。交互嵌入通过计算general嵌入和交互矩阵C的哈达玛积来得到。
模型框架
- 总体框架
- 链路预测的计算过程
假设实体对应的嵌入矩阵为,关系嵌入矩阵为,交互矩阵为,对于给定的三元组h,t,r,其对应的one-hot编码分别为和
嵌入的计算公式为
则实体的交互嵌入计算为
关系的交互嵌入计算为
二者的非线性结合表示为
得分函数定义为
crossE的得分函数可以展开为
作为对比,crossES移除了交互部分,其得分函数为
- 可解释性的计算过程
作者将可解释性定义为推理路径的查找,比如说下图中,左侧是推理路径或者说前提,右侧是结论,左侧就是对右侧的一个解释
可解释性算法分为以下步骤:
- 寻找相似的关系:对于关系r,其相似关系的集合定义为
- 搜索h和t之间的路径:这里的路径长度最多为2,穷举法在上面定义的候选关系集合内部搜索以下几种情况
- 搜索相似节点:对于实体h,其相似实体的集合定义为
- 搜索相似结构:
总体流程如下
一些实例如下
实验部分
- 链路预测对比实验
hit10结果对比
这个实验结果很有意思,模型在WN18数据集上的效果并不出色,但是FB15k上远超其他模型,说明模型更适合于复杂的数据集
- 可解释性实验
论文提出了两种评价模型提供解释的能力的指标,Recall 和 AvgSupport,其中 Recall 指的是通过类比结构能够提供解释的预测结果占总预测结果的比例,AvgSupport 是指能提供解释的预测结果的平均的支持度, 支持度是指知识图谱中存在的头尾实体之间的相似结构的实例个数。这两个指标越高,说明模型的可解释性越好。
评价
这篇文章的亮点主要在对实体和关系的交互建模,以及对嵌入的可解释性做了深入的探究。两个结论也很有意思,一个是模型在简单数据集上效果很差而在复杂数据集上效果很好;另外一方面,嵌入模型的预测能力和提供解释的能力并没有直接关联,具有较好预测能力的模型并不一定也具有较好的提供解释的能力,这是两个不同的评估维度。
本文标签: predictionEmbeddingsInteractionGraphsKnowledge
版权声明:本文标题:Interaction Embeddings for Prediction and Explanation in Knowledge Graphs 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dongtai/1728075905a1144469.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论