admin管理员组

文章数量:1530054

Richpedia: A Large-Scale, Comprehensive Multi-Modal Knowledge Graph

一、Richpedia是一个图像多模态知识图谱,顾名思义实体分为了文本实体和图像实体,由这些实体构成三元组。论文介绍了Richpedia的建立过程,包括了数据收集、图像处理和关系挖掘。

                                                            图1 构建流程

1、数据收集:
      text实体来自Wikipedia,图像是通过Google,Yahoo和Bing来搜索text实体爬取的。Wikipedia中每个实体包含了唯一的IRI,文中提到将这些IRI添加到Richpedia,而非实体本身。最终一共收集了20638个关于城市、景点和名人的实体。(这里用IRI的原因就是为了后期使用的时候可以直接在Wikipedia上查询)
      对于图像实体,直接从Wikipedia收集,然后在Richpedia创建对应的IRIs。作者一共收集了2883162个实体的图像,平均每个实体保留99.2个。
      收集完两种实体,生成三元组,文中生成了三种三元组。第一种,(ei, rp:imageof, ek)图像实体ei是KG实体ek的图像。(图像与文本的关系imageof);第二种,(ei, rp

本文标签: 图谱多模知识论文Richpedia