admin管理员组

文章数量:1536016

编者按

 

 

 

 

本篇文章来自于17th Extended Semantic Web Conference (ESWC2020) 会议。该文章提出了基于语义标注网络的结构化数据集,包含工业4.0标准、范式和框架,并给出了知识图谱在工业4.0应用的现有案例。

 

本文作者北京大学周雨奇,将对原文进行概要阐述。

 

文末提供获取文章获取方式。

 

 

 

 

 

 

摘要  近些年来,对于研究者而言,保持对所在领域最新进展的了解是最主要的事情之一。特别是在快速发展的领域,相关的工作不断增加,不断更新和推翻以前的理论和方法。举例来说,工业制造系统的数字化,称为工业4.0,目前正面临极多的标准化工作和参考方案,导致人们接受到的信息嘈杂。本文提出一个结构化的数据集,该数据集以带有语义注释知识图谱的形式来表示工业4.0的相关标准,规范和参考框架。图谱提供格式一致的带注释的指导以帮助使用者(无论是初学者还是专家)来理解如何部署工业4.0系统。本文还阐述了该图谱在不同任务要求下的适用性,展示了其目前的应用以及进展,评估了其质量。

 

01

引言

工业流程受规范和标准的驱动。工业制造的可靠性和安全性要求严格而正式的规范。ISO,IEC或ETSI等国际机构以及NIST,DIN或ANSI等国家组织都面临着这种需求。它们构成了广受认可的权威机构网络来确保标准和规范的高质量。

表1 资源总览

 

我们提出一个公开的包含的最新I40标准,参考框架以及关键需求的知识图谱。因为对于一个主题来说,其内部相互联系十分频繁,其和外部主题的关系也变化多样,因此我们选择了基于rdf的知识图谱的设计来满足I40标准和参考框架。利用图谱,我们可以检索到以下类型的信息:

 

1.在哪里可以找到关于某个主题的额外信息?

2.哪个规范最适合确保工业4.0设备之间数据交换的安全性?

3.如何找到与一个特定的与工业4.0难题的有关规范?在哪里可以找到适当指南来解决问题?

 

本工作的一个亮点是其提供了与外部数据源的关系。公开可用的信息(例如来自DBpedia的信息)帮助用户理解,让用户从其他数据源中获得更多信息,这有利于以下人群使用: 感兴趣的系统架构师来发现和学习合适的设计模式,在标准化组织工作的I40专家需要注意和观察别人工作可能带来对自己工作有益的启发,寻找最佳方法的组件开发人员寻找合适的接口和模型,系统集成开发者需要了解常见的数据模型和它们之间交互模式,机器制造商需要确保他们的数字接口的可持续性,I40初学者利用图谱来更轻松入门。

 

针对上述挑战,我们做到了以下几点:(1)开发了一个工业4.0知识图谱(I40KG),(2)展示其维护和管理过程,(3)讨论其作为其他资源和应用基础的适用性。

I40KG有助于克服与实现有关工业4.0要求太多背景知识的障碍的愿景。

 

02

I40KG 的应用领域和其带来的冲击

本节解释I40KG的背景,描绘其发展前景,并将其与目前类似的方法进行比较。

 

2.1 现状

I40KG面临的挑战——支持新学者、领域专家和任何其他利益相关者对已发布的标准、框架和关注点建立和组织一个适当的概观,是阻碍I40的走向被广泛应用的关键障碍之一。在此介绍的工作扩展了之前为工业4.0标准创建整体本体的努力。Grangel-González等人[7]介绍了工业4.0组件的第一个本体,特别是针对资产管理模型。作为对这项工作的扩展,[6]发展了图的基本结构和模式,以及根据统一格式构建工业4.0相关标准和规范的第一种方法。这些工作介绍了标准和标准化框架概念的初始定义。Bader等人[2]提出了进一步的扩展,使用Industry 4.0参考框架和基于web的可视化服务和交互式视图增强了图谱的易用性。

I40KG是第一个应用机器可读数据互连包含I40标准化知识的文本、规范和信息资源的结构化方法。与早期的工作相比, I40KG包含的实体数量已经大大增加,从Grangel-González等人提出的不到80个扩展到超过300个实例。此外,为了允许用户过滤特定案例和利用相关实体的上下文,I40KG已经引入和实现了大量的受Industry 4.0影响的要求。

 I40KG构成了一个由相关标准、参考框架和关注点组成的机器可读资源集。因此,它包含整个工业4.0主题的可扩展表示。与更常见的文献综述相比,I40KG是一个语义丰富且可公开访问的资源,它代表了该领域在现在及以后的状态。就我们所知,目前没有可获得的类似的知识图谱或资源。

关联数据的原则,特别是通过已建立的网络技术公开访问的数据,是语义网社区的核心。我们提出的知识图谱利用了这些实践,并将以前独立的信息源与链接的开放数据云(特别是DBpedia)连接起来。因此,SemanticWeb社区可以利用知识图谱来构建和扩展I40上下文中的各种相关工作。然而,I40KG的目标用户并不局限于语义网社区。由于数字化的主要趋势影响到任何领域,特别是目前的制造业,多个社区可以从I40的工作中受益,I40中获得的启发可以辐射到智能城市、新的移动解决方案、智能家居等领域。

由于I40KG遵循提供链接数据的原则,它还可以作为向其他社区传播语义技术的一种方式。我们遵循了Noy等人制定的建议和指南[12],以确保图的质量。目标群体一般不太熟悉语义网,特别是基于RDF的知识图谱,因此大家对I40KG的适应可以进一步支持语义网和链接开放数据概念和做法的传播。

 

2.2 相关工作

与本文中提出的工作类似的综述通常以两种形式出现。一种是,具有学术背景的专家收集相关的出版物并将其纳入文献综述。另一种是,行业专家和协会通过参考框架和白皮书发布他们对该领域的观点。这两种方法都需要读者进行大量的精力来发现、查找和理解所提供的内容。此外,知识仅在发布日期前后的有限时间内有效。针对最近的进展来更扩展和调整资料,更新资料并不是常见的做法。特别是在研究界,更新调查论文以反映第一次发表后学界的发展这种事情通常不会发生。

尽管如此,每年仍有大量关于工业4.0和相关物联网的回顾。例如,Xu等人对主要驱动因素和标准化活动[16]进行了全面概述,并提到了关键的发展和关注点。Martinez等人概述了工业4.0与网络物理系统和(工业)物联网[14]的关系。然而,学术界的通常做法是,忽略有关技术标准的参考。这个做法并不能反映对于工程和实施过程的标准和规范的与实际是否相符。

在互联网上查询技术信息主要通过搜索引擎。尽管越来越多的引擎可以直接回答并返回相关信息,例如通过显示Wikipedia摘要,但通常只提供web站点的集合。然后,用户必须手动发现和检查信息源。特别是对于查找技术信息的需求,这种方法效率非常低,非常耗时。需要相当多的背景知识。Lafia, Turner和Kuhn[10]展示了开放数据上的语义注释和映射是如何改进发现过程的。尽管如此,搜索有针对性的、特定领域的信息仍然是一个很大的问题。

访问的数据集,因为贡献和见解仅代表书面文本,不能被进一步的工具和应用程序处理。

图1 I40KG的三个部分 

 

一些作品解决了构建工业标准的挑战。例如,Lu等人[11]描述了一个智能制造系统。类似地,Andreev等人[1]提供了一些无线电连接标准和技术的可视化比较。然而,这些调查都没有提供一个可访问的数据集,因为他们的贡献和见解仅是书面文本,不能被进一步用工具和应用程序处理。

 

03

设计和技术质量

I40KG设计时遵循将资源作为链接数据发布的做法。如表2所述,资源遵循公平原则,以透明和开放的方式创建、策划和获取。使用Wilkinson等人[15]的符号在括号中列出所需的特性。图中还重复使用了通用的RDF词汇表。上层本体,如DUL或DCTERMS,支持对类和属性的理解。与DBpedia资源的关系有助于识别实体,而且还为进一步查找提供了有价值的指导。

 

表2 I40KG的细节

 

3.1本体描述

在本节中,我们将介绍I40KG的组成。I40KG采用模块化设计,以确保源的可维护性和增加用户的可读性。正如Parent和Spac- capietra[13]所建议的,每个部分都关注在各自的Turtle文件中的子域——标准、关注点和参考框架(参见图1)。每个部分通过owl:imports语句相互依赖。

原有的标准本体得到了扩展,但仍作为其他模块的基础。它把标准作为一个逻辑概念,定义了属性和关系,并包含所有标准实例(如图2)。关注(concerns),作为ISO42010[9]中定义的,可以理解为本领域的需求,动机或问题。为了提高可读性,我们把术语“关注”(concern)和“需求”(requirement)作为同义词,尽管ISO 42010中的定义略有不同。

 

3.2 I40KG示例实例

图3显示了一组I40KG实例。关于AutomationML的IEC 62714与其他标准有不同的联系(如,sto:uses, sto:isComponentOf, sto:relatedTo)。此外,注释(键为绿色,值为黄色)解释实体本身,包含源的官方位置信息。对于IEC标准,这通常是IEC网站上各自的标准。我们还提供了与外部资源的更多关系,主要是对Wikipedia/DBpedia。

图2 标准模型的核心类别和属性

 

如图3所示,IEC62714被归类为RAMI控制装置,这是一个与RAMI4.0标准化框架相关的标准分类方案。用户可以遍历这些链接并发现另一个RAMI4.0可信度的标准分类实例Trustworthiness,,“关注”(concern)的内容在图4中有展示。通过这种方式,用户可以获得更多的信息,也可以进一步探索I40KG。

  图3 包含实体:标准(IEC 62714)通过框架(RAMI)和需求(可信赖性)链接到标准分类(RAMI)。

 

图4 关注(concern)的层次结构, 说明系统的“可信赖性”和其基本的关注(concern)分类。

 

3.3更新过程

知识图的维护遵循三种不同的插入过程。如图5展示了标准(上)和参考框架(下)的选择、审查和标注过程。关于选择标准的细节参见[3,6],因此在这里省略。这两种方法都使用GitHub远程仓库及其提交历史记录来确保透明性。

除了手动扩展,我们还引入了一个自动更新过程(参见图5)。由于新标准的更新频率已经太高,我们使用一个机器人搜索此类事件,将元数据映射到RDF,滤出相关标准和规范,并提出结果插入到I40KG中。目前,只有IEC标准受到监测,但我们打算将其推广其它标准中。自动更新过程最终需要手动审批来确认,通常还需要对外部资源(例如DBpedia资源)附加注释。

图5 插入过程:创建I40KG的3个子过程

 

04

获取I40KG

I40KG遵循大家的通常的最好做法建立对本体和关联数据资源的进行记录。我们为所有类、属性和实例提供了一个易读的文档。http://i40.semantic-interoperability/sto/.)此外,还提供了一些序列化文件,例如RDF-XML、Turtle、N-Triples等,其中Turtle文件作为最终解释。重定向和内容协商可以为每个客户端提供最合适的序列化协商。

I40KG及其实体在名称空间STO中定义,为了大家可长期访问性使用W3IDs。STO是“标准本体论”(Standard Ontology)的首字母缩写,由于可持续性的原因被保留下来。知识图谱在CreativeCommons 3.0许可下可用,任何人都可以为任何目的重用。根据A-和T-Box对原始图谱进行扩展是可能的,但需要创建者的批准,以确保内容的一致性和质量。变更请求可以发送到我们的指定位置,一个公开的GitHub存储库(参见表1)。

知识图谱的维护和进一步发展会发表到GitHub库中,特别是通过GitHub issue。其也是我们主要的沟通渠道,以便提出变更、记录错误和概要扩展。完整的源代码可以访问,所有的更改和更新都是开可见和透明的。我们遵循语义网的最佳实践,每个实体都用众所周知的注释属性进行注释,即rdfs:label, rdfs:comment,并链接到DBpedia资源(只要存在合适的条目)。

 

05

图形内容的可重用性

 

我们所描述的知识图谱可以应用于多个项目中。在国际数据空间(IDS)的情况下,它不仅用于其数据模型,而且还作为I40领域的一般参考资源以及最新的参考框架和架构。(https://www.internationaldataspaces/)我们使用I40KG之上的知识图谱嵌入(embedding)来挖掘标准之间的关系。https://github/i40-Tools/I40KG-Embeddings/。然后我们使用无监督机器学习方法,例如聚类,来揭示I40KG中现有标准的关系。为了支持和概述所提供信息内容,我们开发了一个可视化工具。https://i40-tools.github.io/StandardOntologyVisualization/其中各种预配置视图允许对I40KG的实体进行交互选择和比较。该网站提供了包含标准的层次概览、时间轴、可视化各种相互关系的网络视图和利用维恩图和共现矩阵的比较工具。图6和图7显示其效果。此外,一个公开的SPARQLendpoint提供了I40KG的最新版本,它也托管在一个VoCol实例[8]上。

所有常见的RDF工具都可以使用I40KG及其源文件。只要合适,它的核心类就与上层本体相关联。特别的,链接到的DBpedia资源允许它直接与其他知识图谱集成,特别是开放数据云(Linked Open Data Cloud)。然而,I40KG并不打算完全覆盖该领域,也不代表或判断所提及的标准、规范和框架的内部质量。对于特定的上下文或用例,最终决定某个标准或规范的适用性是——而且总是必须是——由用户负责的。I40KG可以支持用户有效地获得概述并发现未知资源。当我们不断地扩展和更新图表时,完美的覆盖既不可能也不打算实现。然而,领域的充分完备性是必要的,并且已经由Bader等人[2]检验过了。所提出的选择标准显示了如何审查学术和行业影响,以优化发现和过滤I40KG实体。

尽管如此,让知识图谱变成一个包含尽可能多内容的全面概述是可取的。我们用两种方法对知识图谱进行评估。第5.1节解释了潜在的用例,展示了可以解决哪些任务,以及I40KG如何能够支持目标人群。第5.2节描述了执行的测试和质量度量。

图6 参考框架和标准的维恩图

 

图7所示 关注和分类类别之间的共现矩阵

 

5.1 用户画像

 知识图谱有多种用途。我们通过描述几个用户的故事来作为示例。Alice, Bob和Charlie代表典型的用户,他们在工业4.0的环境中都有不同的背景和信息需求。

Alice刚刚开始研究工业4.0的应用,她需要快速了解最具影响力的参考框架。她必须使用正确的术语和概念与顾问、供应商和开发人员进行沟通,以便有效地管理项目资源。Alice查看提到的web服务的层次结构视图,了解哪些框架包含哪些类别和标准。她快速了解了在几乎所有框架中哪些标准是最普遍的。她研究了各分类之间的关系,并浏览了与标准和其他著作以及新参考框架的联系。这个过程让她对该领域的结构、相关的技术标准以及它们之间的关系有了一个大致的了解。Alice还在I40KG上执行无监督机器学习算法。这些算法的输出提供了关于标准之间不存在关系的知识,可用于改进框架所提供的分类,使得当前工业4.0标准的知识得以丰富,从而增强了Alice对这个复杂领域的理解。

I40KG的另一个用户是Bob,他是一个在标准化委员会工作的行业专家。他了解工作组工作和想法的所有细节,并知道是哪些论点导致了该委员会提议了哪些办法。对于指导方针的进一步迭代,Bob希望了解焦点和现状,了解现存的一些既相互补充又相互竞争的做法。此外,Bob为他自己的标准化工作寻找好的想法。

图8 参考框架相似性。

 

Bob使用I40KG创建如图8所示的分析。快速浏览一下结果,他发现(参见图8(1)),例如,在Plattform Industrie 4.0资产管理模型中定义的概念与参考架构模型Industry 4.0 (RAMI4.0)密切相关。这是一个非常明显的发现,因为这两个模型都是由同一个组织发布的,Bob根据知识图中两个实体之间的关系迅速识别了这一点。此外,Bob还指出了工业互联网联盟(IIC)的参考体系结构和FIWARE平台规范以及IoT-A参考体系结构[4]之间有一个重要的重叠(参见图8(2)和(3))。(https://www.fiware/ )他已经熟悉IIC的工作,因此他决定也看看FIWARE和IoT-A的著作,因为它们可能提供进一步适当的见解。

Charlie是一位高级系统架构师,他知道他的客户在下一个项目中将面临的关注点和需求。为了确保数据安全,他在找一个最佳做法。前面提到的web服务的共现矩阵描述了Charlie关注的是哪个参考框架和哪个各自的分类框架。

图9 重点比较。通过参考架构计算工业4.0要求的总覆盖范围。较高的分数并不意味着较高的质量,而是一个主题的覆盖面更广。

 

此外,他使用关注层次结构来聚合I40KG的信息(如图 9)。Charlie可以看到IIC参考体系结构在互操作性引用方面优于其他体系结构(cf. Fig. 9(1))。然而,由于数据保护是他的主要目标,IDS参考体系结构模型似乎是一个更有价值的信息源(参见图9(2)和(3))。

 

5.2 技术评估

 常用的工具如本体缺陷检查器和RDF-TripleChecker已经对语法质量进行了检查。(http://oops.linkeddata.es/ )(http://graphite.ecs.soton.ac.uk/checker/)这些工具表明,就常见的RDF和本体缺陷而言,I40KG是一致的和正确的。凡是提到的工具表明有改进潜力的地方,相应的部分都经过了严格的手工评估。报告也托管在GitHub存储库中。

例如,这些报告提到了两个问题。一些属性缺少域和/或范围属性,有时类的拆离性没有得到充分声明。然而,已经明确决定不为所有属性设置范围和域,因为它们对I40KG推理的影响很容易导致不一致。另一方面,完全分离语句是相当少见的,它只给图本身增加有限的附加值,但需要大量的维护。

此外,我们使用Färber等人[5]提出的指标来评估I40KG的质量。表3包含了Färber等人根据类别分组的所有指标,以便提供尽可能多的信息。然而,几个建议标准的表达是有缺陷的。一个原因是I40KG覆盖了一个新的结构化开放数据领域,因此不存在黄金标准(完全性)。此外,已明确决定避免某些声明和关系。例如,标准的有效性时间不是由发布者决定的,这使得插入的任何信息在默认情况下都是错误的。关于资源互连的建议,owl:sameAs会导致错误的推断,导致引入,例如sto:hasDBpediaResource和sto:hasWikipediaResource等。

 表3 I40KG的评估结果

 

总而言之,我们相信I40KG能够满足社区的期望和标准,尽管有些指标无法满足。我们认为,这些特征有助于潜在用户更好地评估I40KG的完整度和限制。在可行的情况下实施了最佳做法和建议。为了保持总体资源的最佳质量,并支持语义社区的应用,偏差部分已经被分析并处理。

 

06

结论与未来工作

在本文中,我们展示了工业4.0知识谱,描述了标准、参考框架和关注的最新状态。该资源描述、连接和概述了最相关的信息源。我们解释了I40KG的特性,介绍了它的内容,概述了它的各种应用。I40KG在设计上符合链接数据原则,并通过一组支持工具、文档和托管服务进行了增强。它的管理和维护是透明的,并向社会开放

我们认为,对于每个参与的参与者来说,繁琐的搜索和复杂的信息资源的结构是障碍实现工业4.0的关键之一。本文提出的方法正是针对这一挑战。语义网技术的好处是可以支持工业群体,并进一步触及新的应用领域。我们已经概述了I40KG如何解决这些问题,并为不同的目标群体创造附加值的想法。

I40KG将得到进一步的维护和扩展。在达到一定的成熟之后,我们接下来将重点关注I40KG更高级的应用。例如,图的形式化知识可以用来提高基于机器学习的推荐系统的性能。图谱主要的目标是并一直是继续支持制造业的现代知识分子。工业4.0面临的障碍和需要花费努力仍然太昂贵,阻碍了其广泛传播。

 

06

参考文献

  1. Andreev, S., Galinina, O.,Pyattaev, A., Gerasimenko, M., Tirronen, T., Torsner, J., et al.: Understandingthe IoT connectivity landscape: a contemporary M2M radio technology roadmap.IEEE Commun. Mag. 53(9), 32–40 (2015)

  2. Bader, S.R., Grangel-González, I., Tasnim, M., Lohmann, S.: Structuring the industry 4.0landscape. In: International Conference on Emerging Technologies and Factory Automation(ETFA), pp. 224–231. IEEE (2019)

  3. Bader, S.R., Maleshkova, M.,Lohmann, S.: Structuring reference architectures for the industrial internet ofthings. Future Internet 11(7), 151 (2019)

  4. Bassi, A., et al.: EnablingThings to Talk: Designing IoT Solutions with the IoT Architectural ReferenceModel. Springer, Heidelberg (2013). https://doi/10.1007/978-3-642-40403-0

  5. Färber, M., Bartscherer, F., Menne, C., Rettinger, A.: Linked dataquality of DBpedia, Freebase, OpenCyc, Wikidata, and YAGO. Seman. Web 9(1),77–129 (2018)

  6. Grangel-González, I., et al.: The industry 4.0 standards landscape from asemantic integration perspective. In: ETFA 2017, pp. 1–8. IEEE (2017)

  7. Grangel-González, I., Halilaj, L., Auer, S., Lohmann, S., Lange, C., Collarana,D.: An RDF-based approach for implementing industry 4.0 components withadministration shells. In: ETFA 2016, pp. 1–8. IEEE (2016)

  8. Halilaj, L., et al.: VoCol: anintegrated environment to support version-controlled vocabulary development.In: Blomqvist, E., Ciancarini, P., Poggi, F., Vitali, F.

    (eds.) EKAW2016. LNCS (LNAI),vol. 10024, pp. 303–319. Springer, Cham (2016). https://doi/10.1007/978-3-319-49004-520

  9. Hilliard, R., et al.:ISO/IEC/IEEE 42010: Systems and Software Engineering - ArchitectureDescription, December 2011

  10. Lafia, S., Turner, A., Kuhn,W.: Improving discovery of open civic data. In: 10th InternationalConference on Geographic Information Science, GIScience. LIPIcs, vol. 114, pp.9:1–9:15. Schloss Dagstuhl (2018)

  11. Lu, Y., Morris, K.C.,Frechette, S.: Current standards landscape for smart manufacturing systems.NIST, no. 8107, p. 39 (2016)

  12. Noy, N.F., McGuinness, D.L.,et al.: Ontology Development 101: A Guide to Creating Your First Ontology(2001)

  13. Parent, C., Spaccapietra, S.:An overview of modularity. In: Stuckenschmidt, H., Parent, C., Spaccapietra, S.(eds.) Modular Ontologies. LNCS, vol. 5445, pp. 5–23. Springer, Heidelberg(2009). https://doi/10.1007/978-3-642-01907-4 2

  14. Saucedo-Martínez, J.A., Pérez-Lara, M.,Marmolejo-Saucedo, J.A., Salais-Fierro, T.E.: Industry 4.0 framework formanagement and operations: a review. J. Ambient Intell. Humaniz. Comput. 9(3),789–801 (2018)

  15. Wilkinson, M.D., et al.: TheFAIR guiding principles for scientific data management and stewardship. Sci.Data 3 (2016)

  16. Xu, L.D., Xu, E.L., Li, L.:Industry 4.0: state of the art and future trends. Int. J. Prod. Res. 56(8),2941–2962 (2018)

     

 

 

免责申明:本文全部内容均来源于网络开放信息整理,如有侵权,请联系删除

本文标签: 图谱工业知识