Overlapping Community Detection with Graph Neural Networks|电子爱好者

admin管理员组
文章数量:1626372

论文： Overlapping Community Detection with Graph Neural Networks.
源码： https://github/shchur/overlapping-community-detection

文章概述

现有的用于社团检测的神经网络只检测不相交的社区，而真实的社区却是重叠的，针对这一不足，提出了一种基于GNN的重叠社区检测模型NOCD。文章通过GCN模型学习图的隶属关系矩阵（affiliation matrix）F，用最大似然估计使F生成的图和真实图尽量相似，从而获得每个节点所属的社区。

Algorithm/Model

Bernoulli–Poisson model
Bernoulli–Poisson（BP） model是一种允许重叠社区存在的图生成（graph generative）模型，根据隶属关系矩阵 F ∈ R ⩾ 0 N × C F\in\mathbb{R}_{\geqslant0}^{N\times C} F∈R⩾0N×C，可以生成对应的邻接矩阵，表示为：
A u v ∼ B e r n o u l l i ( 1 − e x p ( − F u F v T ) ) \\A_{uv}\sim Bernoulli(1-exp(-F_uF_v^T))\, Auv∼Bernoulli(1−exp(−FuFvT))
F u F_u Fu是隶属关系矩阵F中节点u的行向量，直观来说，u和v的共同社区越多（即 F u F v T F_uF_v^T FuFvT的点积越大），它们就越有可能有边相连。

Model definition
Bernoulli–Poisson模型的最大负对数似然估计：
− log ⁡ p ( A ∣ F ) = − ∑ ( u , v ) ∈ E log ⁡ ( 1 − e x p ( − F u F v T ) ) + ∑ ( u , v ) ∉ E F u F v T \\-\log p\left(\left.A\right|F\right)=-\sum_{(u,v)\in E}\log\left(1-exp(-F_uF_v^T\right))+\sum_{(u,v)\notin E}F_uF_v^T\, −logp(A∣F)=−(u,v)∈E∑log(1−exp(−FuFvT))+(u,v)∈/E∑FuFvT
真实世界的图通常是非常稀疏的，这意味着方程中的第二项对损失的贡献要远大于第一项。于是使用了不平衡分类（imbalanced classification）的技术，通过平衡这两项来使损失函数更加合理：
L ( F ) = − E ( u , v ) ∼ P E [ ∑ log ⁡ ( 1 − e x p ( − F u F v T ) ) ] + E ( u , v ) ∼ P N [ F u F v T ] \\L(F)=-E_{(u,v)\sim P_E}\left[\sum\log\left(1-exp(-F_uF_v^T\right))\right]+E_{(u,v)\sim P_N}\left[F_uF_v^T\right]\, L(F)=−E(u,v)∼PE[∑log(1−exp(−FuFvT))]+E(u,v)∼PN[FuFvT]
其中， P E P_E PE和 P N P_N PN分别表示edges和non-edges上的均匀分布。
传统方法直接优化隶属关系矩阵F，本文使用GNN，寻找参数 θ ∗ \theta^\ast θ∗最小化平衡的负对数似然函数：
θ ∗ = arg ⁡ min ⁡ θ L ( G N N θ ( A , X ) ) \\\theta^\ast=\mathop{\arg\min}\limits_{\theta}L(GNN_\theta(A,X))\, θ∗=θargminL(GNNθ(A,X))
使用2层的图卷积神经网络GCN作为NOCD模型的基础，GCN定义为：
F ≔ G C N θ ( A , X ) = R e L U ( A ^ R e l U ( A ^ X W ( 1 ) ) W ( 2 ) ) \\F\coloneqq GCN_\theta(A,X)=ReLU(\hat{A}RelU(\hat{A}XW^{(1)})W^{(2)})\, F:=GCNθ(A,X)=ReLU(A^RelU(A^XW(1))W(2))
其中 A ^ = D ~ − 1 / 2 A ~ D ~ 1 / 2 \hat{A}=\tilde{D}^{-1/2}\tilde{A}\tilde{D}^{1/2} A^=D~−1/2A~D~1/2, A ~ = A + I N \tilde{A}=A+I_N A~=A+IN。模型与标准GCN模型的两个主要区别是(1)第一个图卷积层后的batch normalization和(2)所有权重矩阵的 L 2 L_2 L2正则化。模型有两种，一种是将节点属性X作为输入的NOCD-X，一种是使用邻接矩阵作为输入的NOCD-G。

Scalability
BP模型可以通过缓存技巧，使复杂度从 O ( N 2 ) O(N^2) O(N2)降低到 O ( N + M ) O(N+M) O(N+M)。通过不使用全部的邻接矩阵A，而是使用S个edges和non-deges的mini-batch，可以进一步加速。

在衡量指标的选取上，文章认为使用Jaccard和F1score可能非信息不完全的社区任意高的分数，而使用重叠归一化互信息（NMI）作为衡量指标更为健壮和有意义。

Experiment Detail

文章引入了4个新的论文引用数据集
为了证明GNN的存在是必要的，还与将GNN替换成多层感知机（MLP）和直接优化F的方法进行了对比，结果说明使用GNN是有意义的

本文标签： Detection Community Overlapping Networks neural

版权声明：本文标题：Overlapping Community Detection with Graph Neural Networks 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/dongtai/1728944570a1181100.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Overlapping Community Detection with Graph Neural Networks

文章概述

Algorithm/Model

Experiment Detail

更多相关文章

visual Studio 2019 community 如何实现MFC开发及调试

【Python】PyCharm2021.2 Community安装及环境变量配置

警告：mysql-community-server-5.7.28-1.el7.x86_64.rpm: 头V3 DSASHA1 Signature, 密钥 ID 5072e1f5: NOKEY 错误：

安装mysql 8报错：mariadb-libs 被 mysql-community-libs-8.0.22-1.el7.x86_64 取代

VS 2015 社区版(Community) 试用期(30天)之后，账户登录

PyCharm Community Edition 2023.2.5，可用软件包无法显示解决方法；更新软件包列表时出错: Connect timed out 解决方法。

解决linux安装mysql-community-client-5.7.37-1.el7.x86_64的依赖检测失败问题

prometheus-community-PushProx介绍

MySQL 8.0.27.1版本安装(mysql-installer-community-8.0.27.1.msi)

VS2019 社区版(community) 离线版本 解决“试用30天过期”步骤

Visual Studio 2019 Community 离线注册教程

社区发现(Community Detection)算法

Pycharm-community-2020.2.3 社区版安装教程

Failing package is: mysql-community-client-5.7.38-1.el7.x86_64 GPG Keys are configured as: file:

python pip install community安装不了？？？

Linux下rpm方式安装MySQL遇到warning: mysql-community-server-5.7.25-1.el7.x86_64.rpm: Header V3 DSASHA1 Sign

Navicat for Mysql和mysql community的安装和简单使用

IDEA Community(社区版) 使用Maven创建Web工程 并部署tomcat

Visual studio community 2013，this licence has expired, The online service is not available

Pycharm（Community版本）和Python 3.9.0的安装与配置2020-10-26

发表评论

推荐文章

std::priority_queue 报错Expression invalid comparator

BUG的Priority()和Severity属性

Chrome应用商店打不开问题

iPhone安装.ipa文件

mysql离线安装报错：error: Failed dependencies: net-tools is needed by mysql-community-server-5.7.16-1.el7.

热门文章

在互联网公司当中，实施工程师是干什么的呢?为什么要负责与客户沟通呢？从单词起源和词根词缀、例句等等角度记住该单词，delegate1. 单词起源2. 词根词缀3. 词性及定义4

Win10切换共享文件夹账号

如何开心愉快兴趣满满的学习机器人和人工智能知识并提升思维力

＜Attention Is All You Need＞：全网首次提出Transformer模型论文中英文对照学习

STL中的序列式容器——priority_queue（优先队列）

Android 设备在Play Store无法搜索下载Netflix软件

es文件管理服务器的ip,es文件浏览器访问ftp服务器

【Elasticsearch】es脚本编程使用详解

xsmax进入dfu模式_iPhone XSXS Max如何强制重启？如何进入恢复模式或DFU模式？

如何快速安装mysql-community-server

最新文章

hp服务器330g6怎么安装系统,HP ProLiant ML330 G6配置和特点解析

Linux之系统安装读书笔记

linux麒麟操作系统,优麒麟系统最新版下载_优麒麟操作系统下载[国产操作系统]-下载之家...

计算机操作系统安装及备份系统部分,操作系统安装、备份和还原.ppt

win10重装Ubuntu22.04安装报错复盘

液晶电视测试软件u盘,突破封锁！用U盘给电视安装APP居然这么简单

windows1011系统安装教程、U盘安装教程

电脑里大容量HTML文件,大容量U盘重装系统 快速备份全部电脑文件

使用U盘安装Ubuntu系统

怎样用U盘安装Ubuntu系统ubuntu系统怎么安装

电脑重装系统经验总结

服务器怎么用u盘加载硬盘驱动,戴尔服务器安装用U盘加载硬盘控制卡驱动.pdf

如何安装 Windows+ubuntu 双系统

nas存储服务器操作系统,你会用 NAS 给 PC 装系统吗？

搞个服务器安装黑群晖系统,牛人闲置电脑大改造！超低成本组建家用黑群晖NAS...

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

如何通过treenode实现二叉树

VS2019 社区版(community) 离线版本解决“试用30天过期”步骤

IDEA Community(社区版) 使用Maven创建Web工程并部署tomcat

电脑里大容量HTML文件,大容量U盘重装系统快速备份全部电脑文件

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载