admin管理员组文章数量:1558103
A Semi-supervised Graph Attentive Network for Financial Fraud Detection 个人总结
写在前面:为方便阅读,尽量使用中文总结,对于翻译无把握或专有词汇,在中文后附上原文字段。此外,水平有限,对文章理解有偏差部分恳请大家海涵, 指正。
顺便,移步去GitHub看看憋>﹏<
0. 原作信息
@inproceedings{wang2019semi,
title={A Semi-supervised Graph Attentive Network for Financial Fraud Detection},
author={Wang, Daixin and Lin, Jianbin and Cui, Peng and Jia, Quanhui and Wang, Zhen and Fang, Yanming and Yu, Quan and Zhou, Jun and Yang, Shuang and Qi, Yuan},
booktitle={2019 IEEE International Conference on Data Mining (ICDM)},
pages={598--607},
year={2019},
organization={IEEE}
}
1. Contribution 本文贡献
-
设计semi-supervised GNN,利用有标签、无标签数据。(通过设计不同 L o s s Loss Loss实现)
-
使用Hieranchical Attention,增加模型可解释性
-
在花呗的异构数据上很work。
2. Background 背景信息
-
任务: 欺诈检测,Fraud Detection
可视作分类任务,由于异常点的采集,标注极其耗费人力物力,数据集常为少量有标签数据(labeled data),及大量无标签数据(unlabeled data).
模型需要具备解释性, 能向部署方, 被检测者说明检测的判别标准.
-
过往检测方式
- 基于规则, Rule-based
- 原理: 假定欺诈活动基于一定可观测的模式
- 缺点: 耗费人力手工设定, 依赖专家知识; 容易被攻击
- 基于统计特征的机器学习模型
- 如SVM, 树模型等
- 缺点: 未利用用户间交互信息
- 图表示学习的尝试
- 黑箱模型,缺乏解释性
- 基于规则, Rule-based
-
综上,欺诈检测建模有如下灵魂三问:
- 如何处理不平衡的数据,利用无标签的数据? (semi-supervised)
- 如何利用用户间交互,及不同类别的特征? (heterogenous graph)
- 如何保证模型可解释性?
3. The Model Semi-GNN 模型
3.1 Problem Definition and Notations 问题定义及注记
-
图的构建
- 重点研究User用户类型节点, 图中有标签数据<<无标签数据
- 异构图(文中记为multiview graph), G v = { U ∪ S v , E v } , v ∈ { 1 , … , m } G^{v}=\left\{U \cup S^{v}, E^{v}\right\}, v \in\{1, \ldots, m\} Gv={ U∪Sv,Ev},v∈{ 1,…,m}, v v v即view
- view由具体业务确定, 本文中部分view是从用户特征处理产生的, 以增加结构信息. (详见实验部分数据集处理)
-
注记:
3.2 Overview 整体架构
node level(聚合各view内信息) → view level(整合views信息,得到对user的embedding) → relation loss ( 对有/无标签数据不同损失)
3.3 Node Level
对于节点u, i在view v中的特征表示, 设为 e u i v e_{u i}^{v} euiv
∵ 不同邻居节点对节点u的影响不同, 引入Attention来自主学习邻居节点的权重,
α u i v = exp ( e u i v ⋅ H u i v ) ∑ k ∈ N u v exp ( e u k v ⋅ H u k v ) \alpha_{u i}^{v}=\frac{\exp \left(e_{u i}^{v} \cdot H_{u i}^{v}\right)}{\sum_{k \in \mathcal{N}_{u}^{v}} \exp \left(e_{u k}^{v} \cdot H_{u k}^{v}\right)} αuiv=∑k∈Nuvexp(eukv⋅Hukv)exp(euiv⋅Hui
本文标签: GraphAttentiveSemisupervisedFraud
版权声明:本文标题:A Semi-supervised Graph Attentive Network for Financial Fraud Detection 个人总结 内容由热心网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:https://m.elefans.com/dongtai/1727383937a1112202.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论