Google图嵌入工业界最新大招高效解决训练大规模深度图卷积神经网络问题.docx
《Google图嵌入工业界最新大招高效解决训练大规模深度图卷积神经网络问题.docx》由会员分享,可在线阅读,更多相关《Google图嵌入工业界最新大招高效解决训练大规模深度图卷积神经网络问题.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、Google图嵌入工业界最新大招,高效解决训练大规模深度图卷积神经网络问题 导读 本文主要介绍Google发表在KDD 2019的图嵌入工业界最新论文 提出Cluster-GCN 高效解决工业界训练大规模深度图卷积神经网络问题 性能大幅提升根底上依靠可训练更深层网络到达SOTA效果 并开源了源代码。 |yyl424525 来源 |CSDNboke 整理 |深度传送门 ID: deep_deliver 摘要 图卷积网络 GCN 已经成功地应用于许多基于图形的应用 然而 大规模的GCN的训练仍然具有挑战性。目前基于SGD的算法要么面临着随GCN层数呈指数增长的高计算本钱 要么面临着保存整个图形以及
2、每个节点的embedding到内存的宏大空间需求。本文提出了一种新的基于图聚类构造且合适于基于SGD训练的GCN算法 Cluster-GCN。 Cluster-GCN的工作原理如下 在每个步骤中 它对一个与通过用图聚类算法来区分的密集子图相关联的一组节点进展采样 并限制该子图中的邻居搜索。这种简单且有效的策略可以显著进步内存以及计算效率 同时可以到达与以前算法相当的测试精度。 为了测试算法的可扩展性 创立了一个新的Amazon2M数据集 它有200万个节点以及6100万个边 比以前最大的公开可用数据集 Reddit 大5倍多。在该数据上训练三层GCN Cluster-GCN比以前最先进的VR-
3、GCN 1523秒vs 1961秒 更快 并且使用的内存更少 2.2GB vs 11.2GB 。此外 在该数据上训练4层GCN Cluster-GCN可以在36分钟内完成 而所有现有的GCN训练算法由于内存缺乏而无法训练。此外 Cluster-GCN允许在短时间以及内存开销的情况下训练更深化的GCN 进而进步了使用5层Cluster-GCN的预测精度 在PPI数据集上实现了最先进的test F1 score 99.36 而之前的最正确结果是98.71。 背景介绍 图卷积网络 GCN 9在处理许多基于图的应用中日益流行 包括半监视节点分类9、链路预测17以及推荐系统15。对于一个图 GCN采用图
4、卷积运算逐层地获取节点的embedding 在每一层 要获取一个节点的embedding 需要通过收集相邻节点的embedding 然后进展一层或者几层线性变换以及非线性激活。最后一层embedding将用于一些最终任务。例如 在节点分类问题中 最后一层embedding被传递给分类器来预测节点标签 进而可以对GCN的参数进展端到端的训练。 由于GCN中的图卷积运算 operator 需要利用图中节点之间的交互来传播embeddings 这使得训练变得相当具有挑战性。不像其他神经网络 训练损失可以在每个样本上完美地分解为单独的项 decomposed into individual terms
5、 GCN中的损失项(例如单个节点上的分类损失)依赖于大量的其他节点 尤其是当GCN变深时。由于节点依赖性 GCN的训练非常慢 需要大量的内存反向传播需要将计算图上的所有embeddings存储在GPU内存中。 现有GCN训练算法缺陷 为了证明开发可扩展的GCN训练算法的必要性 文中首先讨论了现有方法的优缺点 包括 内存需求、每个epoch的时间、每个epoch收敛速度。 这三个因素是评估训练算法的关键。注意 内存需求直接限制了算法的可扩展性 后两个因素结合在一起将决定训练速度。在接下来的讨论中 用N为图中的节点数 F为embedding的维数 L为分析经典GCN训练算法的层数。 GCN的第一篇
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Google 嵌入 工业界 最新 高效 解决 训练 大规模 深度 图卷 神经网络 问题
限制150内