北京智源-京东联合实验室“城市计算夏令营”第四天

课程:Frontiers in Network Embedding and GCN
报告人:崔鹏
报告人简介:清华大学计算机系长聘副教授,博士生导师,“智源学者”青年科学家。研究方向为大规模网络表征学习、大数据驱动的因果推理和稳定预测。
课程介绍
如今,网络越来越大,越来越复杂,应用越来越广泛。要有效地处理图数据,需要通过网络表示学习使模式发现、分析和预测等高级分析任务在时间和空间上都能有效地进行。崔教授介绍网络嵌入和GCN的最新趋势和成果,包括 disentangled GCN、anti-attack GCN等。

333

网络数据广泛存在
网络学习的挑战:1、很多没有标准化的数据。2、很难对点和边做同步处理

11-2

网络学习的挑战

网络学习的方法分为两类:Network Embedding和Graph Neural Network
Network Embedding:学习图网络中节点的低维度表示,并在向量空间表示图的基本特征。

44444

Network Embedding

只考虑节点和边:矩阵分解
考虑拓扑结构的方法:DeepWalk、Line、SDNE、Grarep

555

DeepWalk

66-2

SDNE

动态网络嵌入:静态网络的嵌入没有考虑到网络随时间的演化。而真实网络的连边和节点以及节点特征都是动态的。基于动态网络、在网络嵌入中考虑时序信息更加符合实际,也会使得嵌入获得更加丰富的信息。动态网络嵌入的关键问题如下:新增节点、新增/新删的边、累计误差、扩展性优化。

11-4

动态网络嵌入的关键问题

最后崔教授讲解了最近研究的趋势,如GCN的鲁棒性、图嵌入的可解释性、图嵌入的自动机器学习等
1313

GCN的鲁棒性
123