前言
图作为一种表达复杂关系结构的重要数据形式,具有广泛应用价值。传统基于欧几里得空间的机器学习方法难以应对图数据的高阶依赖与复杂结构。因此,面向图数据的图机器学习方法应运而生,并迅速成为研究热点。特别是,将深度学习应用于图数据而产生的图神经网络在建模图结构数据方面表现出显著优势,近些年已经成为人工智能的核心技术,并广泛应用于推荐系统、风控安全、药物研发等领域。
笔者于2022年开设“图机器学习”研究生课程,一直苦于没有合适的教材。虽然以图神经网络为代表的图机器学习是研究和应用热点,学术专著有不少,但是国内外相关的教材很少。由于一直专注于图机器学习相关研究,因此也萌生了写一本《图机器学习》教材的想法,既是对研究工作的总结整理,也是对该方向的系统梳理;但也深知教材与专著有巨大差异,写一本好教材比专著要难得多。经过两年的酝酿,一年的写作,近一年的编辑校对,这部凝结了笔者在相关方向近20年的研究和思考的教材,希望能够对该方向的研究有所促进,对相关课程建设有所帮助。
本书系统全面介绍图机器学习的基本原理、核心算法与典型应用,帮助读者建立完善的图机器学习的知识体系与实践能力。本书由基础篇、进阶篇与应用篇三部分组成,既涵盖了图机器学习的主要内容,又循序渐进,满足读者的不同需要。本书主要内容如下:
基础篇(第1~5章)系统介绍图机器学习的基本概念和基础模型,帮助读者打下坚实的理论与方法基础。第1章介绍图的类型、表示方法与基本操作;第2章系统讲解节点、边和图级特征的构造与应用;第3章则引入图嵌入方法;第4章介绍图神经网络的基本结构和经典模型;第5章讨论图神经网络在数据、架构和训练三方面的优化策略。
进阶篇(第6~10章)全面介绍图机器学习的前沿进展,帮助读者把握图机器学习的核心技术与发展趋势。第6章总体介绍了图机器学习的前沿方向;第7章总结异质图机器学习的基本方法与代表性模型;第8章深入讲解谱图理论与频域建模在图机器学习中的应用;第9章探讨可信图神经网络的4个核心维度,包括鲁棒性、公平性、分布外泛化与可解释性;第10章系统分析图基础模型的研究背景、实现路径及其与大模型的融合方式。
应用篇(第11~15章)介绍图机器学习的平台实现与典型应用,帮助读者应用图机器学习技术解决实际问题。第11章介绍图机器学习平台的设计理念,概述主流平台,如DGL与GammaGL的核心特点;第12章以典型图模型为例,展示如何在平台中实现节点分类、图分类与链接预测任务;第13章讨论图机器学习在推荐系统中的挑战与应用;第14章介绍图机器学习在金融风控与内容风控中的典型任务;第15章进一步展示图机器学习在科学中的应用。
本书由图数据挖掘与机器学习实验室(GAMMA Lab)全体人员共同完成。笔者统筹了本书的撰写和修订工作,杨成、王啸、张志强分别负责基础篇、进阶篇、应用篇的撰写。除作者外,GAMMA Lab的很多学生为本书做出了巨大的贡献,我们向所有为撰写本书做出贡献的学生表示衷心的感谢,他们分别是总体协理: 翟新龙;第1章: 陈宇络、陈博宇、褚祺峙;第2章: 翟新龙、赵明宇、郝宇;第3章: 邢宇杰、孙华彬、伍斌;第4章: 王春辰、俞泽楷、刘巴特;第5章: 闫博、李书杰、何讯;第6章: 张中健、朱馨妍;第7章: 于越、崔善元;第8章: 刘洋、郭泽远;第9章: 李一博、王秋雨;第10章: 周奇民、李鑫;第11章: 刘曜齐、周光煜、陈泽琦;第12章: 刘曜齐、曹文轩、刘洋、包骏飞;第13章: 陈伟杰、刘海博;第14章: 杨成栋、包俊飞;第15章: 刘佳玮、程泓涛、郭枫。
最后感谢我的家人!是你们让我还残存理想!
石川2025年10月
