前言
材料科学作为支撑现代科技发展的基础性学科,在能源、信息、生命健康等诸多领域中扮演着不可替代的角色。新材料的设计与发现,常常伴随着漫长的实验周期与高昂的研发成本,同时面临复杂的多尺度、多物理过程挑战。传统材料设计方法依赖科研人员的经验积累与试错探索,在庞大的化学空间与结构空间中,往往难以高效筛选与优化理想材料。
近年来,随着以机器学习为代表的人工智能技术迅速发展,材料科学正迎来一场深刻变革。机器学习通过对海量数据的建模与学习,深入挖掘其中的潜在规律,已在材料性质预测、材料筛选等方面展现出巨大潜力,成为推动材料科学进一步发展的重要力量。
然而,将机器学习技术及其相关工具应用于材料学研究,对许多材料专业学生而言仍是一项巨大挑战: 一方面,材料专业学生普遍缺乏系统的机器学习知识; 另一方面,在“AI for Science”的时代,仅停留在理论学习层面无异于纸上谈兵,真正实现机器学习与材料科学的深度结合,还需要大量动手实践。基于此,从2023年春季学期起,笔者之一在北京大学材料学院开设了《机器学习辅助材料模拟实践》课程,旨在培养既具备扎实理论素养,又具备实践能力的复合型人才。经过三年打磨,课程对象从最初的博士生扩展至高年级本科生,并在不断完善中逐渐成熟。同时另外两位笔者也分别在华中科技大学材料学院、西北工业大学材料学院开设类似课程。基于三位老师的课程实践,本教材应运而生。
与传统机器学习教材相比,本教材具有两大突出特点:
首先,针对材料专业学生的学习和科研实际需求,对机器学习知识进行了适度精简,省略了部分复杂公式推导,使学生能更加专注于理解与材料研究密切相关的核心算法原理。
其次,为帮助学生深入理解机器学习在材料研究中的应用,每一章均配备了相关代码示例,尽可能基于真实数据集复现材料研究案例。所有配套代码已公开在玻尔科研空间站,读者可通过链接或二维码访问并直接在线运行。笔者坚信,实践是最好的学习方式,因此强烈建议读者在阅读教材的同时,积极动手实践,通过运行代码加深对知识的理解。
课程配套代码网址如下: https://www.bohrium.com/courses/2618999975?tab=courses。
本教材面向没有机器学习基础的材料专业本科生,共分为五个部分:
机器学习基础: 总体介绍机器学习相关基础概念、常用数据分析工具和使用方式与材料信息学基础。
统计机器学习模型与性质预测: 介绍线性回归、逻辑斯蒂回归、决策树、SVM、聚类、集成学习等经典机器学习算法,并介绍其在材料中的应用。
深度学习模型与材料表征: 介绍图像分类、图像生成、目标检测、序列生成相关算法,并介绍其在材料表征等方面的应用。
机器学习势函数: 介绍机器学习如何与传统计算材料学结合,并介绍机器学习势函数工具DeePMDkit的原理和使用方式。
机器学习辅助材料设计前沿进展: 介绍机器学习在材料领域的前沿应用。
本书主要由北京中关村学院AI教育研究所王一博、华中科技大学材料学院教授单斌、西北工业大学材料学院教授牛海洋共同撰写,并得到了来自北京深势科技有限公司的陈乐天、东奕汐、董晟渤,来自华中科技大学的
叶芳文和来自西北工业大学的任雨锋、刘瑞恒的帮助。同时本书的相关案例也受到大量文献的启发(均已在正文中标明出处)。在此一并对本书所有贡献者表示感谢。
需要说明的是,由于本书面向没有机器学习基础的读者,部分内容在讲解上比较详尽,对于已有一定基础的读者来说或许略感冗长; 同时,本书对数据驱动方向的介绍较为充分,而对机理驱动方向的覆盖则相对有限; 此外,尽管近年来材料领域涌现了众多新兴机器学习工具,但由于篇幅所限,本书仅选取了诸如DeePMDkit、UniMol等具有代表性的工具进行介绍。
尽管如此,我们依然希望这本教材能够成为读者迈入“机器学习辅助材料设计”领域的启蒙之作,激发兴趣,打下基础。衷心祝愿各位读者,能够以此为起点,乘风破浪,在人工智能赋能材料科学的征途上,成为推动科技进步的中坚力量。
王一博
2025.4.29
