前言
在 21世纪的今天,人工智能( AI)已经成为推动社会发展的关键技术之一,其影响力渗透到经济、文化、教育、医疗等各个领域。随着技术的不断进步,人工智能的应用范围和深度都在不断扩大。其中,生成式人工智能( Generative AI)作为一门新兴的学科,正以其独特的创造力和革新潜力,引领着人工智能领域的新浪潮。生成式人工智能是指具有文本、图片、音频、视频等内容生成能力的模型及相关技术,旨在通过学习大量数据的分布,捕捉数据的内在特征和模式,在保持数据分布一致性的基础上进行新内容的生成。
本书旨在为读者提供一个全面、系统的学习路径,从基础理论到前沿应用,从技术实现到伦理考量,全方位地介绍生成式人工智能的各个方面。本书适用于对人工智能感兴趣的学生、研究人员、技术开发者以及任何对这一领域充满好奇心的读者。
本书从功能上分为四部分:基础知识、核心技术、技术评估与治理、课程实践。在基础知识部分,第 1章首先探讨生成式人工智能的基本概念,包括其定义、发展历程、核心原理、应用场景、面临挑战等;第 2章介绍生成模型的算法基础,便于读者更好地把握相关前置知识,包括生成模型基本概念、数学基础、常见生成模型简介、评估指标等。在核心技术部分,第 3~9章介绍生成式人工智能的核心技术及其典型应用,如 Transformer、生成对抗网络( GAN)、变分自编码器( VAE)、流模型、能量模型、大语言模型、多模态生成模型等,这些技术是构建强大生成模型的基石,它们使得机器能够学习复杂的数据分布,并生成高质量的合成样本。并进一步讨论生成式人工智能的实际应用,从文本生成、图像合成到音乐创作,本书将分析这些应用背后的技术逻辑,探讨它们如何改变我们的工作和生活方式。同时,我们也会关注生成式 AI在跨学科研究中的应用,如药物发现与分子生成、气候与环境模拟、物理与化学模拟等,这些应用不仅提高了效率,也为用户带来了更加个性化的体验。在技术进步的同时,我们也必须关注生成式人工智能可能带来的伦理和社会问题。在技术评估与治理部分,第 10章介绍生成式人工智能的评估、安全与伦理问题,如深度伪造( Deepfakes)技术可能被用于制造虚假信息,侵犯个人隐私,甚至影响社会稳定。因此,本书将专门讨论这些挑战,并探讨如何通过技术、法律和社会手段来应对这些问题。在课程实践部分,第 11章设计了文本、语音、图像、视频等生成实践内容,其初衷是让读者能够在实践中学习、巩固生成式人工智能的理论,学以致用。
在本书编写过程中,得到了很多专家和朋友的大力支持和帮助。郑南宁院士对整体的大纲提供了宝贵建议,并组织多次会议讨论完善本书内容,包括增加变分推断部分内容、将原本 16章的内容合并精简为 11章、将 Transformer单独作为章节进行介绍等。戴琼海院士对本书的整体内容的组织提供了很多建设性意见。陶建华教授完成教材的整体架构设计,并组织完成本书的编写工作,具体完成第 1章、第 2章的变分推断相关内容、第 3~5章、第 8章的编写与校正。其中张帅博士协助整理第 1~3章的相关素材,并进行整本教材的校正;于涛博士、王玉旺博士协助完成第 4、5、11章素材搜集与整理。赫然研究员完成第 6、7、10章的内容规划与编写,曹杰博士协助完成相关的材料整理与校正。刘偲教授完成第 2、9、12章的内容规划与编写。他们对本书付出了大量的时间与精力,他们的专业与细致是本书质量的保证,在此谨向他们表示最诚挚的感谢!
本书中的矩阵和向量并未严格统一做黑斜体处理,在此特别说明。
在编写这本教材的过程中,我们力求内容的准确性和前沿性,同时也注重理论与实践的结合。我们希望读者通过学习本书,不仅能够掌握生成式人工智能的核心技术,更能够培养出批判性思维和创新能力,为未来的人工智能发展做出自己的贡献。
衷心感谢郑南宁院士、戴琼海院士给予的大力支持和帮助,感谢教育部人工智能领域“ 101计划”建设委员会,感谢清华大学出版社的支持,使得本书能够顺利作为“ 101计划”系列核心课程教材的一本著作出版。
在人工智能的征途上,我们正站在一个新的起点。《生成式人工智能》将作为你的指南,带你探索这个充满无限可能的新世界。让我们一起启程,拥抱这个充满挑战和机遇的时代。
编者
2025年 5月
