前〓〓言
党的二十大报告提出,要坚持教育优先发展、科技自立自强、人才引领驱动,加快建设教育强国、科技强国、人才强国,坚持为党育人、为国育才,全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之。而“人工智能”是落实立德树人根本任务,培养德智体美全面发展的社会主义建设者和接班人不可或缺的重要内容。
在人工智能已经成为我国发展战略的今天,很多人想知道“什么是人工智能”“人工智能都研究什么”“人工智能发展水平如何”。
在清华大学,很多学生,包括理工科的学生,以及人文、社科等学院的学生都想系统地了解、学习人工智能。
理工科学生会关心“人工智能都研究什么”“今后我是否要学习相关课程”。人文、社科等学院的学生也希望了解和学习人工智能: “人工智能对我今后的学习、工作和生活有什么帮助?”
为此,我在清华大学开设了这样一门课,为本科低年级学生,包括理工科的学生,以及人文、社科等学院的学生,系统地讲授人工智能。这本教材就是为这门课服务的。这本教材有这样一些特点:
具备高中数学知识的学生就能够理解课程内容。人工智能很多内容非常艰深。然而,低年级本科生的数学知识还比较有限。因此,课上尽可能避开艰深的数学,用比较通俗易懂的语言解释其中的做法和道理。尽管书中有少量的数学公式及其推导,但是这些内容并不艰深。即使跳过相应的公式推导的段落和小节,也不影响学生对于整体内容的理解和把握。这样,就为有不同需求的学生提供了更大的灵活性。
比较系统全面地介绍人工智能的主要内容。有些人工智能导论性质的课程,只能深入讲解人工智能的某几方面。由于人工智能内容繁多,而学时有限,因此考虑了内容的深度就无法顾及内容的广度。该课程由于面对低年级本科生,因此更适合考虑内容的广度,因为他们的数学知识还比较有限。这样,就可以比较系统、全面地介绍人工智能的一些主要方向。也正因为如此,每一个方向只能介绍一些最基本的理论、方法和模型。当然,人工智能中很多重要的内容就无法一一讲解,更无法深入讲解。希望深入学习和研究人工智能的学生仅仅学习本课程是远远不够的,需要今后继续阅读相关的资料,学习相关的课程。为此,在每一章内容后面,列举了相关方向的课程、书籍、数据和资料,以便学生选择和学习。
各部分内容之间的依赖性弱。为了教学的考虑,各部分内容之间的依赖性尽可能被弱化了。但这毕竟是理工科的课程,课堂内容的先后依赖性还是有的,只是被弱化了。按照现在的章节顺序讲课,这种内容的衔接是最自然的。例如,“搜索”放在第2章。这样,后面各章的方法中有可能会涉及搜索技术的使用; 再例如,在“推理”一章,传统的推理方法是符号系统的方法,而近些年的推理研究涉及了学习算法(学习语言、图像等数据)和推理技术。因此,这一章放在了计算机视觉、计算机听觉、自然语言处理与理解等章之后。还有一些内容也是这样,这里不一一解释了。
从问题举例和实际应用问题入手。每章的内容是从应用需求开始讨论,这样学生会更容易理解人工智能相关研究的必要性。方法和算法的讲解也往往是通过举例完成,这样能够直接体会一个算法的实际执行过程,也能避免一些高深数学带来的困扰。对于这些例子和实际应用背后的问题,特别是理论问题、研究的难点,会在每章比较靠后的部分简要讨论。
内容反映人工智能的研究前沿。人工智能研究发展迅速。结合当前最新的人工智能研究状况,讲解相关内容,更容易激发学生学习兴趣。因此,人工智能方面重要的研究进展会体现在教材中。不仅如此,在每一章中,还介绍了相关方向的一些研究困难和没有解决的问题。这样,学生可以了解当前技术的局限、今后可能的研究方向。这也可避免学生在进一步学习和研究中“不看方向只走路”。
每章后提供了练习题。只听课是远远不够的,做练习是必要的。但限于学时等因素,除第1章外,每章后只布置了少量习题供学生消化和巩固学习内容。
当然,人工智能内容繁多,即使是宽泛的介绍,这样一门课也不能涵盖人工智能所有内容。因此,有一些内容只能浅浅提及。
从教学角度看,大致上每章内容可以讲一次2个学时的课。其他时间安排学生进行讨论、实验、参观。考虑到不同学校不同老师的需求,很多章节包含了比较丰富的内容,包括一些简单的公式推导、算法描述、计算和应用举例,以供选择。如果全部讲授这些内容,2个学时可能不够。
讲课时使用的教学课件,可以通过扫描书中的二维码下载,以利于读者的使用。书中每章最后一小节为“进一步学习的内容”,内容会及时更新,以方便学习最新内容。
为及时出版此书,我的学生提供了很多帮助。感谢崔森、肖昌明、洪锐鑫、李子昂、刘浩涤、闫昆达、庞昕宇、吴浩睿、朱宇轩、吾尔开希·阿布都克力木。
人工智能是正在发展中的学科,很多问题没有定论。笔者才疏学浅,对人工智能所知寥寥。因此,个人的观点及书中错误在所难免,真心希望读者不吝赐教。
张长水
2024年4月于清华园