前言
前言
近年来,人工智能理论与技术无论在学术研究还是在实际应用中,都得到了广泛关注,成为当今信息科技的发展潮流。但同时,诸如自动驾驶、客服机器人等人工智能应用中发生了一系列安全事件,引发了人们对人工智能应用前景的担忧。由此,人工智能安全被提上重要议程,学术界加快了人工智能安全理论与实践的研究步伐。从学科发展的角度看,人工智能和网络空间安全存在密切的联系。一方面,人工智能理论和技术有效地提升了网络空间安全攻击与防御的智能化水平; 另一方面,人工智能模型应用越来越多地被发现存在漏洞和安全风险,并成为网络空间安全的新问题。人工智能安全则是这两个学科方向发展和交叉的必然结果。
在教育部阿里云产学合作协同育人项目的支持下,本书结合大数据驱动的人工智能发展背景,对人工智能安全的理论与实践技术进行了全面梳理。从人工智能的安全观、人工智能安全的数据处理、人工智能用于网络安全的攻击与防御、人工智能模型的对抗攻击与防御以及人工智能平台的安全与工具五个角度,建立人工智能安全的完整知识体系。
本书作为一本产学兼顾的教材,具有如下特色:
(1) 围绕大数据驱动的人工智能发展背景,充分考虑数据在人工智能中的重要性,提炼出人工智能安全的数据主线。把网络空间安全智能防御的数据处理、人工智能模型训练阶段的数据安全、推理阶段的数据安全以及数据角度的防御技术,作为知识体系的主干。
(2) 从安全观的角度来组织人工智能安全的知识体系。人工智能安全是人工智能和网络空间安全的交叉学科,网络空间安全的基本特征和规律对于人工智能安全仍然适用。这种知识体系安排充分考虑了两个学科方向的内在联系,有利于读者更深刻地理解人工智能安全。
(3) 既注重人工智能安全的相关理论,也强调人工智能安全实践技术。一方面,围绕人工智能安全模型和算法,介绍了相关数学和对抗攻击的基础理论; 另一方面,基于阿里云天池实验室构建了十个实践案例,极大方便了读者进行在线实验,并理解人工智能安全技术的实际运用。
本书共分五部分,第一部分对人工智能安全问题、基本属性、技术体系等进行了归纳梳理。第二部分着重介绍人工智能安全数据处理的三个重要方法,即非平衡数据分类、噪声数据处理和小样本学习方法。第三部分从人工智能技术用于解决网络空间安全的攻击与防御问题角度,以网络入侵检测、SQL注入检测、虚假新闻检测为例介绍人工智能方法的应用,从攻击图的角度介绍典型人工智能方法在攻击与防御中的应用。第四部分围绕机器学习模型的安全问题,对攻击者、对抗攻击的理论与方法、典型的对抗攻击方法、隐私安全、聚类模型的攻击以及对抗攻击的防御方法进行了梳理。第五部分介绍机器学习平台的安全和基于阿里云天池AI学习平台的若干案例与实验。这五部分所构成的人工智能安全知识体系如下图所示。
本书作者及其科研团队十多年来一直从事网络空间安全、人工智能和大数据技术相关科研和教学工作。在包括国家自然科学基金项目在内的各类科研项目支持下,对网络空间安全防御、互联网内容安全、机器学习模型算法及应用做了大量研究,积累了一定的经验。此外,作者从2011年开始先后为复旦大学信息安全专业的本科生、研究生开设了“信息内容安全”“大数据安全”等课程,经过多年的教学实践,累积了丰富的教学资源。
全书由曾剑平负责内容安排、编写和统稿,由人工智能安全理论和技术的研究人员参与编写。王从一、肖杨、柴颖、朱哲元、段江娇编写并验证了本书的案例。吴爽和陈彦羽参与了第6章的编写。曾睿对全书进行了校对。在本书编写过程中,得到了阿里云计算有限公司多名技术专家的大力支持,在产学合作教材编写项目申请、立项、跟踪、结题以及应用案例构建方面给予了很多帮助和指导。此外,在教材编写过程中,参考和引用了许多论文、技术报告,均已在参考文献中列出。在此,一并表示衷心的感谢。
由于时间仓促和作者的学识水平限制,并且人工智能安全技术仍在快速发展中,诸多问题逐渐暴露,书中难免存在不足和疏漏,恳请读者不吝批评指正,以利于再版时修订完善。
读者可关注微信公众号IntBigData(互联网大数据处理技术与应用),订阅与本书相关的文章,并与作者互动。
作者2022年3月