图书前言

译 者 序

亲爱的读者,很荣幸能够为大家带来这本《联邦学习》的中文版。作为一名机器学习领域的研究者和从业人员,我深知联邦学习作为一种新的学习范式对机器学习领域的重要性和带来的挑战。《联邦学习》旨在为读者提供一个全面而深入的了解联邦学习的平台,帮助大家更好地理解联邦学习的概念、原理和应用,并且将联邦学习的最新研究进展和技术成果带给大家。

2018年,我从北京大学毕业后,工作中一次偶然的机会让我开始研究联邦学习,从研究理论到工程实践,再到商业应用,在联邦学习领域取得的每一次进展都历历在目。不得不说,联邦学习是非常有挑战性同时具有巨大发展前景的研究课题。2018年,我从最早的端云联邦学习开始研究,将端云联邦应用于图片、文本以及推荐领域。2020年,我开始探索企业之间的纵向联邦学习方向,研究纵向联邦学习在营销领域的应用与落地。联邦学习面临的不仅是一些学术领域的挑战,更多的是工程实践以及落地应用带来的工程问题和成本效率问题。

《联邦学习》汇集了联邦学习领域的顶尖研究人员的经验和成果,从各个角度论述了联邦学习的发展历程、关键技术和应用前景。这里,我要感谢原书的作者以及参考文献的学者,他们的研究成果和深刻见解使得本书足以成为联邦学习领域的一本重要参考书。

我相信,通过本书的阅读,您将对联邦学习有更深入的了解,也将对如何应用联邦学习技术有更清晰的认识。无论是从学术研究还是实际应用的角度,您都能找到研究方向,它们在以后的工作中具有实际的参考意义和价值。

最后,我要衷心感谢每一位读者的支持和关注,希望本书可以为您带来有益的启示和帮助;也希望我们在联邦学习的研究和实践中不断探索和创新,为机器学习的发展、企业应用的创新、数据安全保护等方面作出更多贡献。

敬祝好运!

刘璐

嗨,亲爱的读者!

很高兴为大家带来这本《联邦学习》的中文译本。无论您对联邦学习已有所了解还是想要在联邦学习领域发展,本书都是一个必选项!

随着国内一个个联邦学习项目的落地,可以肯定地说,联邦学习将成为未来国内乃至全球信息系统发展的重要技术基础。联邦学习作为隐私保护的解决方案,能够在不共享数据的情况下进行联合建模和持续模型训练,解决数据隐私和安全问题。它能有效解决企业数据孤岛问题,实现行业生态的人工智能的协作。联邦学习在企业应用、金融、医疗、推荐系统等领域有广泛应用,并且在技术发展和商业化方面具有巨大潜力。

能够参与本书的翻译工作,我深感荣幸。我希望通过我的理解和经验,将作者的著作精华准确地传达给读者,并为大家提供一份关于联邦学习的全面的、有价值的学习资料。同时,我也希望读者能够在阅读本书的过程中,深入理解联邦学习的核心价值和应用前景,从而更好地为您的项目和职业生涯提供帮助。

最后,我要感谢所有为《联邦学习》的中文译本付出努力的人,包括出版社和编辑,他们的辛勤工作和专业精神使得本书的中文版得以顺利出版,感谢他们对我的耐心指导和帮助。同时,我也要感谢本书的译者刘璐,她为这本书的整体翻译效果付出非常大的努力,并给予我不少帮助。

希望这本书能够为大家带来启发和帮助,让我们一起加入联邦学习的领域,创造更加美好的未来!

此致

张玉君

序    言

在过去二十年中,机器学习取得了巨大的进步,并广泛应用于诸多领域。机器学习的成功很大程度上取决于能否使用高质量的数据进行训练,包括有标签和无标签的数据。

关于数据隐私、安全和所有权的问题引起了公众和技术界的激烈讨论,讨论的焦点是如何在兼顾监管和相关者利益的前提下,使用数据进行机器学习。这些问题和相关的法律法规让人们意识到,把所有训练数据都存储在一个集中数据库里的方式与保护数据所有者的隐私权利是有冲突的。

虽然分布式学习和模型融合的概念已经被讨论了至少十年,而联邦机器学习(FL)作为一个新概念,自2017年以来才开始由MacMahan等人推广。在接下来的几年中,学术界和工业界都进行了大量的研究,在撰写本书时,第一个可行的联邦学习商业框架已进入市场。

《联邦学习》旨在捕捉过去几年在该领域的研究进展和最新技术,从该领域的原始概念到首次应用落地和商业化使用。为得到广泛而深入的概述,我们邀请了前沿的研究人员从不同视角讨论联邦学习:机器学习的核心视角、隐私和安全视角、分布式系统视角和特定应用领域视角。

《联邦学习》面向研究人员和从业者,深入介绍了联邦学习的最重要问题和方法。部分章节包含一系列技术内容,这些内容有助于理解算法和范例的复杂性,以便在多个企业情况下部署联邦学习。其他章节专注于介绍如何选择针对特定用例定制的隐私和安全解决方案,还有部分章节则介绍了联邦学习系统运行过程中的实际情况。

由于这个主题是跨学科的,因此在本书的不同章节中会有不同的术语约定。例如,联邦机器学习中的“参与方”对应分布式系统中的“客户端”。本书的开头介绍了一些常用的专业术语,对章节中涉及的特定领域的专业术语,我们会转换为通用术语进行描述。这样做的目的是让不同背景的读者都能理解本书内容,同时又保持特定学科领域的范式。

总体而言,《联邦学习》为读者提供了关于最新研究进展的全面综述。

在编辑本书和撰写其中部分章节的过程中,我们得到了许多人的帮助,这里表示特别的感谢。IBM研究所不仅为我们提供了在这个领域中进行学术研究的机会,还让我们将这项技术付诸实践并成为产品的一部分。在这个过程中,我们学到了很多宝贵的经验,因此非常感谢IBM的同事们。此外,特别感谢我们的主管Sandeep Gopisetty,他为这本书的研究提供了条件;感谢Gegi Thomas,他确保我们的研究成果被纳入产品中;还要感谢我们的团队成员。

感谢《联邦学习》的所有作者为本书提供了有价值的内容,并且耐心地接受了我们对他们所写内容的修改请求。

感谢我们的家人,在编写和编辑本书的一年中,他们能够忍受我们将本该陪伴他们的时间投入撰写书籍中。Heiko深深感谢他的妻子Beatriz Raggio,感谢她的付出和一直以来的支持。Nathalie深深感谢她的丈夫Santiago和儿子Matthias Bock,感谢他们的爱和支持以及为她完成所有项目(包括本书)加油打气。Nathalie还感谢她的父母Adriana和Jesus;如果没有他们大力和持续的支持,本书以及许多其他相关成果都将不可能实现。