图书前言

前    言

自2023年年初ChatGPT问世以来,以生成式模型为代表的人工智能(AI)行业受到了极大关注。截至2024年年底,AI行业发展迅猛,日新月异。全球针对AI行业的投资也远超其他行业,可以说AI技术是近几年人类社会最为关注的领域。与其他行业的变革不同,AI的发展并不局限于本行业,而是逐渐渗透到全球各个行业,慢慢地成为国力竞争的重要因素。如此规模,与其称AI为一个行业风口,笔者更想大胆判断为五次工业革命。

生成式AI应用从广义上来说包括三个方向:使用AI应用、基底模型训练以及生成式AI应用开发。其中,基底模型训练储备了生成式AI应用底层使用的模型,例如ChatGPT底层的GPT系列模型;而生成式AI应用开发则是使用基底模型,通过一定的开发手段和机制将模型能力融合到应用中,并最大可能地发挥基底模型的能力。

目前市面上与AI相关的图书大部分介绍的是使用AI应用,例如怎么使用ChatGPT写文章,如何组织Prompt等,少部分图书则涉及基底模型训练。前者内容较为浅显,容易被替代且不具备时效性,而后者有较高的门槛,更适合专业算法从业人员阅读。对于承上启下,既兼容前两者的内容,又详细介绍各式生成式AI应用开发的图书,市面上仍然比较欠缺。本书希望可以补全这部分资料的不足,帮助更多想从事AI行业的人入门。

这里简单介绍一下本书的写作背景。笔者算是国内最早一批探索生成式AI应用开发并落地取得成果的编程人员,目前在字节跳动的抖音业务线任职前端工程师。那么,笔者是如何接触到生成式AI应用的呢?

2022年11月,出于个人兴趣以及对代码质量的追求,笔者在网站上撰写了一本关于单元测试的电子书《前端单元测试精讲》,之后开始尝试为团队落地单元测试。实现过程中遇到了不少瓶颈,主要在于程序员编写代码测试的时间成本较高,在排期紧张且频繁迭代的情况下落地困难。

随后,笔者开始尝试使用一些自动化手段来生成单元测试,比如代码静态分析、注入监听插槽等方法,以减轻程序员手动编写单元测试的负担,但效果一直不尽如人意。因为单元测试代码虽然有规律可循,但面对的场景众多,复杂度较高。

这个问题困扰了笔者很久,直到2023年3月,ChatGPT的横空出世让笔者迸发了新的灵感。经过尝试后发现,虽然ChatGPT生成的内容尚有瑕疵且不够稳定,但作为单元测试生成的初稿效果非常好,几乎达到开箱即用的程度。

2023年4月,笔者基于GPT模型实现了自动化生成单元测试的插件,并在公司内落地。这个插件服务了抖音安全、春节服务、TikTok等不同业务线的几十个团队,生成了10多万单元测试代码,使研发效率提升了近60%。在这次成功案例后,笔者还开发了AI CR、AI代码防劣化等提效的插件,在部门内都取得了不错的反响。

在整个过程中,笔者总结了不少一线的生成式AI应用开发经验,并在社区发表了相关文章。2023年年初,分享生成式AI应用开发经验的文章还非常少,因此一经发表便连续几周都排在热搜榜上,并获取了10多万的阅读量。

这时,清华大学出版社的编辑找到了我,希望我能将这些经验编写成书。本人喜欢分享技术,也希望能够将近两年的生成式AI应用开发经验系统地沉淀下来,帮助更多的人,加上之前有写作电子书的经验,于是答应了下来。从2023年11月份至今,笔者利用每个周末和碎片化的时间,将与生成式AI应用相关的知识都写了下来。这便是本书的创作背景,编写本书对笔者而言也是一段独特且充满挑战的经历。

坦诚地说,社区里除了对AI应用的肯定外,也有不少对AI发展的质疑声,认为生成式AI应用可能只是昙花一现。毕竟,尽管现在模型的能力令人吃惊,但并不能完全代替人类。笔者个人判断,从长远来看,尽管AI模型自身目前还无法完全替代人类,但AI无疑将成为未来发展趋势的重要方向。这一点从行业内的变化和全球投资趋势中均可得到印证。生成式AI应用的基建需要长时间的建设和投入,对于个人和团队而言都是不错的机会。就像蒸汽时代、电气时代和信息时代初期一样,当时也存在很多质疑声,认为它们可能是昙花一现。我们仍需给AI时代的到来给予更多的时间,也给未来多一点信心。

当然,个人判断并不仅是口头说说,笔者也将于2024年9月从抖音业务线主动转岗到字节跳动AI IDE架构业务线,以身入局。正如上面所说,给AI时代的到来更多的时间,也给未来和自己多一点信心。本书不仅是读者进入AI应用领域的起点和入局令牌,对于笔者而言也是新的开始和挑战,很荣幸能与各位读者一同前行,做一些有挑战的事情。

本书提供了全部源代码,读者可扫描下方二维码下载。

如果下载有问题,请用电子邮件联系booksaga@126.com,邮件主题为“生成式AI应用开发:基于OpenAI API实现”。

本书得以顺利完成,离不开我的妻子春燕的支持。在笔者迷茫和疲惫的时候,她总能耐心倾听并给予安慰。今年,她还生下了一个可爱的男孩,但由于笔者工作繁忙,即使在业余时间也需赶稿,因此她几乎承担了家中所有的家务和照顾孩子的重任,付出良多。笔者深感幸运,能有这样一位温和、宽容的伴侣。

同时,感谢清华大学出版社的编辑,让笔者有机会将这几年的沉淀和所学系统地分享给读者。在写稿过程中,编辑提出了大量专业建议,让本书能够以更好的一面呈现出来。

最后,还要感谢为本书撰写序言的死月、张添富、章小川、陈阳、魏富强和夏柏阳老师们,感谢他们能在繁忙的工作之余抽出宝贵时间读完笔者的拙作,撰写专业、中肯的点评。

尽管本书融入了笔者的所有努力,但由于水平有限,难免有疏漏之处,欢迎读者批评指正。

总有人间一两风,填我十万八千梦。

陈祯民

2025年1月于深圳