序
做一回“颜色不一样的烟火”
为什么写这么一本书
写这本书时,我正身处他国,独在异乡为异客。那时,国际风云变幻,山雨欲来风满楼。
无意间,读到坊间一篇好文——《反思华为,无“根”之痛》
鲁不逊. 反思华为,无“根”之痛. 量子学派,2020.5.。文章认为,中国受制于人,原因在于,我们缺少“根”技术。
“根”技术,是碳基文明的驱动引擎。例如,Android系统是安卓手机行业里的“根”,ARM架构是全球计算机芯片行业的“根”,Linux开源体系是很多软件服务的“根”,诸如此类。
中国缺少“根”技术的原因有很多,文章盘点十条以论之,言之凿凿,不可谓不深刻,但有两条最能刺激我的神经。
第四条: 对形式逻辑毫不在意,理性思考至今是稀缺资源。
第八条: 视浅薄趣味为人生追求,对哲学思辨毫无感觉。
为什么是这两条最触动我呢?倒不是因为它们特别独到,而是因为,或许能为之做点什么。
很早之前,我就有意写一本有关人工智能的科普书籍,但由于诸多原因,未能成行。趁这次和清华大学出版社结缘之际,心中潜伏已久的暗流喷涌而出——或许,我可以做一回“颜色不一样的烟火”——写一本不太一样的《人工智能》!
人工智能在中国非常火爆。君不见,AI企业,数不胜数。君不见,高校专业设置,蜂拥而至。
是的,掌握“人工智能”技术很有用,它能帮助公司获取更多客户,立于不败之地,挥斥市场方遒。学习“人工智能”技术很有用,它能帮你找到一份好工作,站稳职场,前途如花似锦。
人工智能极简入门
序做一回“颜色不一样的烟火”
但需要反思的是,“有用”的终极标准是什么?
很多年以来,我们常说,“师夷长技以制夷。”学习他人先进的技术,是有用的。
然而,站在当下,重新审视这句话,我们会发现,它可能是有问题的。
这是因为,“师夷长技”,很可能不“制夷”,反而“被夷制(抑制)”。
为何会这样?
无他,只因“根”不在我们这里。生产“根技”的思想,我们还不够熟稔。
然而,无名如我,在诸如国家、学科这样宏大的叙事面前,我,一名普通的高校教师,能做什么呢?
但我觉得,有一分热,发一分光,犹如萤火,即使微弱,也可在黑暗里发出一点光,不必等候炬火。
古人很早就告诫我们,“勿以善小而不为。”
是的,我尝试要写这本《人工智能极简入门》,添加一点点“小善”。
相比于其他同类图书,除了通俗易懂、图文并茂地介绍AI的前沿技术之外,这本书的“小善”还体现在,它融合了更多的“理性思考”和“哲学反思”。
特别是“哲学反思”,在很多人看起来,是无用的。但庄子很早就说了,“无用之用,方为大用。”
在人类历史发展的长河中,无数的事实警醒我们,很多当下“无用”之学,长远看来,都意义深远,流芳百世。
针对人工智能,哲学思辨有什么存在价值呢?我们知道,在人工智能发展过程中,势必会遇到各式各样的问题。哲学反思或许并不能解决问题,但它能突出问题的本质,并引导着我们继续探寻下去。一个好的问题,有时可能比答案更重要。追寻一个好问题,预启未来探索的方向。
在欧美文化圈内,诞生了一大批天才哲学家,例如亚里士多德、巴门尼德、莱布尼茨、休谟、维特根斯坦等。他们很多看似无用的哲学思想,犹如火种,在批判中接力与传承,熠熠生辉,潜移默化地指引着人工智能的发展。例如,目前的符号推理、知识图谱、自然语言处理等众多子领域,无不蕴含着他们的哲学理念。最终,这些看似“无用”的哲学反思,成为人工智能的众“根”之一。
对于读者来说,如果能在了解AI前沿技术的同时,还能多培养一抹人文品位,多探究一些“无用”之学,长远来看,无疑是有益处的。
如果本书能在这方面起一丁点作用,那它就是有价值的。至少,我认为,这个尝试是值得的。
此外,我想说的是,王小波是我的偶像。他不仅是一个有趣的小说家,其实还是一个地道的理工男。在《沉默的大多数》里他写道:
我对自己的要求很低: 我活在世上,无非想要明白些道理,做些有趣的事,倘能如我所愿,我的一生就算成功。
其实,这也属于我所认可的成功的定义。写作于我而言,算是一件有趣的事。而且,我还会尽量把《人工智能极简入门》这本书写得有趣,这就算我这个理工男的一点点情趣吧,简称“理趣”。是的,有理有趣,就是这本书的最大特色。
本书的定位与特色
本书以人工智能极简入门为首任,以介绍人工智能技术为底色,内容既包括经典算法(如k近邻、贝叶斯、决策树和神经网络等),又涵盖前沿技术(如深度学习、自然语言处理等),因考虑“入门”的定位,而没有“大而全”地把传统的机器推理、搜索策略、遗传算法、专家系统纳入其中,不是它们不重要,而是在当前的主流人工智能算法中,它们的荣光渐退,限于篇幅,暂无空间容纳它们。
在写作手法上,本书力图摆脱传统科技书籍的刻板印象,力图做到文笔流畅,可读性强,时有天马行空之处,内容涉及人工智能的历史、哲学、心理学和人文科学等领域。
“纸上得来终觉浅,绝知此事要躬行。”本书绝非只是务虚之谈,而是配备了很多感性的实战项目,帮助你在实践中理解抽象的原理。对于没有编程基础的读者,我们准备了简易上手的Excel版本实践(部分项目适用);而对于有Python编程基础的读者,我们提供了Python版本的源代码。限于篇幅,实战项目的详细讲解,不在正文之列。
客观来说,人工智能博大精深,细分领域庞杂。因此,本书只负责“领进门”,“修行”要靠你个人。毕竟,高手都是自学出来的!
阅读准备
如果你对实战感兴趣,要想运行本书中的示例代码,需要提前安装如下系统及软件。
(1) 操作系统: Windows、Mac OS及Linux均可。
(2) Excel: Office 2010以上版本即可。
(3) Python环境: 建议使用Anaconda安装,确保版本为Python 3.x即可。
(4) sklearn: 建议使用Anaconda安装sklearn 0.22.1及以上版本。
(5) TensorFlow: 建议使用Anaconda安装TensorFlow 2.0及以上版本。
联系作者
自认才疏学浅,且限于时间与篇幅,书中难免出现理解偏差和错缪之处。若读者朋友们在阅读本书的过程中发现问题,希望能及时与我联系,我将在第一时间修正并对此不胜感激。
邮件地址: bailj@tup.tsinghua.edu.cn。
致谢
《人工智能极简入门》的部分内容,最早在“七月在线”上做过讲座,口碑还不错。但与讲座不同的是,成书要严谨得多。从最初的构思、查阅资料、撰写内容、绘制图片,到出版成书,历时两年有余。图书得以面市,自然得益于多方面的帮助和支持。在信息获取上,我学习并吸纳了很多精华知识,书中也尽可能地给出了文献出处,如有疏漏,望来信告知。在这里,我对这些高价值资料的提供者、生产者,表示深深的敬意和感谢。
很多人在这本书的出版过程中扮演了重要角色——清华大学出版社的白立军老师在选题策划和文字编辑上,河南工业大学的张开元、石岩松、陈伟楷和潘世泽等在文字校对上,均付出了辛勤的劳动,在此一并表示感谢。同时,感谢自然科学基金(项目编号: 61705061、61975053、U1904120)及河南工业大学思政课程教改基金(机器学习)等项目的支持。
张玉宏
2020年7月于美国卡梅尔
