清华大学出版社2016年5月
总序在“全国高等学校智能科学与技术专业规划教材”出版之际,编审委员会(以下简称编委会)愿借此机会阐明规划出版这套教材的学理构思。
信息化和智能化是人类社会发展的大趋势。信息化的发展正在日益走向成熟,智能化的发展正在成为关注的焦点。战胜国际象棋世界冠军的Deeper Blue,战胜“危险边沿”问题抢答竞赛全美冠军的Watson,以及战胜围棋世界冠军的AlphaGo,都是智能科学技术突飞猛进的象征。
科技发展,人才必须先行。为了适应智能化的社会需求,我国高等学校设置了智能科学与技术本科专业。经过十多年的实践探索,各校在学科建设中积累了丰富的经验。在此基础上,编委会对本专业的教学计划和课程设置展开了深入分析,形成以下共识。
第一,注意到本专业的崭新性、高难性、重要性的特点,为了使那些刚刚脱离中学学习环境、初次踏进陌生而又神往的大学校门的莘莘学子真正学好这个专业,设置一门高屋建瓴而又深入浅出的“智能科学与技术导论”课程,在专业理念和学习规律两方面实施循循善诱的入门引导,是至关重要的举措。
第二,智能科学与技术的学科目的,是探索自然智能的机理,并根据自然智能机理的启示研究具有一定智能水平的机器。前者是自然智能研究,后者是机器智能(也称人工智能)研究,两者互相联系,相辅相成。因此,智能科学与技术专业直接需要的自然科学基础是“脑与认知科学基础”。
第三,当今时代面临越来越多复杂问题的挑战。复杂问题的共同特点是不仅存在随机型的不确定性,而且存在多种类型的不确定性因素。认识和克服这些不确定性因素所造成的影响,是智能科学与技术不可回避的特殊任务。因此,智能科学与技术专业需要掌握“不确定性数学基础”。
第四,完整的智能过程包括信息获取(传感)、信息传递(通信)、信息处理(计算)、知识生成(认知)、策略创建(决策)和策略执行(控制)。其中,作为核心智能过程的知识生成和策略创建是本专业的基本内涵。因此,设置“机器智能”来阐述核心智能的理论和方法就成为顺理成章的选择。
第五,由于智能奥秘本身所具有的基础性和深刻性,智能科学技术的研究注定需要科学研究方法论的指导,而且,智能科学技术的发展本身就是一部科学方法论的生动教材。因此,为了使本专业学生具有驾驭未来智能科学技术的创新意识,设置“科技史与方法论”的课程是富有远见的明智之举。
根据以上分析,编委会建议我国高等学校智能科学与技术专业的核心课程包括智能科学与技术导论(第一学期)、脑与认知科学基础(第三学期)、不确定性数学基础(第四学期)、机器智能(第五学期)、科技史与方法论(第六学期),它们是本专业教学的公共必修课程。当然,随着智能科学技术的发展,核心课程会相应地推陈出新。
深刻性,复杂性,源源不断的创新性,无处不在的广泛应用性,这些都是智能科学技术的基本特征。因此,除了核心课程教材,编委会还规划了一系列配套课程教材,如《自然语言理解》、《机器学习》、《智能决策》、《知识处理》、《智能机器人》和《智能游戏》等。编委会同时呼吁广大教师自主编写和推荐具有各校个性化特色的专业课程教材。
编委会对于本套教材的编写提出了以下要求,在取材范围上要符合课程定位,符合大纲要求;在内容上要强调体系性、开放性和前瞻性;在章节安排上要体现认识规律;在叙述方式上要引导读者积极思维;在文字风格上要采用规范语言,在语言格调上要亲和、清新、简练。
编委会相信,通过作者们的共同努力,编写好以上核心课程教材和丰富多彩的配套课程教材,就可以较好地满足智能科学与技术专业的教学需要,为培养高质量的智能科学与技术专门人才提供优良的服务。
饮水思源,在全国高等学校智能科学与技术专业规划教材问世之际,编委会对为这套教材的出版做出贡献的各有关方面表示崇高的敬意和衷心的感谢。
2001年,中国人工智能学会及其教育工作委员会开始积极推动在我国高校设立智能科学与技术本科专业。2004年,北京大学自设的本科专业开始招生。2005年,国家教育部正式批准一批高校设立本专业。自此,智能科学与技术专业开始在祖国的大地上茁壮成长。
清华大学出版社对本系列教材的编辑出版给予了高度重视和大力帮助,主动与中国人工智能学会教育工作委员会开展合作,组织和支持了全国高等学校智能科学与技术专业规划教材的策划与编审委员会的组建和运转。
智能科学技术正处在迅速发展和不断创新的阶段。编委会真诚地希望,本套规划教材的出版不仅对我国高等学校智能科学与技术专业的学科建设发挥积极的作用,而且对世界智能科学技术的研究与教育做出积极的贡献。
同时,正因为智能科学技术处在快速发展的阶段,我国高校智能科学与技术专业还处在成长时期,本套教材难免存在错误和不足。为此,恳切希望广大读者对本套教材中的问题提出批评意见,以便我们不断改进和完善。
全国高等学校智能科学与技术专业规划教材编审委员会2016年4月作为我国高等学校智能科学与技术本科专业的专业基础课教材,用《机器智能》代替已有不同理解的《人工智能》,是一个与时俱进的尝试,也是一个颇为成功的尝试,因而是一个值得称道的成果。所以,我乐意推荐它在清华大学出版社出版。
世界上已经存在许多成熟的人工智能教材版本。
其中,获得赞颂最多的恐怕要数人工智能领域两位后起之秀Stuart J. Russell和Peter Norvig于1995年首次出版、2003年再版的Artificial Intelligence: A Modern Approach。这是一部名副其实的鸿篇巨制,超过1000页的篇幅,超过1000篇的参考文献!该书最为引人注目的亮点是,它宣称已经找到并建立了一种 “人工智能的现代方法”,能够把人工智能领域原来“三分天下,各据一隅” 的不同学派统一起来。因此,该书已被世界上90多个国家的900多所大学用做教材,实属世所罕见!但是,仔细研读这部巨著之后却发现,该书所谓的“统一”,只是以Agent为载体把各种不同学派的结果“汇集”到了一起,并没有从理论上找到“实现统一的方法”。
与Russell和Norvig的巨著有着异曲同工之妙的是Stanford大学老一辈人工智能学者Nils J. Nilsson于1998年出版的Artificial Intelligence: A New Synthesis。这本书所强调的“新的综合方法”其实与Russell和Norvig提出的“现代方法”颇为相近,也是以Agent为载体把各种不同方法的结果“汇集”起来,只是在具体的处理上各有特色。
然而,这两部当代国际上标杆性的人工智能著作却都清晰地描绘了一个现实: 国际学术界对于人工智能领域长期存在的“三分天下,各据一隅”现状深感不满,因此都在努力寻求实现“三分归一统”的统一之道。
在这种国际学术背景下,本书作者发现了《机器知行学原理》和《高等人工智能原理》等著作所展示的“统一之道”,经过艰苦思考,完成了本书的编写。在经典人工智能教材好书如林的背景下,作者没有选择那条编写经典人工智能教材的轻松之路,而是选择了编写《机器智能》教材的艰苦之路,这是值得称道的原因之一。
在国内外的人工智能教材中,大多数都只讲功能模拟的人工智能理论(即物理符号系统,后来演变成专家系统),不讲结构模拟的人工智能理论(即人工神经网络),也不讲行为模拟的人工智能理论(即感知动作系统),这就是“三分天下,各据一隅”的格局。在这种情况下,本书作者不希望学生们陷入“只见树木,不见森林”的境地,而希望为学生们提供完整统一的智能理论和方法,因此努力寻求人工智能理论的有机统一,这是值得称道的原因之二。
本书寻到的“统一之道”是什么呢?不是大脑结构,不是大脑功能,也不是系统行为,而是智能生成机制,也就是“知识的外部生态过程: 信息知识智能的转换”。不过,这里的“信息”包含了“本体论信息”(作用于认识主体但还没有进入认识主体内部的外部客体信息)和“认识论信息”(认识主体所感悟到的信息)。因此,更为准确地说,智能生成机制是“本体论信息认识论信息知识智能的转换”。
与本书相映成趣的是,国际上也在研究DataInformationIntelligenceWisdom转换,不妨把它简写为DIIW转换。但是相比之下,DIIW转换存在几个严重的缺点: 其一,没有考虑“本体论信息”,使得这个转换丢失了信息的来源,DIIW转换变成了无源之水;其二,Data乃是认识论信息的语法信息载体,还丢失了认识论信息的语用信息,使DIIW转换变成了无的放矢;其三,DIIW转换中的Information其实应当是语义信息,而不是Shannon信息论的信息,可见它把信息和语义信息混为一谈;其四,Wisdom是人类才能拥有的“智慧”,人工(机器)智能系统只能生成“智能”,而不可能生成“智慧”。可见这个转换把智能与智慧也混为一谈,使DIIW转换陷入了盲目性。总之,DIIW转换还相当不规范!而本书则抓住了智能生成机制,这就使它走在了国际学术界的前头,这是值得称道的原因之三。
本书不仅抓住了“智能生成机制”(知识的外生态过程),从而引入了机制模拟的人工智能理论,而且又抓住了“知识的内部生态过程”,因而得到了“基于经验知识的结构模拟人工智能、基于规范知识的功能模拟人工智能、基于常识知识的行为模拟人工智能,分别是机制模拟的三个相辅相成的特例”的结论,于是实现了“机器(人工)智能的统一”,实现了Russell、Norvig、Nilsson等人希望实现而没有实现的目标,这是值得称道的原因之四。
当然,本书还有其他一些值得称道的地方,不再逐一赘述。
同样,任何尝试都不可能完美无缺。正如一位哲人所说: 不讲现实不行,没有理想更不行;但现实的东西都不是理想的东西,理想的东西都不是现实的东西。本书显然也不是理想的教材,存在许多需要改进的地方。尤其,信息转换依赖的算法理论和逻辑理论问题还需要进一步解决。显然,随着智能科学与技术的不断进步和发展,《机器智能》也必须不断地进步。但是,上述优点已经使本书具备了足够的出版价值。
希望本书作者在教材的使用过程中多多倾听广大师生的意见和建议,不断改进,不断充实,使本书不断趋于完善,造福学生,造福学术界,造福社会。也希望清华大学出版社不断推出像《机器智能》这样有创新学术见解和创新学术特色的著作,以飨读者。
2016年3月于北京智能科学与技术是我国高等学校一个年轻的本科专业,从2004年北京大学开始设立至今,已经走过了十余个年头。专业建设不断取得进展,课程建设日益走向规范。2008年全国智能科学与技术教育学术研讨会形成共识,把“机器智能”确立为该专业的核心课程,但是目前尚未见到同类教材。
众所周知,传统的“人工智能”以及相关课程早已深入人心,国内外都出版了大量教材。遗憾的是,它们多数是以传统人工智能的基本概念和基本技术应用为主,随着科技的发展进步,再补充一些最新的技术或应用,并结合动手实践。这一方面说明了社会对于智能科学技术的需要和关注日益增强;另一方面,也暴露了智能科学技术领域课程及教材建设的局限性: 缺乏创新性的架构和融合,还是以分散的技术堆积为主要形式。这与当前智能科学技术领域飞速发展的现实是不相匹配的,亟须建设更加符合时代要求和领域特色的新课程和新教材。本教材就是在这种背景下,结合作者多年的教学实践经验编著完成的。
为什么要定名为“机器智能”?它的基本思路和内容体系是什么?它与“人工智能”课程有何区别与联系?为什么它会成为智能科学与技术专业的核心课程?这与科学技术的发展是否有紧密的关系?……相信读者一定会产生类似的诸多疑问。
这门课程不沿用“人工智能”的名称,而定名为“机器智能”,主要是因为“人工智能”这个术语的含义出现了明显的“二义性”问题: 1956年夏天达特茅斯会议首次定义的人工智能(Artificial Intelligence)概念是指“用计算机模拟人的逻辑思维”,这就是基于符号逻辑的物理符号系统(后来演变为专家系统);但是,人工神经网络、感知动作系统显然也都是人工智能系统,然而都不符合“用计算机模拟人的逻辑思维”的定义,因此不被认可为“人工智能”,于是出现了基于符号逻辑的人工智能与基于并行计算的神经网络互相排斥的事件,致使神经网络与模糊逻辑和遗传算法结合起来共同另立了“计算智能”。感知动作系统是行为主义人工智能的代表,也加入了“计算智能”而没有加入“人工智能”。这样就发生了问题: “人工智能”究竟应不应当包含人工神经网络和感知动作系统?如果不包含,显然不合理;如果包含,又不符合“人工智能”的定义。如果启用“机器智能”的称谓,上述矛盾就被排除了。“机器智能”就是指一切机器所具有的智能,上述三者都可以包含在其中,表达了更完整的概念。按照上述分析,本教材将给学生提供比较完整的智能科学技术的概念和知识。
事实上,2008年全国智能科学与技术教育学术研讨会形成的共识很明确: 在智能科学与技术本科专业培养方案中设置“机器智能”这门课程,而非传统的“人工智能”,这样既可以融合传统研究的各方面研究成果,使其形成相辅相成的合力,又可以在更广泛的范畴内考察智能科学与技术,这与当前智能科学与技术在日益广泛的学科领域内发挥重要作用的现状和需求是非常契合的。
机器智能(Machine Intelligence)是智能科学与技术本科专业三年级的一门专业基础课,旨在从科学技术发展的宏观规律和智能科学技术发展的具体进展来给出智能科学技术的基本内容;通过机器智能基本概念和模拟方法的梳理把智能研究领域原先互相分离的结构模拟、功能模拟、行为模拟三大主流方法融为一体;同时,通过对各个主流方法的主要研究内容、研究思路和特色的讨论,继承与发展已有的优秀成果,为读者展示机器智能领域清晰而完整的脉络。此外,通过安排应用和前沿问题概览,包括机器情感、智能信息网络、智能机器人和智能研究中的未决问题和创新空间,激发读者对本学科领域的兴趣和热情,为后续各门专业课程的教学科研打好坚实的基础。
以往一般认为,人工智能是计算机学科的一个组成部分,这对1956年诞生的物理符号系统和其后的专家系统而言是正确的,因为物理符号系统/专家系统一直都是以计算机为硬件平台发展起来的。但是,对于人工神经网络和感知动作系统的研究而言却不贴切了,因为它们并不单纯以计算机为平台。
Brooks在20世纪80年代后期就曾经提出了对功能主义(专家系统)的批评,这也为他后来提出感知动作系统奠定了基础。Brooks认为: 物理符号系统/专家系统不能直接感知外部世界,也不能直接作用于外部世界,不是完整的智能系统。因此,他提出了感知动作系统,试图从感知到动作的过程全面地模拟人类的智能。
进入21世纪,信息科学、知识理论、智能统一理论等研究成果陆续出现,人们进一步认识到,智能研究应该是信息科学的分支,因为智能就蕴含在整个信息过程中,这将在本书中进行详细的阐释。
七十多年来,人工智能相关研究领域先后形成了三大主流方法,包括结构主义、功能主义和行为主义。多数人工智能教材都是以功能主义人工智能的基本理论和应用为基础,辅以一些新的成果或应用。如Russell等人编著的Artificial Intelligence: A Modern Approach是集大成之作,覆盖面很全,世界很多大学用它作为教材;Nilson编著的Artificial Intelligence: A New Synthesis也强调避免片面性。两者都是人工智能优秀教材的代表,它们用Agent为载体,使它从简单到复杂逐渐丰富,从而将传统人工智能、神经网络、感知动作系统包含进来,然而却没有真正有效地把它们统一起来。
客观上,人工智能研究存在三大主流方法。已有的人工智能教材和著作没有阐明它们之间的内在联系,因此被外界批评为“人工智能理论不成体系”。事实上,这也是“智能科学技术”没有被承认为一个独立的一级学科的重要原因。
当前,社会对于智能科学技术的需要和关注日益高涨,智能科学技术领域的研究也取得了重要进展,它的许多应用成果已经进入了人们的生活、学习和工作中,对人类社会的发展产生了重要影响,这些都形成了编写机器智能教材的客观需求。本书希望在“人工智能的统一理论”基础上,通过机制模拟研究方法把已有的智能科学技术成果融为一体,这是本书的最大特色。这样,以前人们关于“人工智能理论没有体系”的状况就有望得到改观。
本书强调应当为读者提供完整的知识和统一的理论,而不能只是局部的知识以及不和谐不统一的理论。这不但将大大提升读者在本领域的科学认知水平,而且能让读者直接触及智能生成的共性机制这一世界性前沿问题,培养读者善于分析地继承已有的科技进步成果,善于发现问题、分析问题和解决问题的科学创新精神;同时也能使智能科学与技术专业的建设更具有时代创新特色,从而为繁荣我国智能科学技术事业、培养自主创新能力、建设创新型国家做出应有的贡献。
读者可能会问,为什么对机器智能的四种研究方法采用结构模拟、功能模拟、行为模拟和机制模拟的顺序介绍?这里主要考虑了科学研究方法论和认识论的规律:
(1) 系统的结构是非常具体的,因此,20世纪40年代最先被提出来的智能模拟思路就是结构主义,这一方法认为把结构研究明白了,就把系统认识清楚了。这也是近代科学所强调的“结构决定论”。但是,结构只是系统的硬件基础,不能完全决定系统的能力。后来结构主义的研究果然遇到了困难: 人的智能系统不仅结构复杂,而且机制深奥。遭遇进退两难的局面: 前进?结构和机制都很困难;后退?智能水平就会降级。
(2) 20世纪50年代中期,随着数字计算机的发展,人们认为它具有人脑的功能(所以它被称为“电脑”),于是可以用来模拟智力功能,而不必理会智能系统的具体结构。在结构主义遭遇困难的背景下,功能主义自然成为智能研究的出路。功能主义认为,只要具有了智能所需的功能,智能系统就模拟成功了,这就是“功能主导论”。用计算机模拟人类的逻辑思维的学科就是那时人们所理解的人工智能。这种方法的问题在于: 计算机模拟的智能既没有考虑意识功能,也没有考虑情感功能。而且,功能主义的发展此后也遇到了“知识瓶颈”的困难,说明功能模拟方法也不能完全解决问题。
(3) 在结构主义和功能主义都暴露出各自的缺陷后,从20世纪90年代开始出现了行为主义的思路,即“行为表现论”,行为主义认为,无论采用什么结构和具有什么功能,只要能表现出智能的行为(在受到外界刺激时能够产生恰当的行为响应),就等于模拟了智能系统的能力。不过,行为主义模拟智能的方法存在一个重大的缺点,就是只有那些能用行为表现的智能才可以被模拟,但是还有很多智能过程是无法用行为直接表示的。
(4) 在全面考察了结构主义、功能主义和行为主义智能模拟方法的成就与不足的基础上,人们认识到,智能的生成机制才是智能系统的实质和灵魂。由此启迪了机制主义的智能模拟方法。这一方法认为,无论给定什么样的问题、环境、目标,智能系统的生成机制必然都是要首先获得“问题、环境约束、预设目标”的信息,然后据此提取和建立相关的知识,进而在目标的导控下利用上述信息和知识演绎出求解问题的智能策略,并把它转换为相应的智能行为作用于问题,从而解决问题。可见,机制主义智能模拟方法就是: 把关于“问题、约束知识和目标”的信息作为起点,把信息转化成为知识,进而在目标引导下把信息和知识激活成为智能策略,运用策略解决问题。因此,可以把智能生成机制和机制主义智能模拟方法简明地概括成为“信息知识智能转换”。本书后面的章节将阐明: 结构主义的人工神经网络方法所遵循的正是“信息经验知识经验策略转换”,功能主义的专家系统方法所遵循的乃是“信息规范知识规范策略转换”,而行为主义的感知动作系统方法所遵循的则是“信息常识知识常识策略转换”,它们都是机制主义智能模拟方法在特定知识条件下的特例;而经验知识、规范知识、常识知识之间则构成了知识本身的和谐生态系统。因此,可以得出结论: 机制模拟与结构模拟、功能模拟和行为模拟三种方法不是平行的,而是机制主义和谐地融合和统一了结构主义、功能主义、行为主义方法,成为了一个统一的理论体系。这就是本书内容组织的方法论和认识论根据。
本书可作为高等院校智能科学与技术相关专业高年级本科生的教材以及计算机类、信息技术类与自动化类相关专业本科生的参考用书,也适合对智能科学技术有兴趣的广大读者阅读。
在本书漫长的编写过程中,作者得到了很多专家、同事和朋友的大力支持和帮助。钟义信教授对本书的编写给予了极大的关注,在百忙之中反复审阅,提出了若干宝贵的建议,并多次亲自指导修改。周延泉副教授对本书第1章和第2章提出了很好的建议。李睿凡博士对本书第3章和第10章的编写提供了大力支持并提出了宝贵建议。袁彩霞副教授对本书第4章和第5章给出了很好的建议。鲁鹏博士对本书第5章的编写提供了宝贵的意见参考。刘咏彬博士对本书第9章的编写给出了极好的意见。张亚召同学为本书第8章和第9章的编写提供了丰富的素材。张玥编辑和王万森教授最初全力推动了本书的编写计划,先后对本书的思路和文字给出了特别好的意见和建议,并在作者情绪不振时多次给予鼓励和支持。在此谨向他们表示最诚挚的感谢!
特别感谢北京邮电大学智能科学与技术专业2007、2008、2009、2010、2011、2012级的所有同学们!是他们陪伴着这门课程、原始的讲义和这本书稿一路走来,他们倾听其中的内容,他们不断地给予宝贵的反馈和建议,坚持不懈地鼓励作者前行!
本书的编写工作得到了国家自然科学基金项目的资助(项目编号: 71231002,61202247,61202248, 61472046)。
由于作者知识水平和研究能力有限,本书的错误和缺点在所难免。在此恳请读者能够坦率地对本书的错误和缺点提出批评,使本书能够不断改进,也使作者不断进步。