第一篇 人工智能 概述 1 什么是人工智能 .智能机器:千年梦想 唐代《朝野佥载》记载了一名叫殷文亮的县令,喜好饮酒。他制作了一个“劝酒”机器人,客人喝得少了,就到跟前唱歌跳舞,酒喝不完歌舞不停,因此每次饮宴都会宾主尽欢。 阿拉伯学者加扎利 (1136—1206) 制作的机器玩偶,传说会吹拉弹唱,还可以组成乐团。 人工智能(arti.cial intelligence, AI)是一门科学,目的是让机器拥有类似人的智能行为。这些智能行为包括感知、运动、推理、学习、规划、决策、想象、创造、情感等。 《列子·汤问》记载了一位名叫偃师的巧匠,制作的机器人惟妙惟肖。他带着自己的歌舞机器人拜见周穆王。机器人竟然向穆王的嫔妃们抛媚眼,惹得穆王大怒,要治偃师的罪。偃师无奈,将其剖开,穆王才相信跳舞的是机器人。 .人工智能无处不在 古罗马数学家希罗在《自动装置制作》一书中所描述的一个全自动化的木偶剧院。 .强大的人工智能 刷脸支付 人工智能写小说 人工智能谱曲 语音助手 新闻推送 人工智能为数学家出题 人工智能寻找抗癌药物 搜索引擎 .人工智能的基本概念 一般认为,人工智能是探讨用计算机模拟人类智能行为的科学。 计算机是实现人工智能的基本工具。为智能行为建立计算模型是人工智能的基本任务。 约翰·麦卡锡 (1927—2011),美国计算机科学家,“人工智能”一词的提出者。 计算 智能行为 人工智能起源于对人类思维的模拟,关注那些需要“动脑子”才能完成的工作,或称为智能行为,如感知、记忆、动作、推理等。 当前人工智能方法都是通过计算实现的,因此计算机是基本工具。基于物理过程实现的功能一般不作为人工智能的研究对象,如风力带动石磨研磨稻谷等。 思考与讨论 19世纪末,著名物理学家皮埃尔·居里(居里夫人的丈夫)在自己的实验室里发现磁石的一个物理特性,就是当磁石加热到一定温度时,原来的磁性就会消失。后来,人们把这个温度叫作“居里点”。人们利用这一现象设计了电饭锅,当米饭煮熟后会“智能”地断开电源。思考一下,电饭锅这种自动断开电源的功能算是人工智能技术吗? 实践设计:分组合作,设计一个调查问卷,调研公众对人工智能的认知程度。问卷中可以包含诸如“智能冰箱是不是人工智能”“人工智能就是机器人”“人工智能就是编程”等问题。通过对问卷结果的分析写一份调研报告,讨论不同人群或某一特定人群对人工智能的认知程度(如大学里的文科、理科学生;外卖人员和商场导购人员等),提出一些关于提升人工智能基础素养的建议。 .关于人工智能的误解 1 人工智能就是机器人 人工智能未必具有硬件形式,也未必是人形。很多强大的人工智能,如 AlphaGo,只是一个计算程序。反过来,机器人也未必是智能的,一些机器人仅是做些重复性操作,智能度并不高。 2 人工智能就是编程 人工智能和编程是不同逻辑范畴的概念。编程是用计算机语言和机器沟通的方式,编程的对象既可以是人工智能算法,也可以是简单的打印命令。人工智能本质上是一门科学,既包括理论研究,也包括软硬件实现,其中软件部分通常由编程实现。 人工智能等价于机器人吗? 什么是人工智能? 视频资源 2 人类智能 .人类的智能有哪些 .智商 智商(IQ)是对智力的测试得分。德国心理学家威廉姆·斯特恩设计了后来称为IQ测试的智力测试方法。在IQ测试中,普通人的IQ为100左右,大约2/3的人IQ为85~115;只有极少数人的IQ在130以上,可以认为是人类中的高智商者。 加德纳的多元智能理论将人的智能总结成7种:逻辑数学智能、语言智能、空间智能、音乐智能、运动智能、人际交往智能、自省智能。后来,又增加了自然智能(利用自然的能力)和存在智能(对人类存在意义等重大问题的思考能力)。这一理论在教育领域得到广泛应用,成为多元化教育的基础。 霍华德·加德纳(1943—. ), 美国哈佛大学心理学家,1983年发表Frames of Mind,提出多元智能理论。 人群中的IQ值的分布 对应加德纳的多元智能理论,IQ测试的是人的语言和逻辑数学能力以及部分空间能力,但与其他能力关系不大。例如,IQ测试通常不能反映人的创造力和社会认知能力。同时,人类的认知过程极为复杂,无法通过一个测试精确测量。因此,IQ不能作为个体能力的绝对评价。 通过动物的脑结构及行为,可以估计它们的IQ值 .情商 情商(EQ)是指认识、了解、控制自我情绪的能力,由美国心理学家彼德·萨洛维和约翰·梅耶等人于20世纪90年代初确立。对应加德纳的多元智能理论,情商与人际交往智能、自省智能、存在智能等更为相关。 高情商者对自身的认知更明确,与人交往更和谐,能积极看待事物,承受挫折能力更强,做决策时更冷静、客观。相反,低情商者缺乏自信,与人合作困难,爱抱怨,找借口,不努力。 .人类为什么这么聪明 人类为什么这么聪明呢?一个根本原因在于人有一个不一样的大脑。研究表明,成年人的大脑大约为1.4千克,占身体重量的2%,几乎是所有动物中比例最高的。在我们的大脑中包含超过1000亿个神经元细胞,非常强大。 因此,人类是通过头脑而不是四肢或牙齿来获得生存优势的。这一选择使得我们的头脑越来越聪颖,越来越强大。反过来,聪明的头脑也让我们的肢体越来越灵巧,可以完成更复杂的创造性活动。现在看来,这一选择是非常明智的:那么多庞然大物都消失在历史长河中,而人类成了这个星球的主宰。 那么,为什么人类可以进化出发达的大脑呢?可能是一些关键的基因变异起到了作用。研究表明,现代人与黑猩猩在基因上有99%是相同的,然而,人类有些特殊的基因可能刺激了大脑的发育。比如,科学家们在2015年发现了一种人类特有的基因ARHGAP11B,可能对促进大脑发育起到了作用。 ..不同动物与人类的基因相似性。图中数字为动物基因中和人类一致的氨基酸所占的比例。 ..不同动物的脑化指数(EQ)。脑化指数是描述动物大脑和身体比例关系的量,并以猫的计算结果为参考进行比例调整(即猫的 EQ=1.0)。 .酒精会损伤我们的大脑 2022年3月4日,国际著名杂志《自然通讯》刊登论文,称随着酒精摄入量的增加,大脑的体积会减小,并且喝得越多,减小的情况越严重。 饮酒也被证明与多种癌症有关。饮酒没有安全线,最安全的饮酒量是零。 思考与讨论 思考一下,为什么人类靠头脑可以战胜那些体力和速度远胜于自己的动物,最终主宰了这个世界?这是偶然还是必然?如果是必然,这是否意味着任何生物世界的演化最终都将产生智能? 实践设计:加德纳的多元智能理论并非没有批评者。例如,心理学研究发现,不同智能之间的相关性是比较强的,这意味着它们之间并不独立,这一点不符合加德纳的理论。因此有人提出“普遍智能理论”,认为每个人都有自己的基础智能,在这一基础智能之上会衍生出各种多元智能。因此,我们经常看到那些聪明的孩子不论哪一门课都学得很好。组织一场辩论赛,正反双方分别支持多元智能理论和普遍智能理论,通过辩论来讨论哪种理论更接近实际。 成年男性大脑体积与饮酒量的关系 人类的智能有哪些? 视频资源 3 人类的智能是如何产生的 人与猿拥有共同的祖先。600万年前,人类还像他的近亲大猩猩们在丛林中玩耍。600万年过去了,大猩猩还是大猩猩,人类却创造出了无与伦比的璀璨文明。迈克尔·托马塞洛的《人类思维的自然史》揭示了人类智能与文明背后的秘密,发现人类智能来源于我们祖先互信、共享、合作的高贵品质。 .生物进化简史 .人类的诞生 600万年前,在非洲某地,一群大猩猩在与自然的斗争中缓慢进化着。由于环境变化,森林消退,他们开始习惯在地面上直立行走。这些进化出的灵长类动物称为“南方古猿”。 200万年前,一支称为“能人”的古猿开始用双手制造石器,成为最早的人类。 人类开始在非洲旅行,开启了全新的进化之路。大约 20万年前,一个称为“智人”的人类种群在竞争中脱颖而出,成为现代人类的祖先。 大约45亿年前,地球从环绕早期太阳旋转的盘状结构中形成。42亿~ 40亿年前,地球表面温度降低,地壳凝固,大气与海洋形成。 40亿年前,最早的生命以蛋白质的形式出现。38亿~35亿年前,单细胞生物出现,分化出细菌,成为最早的生物。 经过38亿年漫长的进化之路,地球上诞生了约870万种生物,其中 650万种生活在陆地上,220万种生活在海洋中。目前,有记录描述的物种大约有180万种。 .人类智能阶跃之谜☆ 大约在200万年前,人类和其他灵长类近亲们拥有同样的认知能力。那么,什么力量使得人类在此后的200万年里突然崛起,产生了远超其他物种的智力呢? 脑容量的大小可以解释人类智能的物质基础,却不能解释人类智能的历史性飞跃。海豚的脑容量达到1500克,超过人类(1350克),脑化指数(5.3)和人类(7.5)也差不太多,但远没有人聪明,也没有发展出“海豚文明”。另外,自智人以来,人类的脑容量其实是减小的,但无疑人是越来越聪明的。 地球生物进化树 .合作激发智能 .人类的无私品质 人类的智能如此强大,不仅远超其他物种,而且也远远超过了生存的需要,且没有停下来的势头。如此独一无二的智能是如何产生的呢?科学家们对这个问题进行了长期研究,认为合作是人类智能开始飞跃的起点。 因为环境的变化,我们的祖先,一批古猿人,已经不能通过摘果子来填饱肚子了。为了生存,他们不得不开始捕猎生活。然而,他们没有那么强壮的身体和尖利的牙齿,奔跑的速度也没有优势。为了生存下去,他们必须进行合作,一起捕捉跑得更快,或更强大的动物。在这种合作中,他们需要互相交流、平衡关系、制定策略,从而锻炼了大脑的各种能力,激发了智能的快速提高。 合作是很多群居动物共有的特性(如狼、黑猩猩甚至昆虫),但只有人类的合作激发了智能的飞跃。这是因为人类的合作非常深刻,包括合作养育婴儿、分享狩猎经验等。这些合作不是为了自己,而是为了其他成员和整个群体。这种合作的无私性在其他动物那里是看不到的。 人类的合作精神来自于人与人之间深刻的认同感,即每个人会把其他人视为和自己具有同样思考方式的个体。这种相互之间的认同感奠定了人类“共情”的心理基础,即通过换位思考理解他人的处境与苦难。因此,我们的祖先愿意帮助他人、信任他人、分享成果、分享经验,必要时甚至为他人和集体做出牺牲。 人类的这种无私品质之所以能够养成,可能是因为当时的生存条件实在是太恶劣了,只有具有这些特质的个体和种群才能生存下来,那些自私自利的人被大自然早早地淘汰了。因此,生存下来的人类天然具有互信互爱的高贵基因。 思考与讨论 .人类文明的诞生 很多昆虫在外出觅食时会协同行动,一起把较重的食物搬回家。一些大猩猩的合作能力更强,在捕猎时会发出叫声提醒同伴。想想看,这些合作与人类的合作有什么不同? 有研究发现,人类的小朋友3个月后就有和他人交流的愿望,很多小朋友乐于和别的小朋友分享玩具和食物。相对来说,大猩猩拿到食物后更喜欢找个角落独自享用。讨论一下,互相分享、互相交流有哪些好处?在人类文明发展史上,分享和交流起到了什么作用? 人与人之间的互信可能是人类文明的开始。有了这种互信,人们愿意接受他人创造的成果并在此基础上继续贡献,为后人留下传承。这种称为“棘轮效应”的积累非常重要,使得每一代种群所创造的成果得以保存并被后代持续改进。 正是基于这种积累,人类慢慢发展出了文字、宗教、艺术乃至现代科学。新诞生的人类在新的知识环境中不断学习并创造出更优秀的智力成果,一步步推动文明的进步。 人类的智能是如何产生的? 人类技术发展曲线 注:BC表示公元前。 视频资源 4 人工智能的起源 .开端:形式逻辑 如果大前提和小前提都是“真”的,则结论一定是成立的。这一思维规律称为三段论。 三段论将思维对象和思维形式进行了区分。这是人类对自身思维规律的第一次理性总结。 人工智能起源示意图 .进阶:思维的数学化☆ 亚里士多德的形式逻辑是用自然语言表述的,容易产生歧义,应对复杂推理比较困难。 霍布斯在他的《利维坦》 (1651) 一书中提出人类的思维可以表示为一个数学计算过程,简单地说,“推理即计算”。 莱布尼茨同样主张用数学来表达思维。在《发现的艺术》 (1685)一书中,他这样写道:“如果人们发生了争执,那么很简单:来,让我们来算算,看看谁是对的。” 思维数学化的目的是对思维过程进行精确的、无歧义的描述。然而直到19世纪,人们才发明了描述思维的数学工具——布尔代数。 亚里士多德(公元前384—前322),古希腊哲学家、博学家、柏拉图的学生、亚历山大大帝的老师,在众多领域做出了开创性贡献。上边右图是他的逻辑学著作《工具论》,这部著作奠定了形式逻辑的基础,也成为人类研究自身思维规律的开端。 托马斯·霍布斯(1588—1679),英国政治哲学家,机械唯物主义的创立者,社会契约论的创始人。 戈特弗里德·威廉·莱布尼茨(1646—1716),德国哲学家、数学家,微积分的发明者之一。 .完善:数理逻辑确立☆ 1854年,布尔出版了《思维规律》一书,完成了逻辑符号化的开创性工作。他用自己开创的数学体系证明了基于明确定义的符号和运算规则,可以表达形式逻辑的推理过程,从而模拟人的思维。为纪念他对逻辑学的贡献,后人将他开创的符号演算体系称为布尔代数。 弗雷格在《概念演算》一书中定义了完整的逻辑演算系统。后来,经过怀特黑德、罗素、希尔伯特、哥德尔等数学家的努力,数理逻辑正式确立。 数理逻辑的确立为用数学方法来描述人类的思维提供了坚实的理论基础,成为人工智能大厦的第一块基石。 弗里德里希·路德维希·戈特洛布·弗雷格(1848—1925),德国数学家、逻辑学家和哲学家,数理逻辑和分析哲学的奠基人。 乔治·布尔(1815—1864),英格兰数学家和哲学家,数理逻辑先驱。1864年,因冒雨给学生上课,布尔患感冒引发肺部水肿去世。 .计算机出现 1936年,年仅24岁的英国科学家艾伦·图灵提出图灵机模型。这一模型表明,基于简单的读写操作可以处理非常复杂的逻辑演算(详见第 5节)。 1946年,第一台通用计算机ENIAC诞生; 1949年,第一台基于存储程序结构的可运行电子计算机EDSAC面世,人类进入计算机时代。 1945年前后,包括约翰·冯·诺伊曼在内的科学家们逐渐确立了计算机设计的基础原则,明确使用二进制计算,像存储数据一样存储程序,并将计算机分成五大组件。这一结构称为存储程序结构。 约翰·冯·诺伊曼(1903—1957),美国数学家、计算机学家、博弈论奠基人,在几何学、物理学、经济学中都有重要贡献。 存储程序结构将计算机分成运算器、控制器、存储器、输入设备和输出设备五大组件。 计算机的诞生为人工智能提供了工具,成为人工智能大厦的第二块基石。 .人工智能诞生 1948年,图灵发表了一篇题为《智能机器》的报告,提出了利用计算机来模拟人类智能的思想,为人工智能的诞生奠定了理论基础。 1956年,约翰·麦卡锡等一批年轻学者在美国达特茅斯学院召开暑期讨论会,探讨实现智能机器的方法,史称达特茅斯会议。在这次会议上,约翰·麦卡锡提出的“人工智能”一词成为新科学的名字。从此,人工智能正式走上历史舞台,开始了半个多世纪的风雨历程。 Artificial Intelligence (1956—.) 思考与讨论 在本节中,我们看到“思维”和“计算”这两个要素在人工智能诞生过程中的重要性。深入思考一下,人工智能为什么抛弃了构造各种灵巧机器的方案,最终走上了计算思维的道路? 如何描述人的思维? 视频资源 5 图灵:人工智能之父 .少年天才 艾伦·图灵,1912年6月23日出生于英国伦敦。在读小学时,他的老师就曾写道:“我见过不少聪明勤奋的孩子,然而,艾伦是个天才。” 艾伦·图灵,英国著名数学家、计算机学家,人工智能科学的奠基人。左图为图灵在第二次世界大战时所设计的Bombe密码破解器,成功破译了纳粹德国的英格尔密码,为二战胜利做出了重要贡献。 ..1926年,图灵进入伦敦谢伯恩公学,表现出对科学的极大兴趣。16岁的时候,图灵接触到爱因斯坦的工作。据说图灵不仅可以读懂这些论文,而且推测出爱因斯坦对牛顿运动定律的批判。 剑桥大学国王学院 ..1931年,图灵考入剑桥大学。1935年因一篇证明中心极限定理的论文被选为剑桥大学国王学院的研究员,当时他年仅22岁。 伦敦谢伯恩公学 艾伦是个天才 .计算理论☆ 1936年,年仅24岁的图灵发表了一篇划时代的论文《论可计算数及其在判定问题上的应用》,文章提出了被后人称为“图灵机”的通用计算模型,为现代计算机的诞生准备好了理论基础。正是因这一伟大贡献,图灵被后人称为“计算机科学之父”。没有计算机的诞生,也就没有人工智能的开端。从这一点上看,图灵是为人工智能准备工具的人。 .机器智能 1948年,图灵发表了一篇题为《智能机器》的报告,提出了用机器实现智能的可能性,并探讨了若干实现方法。例如,他认为可以设计一个通用机器,像教小孩子那样教它一步步成长,这是机器学习的朴素思想。他还提出,可以通过奖励和惩罚来对机器进行“教育”,这是强化学习的基本思路。这些天才思想是人工智能发展之初的第一笔精神财富,直到今天依然指导着后人。从这一点上看,图灵是为人工智能奠定思想的人。 图灵主张通过教育让机器产生智能 图灵建议模拟动物群体活动产生智能 .图灵测试 1950年,图灵发表《计算机器与智能》一文。这篇文章提出了后来被称为“图灵测试”的假想实验。通过这一假想实验,图灵用一种实验的方式定义了智能,即如果我们不能将机器和人的行为区分开来,则认为机器拥有了智能。 “图灵测试”事实上给出了关于“智能”的定义,同时设定了人工智能研究者努力的方向。从这一点上看,图灵是为人工智能设计方向的人。 把人和计算机关在小黑屋里,由人类测试者通过键盘分别与人和计算机进行自然语言对话以区分谁是机器谁是人。5分钟以后,如果机器可以让超过30%的测试者误以为它是人,则认为该机器拥有了智能。 .百年影响 2012年,在图灵诞辰百年之际,《自然》杂志盛赞他是有史以来最具科学思想的人物之一。 为了纪念这位伟人,美国计算机协会(ACM)于1966年设立图灵奖,颁发给在计算机领域做出杰出贡献的学者,成为计算机界的诺贝尔奖。 2000年,华人科学家姚期智因在计算理论、密码学等方面的基础性贡献获图灵奖。这是目前唯一获此殊荣的中国科学家。 图灵奖奖杯 .图灵奖 图灵奖的奖金在设奖初期为20万美元,1989年起增长到25万美元。奖金通常由计算机界的一些大企业提供。目前,图灵奖的奖金为100万美元。 自1966—2021年,共有75位科学家获得图灵奖,获奖领域包括编译原理、程序设计语言、计算复杂性理论、人工智能等。 思考与讨论 有人不同意将图灵测试作为智能与否的标准。他们认为,就算机器表现的和人一样,也不能说机器拥有了智能,因为它只是一堆电路,与人的思维方式完全不同。你是否赞同这种说法?说说你赞同或反对的理由。 (☆) 实践设计:和图灵测试类似,美国哲学家约翰·瑟尔提出一个名为“中文屋子”的思想实验,试图证明外在表现出的智能并不是真正的智能。成立研究小组,查找资料并撰写一篇小论文,说明你们支持图灵还是支持瑟尔,并给出论据。通过海报或演讲的方式宣讲你们的主张,最终通过投票来给出结论,并通过统计学方法研究不同学科背景的学生群体所持观点的差异。 什么是图灵 测试? 为什么说图灵是 人工智能之父? 视频资源 6 达特茅斯会议 .风起云涌 1956年的达特茅斯会议是人工智能的开端。2006年,在达特茅斯会议50周年之际,摩尔、麦卡锡、明斯基、塞弗里奇和所罗门诺夫(从左至右)重聚达特茅斯学院。50年前意气风发的年轻人已经年过古稀,但他们开创的“人工智能”这门学科却风华正茂。 20世纪50年代,通用计算机刚刚诞生,其强大的计算能力引起了研究者的广泛关注。另外,随着数理逻辑的发展,思维可计算的理念已经深入人心。 受图灵“机器智能”思想的影响,利用计算机来模拟人类思维、实现类人的智能机器激发起年轻学者的极大热情。 一批新的研究成果涌现,包括克劳德·香农的对弈算法,赫伯特·西蒙和艾伦·纽厄尔的“逻辑理论家”定理证明系统,马文·闵斯基的SNARC神经网络学习机。 .对弈算法 对弈一向被认为是需要很强智能才能完成的游戏,例如下象棋、围棋等。因此,对弈机器一直承载着人类的智能梦想。最早的自动对弈机器由西班牙数学家莱昂纳多·托里斯于1910年发明。 计算机发明以后,包括图灵在内的很多科学家都研究过对弈算法。其中,克劳德·香农的研究最为深入。他探讨了通用走棋算法,还设计了一台电动走棋机器。 .逻辑理论家 定理证明是一项高智商活动。然而,数理逻辑的发展让人们相信,基于若干基础假设和简单的推理规则,通过计算是可以实现定理证明的。 1955年,赫伯特·西蒙和艾伦·纽厄尔开始探讨机器定理证明的可能性,最后由来自兰德的计算机程序员约翰·克里夫·肖完成了程序编写。他们把这个程序命名为“逻辑理论家”。 这一程序的诞生具有深刻的历史意义,是“思维即计算”这一哲学思想的有力证明。 克劳德·香农 (1916—2001)美国数学家,信息论的奠基人。 莱昂纳多·托里斯的自动对弈机器Ajedrecista 克劳德·香农的自动走棋机器 艾伦·纽厄尔 (1927—1992) 赫伯特·西蒙 (1916—2001) .神经网络学习机 马文·闵斯基 (1927—2016) SNARC神经网络学习机 科学家们很早就知道,大脑是我们的智能中枢,是由大量神经元相互连接组成的。通过模拟大脑的这种连接机制,有可能复现人类的智能(详见第15节)。 1951年,当时还是普林斯顿大学数学系研究生的马文·闵斯基设计了一个称为SNARC的人工神经网络,成为早期神经网络的代表性工作。 .达特茅斯会议:AI的开端 1955年9月2日,约翰·麦卡锡(达特茅斯学院数学助理教授)联合克劳德·香农(贝尔电话实验室数学家)、马文·闵斯基(哈佛大学数学与神经学初级研究员)和纳撒尼尔·罗切斯特(IBM信息研究经理)向洛克菲勒基金会提出申请,希望举办一次为期两个月,大约10人参加的讨论会。 在申请中,麦卡锡等人首次提出“人工智能 (arti.cial intelligence)”的概念,为一门新学科的诞生埋下了种子。 会议大约开始于1956年6月18日,差不多8月17日结束,前后大约有47人参加。讨论在达特茅斯数学系一座教学楼里进行。有时候会有人做主讲报告成果,更多时候是自由讨论。 这些参会者在接下来的几十年里都是人工智能领域的领军人物。他们经历了各种曲折和艰辛,坚忍不拔,勇于创新,完成了一次又一次创举和突破。代表性的工作包括麦卡锡的LISP语言,塞费里奇的机器感知理论,塞缪尔的机器学习方法等。 达特茅斯会议宣告人工智能作为一门新学科正式登上历史 舞台。 约翰·麦卡锡等人向洛克菲勒基金会提交的达特茅斯会议的赞助申请 达特茅斯会议的部分参会者。左数:塞费里奇、罗切斯特、纽厄尔、闵斯基、西蒙、麦卡锡、香农。 .会议讨论的内容 麦卡锡等人在举办达特茅斯会议申请中列出的讨论内容,包括计算机编程、神经网络、计算效率、自我学习等问题。 可见,当时人工智能的研究方向还是很广泛的,很多基础的事情都需要人工智能的学者们考虑。尽管如此,现代人工智能的主要研究内容已经基本确定了。 美国新罕布什尔州达特茅斯学院旧址 思考与讨论 一个有趣的发现,参加达特茅斯会议的学者们的学科背景非常丰富,有数学家、计算机工程师、神经科学家等。有人据此判断,人工智能并不是一门独立的学科,而是一个大杂烩。在网上搜索一下“AI的开端”一节中出现的几位科学家的学科背景,讨论一下为什么人工智能的诞生会有那么多不同领域的科学家共同参与。 达特茅斯会议讨论了哪些内容? 视频资源 7 人工智能的发展历程 .风风雨雨六十年 .黄金时代(1956—1974) 达特茅斯会议后的10年被称为黄金10年,是人工智能的第一次高潮。当时很多人持有乐观态度,认为经过一代人的努力,创造出与人类具有同等智能水平的机器并不是问题。1965年,赫伯特·西蒙就曾乐观预言:“20年内,机器人将完成人能做到的一切工作。” 1970年,马文·闵斯基也发表看法:“在3~8年的时间里,我们将得到一台具有人类平均智能水平的机器。” 这一时期的主要思路是利用符号演算解决推理问题,即“符号主义”,代表性成果包括定理证明、基于模板的对话机器人等。 对话机器人 ..由MIT研究员约瑟夫·维森鲍姆在1964—1966年开发的ELIZA系统是最早的对话机器人。 .严冬到来(1974—1980) 到了20世纪70年代,人们发现对人工智能的预期过于乐观,失望情绪开始蔓延,人工智能走入低谷。 首先,符号主义遇到瓶颈,不能处理实际问题中的不确定性。其次,神经网络被证明具有严重局限性。这些问题使研究者们失去了方向感。 同时,计算复杂性带来对算法实用性的质疑。加拿大计算机学家斯蒂芬·库克和美国计算机学家理查德·卡普等人对计算复杂性做了系统研究,揭示了人工智能中的很多问题难以在合理的时间内找到确切的答案,这让人们对人工智能的实用性产生了怀疑。 .短暂回暖(1980—1987) 到20世纪80年代,人们渐渐意识到通用型人工智能过于遥远,人工智能首先应该关注受限任务。受此思潮影响,以专家系统为代表的知识型人工智能走上历史舞台。专家系统通过收集具体的领域知识来解决任务,获得巨大成功。 ..专家系统将专家知识收集到知识库中,通过推理引擎给出用户所需要的答案。 .二次低潮(1987—1993) 20世纪80年代后期到90年代初期,人们发现专家系统的建立非常困难。例如,由匹兹堡大学设计的疾病诊断系统CADUCEUS仅建立知识库就花了近10年。社会上对人工智能的投资再次削减,人工智能又一次进入低谷。 .务实与复苏(1993—2010) 经过20世纪80年代末和90年代初的反思,一大批脚踏实地的研究者脱去人工智能鲜亮的外衣,开始认真研究特定领域内特定问题的解决方法,在语音识别、图像识别、自然语言处理等领域取得了一系列突破。 在这一过程中,研究者越来越意识到数据的重要性和统计模型的价值,机器学习成为人工智能的主流方法。 2011年,IBM Watson在危险边缘游戏中战胜人类选手。 1997年,IBM深蓝战胜国际象棋世界冠军卡斯帕罗夫。 .迅猛发展(2011年至今) 2011年以后,以深度神经网络为代表的机器学习方法取得了极大成功,开启了以大数据学习为基本特征的人工智能新时代。 2011年,苹果发布了iPhone 4s,其中一款称为Siri的语音对话软件引起了公众的关注,重新燃起了人们对人工智能技术的热情。2016年DeepMind公司的AlphaGo围棋程序在与人类的对弈中取得辉煌战绩,进一步激发起人们对人工智能的关注。 今天,人工智能飞速发展,不仅在人脸识别、智能对话等领域大显身手,更加渗透到物理、化学、生物等各个领域,释放出令人震惊的生产力。我们将在后续内容中对这些成果进行详细介绍。 苹果iPhone 4s中的Siri系统 AlphaGo战胜韩国李世石九段 思考与讨论 人工智能自20世纪50年代发展至今,经历了若干次高潮与低谷。每到陷入困境的时候,总有一些科学家勇敢地打破传统思想的束缚,创造出新理论、新方法,使人工智能重现生机。例如,在符号主义陷入危机的时候,费根鲍姆提出了专家系统的新方法,把人工智能带入了一个新天地。这些故事对你有哪些启发? 人工智能的发展为什么充满曲折? 视频资源 8 让人惊讶的AI .日新月异的人工智能 进入新世纪以来,基于机器学习的人工智能技术大放异彩。特别是2010年以后,以深度学习为基础的新一代人工智能技术突飞猛进。在机器视觉、机器听觉、自然语言处理、机器人等“传统”人工智能领域中,不仅系统(如人脸识别、语音识别)性能得到显著提升,而且还涌现出一些新的智能系统,如写诗、作画等。另外,近几年,人工智能与其他学科的交叉共融取得长足进展,极大拓展了人工智能的应用 领域。 总结起来,当前人工智能发展可以归因于三个主要因素。 2016—2017年, DeepMind的围棋AI AlphaGo击败包括李世石和柯洁在内的人类顶尖围棋高手。棋圣聂卫平称:“AlphaGo 至少20段。” .图像处理 海量的数据积累 + 强大的计算能力 + 深度学习算法 .语音处理 清华大学东南门 Oben公司和西弗吉尼亚大学合作的美颜效果。最左侧为原始照片,美颜程度从左到右依次增强。 Fit 楼 你已到达,目的地在您的前方! 人工智能技术已经可以合成出流畅清晰的声音,甚至可以用很小的代价生成特定人的发音。这一技术已经广泛应用于地图导航中。 德国图宾根大学的研究者利用卷积神经网络合成的具有独特风格的图片。 使用神经网络处理照片,可以改变一个人的年龄、性别,甚至可以让蒙娜丽莎笑得更灿烂。 校园和居家声音报警器,可以通过声音进行呼救,适合安装在卫生间、卧室等场所,既保护了个人隐私,也守护了家人安全。 .自然语言理解 .机器人 波士顿动力推出的机器狗,面对外力推搡时依然可以保持平衡。 OpenAI公司的DALL-E系统,可以听从人的指挥生成图片。上图是给系统输入“泰迪熊作为疯狂的科学家在混合发光的化学物质”后生成的图片。 无人机已经在勘探、救援、航拍甚至战场上大显身手。 Google的自动抓取机器人,可以从无到有学习抓取技巧。 .科学研究中的AI 清华大学的研究者利用自然语言理解技术阅读分子式,可以自动生成对分子式的语言描述,并判断分子式或化学反应是否合理。 OpenAI 2022年 年底发布的ChatGPT模型,通过学习大量人类文字资料,不仅可以和人流畅对话,还可以写小说、写论文、编制项目计划书、充当计算器、调试代码。从这些结果来看,ChatGPT不仅学习到了人类语言本身的规律,而且在一定程度上掌握了语言中所表达的知识,实现了对知识的学习和总结,这是人工智能领域又一次重要突破。 中国天眼每天望星空,产生150TB的数据。人工智能技术可以帮助科学家们从这些海量数据中发现未知的宇宙奥秘。 思考与讨论 英国DeepMind的研究者利用深度神经网络来预测蛋白质结构,精度达到一个原子的尺度。 中国科学院生物物理研究所、清华大学、美国霍华德休斯医学研究所的研究者利用人工智能增强的高清显微镜观察到细胞的贴壁生长过程。 近年来,人工智能与传统学科的结合备受瞩目。2019年,英国利物浦大学在《自然》杂志发表论文中,介绍了一种可以自动做化学实验的机器人。查找相关资料,并讨论一下类似的工作能给人类社会带来怎样的变革。(☆) 实践设计:大语言模型的出现使得我们可以“培养”个人专属的智能代理。基于大语言模型的代理功能训练一个本专业的科普机器人。不同小组之间互相投票,选出优秀科普大使。 人工智能如何预测新冠疫情? ChatGPT是如何炼成的? 视频资源 9 人工智能的风险 .学成了熊孩子 当前主流的人工智能系统都是基于机器学习的,因此它的行为是由训练数据决定的。目前来看,除非有人故意把人工智能系统教坏,还没有迹象表明它会自我学成一个攻击人类的“社会败类”。然而,学成一个熊孩子的风险还是有可能的。 首先,训练人工智能系统的数据量往往非常庞大,其中或多或少会包含一些教人学坏的数据,导致模型产生一些不符合规范的行为。 其次,通过大数据学习得到的模型和人类理解世界的方式总是不同的,因此有可能产生难以预料的行为,导致潜在风险。 最后,一些智能系统具有自适应能力,在与用户的互动中会改变自己的行为。这种自适应学习增大了学成熊孩子的风险。 熊孩子:聊天机器人Tay 2016年,微软的聊天机器人Tay被用户调教成了“熊孩子”,无奈下线。 .机器人三定律 第一定律:机器人不得伤害人,也不得见人受到伤害而袖手旁观; 第二定律:机器人应服从人的一切命令,但不得违反第一定律; 第三定律:在不违反第一定律和第二定律的情况下,机器人应保护自身的安全。 阿西莫夫于1942年发表科幻小说《转圈圈》 (后收录于小说集 《我,机器人》),首次就未来社会的人机伦理关系进行了思考,提出了著名的“机器人三定律”。 然而,这些定律存在一些问题,执行起来比较困难。例如,当机器人遇到坏人行凶时,依第一定律,机器人不能伤害坏人,也不能看到好人受到伤害而袖手旁观,这是让机器人非常矛盾的事情。 有人担心,如果机器真的聪明到需要用三定律来约束他们的时候,恐怕这三定律也起不到什么效果了。未来恐怕还需要探索更合理的准则和方式来约束人类与人工智能之间的关系,保证机器永远是人类的助手和伙伴。 艾萨克·阿西莫夫(1920—1992),美国科幻小说作家、科普作家、文学评论家,美国科幻小说黄金时代的代表人物之一。 .AI的现实风险 虽然人工智能还没有发展到威胁人类的地步,但一些现实风险已经出现,包括隐私泄露风险、法律风险、伦理风险等。 ..人脸识别被滥用的可能性正在增加。在对方不知情的前提下对人脸进行扫描和识别,可能严重侵犯个人隐私,也可能被不法分子仿冒攻击,造成财产损失和安全隐患。 ..自动驾驶汽车发生车祸,责任主体不明确。因为没有直接责任人,需要设计多方参与的保险体系,以便及时对事故损失方进行赔偿。另外,事故处理流程也需要完善,以防二次损失出现。 ..人工智能技术可以轻松改变视频中的人脸和声音,生成高度逼真的伪造视频。这些伪造视频不仅带来社会混乱,还可能被不法分子用作诈骗工具。 .和人抢饭碗的AI 思考与讨论 2019年1月8日,英国的BBC网站发布了未来会被人工智能取代的七大“高危”职业,其中不乏我们眼中的铁饭碗:医生、律师、建筑师、飞行员、警察、房地产中介等。未来可能会有更多职业被人工智能取代,包括很多专业性很强、需要长时间经验积累的 岗位。 历史上每次技术革命都会取代一些旧岗位,同时催生一些新岗位,人工智能也是如此。人们应该对这一变化有足够的心理准备,并及时调整职业规划,选择更具有创造性的行业。 有一个真实的案例,美国旧金山一名警察夜间执行任务时,发现一辆车行驶时没有开车灯,拦截后发现是辆无人驾驶汽车,在警察冥思苦想要如何开罚单时,该车还试图溜掉。如果你是这名警察,你会把罚单开给谁? A. 汽车制造商 B. 人工智能科学家 C. 车辆审核部门 D. 汽车车主。(☆) 实践设计:机器人三定律本质上定义了机器应该从属于人类,然而,随着机器的智能越来越强,这种从属关系受到挑战。有学者提出应给予机器主体地位,独立承担责任,享有权利。组织一场微型学术会议,通过征稿、审稿、报告等环节,讨论这一课题。 机器人三定律能保护人类吗? 未来人工智能会取代我们的工作吗? 视频资源