第 1章认知与计算 1.1认知 认知是主体自身以及与外界交互中的能动和过程总称。人类拥有的高级认知包括感觉、知觉、学习、记忆、注意、思维、想象、语言和行为等,这些高级认知是在漫长的岁月中从众多的低级认知发展进化而来的。 认知从低级到高级分为四个层级,这些不同层级的认知直接导致认知行为的不同,脑与认知科学有一阶认知、二阶认知、三阶认知、四阶认知四个不同的认知层级。每个层级又分为两个水平,沿着这八个水平等级,从原子化学反应行为的选择性自然行为开始,经过本能行为、群体行为、学习认知、关联认知、语言认知、知识决策,最后到达人类拥有的创新创造,形成如图 1.1所示的认知金字塔。 图 1.1认知金字塔 万物有灵,认知存在普遍性和多样性。 1.2元认知 元认知是对认知的认知。依据认知对象对认知过程进行主动的监测以及连续的调节和协调,称为元认知,它是高级认知的重要内容。 元认知和认知的区别主要表现在以下几个方面。 (1)认识和思考的对象不同。认知活动的对象是外在的、具体的,如记忆的对象是某个具体的事件或某篇文章,阅读的对象是某段具体的文字;而元认知的对象是内在的、抽象的,是主体自身正在进行的认知活动。 (2)活动的内容不同。认知活动的内容是对认知对象进行某种智力操作,例如,阅读某一篇文章,通过对字词辨识,对句子、段落的理解,最后整文把握。元认知活动的内容是对认知活动进行调节和监控,例如,阅读中的元认知活动有明确阅读目的,集中注意力在主要内容上,并对阅读进行调节,自我检查阅读效果,并随时修正策略等。 (3)作用方式不同。认知活动可以直接使认知主体取得认知活动的进展,例如,个体阅读一篇文章,就可以知道这篇文章的大意、中心思想。而元认知只能通过对认知活动的调控,间接地影响主体的认知活动,例如,通过自我检查确认主体的阅读是否达到预期目标。 (4)发展速度不同。从个体认知发展看,元认知落后于认知的发展。婴儿出生以后就有了一定的认知能力。幼儿到学前期才开始获得一些肤浅的元认知能力。在大学生中,元认知能力存在较大的个体差异,通过加强对元认知的学习和培养,能使其元认知能力获得发展和提高。 认知是元认知的基础,元认知通过对认知的调控,促进认知的发展。元认知和认知共同作用,促进认知主体完成认知任务、实现认知目标。 元认知主要包括元认知知识、元认知体验、元认知调控等成分。元认知知识是个体关于自己的认知能力、认知策略的知识,以及在何种情境下应该运用何种认知策略、如何发挥自己能力的知识。元认知体验是伴随并从属于智力活动的有意识的认知体验,是关于在某一认知活动中已取得的进展或将取得的进展的信息。元认知调控是指一个主动学习者在力图解决问题的过程中所使用的调控机制,包括计划、检查、监控、检验等。 元认知调控会使个体产生新的元认知体验,同时也会丰富、发展个体的元认知知识。这三个方面相对独立、密不可分,而且相互作用、循环往复,三者动态结合构成元认知。 1.3认知计算 认知计算是以计算的方式理解认知,以及与认知、元认知相关的计算,其核心是智能框架和算法。从宇宙中产生的认知过程中取出可用的智能框架和算法得到人工智能,是认知计算的核心任务,得到的人工智能可以应用到包括回馈生物智能,人脑的理解、 认知计算 治疗、修复和创造在内的广泛场景中。 认知的可计算性一直是一个争论的问题,但随着深度学习、计算机视觉、脑机接口等领域的研究与发展,人们已经体验到至少一定范围内的认知是可以计算的。不仅如此,当前的认知计算成果又在不断扩大认知可计算的范围。 认知的计算理论认为,认知就是计算。在计算理论层面,作为信息处理的系统,都是离散符号操作在图灵意义下的计算,计算对于描述任何认知活动,都是必要的,在一定条件下又是充分的。 认知与计算有着不同的层次,由低到高有生物物理层次、网络回路层次、动力系统层次、信息处理层次、功能算法层次、智能涌现层次。 高级认知计算更加强调机器或类脑如何能够感知、学习、推理、理解世界,并与人类、环境进行交互。它会根据环境的变化做出动态反应,所以认知更加强调它的动态性、自适应性、鲁棒性、交互性。高级认知计算系统的组成,需要一个能够学习、推理的“大脑”,一个物物相连的基本设施,并参与环境感知与交互。 智能行为是认知计算系统功能的体现,智能的功能是其基础结构所决定的,因此人工智能系统的构建有三种技术路线:⑨功能模拟路线认为,智能系统可以理解为某种符号运算系统,可以通过计算平台,设计智能算法,完成逻辑推理,其代表性工作是逻辑主义;②结构模拟路线认为,智能主要产生于大脑皮层,它是由大量非线性神经元互连而成并行处理的神经网络,考虑分区、通路、模块化子系统、系统等方面的结构因素,其代表性工作是连接主义;③行为模拟路线利用感知—模式—动作关系最直接的方法仿造智能系统,识别输入模式,产生相应的动作,其代表性工作是行为主义。在完全揭示智能智慧机制的奥秘之前,这三种路线不断地在融合提升,形成机制模拟,其代表性工作是级联主义。 1.4脑结构与功能 人脑是人类认知产生的重要生理基础。人脑接收外界输入的信息,经过脑的加工处理,转换成内在活动,进而支配人的行为,这个过程就是脑与认知过程。人的认知能力与人的认知过程密切相关,认知是人脑认识过程的一种产物。人们对客观事物的感知 (感觉、知觉)、思维(想象、联想、思考)等都是认识活动。认知过程是主观客观化的脑结构与功能过程,即主观反映客观,使客观表现在主观中。人脑的认知能力存在个体差异,这种差异受到环境和遗传的共同作用,并且行为上的个体差异可以通过大脑结构或功能连接进行预测。 人体是一个复杂的机体,各器官、系统的功能相互联系、制约,直接或者间接处于 神经系统的调节控制之下。特别是人体时常处于变化的环境中,这些环境变化影响着体 内的各种功能。这就需要对体内各种功能不断做出迅速而完善的调节,使机体适应内外 环境的变化,神经系统是体内起主导作用的调节系统。 神经系统分为中枢神经系统和周围神经系统两大部分。中枢神经系统又包括脑和脊 髓,周围神经系统包括脑神经和脊神经。人脑的构造主要包括前脑、脑干和小脑三部分,如图 1.2所示。 图 1.2人脑的构造 前脑属于脑的最高层部分,是人脑中最复杂、最重要的神经中枢,是高级神经活动的物质基础。前脑又分为端脑(大脑皮质)和间脑。 脑干上承大脑半球,下连脊髓,呈不规则的柱状形,由中脑、脑桥、延髓组成。其中,脑桥和延髓也称后脑。脑干控制呼吸、睡眠和觉醒等意识,因此它的损伤大多致命,而大脑皮质损伤相对影响较小。 小脑位于前脑的后下方,在脑干的后面,是脑的第二大部分。大脑的神经元数量约为 860亿,其中大脑皮质约为 163亿,小脑约为 690亿,两者比例约 1:4。小脑参与运动和感觉信息加工,但不直接控制运动,而是整合身体和运动信息并调整运动,从而维持姿态、行走以及协调运动,使其变得流畅而协调。 因此,人脑从方位上讲,可分为前脑、中脑、后脑、小脑。 大脑纵裂将端脑分为左右两个半球,通过大的联合纤维(胼胝体)使两半球发生联系。 1.端脑(大脑皮质) 端脑表面所覆盖的灰质称为大脑皮质,从进化的角度也称为新皮质,由神经元、神经纤维及神经胶质构成。人类大脑皮质上有大量的皱起,称为回,回间的浅隙称为沟,深而宽的沟也称为裂。人脑皮质的体积约 300 cm3,总面积约 2 200 cm2。其中, 1/3露于表面,2/3位于沟壁和沟底。皮质的平均厚度为 2.5 mm,中央前回最厚,约有 4.5 mm,在枕极的皮质最薄,约为 1.5 mm。大脑皮质分为“一沟五裂五叶”:中央沟;大脑纵裂、外侧裂、顶枕裂、距状裂、侧副裂;额叶、顶叶、颞叶、枕叶、岛叶,分别如图 1.3和图 1.4所示。 (1)额叶:位于大脑中央沟以前,被额上沟和额下沟相间成额上回、额中回和额下回,中央沟和中央前沟相间的部分为中央前回,中央前回前面的部分称为前额叶。中央 (a)脑侧视图(四叶) (b)外侧裂内的岛叶 图 1.3大脑五叶 图 1.4大脑主要的沟回 前回是人脑控制运动的中枢,前额叶是人类高级认知活动的生理基础,负责计划、调节和控制人的心理活动,对人高级的、目标导向的行为有重要作用。 (2)顶叶:位于中央沟之后,顶枕裂之前。在中央沟和中央后沟之间为中央后回, 横行的顶间沟将顶叶余部分为顶上小叶和顶下小叶,顶下小叶又包括缘上回和角回。顶叶是人类重要的感觉中枢,响应疼痛、触摸、品尝、温度、压力等感觉,顶叶还与注意功能、空间分辨以及数学逻辑相关。 (3)颞叶:位于外侧裂下方,由颞上、中、下三条沟分为颞上回、颞中回、颞下回,隐在外侧裂内的称为颞横回。在颞叶的侧面和底面,在颞下沟与侧副裂之间为梭状回,侧副裂与海马裂之间为海马回,围绕海马裂前端的钩状部分称为海马钩回。颞叶负责处理听觉信息,也与记忆和情感有关。 (4)枕叶:位于顶枕裂和枕前切迹连线之后,在内侧面,距状裂和顶枕裂之间为楔叶,与侧副裂后部之间为舌回。枕叶负责处理视觉信息。 (5)岛叶:位于外侧裂的深部,其表面的斜行中央沟分为长回和短回。岛叶与情绪功能及自主功能有关。 2.边缘系统 边缘系统是指端脑、间脑和中脑的一些区域和结构,在纤维联系和功能上密切联系相关的系统,发生上古老而又原始,形态上比较恒定,通过帕佩兹环路( Papez circuit,图 1.5)相互联系,并与其他脑结构有广泛联系,参与调解本能和情感行为,调节内脏活动和情绪活动,与个体生存和种族延续有关,与精神、记忆等高级神经活动有关。 图 1.5边缘系统帕佩兹环路 海马与学习、记忆、比对感知信息与经验预期等有关;乳头体与近期记忆关系密切,也对神经内分泌的调控有重要作用;穹窿连接海马和乳头体,是两者信息沟通的桥梁。扣带回分为前扣带回和后扣带回两部分,两者功能及形态结构均有不同,局部解剖及其纤维联系都比较复杂,前扣带回与许多复杂内脏和躯体活动及痛反应有关,后扣带回则是情绪回路的重要组成部分,并参与情感和自我评价等过程,尤其和抑郁症状密切相关;胼胝体是联络左右大脑半球的纤维构成的纤维束板,它把两大脑半球对应部位联系起来,使大脑在功能上成为一个整体,对于两半球间的协调活动有重要作用。 因为边缘系统的结构集聚性和功能整体性,通常从发生学与功能的角度,将大脑又分出一个“大脑五叶”之外的边缘叶,由大脑半球内侧面和底面与间脑连接处的各部结构组成,包括扣带回、海马旁回、海马沟、齿状回、穹隆和海马,还包括脑岛和额叶眶面结构。 3.基底节 基底节也称基底神经节,是大脑皮层下一大块灰质的总称,如图 1.6所示。它位于大脑白质深部,主要由尾状核、豆状核、屏状核、杏仁核组成。另外,红核、黑质及丘脑底核也参与基底节系统的组成。尾状核和豆状核合称为纹状体,豆状核又分为壳核和苍白球两部分。尾状核和壳核种系发生较晚,称为新纹状体。苍白球出现较早,称为旧纹状体。屏状核是位于岛叶皮质与豆状核之间的薄层灰质。杏仁核位于海马旁回的深面,与尾状核尾部相连,是基底节中发生最古老的部分,与屏状核一起称为古纹状体。各部分进化发生组成如图 1.7所示。 图 1.6基底节 图 1.7基底节进化发生组成 基底节是锥体外系统的中继站,各核之间有密切的纤维联系,其经丘脑将信息上传至大脑皮质,又经丘脑将冲动下传至苍白球,再通过红核、黑质、网状结构等影响脊髓下运动神经元。基底神经节与大脑皮质及小脑协同调节随意运动、肌张力和姿势反射,也参与复杂行为的调节。杏仁核与情绪控制、恐惧感、动机、非语言的情绪解读等有关。 4.间脑 间脑位于两侧大脑半球之间,如图 1.8所示,是脑干与大脑半球连接的中继站。间脑前方以室间孔与视交叉上缘的连线为界,下方与中脑相连,两侧为内囊。左右间脑之间的矢状窄隙为第三脑室,其侧壁为左右间脑的内侧面。间脑包括背侧丘脑(又简称丘脑)、上丘脑、底丘脑、下丘脑、第三脑室。 图 1.8间脑 丘脑是间脑中最大的卵圆形灰质团块,对称分布于第三脑室两侧。丘脑包括外侧膝状体、内侧膝状体、腹后侧核团等,被称为“皮质的关口”,除了嗅觉输入以外,其余感觉通道的信息都需要经过丘脑中的相应区域后到达初级感觉皮质。例如,视觉:视网膜神经元 →外侧膝状体 →初级视皮质;听觉:内耳听觉神经元 →内侧膝状体 →初级听觉皮质;躯体感觉:躯体感觉神经元 →腹后侧核团 →初级躯体感觉皮质。丘脑是各种感觉(嗅觉除外)传导的皮质下中枢和中继站,对运动系统、感觉系统、边缘系统、上行网状系统和大脑皮质的活动发生着重要影响。 上丘脑位于背侧丘脑的后上方,包括缰三角、缰连合、丘脑髓纹、松果体和后连合。其中,松果体属于内分泌腺,种系发生起源于低等动物的顶眼,对光线敏感,与光照引起内分泌调节改变有关。 下丘脑是调节内脏活动和内分泌活动的皮质下中枢,下丘脑的某些细胞既是神经元又是内分泌细胞。下丘脑对体温、摄食、水盐平衡和内分泌活动进行调节,还参与情绪过程,并控制与其底部相连的垂体,接收边缘系统等其他脑区的输入信息以调节生理周 期的节律,输出信息到前额叶皮质、垂体等脑区,还通过向血液中释放激素进行远距离的神经调控。 更详细的分区来自德国 Korbinian Brodmann(1868—1918)的分区系统,包括每个半球的 52个区域。这个基于细胞结构和排列进行划分的分区系统,从 Brodmann 1区到 52区,如图 1.9所示。 (a)脑功能定位 (b) Brodmann分区 图 1.9脑功能定位与 Brodmann分区 (1)初级运动区:位于中央前回( 4区),是支配对侧躯体随意运动的中枢。它主要接受来自对侧骨骼肌、肌腱和关节的本体感觉冲动,以感受身体的位置、姿势和运动感觉,并发出纤维,即锥体束控制对侧骨骼肌的随意运动。 (2)辅助运动区和运动前区:位于中央前回之前( 6区),为锥体外系皮质区。它发出纤维至丘脑、基底神经节、红核、黑质等。与联合运动和姿势动作协调有关,也具有自主神经皮质中枢的部分功能。 (3)躯体感觉区:位于中央后回( 1、2、3区),接受身体对侧的痛、温、触和本体感觉冲动,并形成相应的感觉。顶上小叶(5、7区)为精细触觉和实体觉的皮质区。 (4)额叶联合区:为额叶前部的 9、10、11区,与工作记忆、智力和精神活动有密切关系。 (5)视觉区:包括初级视皮层以及纹外皮层。初级视觉区位于枕叶的距状裂上、下唇与楔叶、舌回的相邻区,即 17区;纹外皮层包括 18区和 19区,在每一侧的上述区域皮质都接受并处理来自两眼对侧视野的视觉信息,并形成视觉。 (6)听觉区:位于颞横回中部( 41、42区),又称贺希尔( Heschl)回。每侧皮质均 按来自双耳的听觉冲动产生听觉。 (7)嗅觉区:位于嗅区、钩回和海马回的前部( 25、28、34和 35区的大部分)。每侧皮质均接受双侧嗅神经传入的冲动。 (8)味觉区:位于顶叶躯体感觉区的腹侧,邻接舌、咽感觉区,即 43区以及脑岛旁皮质。 (9)内脏皮质区:该区定位不太集中,主要分布在扣带回前部、颞叶前部、眶回后部、岛叶、海马及海马钩回等区域。 (10)语言运用中枢:分布在多个脑区,包括: ⑨运动语言区,位于额下回后部( 44、 45区,又称布罗卡区或 Broca区);②听觉语言区,位于颞上回 42、22区皮质,具有能够听到声音并将声音理解成语言的一系列过程的功能,又称为维尼克区或 Wernicke区; ③视觉语言区,位于顶下小叶的角回,即 39区,具有理解看到的符号和文字意义的功能;④语言运用中枢,位于顶下小叶的缘上回,即 40区,主管精细的协调功能; ⑧书写中枢,位于额中回后部 6、8区,即中央前回的前方。 人脑功能通常有单侧特异化现象,存在优势半脑。右利手左半脑主要具有语言、分 析、计算、抽象、逻辑、对时间感觉等思维功能;右半脑具有表象、综合、直观、音乐、 对空间知觉和理解等思维功能。在思考方式上,左半球是垂直的、连续的、因果式的; 右半球是并行的、发散的、整体式的。 大脑左右半球的分工并不分明,功能的单侧化只具有相对意义,左右半球既有相对 的分工,又有密切的协作,重要功能需要左右半球密切协作才能完成。对于大多数任务, 左、右侧大脑半球都能完成相应的信息处理,并通过胼胝体进一步整合。 人脑组织的两个基本原则是功能整合和功能分化,需要考虑局部属性和连接属性两个方面。对人脑的分析和理解更需要遵循系统性原理,从系统的角度去思考。大脑组织存在个体差异,获得大脑组织的一般的特征和了解个体差异是相辅相成的,人脑的可塑性也给人脑分区带来挑战。无论如何分区,大脑作为整体大于各部分之和。 1.5三位一体 人脑的三位一体学说,即大脑有如图 1.10所示的三个部分:古脑,也称为爬行脑; 旧脑,也称为哺乳脑;新脑,也就是大脑的新皮质,这三个脑一个覆盖着另一个,在进 化的阶梯上逐步形成。这三个脑,通过神经纤维两两相连,但各自作为独立的系统分别 运行,各司其职。 古脑,也称为古皮质或基础脑,对应爬行动物脑,是最先出现的脑成分,由脑干(延髓、脑桥、中脑)和小脑,以及最古老的基底核(苍白球)与嗅球组成。对于爬行动 物,脑干和小脑对物种行为起着控制作用。在爬行动物脑操控下,人与蛇、蜥蜴有着相 同的行为模式:呆板、偏执、冲动、一成不变、多疑妄想,如同“在记忆里烙下了祖先