前言
著名语言学家王士元教授指出,没有人类发达的大脑,就不可能有我们变化无穷的语
言;同时,没有语言帮助我们组织思想、累积数百年的科学成果,我们也不可能了解大脑
这个极为繁复精密的器官。很明显,大脑和语言息息相关,相互演化。地球上有千千万万
种不同的动物,可只有人类这一物种能如此深刻地影响并改变整个地球的现状及未来。想
要具体理解人类为何如此特殊,研究大脑和语言是必经之路。
莱拉·波罗迪斯基(Lera Boroditsky )指出,人类大脑是一个“语言”大脑,当它处
理来自感官的传入信息时,也在积极、动态地调用语言资源。学习语言的过程,能让我们
窥见人性的本质。语言是从前人那里继承而来的结构深刻的文化对象,它与生物遗传共同
作用,塑造了人类大脑的现有形态。不理解语言的贡献,就无法真正理解人类的大脑。
生物人类学和语言学教授特伦斯·迪肯(Terrence Deacon )指出,向外看,大脑正在
创造一个它不断适应的环境;向内看,语言则是大脑创造的主要产物。从某种意义上说,
我们可以说大脑会呈现出语言所塑造的特征。语言进化与人类大脑进化相互影响、相互交
叠、相互作用。语言与人类大脑共同进化,作为一种形、音、义结合的词汇和语法体系,
它是人类沟通交流的核心方式。
《语言、脑进化与认知》(第1 版)于2022 年由清华大学出版社出版,获清华大学
2024 年优秀教材一等奖。该教材第 1 版的出版时间早于大语言模型ChatGPT 的发布时间。
由于大语言模型(large language model,LLM)改变了我们的工作方式及语言研究方
式,结合清华大学出版社及读者的建议,我们重点对第1 版中的第4 篇进行了重写,主要
补充内容包括:计算机及 AI 发展史;认知科学相关内容(人类对世界的认知及认知科学的
发展、认知科学与物理科学和信息科学的关联及区别、信息时代的两次革命、人类认知五
层级理论);大模型背景知识(LLM 结构、缩放定律与涌现能力、模型资源、数据集资源等)
;
LLM 的训练、微调、推理及应用,包括无监督预训练(数据准备、预训练任务)、监督指
令微调(指令构建、指令微调目标、高效微调方法、人类对齐)、大模型推理(基于参数
知识的推理、基于外部知识的推理)、大模型评测与应用(评测方法与指标、评测数据集、
大模型应用)。
第2 版教材参考了近年来欧美顶级国际学术期刊、人工智能领域顶级会议论文及国际脑
科学中有关语言及认知的六百多篇(部)论著,知识新颖、内容丰富,代表着本学科的国际
前沿。教材主要内容均来自实验,保证了结论的真实性与可靠性;本书涉猎广泛、图文并茂,
约173 万字,包含500 多幅彩色图片,集真实性、趣味性、新颖性、知识性和综合性于一体。
本书从多学科角度探讨了人脑进化、语言产生及人类语言的独特性,强调人脑容量
Yyzzw1-3.indd 13
2026/4/23 16:52:23
语言、脑进化与认知——大脑语言与大模型(第2版)
14
和多层级处理能力在语言中的关键作用,对比了作为技术黑箱的LLM 与作为生物认知
黑箱的人脑之间的差异。书中内容源自清华大学本科生课程脑与语言认知及研究生课程
自然语言处理逐年更新的授课资料,通过比较语言、人脑和LLM 的特性,揭示了它们的
运作机制及内在联系,并提出整合大脑、语言及LLM 的研究思路,以更好地理解三者的
内在工作机制。
本书各篇章内容简述如下:
第1 篇“人类大脑与语言的共同进化”共分三章,系统阐述了语言与人脑在演化过程
中的协同发展关系。
第1 章“人脑的基础知识”介绍了人脑结构与功能的基本框架,内容包括:大脑整体
构成、语言中枢及布罗德曼52 区的功能划分;额叶、顶叶、颞叶、岛叶、枕叶、小脑、丘脑、
基底神经节、扣带回、海马及海马旁回等脑区的解剖结构与语言功能;以及上纵束、额-
枕下束、钩状束、弓形束等重要白质纤维束的分布与作用。这些内容为理解大脑与语言的
神经通路奠定了基础。
第2 章“语言的起源”探讨了语言产生的时空背景与神经机制,涵盖:语言起源的多
种理论(如灵长类手势假说、语言演化树、王士元词汇扩散理论等);语言模态性与类人
猿交流的差异;语言的神经生物学基础(包括镜像神经元系统、FOXP2 基因与语言功能的
关联)。该章通过对比人类与猿类的交流能力,揭示了语言作为人类独特认知能力的生物
演化基础及其认知规律。
第3 章“人脑与语言的共同进化”围绕语言与大脑协同演化的机制展开:首先明确语
言是人类独有的认知特质,并综述相关理论;其次以灵长类及古人类的演化过程为背景,
探讨脑体比、脑商与智力的关系,以及哺乳动物间大脑尺寸与认知能力的关联;最后分析
人类进化过程中颅容积、身体结构与语言能力的同步演化,阐明语言对文化发展与思维方
式的深远影响。本章从神经解剖、认知能力及文化传播等维度,系统论述了大脑结构演化
如何为语言系统的产生与发展提供生物学基础,以及语言与人脑协同进化的历程。
第2 篇“动物大脑与交流”共包括两章,系统探讨了非灵长类动物与非人类灵长类动
物的交流方式,并对比分析其与人类语言能力的异同。
第4 章“非灵长类动物的交流”首先从动物交流的基本定义与功能入手,指出动物的
视觉、听觉、触觉及种间交流等形式虽具有重要的生存意义,但其符号系统缺乏创造性,
无法像人类语言那样生成无限的新颖表达。在此基础上,重点分析了蜜蜂与鸟类的交流方
式:蜜蜂通过舞蹈传递花源位置信息;鸟类则展现出对鸣唱声音结构的学习与模仿能力,
其幼鸟的歌唱学习过程与人类语言习得具有相似性。此外,通过对比不同鸟类神经元数量
与表达方式的差异,揭示了其在物种识别与信息传播方面的潜能。本章还介绍了陆生哺乳
动物(如狼、非洲象、胡子蝙蝠)与水生哺乳动物(如宽吻海豚、鲸类、海狮)的交流行
为,不仅关注它们在声音、动作等方面的表达形式,还通过对比神经元数量、表达方式种
类及大脑体积,系统揭示了其与人类大脑结构及语言能力之间的显著差异。
第5 章“非人类灵长类动物的交流”探讨了灵长类动物在社会行为与交流方面的表现。
一方面,通过分析黑猩猩、倭黑猩猩在社会认知、合作行为、工具使用及资源分配中的表
Yyzzw1-3.indd 14 2026/4/23 16:52:23
前言
现,说明其具备较高的认知水平,并在圈养环境中可习得手势语等基本交流形式。另一方面,
深入探讨了非人类灵长类动物与人类在语言能力上的根本差异,包括:呼叫行为的局限性、
与人类儿童手势使用的异同、情绪表征与指向性信号的认知差异等。此外,通过对比猿类
布洛卡区同源脑区与人类语言区的结构与功能,强调了两者在脑结构、语言网络及系统发
育与个体发育过程中的本质区别。
第3 篇“人脑语言认知机制”共包含六章,系统探讨了语言感知、加工、产生、习得
及其在不同个体与文化背景中的认知机制。
第6 章围绕“听觉与视觉感知器官的语言认知”展开,从发音、听觉和视觉三个维度
进行分析。首先介绍了发音器官的结构及语音产生模型,说明声道与语言产出的关系,并
阐述语音生成的具体神经机制。随后转向听觉系统,系统讲解了外耳、中耳和内耳的结构
与功能,听觉感知路径与语音输入的信息传播途径,进而探讨语言理解过程中的认知模型
及功能解剖基础。这部分还涉及口语与环境声音的识别、语言相关的因果关系推理能力,
以及脑电图(EEG)和事件相关电位(ERP)在语音感知研究中的应用,特别强调语音加
工在汉语双字复合词阅读中的作用。紧接着,在视觉感知方面,涵盖了视觉皮层及通路、
视觉词形区的功能,重点分析汉字形音处理机制与抽象拼写模式的快速提取过程,展现了
视觉系统在语言认知中的关键角色。
第7 章探讨了“语言回路的加工机制”。首先介绍了弓形束、额斜束、额-枕下束、
钩状束等主要白质纤维通路在语言产生和理解中的作用。例如,弓形束与句法理解密切相
关,额斜束则在言语启动和运动区域整合中发挥作用,腹侧路径(如额 -枕下束、钩状束)
主要参与语义处理和词汇检索。此外,还系统讨论了这些神经通路在个体发育过程中的演
变,比较了成人与儿童在背侧、腹侧语言通路发展方面的差异,并介绍了句法与语义网络
的神经解剖框架。
第8 章集中阐述“语言产生与理解的神经机制”,全面展现语言作为特殊认知系统在
大脑中的处理路径。首先强调语言与生俱来的神经基础,提出“语言获得装置”的概念。
接着讲解了语言网络的组织结构,涵盖左脑与语义处理、句法加工、叙述理解等相关区域
的功能连接,以及默认模式网络在语言中的作用。同时,研究了语言相关脑区的功能连通
性,梳理从词形识别到句法结构再到语义整合的加工流程,并分析了信息自下而上与自上
而下的双向处理机制。在语言实际使用层面,深入解析了语言产生与理解的过程,探讨了
反讽、隐喻等非字面语言的神经加工机制,以及汉字阅读、声调识别的脑区反应,结合陈
述性与程序性记忆系统的参与,揭示了语言理解背后的神经认知基础。
第9 章系统论述了“二语习得的认知理论与神经机制”。首先回顾了二语习得的主要
理论模型,包括监控模型、交互假说与竞争模型,并结合乔姆斯基的“普遍语法”和语言层
次结构,为语言习得过程提供理论依据。紧接着,探讨关键期假说与语言习得年龄的关系,
分析单语与双语者在脑区激活模式、词汇处理路径、社会语言使用方面的差异,指出习得
年龄、语言熟练度、语言间相似性等因素对语言网络激活强度的影响。此外,还深入探讨
了二语习得的神经生理基础,结合ERP 和fMRI 研究成果,揭示多语言者在白质纤维束、
皮层下结构及语法处理区域等方面的神经可塑性,描绘出多语言能力背后的认知神经图谱。
15
Yyzzw1-3.indd 15
2026/4/23 16:52:23
第10 章探讨了“大脑偏侧性和性别、文化的差异”。从大脑结构的左右偏侧性出发,
分析其与用手习惯之间的关联,说明语言功能的侧化特征。随后讨论性别差异,指出虽然
男性大脑平均体积较大,但女性在皮质厚度与白质连接复杂性方面具有优势,且智力水平
在性别间无显著差异。最后,以中西方文化在语言相关的人脑算术加工中的差异为例,说
明文化背景对大脑认知模式的深层影响,反映了文化与神经加工的交互关系。
第11 章专注于“失语症研究”,旨在通过病理案例揭示语言认知的神经基础。首先梳
理失语症研究的历史脉络,接着根据说话流利度、理解力、命名能力与脑部病灶对失语症
进行系统分类,并详细介绍了各类失语类型的临床特征、神经病因及其与认知障碍的关系。
此外,还介绍了常用的诊断工具与神经成像技术,包括皮质电刺激、功能磁共振(fMRI)
与正电子发射断层扫描(PET)在语言功能定位中的具体应用,为建立语言功能的脑图谱
提供了实证支持。
第4 篇“人工智能大语言模型”共包含七章,深入探讨了人工智能与大脑语言处理相
关的核心模型、关键技术及实际应用,重点体现了人工智能与认知神经科学、语言学的交
叉融合。
第12 章介绍了“人工智能基础及神经网络相关知识”。首先回顾了计算机与人工智能
的发展历程,从计算机的诞生到现代人工智能的演进,概述了关键技术与理论基础。接着,
系统讲解了神经元及人工神经网络模型,涵盖生物神经元的工作机制、单神经元模型、前
馈神经网络、误差反传算法、Hopfield 网络、深度学习架构及堆叠自编码网络等。随后,
以视觉为例,探讨了深度学习与神经科学的关联,介绍了视觉系统的神经结构与处理机制。
在认知层面,进一步分析了人类认知结构的多层级划分,以及认知科学与物理科学、信息
科学的关系与区别。最后,探讨了语言学理论对人工智能的影响,特别是乔姆斯基的普遍
语法理论、其他语言理论的发展,以及乔姆斯基与辛顿在语言建模问题上的分歧。
第13 章系统介绍了“大语言模型的结构与分类”。首先对其基本处理机制进行了概
述,特别是基于 Transformer 的神经网络架构。然后依次介绍了多类主流模型:如仅使用
编码器的BERT 与RoBERTa ,采用解码器结构的GPT 系列、LLaMA、BLOOM、OPT、
Baichuan、Qwen、PaLM 和 Galactica 等;编码器 -解码器架构中的 T5/mT5 和 GLM 系列;
以及采用混合专家架构的模型,如混元大模型、GLaM 与DeepSeek LLM 。同时,还详细
讲解了代码生成领域的语言模型,如StarCoder、CodeGen、Codex、phi-1 及DeepSeek-
Coder-V2 。
第14 章聚焦于“LLM 预训练数据集”。在英文语料方面,介绍了如Dolma、S2ORC、
The Pile 、RefinedWeb 及 WanJuan-CC 等具有代表性的数据集;在中文语料方面,展示了
ChineseWebText 、WuDaoCorpora 等覆盖多领域、多模态的高质量语料资源;在多语言方面,
重点讨论了 BigScience ROOTS、Wanjuan 和 The Stack 等集合;此外,还专门介绍了指令微调
所使用的数据集,如 COIG-CQIA 、OpenAssistant Conversations 、Self-Instruct 和 Flan Collection 等。
第15 章深入剖析了“无监督预训练的关键技术与策略”。内容涵盖预训练范式UL2、
计算优化技术、中间填充训练(FIM)、文档去重与多样化方法(如 D4)、基于重要性重采样
的数据选择策略等,同时分析了模型架构的差异和预训练目标对模型零样本能力的影响。在
16
Yyzzw1-3.indd 16
2026/4/23 16:52:23
前言
数据处理方面,讲解了训练数据去重、DoReMi 权重优化方法、重复数据对性能的影响与解释,
提出了SlimPajama-DC 的数据组合策略,以及轻量级统一多项选择模型 UniMC。此外,本章
还探讨了伸缩定律与语言模型的涌现能力,涉及从少样本学习特性、自回归模型缩放规律,
到 DeepSeek 和 Gopher 模型中关于规模与能力之间的权衡分析。
第16 章主要讨论“监督指令微调与模型能力评估”。从基础概念出发,介绍了指令微
调对模型能力提升的效果,包括 WizardLM 的指令进化策略、多任务微调在跨语言泛化中
的表现,以及OPT-IML 框架和SUP-NATINST 方法。在参数高效微调方面,系统说明了
LoRA、QLoRA、前缀调优和提示微调等轻量化方法。在评估层面,重点介绍了P-Tuning
方法及多种 LLM 能力评估机制,涵盖模型理解、生成、泛化等方面的评测体系。
第17 章围绕“人类对齐技术与逻辑推理”展开。首先介绍了基于人类反馈的强化学
习(RLHF)技术及其在安全性保障中的应用,并延伸到 AI 反馈、自监督与价值引导等去
人类依赖机制,以及 WizardMath 在数学推理中的强化训练方法。进一步比较过程监督与
结果监督,强调推理中的思维链提示与逐步验证机制。本章还聚焦常识与复杂逻辑推理策
略,包括简单常识推理技术、DeepSeek-R1 系统,以及基于参数与外部知识的推理方法,
展示了当前大模型在逻辑推理方面的研究进展与挑战。
第18 章聚焦“大模型知识产权保护与安全应用”问题。介绍了当前模型在实际应用
中面临的版权与安全风险,并提出了 ModelShield 等即插即用的知识产权水印方案。随后,
通过实验验证展示了模型提取攻击场景模拟、自适应水印生成机制的设计,以及在不同条
件下水印检测性能评估,为大模型的合法使用与安全保护提供了技术支撑。
上述18 章内容对读者关心的以下问题进行了阐释:
(1)人工智能符号推理与自然语言处理中句法模式识别的局限性。
LLM 采用超大规模语言数据驱动的黑箱方法,使其生成解释能力受到限制。我们从
LLM 具有里程碑意义的相关理论、语言的分解与重构及普遍语法研究、自然语言处理早
期句法模式识别与统计模式识别的并行发展等角度,分析了现有句法与语义知识的局限
性;并结合 DNA 和 RNA 的运作机制,阐释了以乔姆斯基(Noam Chomsky)与辛顿(Geoffrey
Hinton)为代表的语言理论之争。在人类进化历程中,语言的出现是一次划时代跃迁:它
不仅彻底改变了信息传递方式,更将文化演化从缓慢的基因复制节奏中“解放”出来,推
向非基因驱动的高速轨道。作为全新的信息生成与传播系统,语言打破了生物数十亿年来
依赖 DNA/RNA 编码传递信息的单一路径,实现了意义的即时生成与跨个体复制。这一“文
化编码系统”可与分子生物学中的“基因表达机制”类比,为理解语言本质提供了新视角,
尤其有助于解析当代语言学中两大流派的分歧。
(2)LLM 的理论基础。
Solomonoff 最著名的贡献是通用归纳推理(Universal Inductive Inference )理论,这是
一种通过贝叶斯概率与算法复杂性处理归纳问题的框架,其算法概率理论与归纳推理框架
为LLM 的理论基础提供了重要支撑。Transformer 框架通过整合多源上下文信息提升了句
法分析性能,最终实现对句子情境意义的理解。LLM 通过Transformer 框架实现对文本的
理解,并能生成连贯、逻辑一致且富有创造性的内容。所有 LLM 均基于Transformer 框架,
17
Yyzzw1-3.indd 17
2026/4/23 16:52:23
并对不同语种的语料进行统计预训练。
(3)LLM 的运作机制。
从知识图谱与深度学习框架的提出,到多层级理论的脑科学验证及深度神经网络算法
的实现,再到深度学习时代LLM 的诞生,本书通过对比LLM 与人脑的训练及工作方式、
语言理解与生成特性,深入剖析了LLM 的运作机制。具体而言,从硬件、数据规模、数
据处理方式、目标、语言学习维度、网络结构复杂度、速度、学习方式、理解能力及文本
生成等方面,对比了二者的训练与工作模式;从语言学习模式、上下文理解、语言理解深度、
创造性及语境识别等方面,对比了二者的语言处理能力,从而揭示了LLM 与人脑的各自
特点、优缺点及内在运行机制。
(4)不同语种的信息熵。
随着LLM 与机器翻译的快速发展,我们得以计算不同语种的信息熵:拼音文字是一
维线性结构,单个字母无独立意义,需组合成串才产生意义(如英语是一维字母串文字,
属于音义结合的形音文字);而汉字是二维方块文字,每个字集形、音、义于一体,偏旁
部首均承载信息,因此信息量大于拼音文字。第 2 版教材对此进行了详细例证,结论如下:
一个汉语词的信息熵
>
一个英文单词的信息熵
>
一个汉字的信息熵。
(5)LLM 与人脑运作机制的比较。
人类与LLM 均通过学习大量语言中的统计规律构建对世界的深层理解,这一过程涉
及特征间的复杂交互,不仅包括语法与词汇的统计匹配,还涵盖对语境、情感及语义的深
度处理。具体差异体如下:
人脑突触数量约为目前最大LLM 参数的 100~1000 倍,说明人脑具有处理复杂任务的
巨大潜力;从信息处理角度看,人脑的学习与适应能力远超当前人工智能系统。
LLM 的训练数据量通常为模型参数量的10~200 倍,模型通过反复学习词元间的关联
模式,将信息压缩到参数中;并借助大规模预训练与参数共享实现知识的压缩编码,确保
在不同任务与上下文中具备良好的泛化能力。
LLM 通过数万亿词元的训练,提取文本中潜在的语义关系、逻辑推理及常识性知识,
借助权重矩阵存储句子与概念的复杂联系,将数据中有用的模式与知识内化,实现压缩后
知识的泛化;其通过 Transformer 框架处理大量输入,将相关上下文信息压缩并整合至激
活态权重中,从而以较少计算资源生成符合上下文的内容。此外,LLM 的训练语料量是
人类阅读量的 1000~10000 倍。
(6)LLM 改变了人类获取知识的方式。
人类学习与语言、知识传承的关系:人类智慧的结晶可通过语言描述与记载,使知识、
经验与财富得以积累,后人能高效掌握先辈智慧—
—
仅需几年或十几年,便可习得人类数
千年文明积累的知识,推动社会走向繁荣发达。人类通过基因代代相传,但基因无法遗传
知识;自然选择塑造的遗传基因仅赋予婴儿适应社会的脑结构硬件,而人脑具有极高可塑
性,可通过外界刺激与经验不断发展。它虽未预设特定知识,却拥有强大的学习机制:依托
基因编码的学习潜力与外界互动,在普遍语法规则下习得任何语言,并以所学语言进行思考
与未来规划。人类通过教育、阅读、实践等传统方式学习知识,不仅积累信息,更培养思维
18
Yyzzw1-3.indd 18
2026/4/23 16:52:23
前言
能力、解决问题的能力及社会互动能力;知识的掌握不仅是信息积累,更关键的是理解、批
判性思维、创造力及情感与社会技能的培养—
—
这些均无法被基因遗传或LLM 替代。
LLM 的知识获取特点:LLM 能在短时间内习得全人类知识,而人类系统性专业学习的
时间至少比LLM 训练时间大1~2 个数量级;受寿命限制,人类无法精通全人类所有知识,
而LLM 虽能突破这一局限,却因参数规模庞大,存在资源占用量大、使用成本高的问题。
受类脑计算启发的 LLM 知识蒸馏(knowledge distillation)技术,可将上游复杂大型教师模型
(全人类知识模型)的知识压缩转移至下游更小、更轻量的学生模型(类似人类专业领域知
识模型),使教师模型的复杂知识被提炼为更简洁易懂的形式,提升学生模型的运行效率。
与之相比,人类教育体系通过在大学不同院系的专业中设置各学科知识,实现知识、技能与
经验的有效传授。
(7)整合大脑、语言与 LLM 研究以揭示其黑箱机制
人脑与语言共同进化,只有人类拥有语言,人脑是语言的物质基础,而LLM 又是基
于类脑计算的 AI 模型,因此唯有整合三者研究,才能揭示其黑箱机制。
近200 年的研究表明,人脑由大脑与小脑构成,含约1000 亿个神经元;大脑包括额
叶、顶叶、颞叶、枕叶4 个脑区,由52 个布罗德曼区(Brodmann area )及十多条白质纤
维束组成。语言脑区主要分布在左脑外侧裂周边,其功能主要通过以下方式确定:临床研
究(观察大脑受损患者的功能变化推断脑区功能,或结合患者生前症状与死后大脑损伤部
位分析)、电生理学方法(如 EEG 测量电信号、MEG 测量磁场变化以检测脑区活动)、神
经影像学方法(如通过fMRI 检测血氧水平变化以确定脑区与功能的关联,或结合CT 检
查结果与临床症状分析脑区功能特征)、解剖学方法(如通过染色观察神经元、追踪神经
纤维了解脑区神经通路)。脑科学研究成果中包含40 多位诺贝尔奖得主的贡献,这些研究
推动了神经科学的发展,为理解大脑处理信息、控制行为提供了科学依据,也为现代人工
神经网络设计提供了理论支持—
—
例如,LLM 的设计与研发便从中获得启发:模仿神经
元通信模式,借鉴其传导方式,以“连接权重”模拟神经递质对信息流动强度的调控;受
左、右半脑在认知任务上的分工启发,构建 LLM 的不同任务能力模块;采用类脑分层结构,
逐层提取并抽象语言特征,并借助注意力机制与位置细胞实现信息定位,进而达成对上下
文相关语言信息的理解与生成。此外,语言学家在语言结构、意义、功能及习得等方面的
研究,也为LLM 提供了重要理论依据,诸多语言学概念、理论与模型直接或间接影响了
LLM 的设计与发展。
人脑的处理效率与复杂性是数百万年演化的结果,其复杂程度远超当前 AI 模型;尽
管 LLM 能生成极自然的语言,但其内部工作原理仍是“黑箱”。将大脑认知机制与模型行
为对比,借鉴大脑处理语言的机制,有助于更好地理解语言背后的认知过程及LLM 的决
策与生成过程,揭示 LLM 的隐性规律,为设计更透明、可解释的 AI 模型提供灵感。LLM
和人脑的运行机制均类似黑箱:LLM 因复杂的数学结构与海量参数,成为乔姆斯基所指
的“外化语言数据驱动的工程与算法黑箱”,虽难以直接理解,但可通过开源代码与附加
解释模型逐步提升可理解性;人脑则是经亿万年演化形成的高度复杂生物系统,是“生物
与认知多层次结合的意识黑箱”,目前仅能通过 fMRI、EEG 等设备揭示其宏观趋势,难以
19
Yyzzw1-3.indd 19
2026/4/23 16:52:23
解码细致思维内容(即乔姆斯基所说的“语言内化内容”)。随着科技与 AI 技术的飞速发展,
黑箱问题的研究有望取得突破性进展。
LLM 的兴起正从根本上重塑语言研究领域。整合脑科学、语言学与 LLM 研究有助于
实现理论突破:神经科学发现可启发 AI 模型创新,而 AI 的算力能加速对大脑认知过程的
模拟与研究;深度神经网络模型受神经元连接启发,LLM 则借助海量数据与算力逐步接近
人类语言处理方式。通过类脑计算,我们不仅模仿了生物大脑的部分信息处理机制,更通
过大量数据与算力提升了语言模型的性能。尽管LLM 的实现主要依赖机器学习与统计方
法,但脑科学研究成果与语言学理论在帮助我们理解并设计更优、更灵活的模型方面,仍
发挥着至关重要的作用。
第2 版教材将100 多年来在脑科学、认知科学领域作出杰出贡献的40 多位诺贝尔奖
得主,在人工智能和 LLM 领域有重要推动作用的 11 位图灵奖得主,以及 9 位国际语言学
泰斗的研究成果,穿插于相关章节中。著名语言学家王士元教授为本书第2 版作序,蔡曙
山教授和杨英锐教授为本书第1 版作序,在此对三位学术前辈深表谢意。《宇航学报》副
主编兼《自动化学报》副主编倪茂林教授对全书第1 版进行了认真审校,提出了诸多宝贵
意见和建议,在此亦深表谢意。
第1 章(大部分内容)、第7 章、第8 章和第11 章的部分内容由久保田千顺执笔;
第2 章、第3 章和第5 章中有关生物医学的内容由王琳执笔,栾亚萁参与了第2 章和
第3 章部分内容的编写;第4.1.6 小节和第6.2.6 小节由黄云龙、宛小昴执笔;第6.2.7 小节
由王玉玲执笔;第6.3.4 小节由张骁晨执笔;第8.4.4 小节由王玉玲、杨思琴、杜丹、许心
仪和张景婷执笔;第9.2.3 小节由杨思琴执笔;第12.2.5 小节和第14 章由江振甫执笔;第
12.3 节由邹佳君执笔;第13 章由江铭虎和姚登峰执笔;第16.3.2 小节和第17.4 节由齐致
潇执笔,他还对第13 章和第15 章初稿进行了统稿;第18 章由庞凯怡执笔,她对第16 章
初稿、第4 篇和附录的第三稿也进行了统稿;其余内容均由江铭虎主笔,江铭虎负责全书
第二稿和第三稿的统稿工作。
书中的图大多在脑与语言认知和自然语言处理课程的PPT 讲义基础上重新绘
制,部分图参考维基百科英文版重新绘制,前3 篇的部分图和第4 篇的大部分图改绘自参
考文献,所有图表的详细出处见附录,以满足教材出版需求。因难以联系到原文作者,我
们将按照中国内地的稿费标准支付相应稿酬。第4 篇“人工智能大语言模型”部分,因涉
及各类大模型、数据集、评估基准及相关算法新名词(数量达数百项),而这些新名词的
解释对理解本书至关重要,该部分内容参见书后附录。
由于时间紧迫、水平有限,且编写教材工作量大,书中难免存在不准确之处,恳请读者
朋友谅解并批评指正。本书的出版得到了国家自然科学基金重点项目(62036001)、国家
社会科学基金重大项目(23&ZD238)、清华大学研究生教育教学改革项目(069-202201J030)
和本科生教育教学改革项目(069-148)的共同资助,在此深表谢意!
江铭虎
2025 年10 月于北京清华园
