前言
国外最新研究进展表明:脑与语言认知是一门新兴的多门类交叉学科,是一门涉及脑神经科学、脑成像科学、分子生物学、认知心理学、语言学、文字学、声学语音学、数理统计学以及人类进化史等多学科的交叉学科。使用语言是人类区别于其他动物的最重要特征。语言学的很多规律与生物学的规律相似,大约2300万年前,类人猿与其他灵长类动物分离,而人类和黑猩猩大约在500万年前产生了分歧 Pika Simone. 2008. Gestures of apes and prelinguistic human children: similar or different? First Language, 28(2): 116~140.。在近300万年中,人类大脑从300g增加到目前的1200~1400g Schoenemann P Thomas, Budinger Thomas F, Sarich Vincent M, Wang William SY. 2000. Brain size does not predict general cognitive ability within families. Proceedings of the National Academy of Science (PNAS) USA, 97: 4932~4937.,它的体积和复杂性在人类进化的过程中不断增加,使得一些旧有的功能得以改进,一些新的功能,如工具的创造和语言的产生得以实现。其中语言和工具的使用和发展起了决定性的作用,口语是大约50万年前现代人出现的标志,使大脑皮质面积开始增加,脑皮质的表面是一种皱巴折叠的构造,这样在头骨范围内有更多的表面区域 William SY. Wang, The Emergence of Language: Development and Evolution, W. H. Freeman and Company, 1991.(语言涌现:发展与演化,林幼菁译,中央研究院语言学研究所,中国台湾,2008)。人脑中操作口语的功能和音义结合的符号系统经过几十万年的进化 VarghaKhadem Faraneh, Gadian David G., Copp Andrew, and Mishkin Mortimer. 2005. FOXP2 and the neuroanatomy of speech and language. Nature Reviews Neuroscience, 6: 131~138.,神经系统自然而然地连接为一个整体,可以说语言与人脑是共同进化的,也是世界上最复杂的两样东西。语言是人类沟通交流的一种方式,具有系统性和社会性,是人类行为的重要部分。人类智慧的结晶可用语言描述和记载,使我们只用几年或十几年的时间就可掌握人类几千年的文明智慧所积累的知识,使我们的经验和财富得以积累。大脑容量的增加扩大了人类行为和认知的能力,决定了人类在物种竞争中的胜出,逐步成为世界的主宰者。
目前我们可以利用功能磁共振成像(fMRI)对脑部进行扫描,侦测出大脑磁场中产生的无线电频信号,以呈现血量、血流速以及氧消耗量等大脑神经活动的非直接结果,并画出大脑解剖图以指示大脑活动的变化。脑被分成左右两个(大致对称的)半球,两个半球通过胼胝体(corpus callosum)连接,脑的结构与语言相关,左脑负责数学、逻辑、语言和语义处理,而右脑负责音乐艺术、直觉、视觉形象、形状、方向识别、空间注意力、感情处理 M. F. Bear, B. W. Connors, M. A. Paradiso, Neuroscience: Exploring the Brain, 2nd ed., 2001, Lippincott Williams & Wilkins.。人脑具有偏侧性,主要表现在一个半球侧反于另一边,就语言而言,大多数右利手者占优势的半球是左半球。我们可以利用失语症作为大脑语言研究的窗口,利用神经成像技术来观察脑功能。研究表明 Sun Tao, Walsh Christopher A. 2006. Molecular approaches to brain asymmetry and handedness. Nature Reviews Neuroscience, 7: 655~662.,人脑有两个主要的语言区域:Broca区(负责语音产生)和Wernicke区(负责语音感知和理解),Broca和Wernicke区域又是相互连接。如果你损伤了Broca区,那么语音产生受到严重损伤,但具有良好的语言理解。如果你损伤了Wernicke区,那么患者具有非常差的语音理解,但有良好的语音产生能力。因此,没有Broca区域,就不能产生语音;没有Wernicke区域,就不能理解语音。人脑的外层称为大脑皮质(cerebral cortex),负责认知功能,这意味着即使是相当浅薄的脑外皮损伤也能够导致严重的认知功能损害。语言和人脑是紧密相连的,也是最复杂、最难研究的课题之一。脑生理结构和现代认知心理学的研究表明:语言信号中的不同词汇与大脑相应处理区域相对应,信号空间中具有相似特征的信号被反映到脑皮质相近区域时,大致保留了信号空间中的概率分布特征和拓扑结构特征,即大脑有自动归类的功能。近十年,细胞分子水平的脑机制研究成果已经可以预计未来的进展将更多地促进和影响自然语言处理的研究。
Newport等人认为人类语言服从形式分析 Nowak Martin A., Komarova Natalia L., and Niyogi Partha. Computational and evolutionary aspects of language. Nature, 417: 611~617.:所有的语言(书面语或口语)都是由小的元素分层递归地组合建构成较大的单元,可以依次用来组成音节、词语、短语和句子,再由此组成段落和篇章。组合规则不是任意的,每种语言都有具体的规则。其核心部分是音和义相互作用的语法规则系统(称为句法),语法规则系统使人类可以产生并理解无限数量的句子,但人类语言的句型是有限的,其规律是可以总结的。从1946年第一台计算机的诞生到今天的网络信息化时代,短短的60多年时间,计算机使人们的生活和工作发生了翻天覆地的变化。目前用计算机自动完成机器翻译、自动文摘、自动校对、人机语音交互和自动问答系统等自然语言处理虽已有了长足的进展,但用计算机实现对人类自然语言的处理还有很长的路要走。目前人脑的基本处理单元(神经元)的数量是计算机的基本处理单元(门电路)的上万倍,人脑的记忆容量是计算机的成千上万倍,目前可以用一万台电脑连成复杂的网络,可模拟老鼠的大脑,要用电脑模拟人脑的全部功能还有许多挑战性的工作要做,相信再过几十年或几百年也可能实现这一美好愿望。
2004年秋,国际著名语言学大师王士元教授来北京清华大学讲学,王先生以达尔文的物种起源、人类迁徙与进化、语言的演化与发展为主线19,从不同的角度讲述了人脑与语言的密切关系,阐明了语言与脑是共同进化的主题思想。王士元先生渊博的知识、宽广的视野、敏捷的思维、独特的视角、新颖的研究方式、友善宽厚的待人和严谨的治学态度,给我们留下了深刻的印象和宝贵的知识财富。《脑与语言认知》一书是受王士元先生来清华大学讲学的启发而作的,王士元教授是当今欧美及中国两岸三地(中国大陆、中国台湾和中国香港和澳门特别行政区)公认的、最有影响的华裔语言学家,王士元教授把我们引入到脑与语言认知这一新的研究领域。从2005年至今,我们系统收集整理了近年来欧美顶级国际学术期刊Nature,Nature Neuroscience,Nature Reviews Neuroscience,Science,First Language,Brain and Language,NeuroImage,Neuropsycholoola,Brain and Cognition,Proceedings of the National Academy of Science (PNAS) USA,J Psycholinguist Res,Psychophysiology,Cerebral Cortex,Journal of Speech,Language,and Hearing Research,Journal of Cognitive Neuroscience,Brain Research,Cognitive Brain Research,Human Brain Mapping,Biological Psychology,Neuroscience Letters,Neuropsychologia,Neuron, Psychological Science,Neuroscience,Journal of Memory and Language,Neuroscience Research,Journal of Neuroscience中数十篇有关脑与语言认知方面论文的内容,很多内容在清华大学2005、2006、2007和2008级本科生和研究生课程中进行了讲授,得到了很好的反响,深受学生的好评和欢迎。本书根据清华大学本科生和研究生的强烈愿望,希望将这些内容结合我们多年来的教学和科研工作进行编辑出版。2009年秋,王士元先生来北京大学讲学,讲授有关脑、语言与认知的内容,课间我跟王士元先生提起清华大学准备编译出版一部《脑与语言认知》的教材,想邀请王先生为本书作序,他欣然答应,并给我们以鼓励和支持,在此对王士元教授深表谢意。书中的大多内容经选修该课程的同学进行了初译,这些同学是潘依婷、李晓薇、徐欢、舒心、曲媛、贾忠贤、魏小芸、张雪原、刘喆、陈燕芬、王瑞朋、武瑞星、王国栋、罗茜、江然婷、索多、刘劼玮、朱逸文、谭沙丽、吴允京、宋文凤、牛萌、葛正琪、张俊川、申银凤、陈乐、魏小芸、吴鹏羽、翦燕妮、隋礼娜、刘江洋、杨益、王楠、孙羽津、曹项、孙小芬、包丽莉、胡亦佳、赵岗、彭仲意、刘琪、刘佳慧、陈守朝、邓琦、戴利、林博、王晔、于子添、邢蓉、赵九华、朱君、张迪、宋宸、张铭丰、周景萍、付苏、苏子宁、刘畅、许多多、施唯、刘佳、狄韵、王会楠、古丽娜、闫会明、张路遥、黎彦彤、王烁、徐可可、张琰、钟融冰、林嘉仪、黄丁如、朱瑞婷、喻梦瑶以及北京邮电大学电子工程学院生物医学工程专业的研究生孙玲君等。我们选择了其中数十篇论文的主要内容,将这些内容编译成中文教材《脑与语言认知》,初译的内容正确率平均只有70%,之后由硕士生王曼对上述同学初译的文稿内容进行了汇总整理,将书内所有图的英文翻译成中文,并编写了作者索引、词汇表和主题索引,王曼对本书约30%的章节进行了逐句校对。博士生刘丁对本书约20%的章节进行了逐句校对。其余章节由江铭虎进行逐句校对,书中的疑难句翻译由生物医学专业的德国博士王琳教授校对确认,最后由江铭虎对本书的全部内容进行了逐句审校。清华大学出版社医学与生物编辑室的编辑罗健老师为本书的出版做了大量的工作,在此表示感谢。这部教材的出版可以为从事该领域的研究人员节约大量的收集英文资料和阅读资料的宝贵时间,可以在较短的时间内系统全面地了解该领域,同时节省了大量的前期研究成本,熟悉了目前脑与语言认知的研究进展,并尽快了解哪些问题有待解决和探索。2005年我以德国海德堡大学客座教授的名义与王琳博士在该校医学院交叉学科计算中心对分子计算进行了探索性的研究,并在International Journal of Neural Systems上发表了我们的第一篇有关分子计算的论文,之后Cellular and Molecular Neurobiology等刊物上陆续发表了我们对脑分子计算的有关论文,我们将来会用更多的时间和精力投入到脑科学的研究之中去促进语言学的发展,相信将来会有更多的研究结果奉献给读者朋友。
人脑与人类语言是世界上最复杂的两样东西,而本书的目的就是探讨脑与语言的认知关系,找出其内部运作规律。本书知识新颖,内容丰富,代表着本学科的国际前沿。目的是探索语言在人脑中的表征和操作方式,探索它们的构建原理和计算理论。弄清脑认知原理可以改善我们对自然语言理解和处理的认识,促进语言学、认知科学、人工智能等学科的发展,它的理论模型对引导认知科学和自然语言理解意义重大。本书还将为我们实验方法的有效性解释提供建议,使我们能够用计算机理解语言并创建新方法。由于该书属交叉学科,涉及的领域多,知识范围广,很多原文的作者具有不同的文化背景,这些作者的母语并非英语;再加上时间紧,水平有限,翻译和校对的工作量大,有些领域的知识并非自己所熟悉的本专业知识,书中的专有名词翻译难免有不准确之处,恳请读者朋友见谅、理解并批评指正,欢迎来信,我的Email地址:jiangmh@tsinghuaeducn,我将虚心向读者朋友学习,并汇总于该书的再版之中,在此深表谢意。
《脑与语言认知》是著名学者蔡曙山教授主编的《清华大学认知科学译丛》之一,本书的出版得到了教育部哲学社会科学重大基金(07JZD0005)和清华大学自主科研项目(2009THZ05、2011THZ0 和 2011THZ01)的资助,该项目的负责人——清华大学文科建设处首任处长、教育部认知科学创新基地主任蔡曙山教授给予了大力支持,多年来蔡曙山教授为清华大学认知科学的研究呕心沥血,在组织研究团队、争取研究经费、开展学术交流和学术研究等方面作出了重要贡献。每当我们遇到困难时,蔡教授总是给予我们尽可能的无私帮助和支持,在此深表谢意。在编译本书的过程中同时得到了国家自然科学基金(61171114),清华大学人文社科振兴基金(2010WKHQ009)和中国科学院模式识别国家重点实验室开放基金资助,在此一并表示谢意。
江铭虎江铭虎,男,1962年生,现任北京清华大学计算语言学教授、博士生导师,电子工程学博士,曾在清华大学计算机系智能技术与系统国家重点实验室和比利时鲁汶大学电机工程系做博士后研究,2005年在德国海德堡大学医学院交叉学科计算中心任客座教授,现为清华大学计算语言学博士点学科带头人和清华大学心理学与认知科学中心兼职教授。主持国家自然科学基金、清华大学“985”基础研究基金、清华大学自主科研计划和“985”认知科学基地项目、教育部留学回国基金、教育部优秀青年教师资助计划等项目20多项,是国家自然科学基金、国家社科基金和霍英东青年科学基金的评审专家,先后担任十余次IEEE国际会议的分会主席。1998年获海峡两岸交大四校优秀博士论文奖(导师袁保宗教授),2000年获全国优秀博士后论文奖,2004年获清华大学学术新人奖,2010年获 IEEE Award in recognition of the contributions to ICSP。在重要国际学术会议和国际学术刊物上发表论文百余篇,他引数百篇次,其中在国际主流学术刊物以正文(regular paper,original paper,or research paper)发表SCI 和SSCI 论文30多篇,发表国家一级学报论文近20篇,发表EI 检索论文近60篇,发表ISTP 检索论文60多篇,在德国 Springer 出版社出版英文专著一部。为清华大学本科生和研究生主讲脑与语言认知、神经网络及应用、自然语言处理和实验语音学等课程,出版教材两部。研究兴趣包括模式识别与人工智能、语言计算和生物计算。
2012年11月于北京清华园