第1章 灵长类动物的语言认知及语言进化 1.1儿童和黑猩猩的早期手语 Early signs of language in child and chimpanzee Gardner R A,Gardner B T 一般来说,婴儿出生后即成长于母语环境中,因此多数语言习得理论认为,早期的母语环境是至关重要的,然而此观点最有力的证据却是间接的。孤儿院的儿童在其成长初期长期受贫乏不利的语言环境的负面影响。通过对父母失聪的失聪儿童和父母听力正常的失聪儿童进行说、读、写的英语能力测试比较后,发现手势语也能证实早期的母语环境对于语言习得是有利的。此外,借助最近开发的技术记录新生儿的行为结果发现,出生后1个月内的人类婴儿对成年人的语音特征是有反应的,比如可以在音素之间进行分割和辨别。早期生长于语言环境的有利影响也很有可能在试图教导动物语言中得到证实。 Washoe研究计划首次尝试教导黑猩猩手语。Washoe在大约11个月大时开始学习美式手语(Ameslan),在51个月中,它学会了132种美式手语手势,并以此作为手语发展研究中可靠使用的依据。如同人类经常使用词汇交流,Washoe使用手语确定指示物的类别而非特定的物体或事件,并使用组合手势。 Brown等人和其他儿童语言研究者对类似于儿童口语习得过程的Washoe的手语习得进行了相当多的评论,涉及Washoe对手势含义的总结归纳、手势组合长度的逐渐增加,以及早期手势组合中各种语义关系的表达等方面。因此,Washoe计划证实美式手语对于黑猩猩来说是个可行的沟通媒介。在被赋予一个合适的媒介之后,实现双向的深层次交流就指日可待了。 自此,若干实验室的黑猩猩习得了一些手语的词汇,研究人员提出了有关个体差异、限制和不同手语教学方法效果的问题。在目前教导黑猩猩手语的计划中,Gardner等人充分借鉴了Washoe研究中的经验,改进了研究进程中的关键点,并且计划维持这些更有利的条件直到受试者达到智力成熟阶段。这样,Gardner等人能更精确地描述黑猩猩在经由人类语言形式的教导后所能实现的最高层次的双向交流。在此过程中,一个显著的改进是若干熟练的手语使用者(即聋人和父母失聪的人)是本计划中的受试者。这些将美式手语作为“母语”的受试者相比于Washoe计划提供了更加丰富的语言模型。另一改进是让受试者在出生后的1天或2天内即开始成长于美式手语的环境中。图11为4个月大的黑猩猩Pili的手势语图解。 Fouts指出,一个叫Salome的女婴在其4个月大时使用了表达食物意义的手势。而黑猩猩使用其第一个手势的年龄似乎早于人类使用第一个词语的年龄,但是与人类出现第一个手势的年龄相比差异并不大。有来自父母的报道,受手语训练的儿童其第一个手势语常出现在5~6个月大时。手势有可能比说话来得简单,也许对父母来说,辨别婴儿模糊的手势比辨别其模糊的口语更简单。 图114个月大的黑猩猩Pili的美式手语。当工作人员拿出它的水瓶时,它做出了美式手语中“drink(喝)”的手势(左图);当工作人员挠了挠它后,它做出了“more(更多些)”的手语(右图)。当做出手势表明更多(more)时,Pili手的位置和手势朝向人的方向相比于之前的反馈过程是不同的(中图)。 Gardner等人认为,在当前计划中,早期手势的出现很有力地确认了主要程序上的两点进步:受试者接受熟练的美式手语使用者的教导和出生后即生长于适当的语言环境中。当然,每位受试者所掌握的早期词汇量本身并不重要,重要的是在更有利于学习手语的条件下有望实现更进一步的发展。 12语言、命名和概念 Language,name,and concept Bronowski J,Bellugi Ursula 语言是将人类经验的模式分析表达为概念单元并将这些概念单元用一定的规则连接起来。 在先前试图测试灵长类动物的语言潜力的研究中,教导年轻黑猩猩使用美式手语的实验是一项重大的突破。这项实验首次将灵长类动物使用某些人类语言的能力和产生人类语音的能力明确地区分开来。这项前沿的研究是在特殊条件下进行的,因此并不认为具有完全的普遍性(就像任何单一研究一样)。尽管如此,它确实能够为及时地重新审视动物使用或能够学习使用人类语言和手势情绪信号之间的关系提供了一个新的有力证明。 黑猩猩和孩子(chimpanzee and child) 自亚里士多德(Aristotle)时代起,人们就坚信语言是人类特有的才能,其他动物要么不完全具备掌握语言所需要的能力,要么其能力只处于相当原始的水平。其中最基本的能力是生成和解释复杂调制的语声连续声谱(continuum)。Lieberman等人强调,黑猩猩与人类发音器官不同。因此,Gardners设法巧妙地避过黑猩猩发音器官问题,教导它们替代的手语是一个好方法。 他们推论手的使用是黑猩猩行为中的显著特征,无论是野生的还是人类饲养的黑猩猩,都有丰富的手势语言。相反,教导黑猩猩Viki说话被证明是徒劳的,口语并不适合这一物种。黑猩猩Viki在6年的集中训练中只学会发出4个非常类似英语单词的音。而当Washoe大约4岁时,它已经学会了做出80种以上可靠的不同手势。 用黑猩猩的手语命名:在自然环境中对黑猩猩的研究指出,它们自己的交流系统主要用于表达个体的动机和情绪状态。对于人类语言的理解取决于导致命名系统的演变因素的理解。使用命名的能力使得人类能够借助于其有关的上下文语境表达他自己的动机状态并与外界交流信息。命名物体是指涉周围环境的最简单形式,这是人类所具有的独特的能力。 语言特征(a characterization of language) 透彻的调查不需要追溯到人类语言的结构,而是需要探讨表征它的全局特征是什么,以及不同于通过其内在状态或其环境唤起动物的明显和直接的信息。与动物不同的是,人类的说话方式更加自由或与引起他们的外在刺激关系甚微,这也是人类行为的普遍特征。另一个特征是人类的逻辑语言,依赖于将外界事物分析成块,在不同的句子中形成不同的组合。相反,动物使用完整的表达方式,并不会分离并重新组合来形成新的信息。在探索人类形成其说话方式与人类大脑一般的运作方式的关联时,行为和逻辑成分都扮演着不可或缺的角色。 从语言的演变特征中,可见灵长类动物具备一些人脑必须的能力的基本形式,例如延迟响应。这对于发生作用的分离、参照的延长甚至语言的内在化而言可能是很小程度的情况。在这些方面,我们也许可以在Washoe使用的手语中发现与儿童早期的语言阶段具有某些相似的例子。不过人类祖先使用的语言是完全超越黑猩猩的。 语境的脱离(disengagement from context) Bronowski等人从两方面比较了Washoe和人类儿童:其一是关于行为步骤1~4,此时Washoe和儿童的早期语言表现类似,尽管几个月后黑猩猩开始明显落后;其二是关于逻辑步骤5,即语言重建,这部分被认为是人类独有的能力。 儿童的语句(the childs sentences) 人类语言5个特征的最后一个——语言重建,面对的处理步骤与前4项不同。儿童在听句子时分析其暗含的全部意思(儿童经历其意思的真实环境)作为儿童自己造句的条件。因而,首先我们将已知的原始符号或名称以一种有意义的方式把自己限制于儿童构建的句子中。事实上,接下来将探讨儿童(一般而言是人脑)是如何从其语境中提取符号或名称,并通过认知句子的内在分析来形成概念的。通过研究、比较能够弄清黑猩猩表达方式的限制和儿童学习第一语言的能力和步骤。 (1)3岁的儿童已经可以形成句子概念的证据之一,即对句子语法关系的理解(例如句子的主语、谓语和动词、宾语)。儿童不仅能清楚地了解这些含意,而且能很好地将其应用于自身的语言中。 (2)3岁左右的儿童似乎能成熟地用多种基本句型表达意思。他们不仅会提出要求和命令,还会否定提议和提出无数的问题。儿童在早期的语言发展阶段,似乎就已具有原始的发问和否定的能力。同时,为了表达更复杂的意义,表达这些含意的语法规则也在同步发展。 (3)3岁的儿童能分门别类地组织自己的词汇,在某些方面类似于成人语言范畴。这些词汇依据语法规则(包括句子各部分的层级关系)组成句子,而不是无序地命名。 语言和概念(language and concept) 有人提议人类习惯于将外界事物分离并命名,这以依赖于更加基本的行为为前提,即将外界事物分解为截然不同的部分并视为独立的个体进行处理。在认知语句的结构中,暗含着将外部世界看作可分离的观点,保持其自身的本质,从而在人脑中可以被单独地处理、组合,因此动作和属性都可以具体化成词汇。从哲学意义上讲,论断不只是将句法模式中的词汇放在一起,也不是处理脑中现成的物体和类目。相反,论断首先将外在事物分解成各个分离的部分,之后才将这些部分重新组合并造新句。当我们观察一个儿童以他自身的观点学习说话时,我们就可以从他归纳语言的用法规则中知道其心智活动,包括构建语法和实体结构的哲学。儿童没有“概括”语言的演变,当然,取而代之的是他在总体上论证了语言发展和人类能力演变的逻辑。Washoe 的例子在深层次上说明了整体重构的过程中人脑进化的特点,而且即使被给予现成的词汇,目前也并无证据证明非人类灵长类动物具备这种能力。 13短尾猴非初级听觉皮质对复杂声音的处理 Processing of complex sounds in the macaque nonprimary auditory cortex Rauschecker Josef P,Tian Biao,Hauser Marc 被麻醉的猕猴的颞上回(superior temporal gyrus,STG)神经元遭受复杂的声音刺激。由具有明确中心频率的带通噪声(bandpassed noise,BPN)脉冲所引起的响应要比由纯粹音调引起的响应激烈得多。这项研究在非初级听觉皮质侧向带中发现了至少一个全新的与听觉通路和脑听觉区(new cochleotopic area)有关的区域。神经元最佳的中心频率沿着大脑前侧的末端轴(rostrocaudal axis)变化,噪声脉冲的最佳频带宽度则沿着中侧轴变化(mediolateral axis)。当猴子的数字化录音呼叫(digitized monkey calls)被用作刺激时,许多神经元会优先选择其中的一些呼叫。对这些呼叫频率构造的处理以及分离成分的回放(playback)显示出光谱整合的不同类型。猴子听觉皮质的侧向区域(lateral areas)似乎是一个分层序列的一部分,在这个序列中,神经元倾向选择更为复杂的刺激,并且这可能是交流声音预处理形成过程中一个重要的阶段。 1973年,Merzenich和Brugge描述了短尾猴颞上平面(supratemporal plane,STP)的一些听觉区域,这些区域包围着主要的听觉皮质AI(1)。其中一个被他们标记为L的区域沿AI横向伸展,一直伸展到颞上回暴露的侧面(exposed lateral surface)。从解剖学角度来看,这些区域基于细胞(cyto)、骨髓(myelo)和化学构造(chemoarchitecture)。术语“带”(belt)被特别用来标识横向联结粒状皮质主要区域(koniocortical primary area)的皮质区域。由于猴子的非初级听觉皮质区域的神经元对通常的纯粹音调(puretone,PT)刺激的反应很微弱也很不稳定,因此对这些神经元的功能特性知之甚少。 类似地,非初级(nonprimary)视觉皮质中的神经元对小的静止的点光源也不能很好地反应。因为纹状皮质外(extrastriate)神经元整合的视觉信息从空间上来看涵盖更大的区域,因此它们比纹状皮质(striate cortex)中的神经元拥有更大的接收区域,也倾向于接收更复杂的刺激。基于同样的理由,在听觉处理通道中处于更高位置的听觉神经元可能会在更大的频率范围中整合信息。因此Josef PRauschecker等人选用了一系列的听觉刺激,这些刺激是由突然发生的环绕给定的中心频率,不同频带宽度的带通噪声(bandpassed noise,BPN)构成的。这些刺激与在给定了视觉体系中的接收区域位置的一系列不同大小的点光源是类似的。实验旨在测试这些神经元的存在,它们倾向于选择一些特定频带宽度的带通噪声,就像纹状皮质外的神经元选择一些特定大小的视觉刺激一样。 基于以下的考虑,研究者又选择了第二组听觉刺激。就人类而言,STG的侧表面包含布罗德曼(Brodmann)42区和22区,它们分别同von Economo的TB和TA区域相呼应。这些区域的损伤,尤其是较后位置的损伤,会造成语音感知的缺陷,但相对于基本的听觉辨识而言,影响却很小。因此从进化和比较的神经解剖观点看,将特别物种的交流呼叫作为另一种宽带信号来看是很有意思的。到目前为止,就非人类的灵长类动物来说,只在松鼠猴(squirrel monkey)上做过这种类型的信号研究。 电极穿透(electrode penetrations)沿着侧裂痕(lateral fissure)的两边进入7只成年猕猴(rhesus monkeys,Macaca mulatta)左半脑的STG和STP区。从侧向带区域中获得了6只猴子的数据。相比较而言,科学家从3只猴子的主要区域AI和R[较接近喙区(rostral area),以前称为RL或吻侧区(rostrolateral area)]中搜集到了数据。平均每只猴子有15个电极轨迹(electrode track)分布在STG和STP区,它们的位置大致与皮层表面成直角,每次穿透至少有3次记录,共计有400个数据记录点。 研究者直接对158个侧向带区域的神经元用同强度纯音调(PT)和带通噪声(BPN)的单位脉冲响应进行了对比。尽管纯音调脉冲(burst)很少有效果,带通噪声脉冲则引起了超过90%的神经元的清晰响应。在158个神经元中有129个神经元对带通噪声的响应超过了对纯音调的响应。举个例子(图12a和b),纯音调刺激只引起了小反应,但是带通噪声刺激在每个中心频率中都引起了明显的响应。中心频率及频带宽度对81个细胞而言都引起了大幅变化(图12c和图14)。 图12随着声音脉冲的带宽变化,猕猴颞上回(侧向带lateral belt)一个听觉单位(singleunit)响应的增强(enhancement)。(图a和b)AL区域神经元对不同带宽的声音脉冲(50ms,75dB SPL,5ms上升和下降时期)响应。图a是PSTHs和光栅显示对600Hz的纯音调以及对以相同频率为中心的两个不同带宽(1倍频程和1/3倍频程)的带通噪声脉冲的响应——PSTH下的黑色条代表了刺激持续的时间。图b是对于相同神经元和相同类型刺激的比率频率(ratefrequency)曲线:纯音调(●),1倍频程带宽的带通噪声脉冲(▼),1/3倍频程带宽的带通噪声脉冲(■)。空框符号表示刺激开始前500ms间隔中相应的基线活动。所有刺激都基于均方根值进行了能量匹配。图c是带通噪声脉冲响应与纯音调响应的不同程度增强的神经元(n=81)的比值。正值代表增加,负值代表减弱。 通过对每个神经元计算比率(BPN-PT)/PT×100%、最佳频率和频带宽度(它们引起最大反应的情况)下对纯音调和带通噪声的响应进行了量化的比较。这81个神经元中的50个神经元(617%)对带通噪声的响应比对纯音调的响应高了50%,其中18个神经元(222%)甚至超过了150%。相反的效果(对反应的减弱超过50%)只在2个神经元(25%)中出现了。 基于这些响应,可以求出大部分神经元的最佳中心频率(BFc)。在与皮质表面垂直的电极轨迹中,最佳中心频率基本保持不变,因此一个最佳中心频率的值就可以从所记录的平均所有神经元分配各自(电极)渗透(penetration)。最佳中心频率分布图被标注到STG和STP区上,这些图揭示了吻末端(rostrocaudal)的连续级数,带有两个方向(图13)。从映射区域的中间部分, 最佳中心频率沿末端(caudally)增长,然后相反、减少,直到到达一个无反应区域,这个区域接近侧向沟(lateral sulcus)和颞上沟(superior temporal sulcus)的联结点。从中间部分沿吻侧(rostrally) 开始,最佳中心频率减少,然后相反又增长。相似的最佳中心频率在所有猴子STP的相邻区域中被找到。因此粗糙地划分,猕猴与听觉通路和脑听觉区有关的侧向带至少有3个区域,分别标识为前侧向(anterolateral,AL)、中侧向(middle lateral,ML)和后侧向(caudolateral,CL)区域。CL区以前并没有得到生理意义上的描述,但它的位置同AI区以及位于STP区上的体区(caudomedial area,CM)有联系,这表示它可能具有一定的对应,至少部分地对TPt区(cytoarchitectonically defined,细胞构造学上定义的)来说是有关联的。 图13沿着一只猴子的侧向沟(lateral sulcus,ls)的最佳中心频率(kHz)的分布图,未标记表示没有明显的响应。类似的分布图在所有猴子中都能找到。可看到STG后部(posterior part)在中心。电极轨迹直接进入了它的侧表面(lateral surface)(●),在穿过覆顶叶皮质(overlying parietal cortex)(●)后进入STP的轨迹也显示了出来。所有电极轨迹都被生物组织学证实。通过计算不同深度的至少3个记录的平均值可以求得每次穿透的最佳中心频率值。AL指前侧向(anterolateral)区;ML指中侧向(middle lateral)区;CL指后侧向(caudolateral)区;STS指颞上沟(superior temporal sulcus);CS指中央沟(central sulcus)。左上角插图:猕猴左脑半球侧面图(lateral view),考察的区域用点刻表示强调。右下角插图:m表示内侧(medial);l表示外侧(lateral);r表示前侧(rostral);c表示末端(caudal)。 在上述讨论的81个神经元(19个在AL,55个在ML,7个在CL)中,研究者量化分析了具有6个或更多涵盖从纯音调到白噪声(white noise,WN)的频带宽度的频率区域的整合。带通噪声脉冲以最佳中心频率为中心。69个神经元可以取到一个最佳频带宽度。最普遍的响应情况在49个神经元(605%)中可以观察到,一个神经元对纯音调或者白噪声的响应很微弱,但对于拥有1/3~2倍频程这一固定频带宽度的带通噪声脉冲反应很强烈(图14a)。偶尔在频带宽度的调谐曲线中能发现两个极点,其中一个能包含纯音调或白噪声。在5个神经元(62%)中,随着频带宽度的增加,响应也单调递增;在7个神经元(86%)中,随着频带宽度的增加,响应也单调递减(对AI神经元来说是最典型的响应)。对于一个给定的神经元,声级在很大范围内的增加对最佳频带宽度并没有多大的影响。尽管提高的程度有时会随不同声级而变化,频带宽度调谐曲线的极点通常是不变的(图14a)。最佳频带宽度的这种声级容忍(level tolerance)包括那些随声级非单调变化的神经元(图14a右上)。 图14侧向听觉(lateral auditory)区域中单个神经元对最佳中心频率的带通噪声脉冲带宽的偏好。图a是3只不同猴子带宽调谐的例子。图中显示其能量匹配刺激的声级变化。方框符号(open symbol)表示基线活动性(baseline activity);WN指白噪声。图b是不同最佳带宽的神经元对应猴脑侧向沟(lateral sulcus)的位置。每组的中值(×)由实线相连。BFc区间:○代表1kHz;▽代表25kHz;□代表4kHz;◇代表15kHz。 对不同中间外侧的(mediolateral)位置的响应进行比较显示,最佳带宽沿着轴增加,即与最佳中心频率轴(图14b,P <0003,Spearman等级相关)大致成正交。与视觉系统类似,尤其是在DL区和V4区,可以做出这样合理的假设——神经元对特定带宽的优先选择是对不同频带的整合以及复杂的兴奋或受抑制的交互作用的结果。不过,这些交互的准确特性还有待探索。 为进一步探索侧向听觉(lateral auditory)区域中神经元的光谱综合化,研究者将猕猴的声音作为刺激。在自然条件下数字记录的呼叫中(from a battery of calls digitally recorded),基于均方 根值进行能量匹配,研究者选择了含有7个代表性样本的标准集。用这些刺激对位于侧向带(lateral belt)AL、ML和CL区的97个神经元进行了测试。在这组测试中,87个神经元(897%)对这些特定呼叫的响应比对其他刺激(图15a)要好,56个神经元(58%)展现了弱的刺激偏好,但31个神经元(32%)对这些呼叫显示了强的偏好。另外还有7个神经元(72%)明显地偏好某一种特定呼叫。 把呼叫的声级(sound level)增加20~30dB并不会改变总体上选择的情况:通过分别计算最高和最低的声级得出的偏爱指数(419±160和415±173)的比较并不能揭示出明显的区别(P > 005,t检验)。3个区域的神经元都明显优先选择猴子呼叫,而非能量匹配的纯音调刺激(图15b)(P < 00001,二项式测试)。通过比较46个神经元对猴子呼叫和对带通噪声刺激的响 图15侧向(lateral)区域神经元对交流呼叫(communication calls)的响应。图a显示的是在相似的总体带宽下,对于嘈杂呼叫(上图,80dB SPL)而非和谐呼叫(下图,82dB SPL)的优先选择。声谱和时间信号显示在一个单位(singleunit)响应PSTHs 和光栅显示的左边。图b是在相同神经元(n=41)中,对猴子呼叫(monkey calls,MC)的响应与对纯音调响应的散点图的比较。图中的虚线平分象限,线上方的点对应的神经元是对MC的响应好于对纯音调响应的情况,线下方相反。图c~e是通过ML区的神经元在呼叫处理中的不同频率成分的非线性求和。呼叫(“咕咕声”(coo),80dB SPL)由一些谐波成分组成(图c,左图)并且引起了很好的响应(图c,右上图)。如果这个呼叫通过2kHz截止频率的低通(lowpass,LP)滤波器,那么同呼叫与未经滤波的情况相比,得到的响应要小得多(图c,第二排)。高通(highpass,HP)滤波的情况也相同(图c,第三排)。带有全部信号的刺激被反复重复以验证这种现象(最底排)的稳定性。图c的PSTHs由20个刺激相加求得。图d中当相同的神经元用音调脉冲(●)来测试时,响应偏爱频率04~2kHz,且最佳频率在08kHz左右。然而,当“咕咕声”(coo)信号按步骤通过低通滤波时,每次会消除一个谐波成分(◆),更高的谐波能在很大程度上提高响应。当加入第八次谐波(上限截止频率约6kHz),所得到的响应同全部信号情况下得到的响应相同。从这点上来看,就人类观察者来讲,经滤波的声音“coo”同原始的“coo”也变得无法分辨。方框符号(open symbol)代表基线活动。图e绘制的是较之纯音调响应的提高作为上限截止频率的一个函数。 应同样揭示出对呼叫的优先选择(P < 001,二项式测试)。这种优先选择的情况在嘈杂和和谐的呼叫中都能发现,但对音调呼叫不适用。 为了找出对这些刺激优先选择的呼叫成分,研究者对一些偏爱呼叫的频率或时间域进行了分割,并且将这些成分作为单独的刺激。对不同的频率段进行测试时,它们的响应通常可以根据超阈值频率 调谐曲线(即带通噪声刺激下获得的最佳中心频率)进行预测。而在其他一些神经元中,可以清楚获得非线性总和的指示(图15中c~e)。因为频率和时间域的非线性总和已经被暗示作为蝙蝠听觉系统中复杂响应特性形成的一主要机制,所以这后半部分的观察结果在今后的实验中尤其应该予以重视。 该实验结果是有价值的另一理由是:人类大脑中的42区和22区(TB和TA)涉及语言声音处理。当位于STG较后部的这些区域被选择性损伤时,会导致语言感知的损害。有关这些区域的语音或音位方面。同样被功能成像研究所证实,研究发现音素较之音调会引起更强烈的激活。非人类灵长类动物的实验结果表明,在脑部相应位置的3个非初级听觉区域(AL、ML和CL)中的神经元优先选择不同类型的宽带(broadband)复杂声音,包括特定物种的发声。这个神经机制负责对这些区域中的刺激优先进行选择,并且可能在哺乳动物的进化过程中得到不断的完善,可能对解密人类语言声音起着重要的作用。 14灵长类动物下丘脑中与视觉、扫视相关的信号 Visual and saccaderelated signals in the primate inferior colliculus Porter Kristin Kelly,Metzger Ryan R,Groh Jennifer M 大脑某区域可同时处理听觉与视觉信号 下丘脑(inferior colliculus,IC)通常被认为是一种主要用于听觉的组织,因为它的早期位置在向上的听觉通道中位于听觉背侧丘脑(auditory thalamus)的前面。Porter等人指出,除听觉响应(概率P < 005)之外,在觉醒的猴子中,其下丘脑的大多数神经元中(180个神经元中的64%)携带了与视觉及扫视相关的信号。响应模式主要包括视觉刺激响应,但也增加了对眼跳动的锁定时刻的活性,缓缓提高视觉刺激开始在锁定时间的活性以及抑制响应。这些与视觉相关信号的存在暗示了下丘脑在汇总视觉和听觉的信息中起到了一定的作用。Porter等人的研究结果还表明各感官通路之间在感官处理(信息)通道中很早就发生了交互作用,这意味着多种感觉的融合可能是一低级而非专门高级的过程。 目前对多种感觉处理的研究已经拓展了我们对多种感知刺激交互作用程度的理解,它们也在暗示各种感觉形式的交互作用所充实的脑区根据历史事实被认为是用单模式(unimodal)分布描述的。如果感知经常是一个多模式过程,那么按照推测,各单一模式的脑区受其他感觉形式(modalities)的影响是讲得通的。然而,这一呈现出的范例的转变很大程度上集中在具有处理功能的大脑皮质阶段。这种观点的一个重要测试是研究各种感觉对较早的信息处理阶段的影响。如果感觉形式间的交互作用对于感知环境的理解形成常常是有用甚至必要的,那么交叉感觉系统的有机融合这一重要神经任务可能不在晚期处理阶段,而是迅速地被补充到前大脑皮层的“单模式”脑区及较后的处理阶段。 这一观点可以通过下丘脑来验证。由于下丘脑在听觉上行通路中拥有较早和显著的地位,它对听力的重要性不言而喻。近期的研究工作显示,除了对听觉有影响外,下丘脑也可能承担着对视觉信号进行处理的任务。谷仓中的猫头鹰易受棱镜过滤的视觉镜像的影响,下丘脑神经元修改了与上丘脑(superior colliculus)神经元的连接,并且它们有了对视觉刺激作出反应的能力,但是只发生在上丘脑被药理学封锁时有抑制影响。若干信息间接证明了哺乳动物的下丘脑也可能在视觉和听觉的交互作用中是起作用的。一些研究者发现,灵长类动物的下丘脑包含具有依靠眼睛位置活动的神经元,当眼睛运动时用一信号弥补视觉听觉系统在空间位置上自然发生的分离是必要的。从视网膜、视觉皮质和上丘脑传输到下丘脑的过程也有解剖学上的证据。然而,一项以前的生理学研究发现,在麻醉了的猫的下丘脑中有少量的视觉响应(小于10%的神经元细胞),而这些视觉响应被报道仅存在于缺乏听觉响应的神经元中。Gutfreund等人证明被麻醉的猫头鹰在解除上丘脑抑制的下丘脑中的视觉响应的“通路(gating)”,下丘脑的视觉信号输入是普遍存在的,但通常是无声的。在以前的生理学研究中,“麻醉的使用可能已导致研究者低估了下丘脑视觉信号传导的重要性”这一说法似乎是正确的。这样视觉响应可能在觉醒的动物中正常地发生,尤其当视觉的刺激来自眼睛对目标的扫视时。因此,研究者进行了一项关于猴子的下丘脑神经元活动的实验,包括在提供声音刺激后给予视觉刺激,以及让眼睛飞快地扫视(saccade),该刺激(彩图16)。彩图17为一个带有与视觉和扫视相关活动的神经元。图18为另外12个神经元的例子,包括视觉性激励(图a~d,图f和图i~l)或者视觉和与扫视相关的(图e,g和图h)活动。图19显示其他视觉诱发活动的3个神经元的例子。彩图110为5个神经元的接受域。 图18另外12个神经元的例子,包括视觉性激励(图a~d,图f和图i~l )或者视觉与扫视相关的活动(图e、g和图h )。光栅和PETH在固定光发光时被对齐,而光栅按扫视的反应时间分类(约定与彩图17中类似)。 图19显示其他视觉诱发活动的3个神经元的例子。图a:主要与扫视相关的活性模式。图b:与扫视相关的脉冲(burst)和慢慢上升的增长活性。图c:强大和持续不变的抑制响应。这3个神经元也显示了听觉响应。约定与图127中的光栅和PETH相同。 讨论 来自这项研究的结果显示,与视觉相关和与扫视相关的信号在下丘脑中与有力的听觉信号 共存是普遍的。这些信号是在正常的环境下显现的(即醒着的动物扫视视觉刺激,该情景在自然环境下是很常见的)。所有3只猴子在处理视觉或者用眼跳动相关信号时的普遍性是类似的,但是这些信号所具有的性质有一些差异。尤其猴子C并未表明包含与眼扫视相关成分的任何活性。这只猴子的视觉反应也似乎更加受限于视网膜的中央凹处位置。这可能说明缺乏与扫视相关的活动的原因:当一视觉刺激在视网膜的中央凹时,看该刺激不需要另外的扫视行为。猴子C的视觉响应发生在扫视固定光 之后,把该刺激传送到视网膜的中央凹上。到目前为止,还不清楚该猴子在这个接受域(receptive field)比其他两动物更可能包含视网膜中央凹的情况。一种可能的解释是下丘脑包含一张视网膜定位图,而Porter等人的记录抽样显示在这3只动物中该图是不均衡的。将来需要通过实验来研究这个问题。与扫视成分相关的放电模式类似于以前对谷仓猫头鹰(barn owl)的研究结果,并且支持上丘脑(SC)至少在生理上是下丘脑相关输入源之一的观点。主要的视觉响应可能来自从上丘脑、视网膜或者视觉皮质的投射。下丘脑的神经元中可见一些接受域(receptive field)的属性[即大尺寸,范围包含同侧的区域(ipsilateral field)以及不同寻常的形状]在任何输入位源(potential sources of input)中并未发现典型的接受域,且暗示下丘脑神经元(IC neurons)上的这些视觉输入结构中一定存在或者直接或者通过中间神经元(interneurons)而来的个体神经元的大量投射会聚(convergence of projections)。 在整个研究中,研究者已使用视觉的、与视觉相关的或者与眼跳动相关的术语来描述活动模式。那么活动的确与注意或者奖赏刺激相关吗?有几个原因反对这一解释。首先,这种反应模式共享经典的视觉和眼跳动相关区域时空反应特性,即存在对视觉刺激或者跳动开始(saccade onset)的反应的锁定时间和接受域(receptive fields);第二,在实验中出现的活性没有被触发或者已成功地被执行;第三,在已做麻醉且未做其他行为任务的下丘脑中发现视觉的响应;第四,响应性质不同于以前探索的与奖赏相关的活动的影响:当奖赏信号即将来临时,这种与奖赏相关的活动是最显著的。神经元子集表明慢慢的上升的响应是具有视觉触发奖励信号的神经元群体最佳候选,但是这些神经元只是该数据集的一小部分(28%);最后,下丘脑包含视觉响应似乎是正确的,因为下丘脑从有视觉反应的区域(视网膜、视觉皮质和上丘脑)接收解剖学的输入。 更广泛地,这些发现促进新兴的思考模式的转变,它提示大脑中占主导地位的单模式(unimodal)区可能实际上易受多种感觉并用的影响。从20世纪60年代以来,研究者已经知道初级视觉皮质包含一些听觉响应,而更多的人类听觉皮质的响应已被以有听力和耳聋受试者的视觉刺激调节的成像研究所阐明。进而,猴子的听觉皮质中的视听趋同(convergence)被证明。下丘脑位于听觉通道中比听觉皮质前的位置,并且可能作为对听觉皮质活动的视觉影响的一个来源。目前,在听觉皮质中明显的单模式视觉响应似乎不像下丘脑(IC)中的那样广泛,但是听觉响应的视觉调制是十分普遍的,并且局部场势尤其明显。在听觉皮质中,视觉的影响依赖于行为任务和视觉刺激的性质。同样,下丘脑视觉的信号可能最终被证明是真实的。此外,眼睛位置(视网膜刺激位置)的监控和对比研究将促进这些区域中的视觉响应的研究。 大脑开始整合信息源的任务在感觉处理通路中发生得那么早可能反映出多种感觉一体化对感知的重要性。视觉反应是何时出现的有待进一步研究,下丘脑中初期呈现的位置如上橄榄综合体(superior olivary complex),通过橄榄体耳蜗束(olivocochlear bundle),直到耳蜗中的外部绒毛细胞。从而,视觉影响可能被传送到处理的更早阶段,这确实是一种令人感兴趣的可能性。因此,听觉通道中视觉影响的存在并不一定意味着听觉通道参加视觉的感知,而是更有可能反映了视觉刺激能影响听觉感知的一种机制。确实,一项最新的对下丘脑单边损害(unilateral lesion)的病人的研究显示,当刺激出现在下丘脑损害相反的半域(contralesional hemifield)时,McGurk影响的双峰交互作用(bimodal interactions)在减少。此外,一些研究还比较了与声音相关的视觉刺激引起的下丘脑反应和通常无声的视觉刺激引起的下丘脑反应,可以帮助我们阐明下丘脑中视觉信号的用途。 15大脑区别人类和非人类语法:功能的区域化和 结构的连通性 The brain differentiates human and nonhuman grammars:Functional localization and structural connectivity Friederici Angela D,Bahlmann Jorg,Heim Stefan,Schubotz Ricarda I, Anwander Alfred 人类语言据称是基于层次结构的序列。人类的这种能力超越了非人类灵长类动物处理简单的临近元素的转移概率序列的能力。这里,研究者将说明人脑用来处理这两种类型序列的区域是不同的。左额岛盖部(left frontal operculum)负责对局部转移的处理,在系统发育上一个比布洛卡区更老的区域专门负责层次依存关系的计算。管道图(tractography)数据揭示了这两个位于左额下皮质(left inferior frontal cortex)的区域在结构上的连通性特征(signatures)的不同,这为区分它们提供了补充的证据。 人类语言能力的核心部分是语音和语义相互作用的语法规则系统,称为句法。这个语法规则系统使人类可以产生并理解无限数量的句子,即词汇的不同组合。句子中词的重新排列和置换关键是由这个语法规则系统中的层次结构决定的。人类的语言能力曾被论证为给予处理递归结构的能力。图111为两种语法类型的结构。彩图112为两种语法类型对应的脑激活模式。彩图113为两脑区的管道图、布洛卡区和额岛盖部(FOP)。 图111两种语法类型的结构。有限状态语法(FSG)和短语结构语法(PSG)刺激的一般结构和例子。两类成员在音位上被分为A、B两类。A类音节包括“i”或“e”两个元音(de、gi、le、ri、se、ne、ti和mi),B类音节包括“o”或“u”两个元音(bo、fo、ku、mo、pu、wo、tu和gu)。相同的音节用于这两种语法。序列中异常的位置有系统的变化。在每一语法结构中正确(corr)和异常(viol,用粗体表示)序列的例子用短和长的语法形式给出。 讨论 现在的研究结果表明,左额皮质在细胞结构和系统发育上都不同的脑区有功能的区别。非人类灵长类动物使用一种可学习的语法,由有限状态语法(FSG)产生的序列转移依存关系的 评估,会使系统发育上更古老的一块皮质——额岛盖部活动起来。相比之下,人类语言使用的语法,根据短语结构语法(PSG)产生的序列层次依存关系的计算会使系统发育上更年轻的额外补充的一块皮质——布洛卡区(BA 44/45)活动起来。这一结果与其他不同研究中所得到的关于处理自然语言中的句法构成上复杂句子层次至关重要的是BA 44区/45区区的结论是一致的,但对处理局部句法错误却不重要。这里将展示出BA 44区/45区和FOP之间主要的功能区别。虽然FOP在两种语法类型中都有参与,但是对层次结构的语句计算仅仅激活BA 44区/45区。看来,FOP支持输入元素与预测元素的核对,因此参与独立于序列结构中非文法的处理。当基于评估的结构层次被计算时,BA 44区/45区又参与了。重要的是,研究者的数据表明,不是本身难以处理造成BA 44区/45区激活,而是该区域的激活是结构层次存在的作用。就这一点,问题出现在多大程度上计算被分配到语言域的布洛卡区和FOP。额下回(inferior frontal gyrus)所定义的区域可能不针对特定的区域,例如,布洛卡区在处理音乐中的句法时被激活,腹侧前运动皮质(ventral premotor cortex)涉及追踪由局部或者全局结构异常造成的异常刺激。这样不同脑区也许独立于特殊域的特定类型的计算,但是它们似乎作为专门的功能网络的一部分得到其领域特殊性。结构数据表明,这两个功能不同的区域是不同结构的网络部分。FOP通过沟束(fasciculus uncinatus)连接到前颞叶,而布洛卡区则经纤维束上纵肌(fasciculus longitudialis superior)连接到颞上区(superior temporal region)的后中部。这些有差别的连通性特征(signatures)得到许多之前和当前研究的功能解释。近期研究表明,由布洛卡区的颞上回(superior temporal gyrus,STG)的中后部构成的网络在调查句法复杂性和处理短语结构语法(PSG)时被激活。在语言学习中,后部STG的激活在功能上与综合处理相连,因为该区域在处理非文法句子时是活跃的,而这种句子中的异常成分不可能综合到先前的结构中,对于复杂句法的第一宾语的句子难以将后一成分综合到先前句子的结构中,句子的最后一个动词是难以集成的,因为需要预先建立的论元层次的修正。相比之下,FOP和STG的前部在处理局部短语结构违例时被激活。脑磁X光成像(magnetoencephalographic)研究的定位数据表明,这两种激活在功能上与结构构建的初始阶段相关,这个过程完成了基于词类信息的局部句法依存关系的核对。有种假设,在口语研究中STG前区的激活可获得词典中词类信息解码,而额下区的激活应与处理局部结构构建相关。在该假设下,可以认为呈现的有限状态语法(FSG)的激活是在FOP中而不是在前部STG中。这种结果的模式是在当前的研究中被观察到的。对两种人造语法类型的直接对比表明,人脑这两个区域在功能上的区别(就其结构连通性特征(signatures)来说,现在的数据)可能是系统发育的、细胞和受体结构的(cyto and receptor architectonically)区别。由一脑区促进完成了人与非人类灵长类动物语法类型的处理,观察资料表明,在系统发育上更晚出现的脑区完成了只有人类才能使用可学习语法类型的过程,这也许能够解释非人类灵长类动物到人类语系发生的进化特性。然而,神经结构水平直接的比较当前看来似乎是不成熟的,因为短尾猴(macaque monkey)前额皮质的细分在细胞结构和功能数据上都被提出,猴子和人脑皮质之间的异同仍在讨论中。因此,目前不清楚的是,短尾猴的F5是否进化为人类的BA 44,或者F5是否直接进化为人类的BA 6,而BA 44 (已出现在猕猴中,最大宽度为4~9mm)进化到人类较大的BA 44。 总之,毫无疑问,处理句法的层次和递归是人类语言至关重要的一个方面。尽管一些人认为这只是很多重要方面中的一个,而另一些人认为这是人类语言唯一特殊的方面。这里的 研究指出了一种关于序列计算的进化轨迹,从处理简单的可能性(probabilities)到计算层次结构的后出现的布洛卡区,在系统发育上布洛卡皮区比额岛盖部(frontal operculum)更年轻,额岛盖部的脑区涉及序列的转移概率的处理。 16“快速映射”的证据:一只家犬的词语学习 Word learning in a domestic dog:Evidence for “fast mapping” Kaminski Juliane,Call Josep,Fischer Julia 在话语获取过程中,孩子们通常会在一个新词语第一次出现之后,就对它的含义形成迅速和粗略的猜想——这种过程被称为“快速映射”。这里,Kaminski等人列举了一个关于一只名叫Rico的博得牧羊犬的例子。Rico能够进行快速映射,记住超过200个不同物品的标记(label)。它能够通过排除学习法来推断出新物品的名字,并且在第一次看到新物品仅仅4周后就能准确地拿取这些物品。快速映射一般学习和记忆的机制也发现于其他动物中,而不是人类特有的语言获取机制。 初学的孩子获得词汇的速度是惊人的:从2岁起,典型的说英语的孩子每天将10个新单词添加到他们的词库中,直到他们高中毕业时,他们平均能够掌握60 000个词的词汇量。一些研究表明,孩子们具有一套操作原理来指导他们的词语学习。但是,这些原理中哪些是单独用来指导语言学习的?哪些是可以与其他物种共有的、更为普遍的认知能力?这个问题依然存在争论。研究者研究家犬在词语学习中的特殊能力,即它能够从一个词语和它对应的物体(该词所指的指示物)获得它们之间联系的能力。通过研究家犬取回熟悉的物品和新物品的行为,研究者测试出它是否能够通过排除学习法来推断出一个新词语对应的物品,即在某个时间进行快速映射,这种映射随着时间流逝能够保持。研究的对象Rico是一只生于1994年12月的博得牧羊犬。它的主人声称它能够记住超过200个物品的标记,这些物品中大多数是儿童玩具和球类,并且Rico能够依据指令准确地取回相应的物品。Rico早在10个月大的时候就被训练取物品,那时它的主人将3个不同的物品放在屋子的不同位置,并让这只狗取回其中一个。如果Rico取回正确的物品,那么作为奖励它就会得到食物或陪主人玩耍。 渐渐地,Rico熟悉的物品越来越多。通常,主人将新物品给Rico看一下,并说它们的名字2~3次。然后Rico有机会和新的物品一起玩,使得新物品与其他物品的概念集合合并在一起。但是,“聪明的Hans”效应是否在Rico的行为中起作用,这一点仍然不清楚。于是,研究者设计了第一个实验来估测Rico在受约束的条件下正确取回不同物品的能力。Kaminski等人将200个Rico熟悉的物品随机分为20组,每组10个不同的物品。在主人带着Rico在一间分离的房间中等待的时候,试验者在试验房间安置一组物品,然后回到主人和狗那里。接下来,试验者让主人命令Rico从隔壁的房间分别相继取回两件随机挑中的物品。当Rico搜寻所需要的物品时,它看不到主人和试验者。结果它从40件物品中正确取回37件(二项式测试,P<0001)。这个试验表明,Rico真的懂得这些物品的标记。有人可能会反对说,有些词语,例如“取回——袜子”会构成单词语的命题。然而,更多的证据表明,Rico真的懂得词语对应的是什么物品。例如,它会依据指令将一件物品放进盒子里或者带给某个人。研究者需要更为系统化地测试来检测Rico对全部短语的理解程度。但无论如何,相比以前只用3~5件物品来对狗进行测试的试验,这次试验中的物品数目已经足够多了。 Rico的“词汇量大小”可以和受过语言训练的猩猩、海豚、海狮和鹦鹉相比了。为了衡量Rico快速映射的能力,Kaminski等人在隔壁的房间将一件新物品置于7件它熟悉的物品之中(8件物品,需要进行8次尝试)。在这次所谓“辨认任务”中,Kaminski等人设计了10个阶段,一共加入10件新物品。在一个阶段第1次尝试,主人常常让Rico取回一件熟悉的物品,然后在第2或第3次尝试时让它依据新物品的名字取回它。在一个阶段完成之后,Rico被允许休息一会,之后开始下一阶段的试验。Rico在第一阶段就取回了新的物品,并在总的10个阶段中有7次取回正确的物品(二项式测试,P<0001)。显然,它可以基于排除学习法将新的词语和对应的新物品联系在一起,因为它知道熟悉的物品已具有名字,或者因为它们不是新的物品。在新物品第一次也是唯一一次出现4周之后,Kaminski等人评估了Rico对新单词和新物品之间联系的记忆力。在这个“保持性任务”中,研究者仅仅使用那些Rico在“辨认任务”中相继正确取回的物品。在两任务之间,Rico无法接近目标物品。Kaminski等人将目标物品同4件全新的物品和4件熟悉的物品一起放在同一间屋子里(共9件物品),然后先让它取一件熟悉的物品,之后(在第2次或第3次)取回了目标物品。“辨认任务”4周之后,它在6个阶段中的3个阶段正确取回了目标物品(P<01)。这个取回的正确率已经可以和3岁的孩子相比了。在其他的案例中,Rico都是带回那些不熟悉物品中的一件,并且一次也没有带回熟悉的物品。研究者重复这个试验,首先使用新的物品重新进行“辨认任务”。在“辨认任务”之后10分钟,Kaminski等人测试Rico对新词语—新物品联系的保持力。它在6次尝试中有4次取回了正确的目标物品(P<002)。这些试验表明,Rico确实能够将特定的声学模式(人类词语)和环境中特定物品联系起来。显然,Rico懂得物品名称的丰富经历让它建立起一种规律,那就是物品可以有名字。进而当它面前出现一个混在其他熟悉物品中的新物品时,它可以基于排除原则推断出一个新词语指向的物品。这符合所谓“新名词—无名类”定律的获得,并且避免了在儿童中出现的词汇交叠。此外,Rico能够将单词与物品之间的联系内容储存在记忆里,因为无论在新的词语—物品联系刚刚出现之后,还是在4周之后,它都能从一组新旧混杂的物品中正确取得目标物品。究竟Rico的表现是基于特殊的思维,还是它接受大量的词语—物品联系的结果,仍然有待实验调查研究。但毫无疑问,Rico是一只动机性很强的狗,它的某些才能可解释博得牧羊犬常被用作工作犬的原因。更加一般地讲,那些能够满足人类交流目的的狗类能够通过自然进化的选择。然而,研究者假设Rico的表现能被分解为若干更为简单的机制。这包括: (1)它对“目标物品拥有标记”原则的习得。 (2)普遍的学习机制,即排除学习(自然匹配)法。 (3)将这种知识储存在记忆中的能力。 所以,试验的结果充分支持这样的观点:之前在人类孩子中描述的看似复杂的语言技能,可能与其他物种中存在的一些更为简单的认知机制有所联系。Rico对目标物品和对应的标记形成联系的能力,是否与孩子们对物品名称的认知能力一致,这仍有待进一步研究。孩子们显然从很小开始就在词语意义方面比Rico有着更广泛的知识,而且他们可以区分词语间的不同功能,例如动词、形容词和专有名词。另外,孩子们能够有效地使用新学到的词语,也就是说,他们能够由快速映射说出所确定词语的意思。但是,研究的结果确证了之前的假设:听者给特定的声音赋予意义的能力,要比灵活的发出特定声音的能力进化得更早,且更为独立。这就是说,某些感知与认知机制可以指明那些在早期人类开始使用语言之前就存在着的语音理解。 17狗能不能学会词语 Can a dog learn a word Bloom Paul 当说明语言学习不仅仅需要恰当环境的观点时,心理学家常常指出,小孩和狗同时接触到语言,但只有小孩才能学会说话。这个例子可能需要改变了。在这篇文章中,Kaminski等人报道了一只能够学习词语的取名为Rico的博得牧羊犬的出色能力。当试验者在另一房间放置10件物品后,Rico总能按主人的要求取回正确的物品,并且重复的试验表明,它具有超过200个词语的词汇量。更令人印象深刻的是,它可以仅仅在一次尝试之后就学会(词语的含义),类似小孩子们具有的“快速映射”的能力。Kaminski等人通过将一件新物品与7件Rico熟悉的物品放在一起,并让主人说一个Rico从没听过的名字命令Rico去取回对应物品,测验它快速映射的能力。它总能取回那件新物品,就像小孩子一样,明显的倾向认为:新的词语更有可能指向那些没有名字的物品。一个月后,Rico对它学到的单词显示出一定的记忆力。它的能力可以和接受过类似测验的孩子和成人相比。狗的主人经常称赞他们爱犬的交流与社交能力,而这个试验支持了他们的观点。确实,Rico学习词语的能力超过了非人类的灵长类动物,例如从没有显示出类似“快速映射”特征的黑猩猩。正如研究者所说,这就是为什么狗类被特别选中作为人类交流的对象。更为一般地,这项研究能很好地支持其他有关家犬社交能力的研究,并很可能成为比较认知研究领域的一大进步。对心理学家来讲,狗类将代替黑猩猩(作为研究对象)。Rico的学习能力与人类孩子相比如何呢?Kaminski等人指出两处不同:一点是,孩子有着更为丰富的词汇,包括特定人物、属性、动作和关系的名称,而Rico只知道一些可拿取物品的名称,例如玩具和球;第二点,孩子能够说,而Rico不能。但这不是全部。Rico已经9岁,懂得大约200个词,而9岁的人类已经懂得数万个词语,而且每天学习超过10个单词。孩子的单词学习能力很强,他们能从无意中听到的话语中学到词语,甚至没有人想要教他们。相比来讲,Rico只能通过特殊的取东西的游戏来学习。孩子们能通过语境理解其中的词语;Rico对词语的理解显然是通过它取回物品的行为体现。将心理学家Lila Gleitman(关于大猩猩的语言)的话稍微改变用在这里:如果孩子们用Rico的方式学习词语,恐怕父母们都要尖叫着跑去找最近的神经科医生了。可能Rico正是做着孩子们做的事情,只不过不如孩子们做得好。一个2岁的人比一只9岁的狗懂得多,毕竟孩子有着更好的记忆力和对成人思维更好的理解力。Rico的能力差距可能反映在程度上,而非物种上的差距。一种更令人怀疑的观点认为,Rico的能力和人类学习词语没有任何关系。对一个孩子来说,词语是指向外界世界的类别或个体的符号。甚至1岁的儿童都更加喜欢有参考性质的词语。当孩子学习一个词语,例如“袜子”,他们不把它理解为“拿来袜子”或者“去找袜子”,而且他们不仅仅将这个词语同特定的袜子联系到一起。他们更倾向于把这个词指向一个类别,从而他们可以使用这个词来索取一只袜子,或者指出一只袜子,再或者对另一只袜子的缺失给予评论。那Rico能否理解这种指向作用呢?我们不清楚(图114)。实验中,Rico的能力仅限定在特定方面。Rico学习所有的新物品是通 图114解释一条命令的不同方式:当一只博得牧羊犬Rico被主人命令取回一只袜子时,它可能按一个孩子的方式理解它的主人。也就是说,Rico可能倾向于将词语“袜子”指向现实世界中的一类物品,而命令中其余的部分意味着它应该向着该种类中的某个元素作出某种动作(取物)。另外一种可能性,它没有完全理解这种指向机制,而是仅仅局限于将主人说的这个词语,同某个特定的行为,例如“接近一只袜子并取回来”联系到一起。 过取物,测试Rico理解这些物品的程度也是通过取物的方式进行的。同时,总是Rico的主人和它进行交流。虽然这个试验设计得很精细,以至于不需要担心会出现类似于“聪明的Hans”的问题(Hans是一匹看似会算数的马,其实不过是他的主人在一旁提示它)。但如果说Rico真的理解声音—意义的联系,就像Kaminski等人一直指出的,那么指令者是谁应该无关紧要。进一步的实验有助于解决这个问题。Rico能不能通过看到一件物品并听一个人说物品的名字的方式来学习这个新词语呢?它能否通过某种方式学习一个词语而不是取回一个小物体呢?它能否通过某种方式展示一个词语的知识而不是通过取物呢?(Kaminski等人指出存在更多的证据表明它可以——这一点有待通过试验的方式探究)。Rico能否遵守“不要去取得某种物品”的指令,就像人们告诉一个孩子不要碰某个东西那样呢?Rico的能力很吸引人,但在我们获得这些问题的答案前,舍弃“孩子能够学习词语而狗不能”的观点还为时过早。 18FOXP2基因与语音及语言的神经解剖学的关系 FOXP2 and the neuroanatomy of speech and language VarghaKhadem Faraneh,Gadian David G,Copp Andrew,Mishkin Mortimer 语音和语言是人类大脑先天的能力这一观点已被长期广泛地接受了,但是最近,通往这些非凡才能的基因基础的切入点被找到了。具有语音、语言障碍的家族中FOXP2基因突变的发现,促使神经学家追踪该基因在胚胎发育过程中的神经表示,追踪这种基因突变对大脑结构和功能造成的影响,并因此开始破译以清晰语音表达到顶点的我们的那部分神经遗传。 长期以来,人们就知道语音和语言障碍在家庭中存在的事实,因而一种或多种基因突变就被认为是可能的诱因之一。然而,就在最近,这样一种诱因性的突变得到了证实。这种发现为人类独特的交流方式的神经遗传学研究领域翻开了崭新的一章。新的研究从调查3代KE家庭开始,KE家族一半成员有口头言语表达障碍,那是一种与常染色体显性突变相一致的遗传模式。在行为分析的基础上显示,这种言语表达障碍其实深植于口与面部的运动障碍,这明显地表现在言语的过程中。这种定量表型的描述使得基因连接分析成为可能,也引导了后来的突变基因FOXP2的鉴定。相关的,行为表型帮助揭示造成突变的神经病理学的重要区域。虽然关于神经病理学和其功能结果还有许多方面需要研究,但是对于理解单个基因如何造就人类精通(proficient)口头交流已经有了一个好的开端。在此,Faraneh等人综述了受到影响的KE家族成员的行为表型、相关的结构和功能神经病理学和在正常的脑组织(brain tissue)中FOXP2基因的表达。这些发现使研究者为语音和语言提出了神经回路系统部分的试验模型,该模型部分地但也严重地依赖于FOXP2基因。彩图115为KE家谱(pedigree)。彩图116为双侧立体像素形态测量学分析结果(有色区), 受到影响的KE家族成员有明显的灰质减少的区域。彩图117为老鼠的FOXP2基因与人类的FOXP2基因在胚胎的135天(鼠)和卡耐基23阶段(人类受精后56天)的大脑中具有类似的表达。 框1FOXP2的分子遗传学(molecular genetics) 在KE家族中造成语音和语言障碍的基因起初被定位到染色体的长臂上。即使在早期阶段,起因基因(那时称为SPCH1)似乎也一定被定位了,因为其联接是强有力的,LOD分值高达66(超出3即是有效统计)。进一步的分析缩小了遗传区域的范围,确定了不相关的个体CS,类似于语音和语言障碍并涉及SPCH1基因区域的染色体易位。最后,通过分析CS的染色体得以辨别出导致语音和语言障碍的基因FOXP2。CS的易位断点(translocation breakpoint)映射到一个单一人工细菌染色体(bacterial artificial chromosome,BAC)的克隆上。在这个BAC上,研究者发现了一种新基因FOXP2的一部分,FOXP2基因和其他forkhead基因是同源的。CS的易位断点破坏了FOXP2的基因结构。此外,在KE家族成员中发现了FOXP2序列在其他地方的基因突变。这种突变发生在每个受到影响的家族成员身上,但不会发生在未受影响的成员身上,也不会发生在不相关的对照受试者的364个染色体上,表明这种突变不是简单的多态变量。重要的是,这种突变在FOXP2序列的553位点用组氨酸替代了精氨酸。精氨酸在FOX基因中是不变量,显示出其决定性功能作用,且精氨酸在forkhead域的第三个螺旋结构中临近一个组氨酸,而在转录控制过程中,蛋白质与DNA就在此结构中发生接触。在FOXP1中相应的剩余物(residue)R127H的一 种突变对生物体外蛋白质功能产生严重的不良后果。因此似乎可以肯定的是,KE家族中氨基酸的替代作用导致了FOXP2基因一个复制体的功能缺失,剩余的复制体对于大脑正常运转是不足的(单倍剂量不足,haploinsufficiency),这就导致了语音和语言障碍。 框2鸣鸟的FOXP2 基因 与人类相似,鸣鸟通过模仿学习发声。现在提出一个问题:在物种分支中如此广泛的不同FOXP2版本之间有没有任何相似之处?最近的报告表明是它们有相似之处的。虽然哺乳动物和鸟在3亿年以前从同一条线分离,斑胸草雀(zebra finch)中的FOXP2蛋白有5个氨基酸位置和老鼠不同,有8个氨基酸位置和人类不同,这些不同产生了多于98%的蛋白质特性的特征,即使在人类和鸣鸟之间也是如此。此外,斑胸草雀脑中FOXP2表达的所有模式和哺乳动物大脑中的模式显著地相似,包括人类胎儿的脑。特别有趣的是禽鸟歌唱回路的FOXP2表达。彩图118 表明组成该回路的两通路中更多的喙(rostral)形成同源于额基底神经核环路的环。特别是,外皮质或“皮质”区的神经元(高级发声中心)发送轴突到纹状体/苍白球部分(striatal/pallidal subdivision)(X区,只为声音学习者所拥有),这部分反过来投射到一个核丘脑区(thalamic region)(背外侧丘脑的内侧核,medial nucleus of the dorsolateral thalamus,DLM),从那儿又返回到“外皮质”(前部新纹状体的外侧巨细胞核,lateral magnocellular nucleus of the anterior neostriatum,LMAN)。LMAN随后投射到线路的尾部通路(caudal pathway),这就构成了一个服务于歌唱活动的运动通路。FOXP2不仅在基底神经核X区和丘脑(thalamic)DLM区表达强烈,而且X区的表达在临界期(critical age,孵化后35~50天)内增强,在这段时间里鸟类模仿唱歌。值得注意的发现还有,FOXP1的表达不像FOXP2(FOXP1能成为2聚物,dimerize),在性别上是两性的,显示出雄性在学习唱歌时X区表达加强,而在雌性非唱歌学习时相应区域没有这类表达。这一发现表明,FOXP1对人类语音可能也是很关键的。 框3FOXP2 的进化 现在,科学家的研究兴趣已集中于FOXP2的进化。在对KE家庭的成员特定的语音和语言 反常(abnormal)发展现象进行观察时发现一个基因在复制中发生突变。比较人类FOXP2基因序列的核苷酸和氨基酸,其他灵长类动物和有胎盘的哺乳动物FOXP2基因产物是其中最高地保存的5%的蛋白质,表明它对哺乳动物有重要作用。此外,不同人类的种群氨基酸序列本质上没有变更,标志着现有的FOXP2基因序列在现代人类身上是固定。虽然自人类和老鼠血统在7千万年前开始分 歧时,就有很多核苷酸变化在FOXP2基因中累积,但是只有3个氨基酸在FOXP2基因中发生改变。引人注目的是,这3个变化中的2个(位置303上的苏氨酸变为天冬酰胺。位置325上的天冬酰胺变为丝氨酸),目前为人类所独有,而黑猩猩(chimpanzees)、大猩猩(gorillas)或 猩猩(orangutans)都没有。因此,仅仅从400万~600万年前人类血统与黑猩猩血统分离开来时,这些氨基酸置换就已产生,并成为固定的FOXP2基因序列。给定这一进化时段,该氨基酸改变率比预计的偶然变化要大很多。而且,FOXP2基因序列中这两个氨基酸的改变满足相对较新的选择性“sweep”的所有标准,其中这个推定的有利基因型在人类中迅速传播。确实,这种传播在过去的10万~20万年内预计已经完成,接近解剖学上现代人类出现的时间。FOXP2核苷酸序列分析的这些结果预测这两个人类特有的氨基酸改变证实了FOXP2功能。位置325上氨基酸的改变创造了一个可能的磷酸化的场所,可以影响一个作为转录抑制因子的蛋白质功能,虽然人类FOXP2基因序列是不是在功能上和现代人类语音和语言能力相关还有待确定。 19从仿真的视角看词汇和句法的共同演变 Coevolution of lexicon and syntax from a simulation perspective Gong Tao,Minett James W,Ke Jinyun,Holland John H,William S Y Wang 简单的句法(以一种简单词序的形式)能否在词汇的出现期间显现出来,人们正在从一种仿真的视角研究这一问题。一个多方施事者(multiagent)计算模型通过反复交流可追踪词汇—句法的共同演变。可能影响自组织过程的几个因素也在讨论之中。模拟间接意义的转移用来研究非语言信息对于听者理解的影响。除理论和经验性的论点外,这一支持演化产生论的计算机模型,论证了句法在某些一般领域能力范围内的适应性,从而为反驳先天论提供了证据。 引言 语言的出现长期以来已成为诸如语言学、生物学、心理学和人类学等具有多学科背景的学者感兴趣的课题。关于语言学的出现,有两种截然不同的理解:一种是个体发生(ontogenetic)的出现,指的是婴儿如何从其环境中获取语言的过程;一种是系统发生(phylogenetic)的出现,则认为我们的物种,现代人(Homo sapiens),如何从语言能力前的(prelinguistic)交流向我们今天使用的语言交流逐渐转变的过程。关于语言的系统发生的出现,已经有两个著名的假说:天赋论相信人类的语言才能必定是由与生俱来的、特有的语言特征决定的,这种假说已经成为语言学领域中的教条;涌现论假定进化力驱使某些一般领域的特征应用到语言中,驱使语言从原始形式变成现代复杂的、人类特有的形式。 虽然在人类语言方面两种假说持同样的进化观点,它们之间决定性的差异在于句法这一人类语言的重要特征,是由先天的、某领域特有的特征导致的,还是从某种领域的一般能力逐渐发展起来的。关于句法的起源,有两个值得注意的方案: (1) 先天句法是一个“引导(bootstrapping)”的方案,它坚持认为一种完整的、起源于词汇的语言,是通过由一种先天句法调节词语搭配发展而来。这一方案遵循天赋论假设。 (2)不带有先天句法的“公式化”的方案,它认为语言可能始于一个整体的信号系统,在这个系统中一个信号在整体上表示一种意义,而不存在能够传达其内部或本身意义的子部件。那么,假定在发音(或话语utterances)和含义中零星的、反复出现的成分引起了整体信号的分割 (将较长的、具有完整意义的发音表达分割成为具有意义成分的子音节的组合)并且导致了共享句法结构的聚合。通过这种分割,合成的语言逐渐出现,其中信号的意义是其意义要素的一种功能(结合)。 不带有先天句法的“公式化”方案得到下列论证的支持。首先,原始人类的认识系统也许不足以在他们经历环境事件时对于“行动的始作俑者”或是“经历一种行动的实体”产生清晰的概念。因此,在那个阶段,原始人类交流系统中的信号一定由许多整体项组成,类似于在灵长类动物和诸如鸟等其他动物的交流系统中所发现的那样,尽管它们的性质可能是十分不同的;第二,检测类似模式和给这些项排序是人类和其他动物共有的两种一般领域的能力,尽管这些能力的实际水平是不同的。例如,排序能力作为一种认知的预处置在语言能力前(prelanguage)的婴儿和其他灵长类动物中已被证明。据此,在人类领会合成的语义概念之后,可能会有一个发展的阶段,在这一阶段,早期的原始人类开始检测到解码合成含义和偶然出现在整体信号中的递归模式,并且把这些模式分割成单词。此后,排序能力被用来调节这些词汇以表达复杂的含意,使确定的序列有可能成为惯例的、占统治地位的词序,即简单句法的涌现。最后,在没有任何外部指导或先天语言特定的先决条件下,从整体到分解的这一发展过程,在孩子的第一和第二语言习得中已被证明。总之,这一方案从某种一般领域的能力提供句法涌现的一种起源,而更多的语言学家逐渐相信语言中的文法规则更可能是由于语言的使用而产生的惯例化的结果形成的,而不是作为先天的特殊语法模块的结果而形成的。 除上述理论上和经验性的争论之外,计算建模最近已努力作为一种有效的方法学来学习语言