admin管理员组

文章数量:1532275

2023年12月21日发(作者:)

词汇识别的双通道交互激活模型及ERP研究

侯友;白学军

【摘 要】The Bi-modal Interactive Activation Model (BIAM) is the most

complete model of the word recognition theory. In this review,we

introduced the general characteristics of BIAM model and its mechanism

to explain the visual word recognition. We also described a series of

components of event related potential (ERP) with related to reflect the

component processes in the model, including N/P150,N250, P325,N400.

Finally,the future direction in the field of visual word recognition was put

forward.%双通道交互激活模型(BIAM模型)是目前词汇识别理论中最为完整的模型.介绍了BIAM模型的一般特点及其对视觉词汇识别的解释机制,对围绕该模型进行的ERP研究所获得的成分的心理意义进行了阐述,主要包括N/P150,N250,P325,N400,并提出了今后的研究方向.

【期刊名称】《内蒙古师范大学学报(自然科学汉文版)》

【年(卷),期】2013(042)001

【总页数】6页(P99-104)

【关键词】双通道交互激活模型;N/P150;N250;P325;N400

【作 者】侯友;白学军

【作者单位】天津师范大学心理与行为研究院,天津300074

【正文语种】中 文

【中图分类】G449

在阅读过程中,如何在短时内识别某个词汇是过去四十年来语言认知科学各种理论一直试图回答的问题[1].词汇识别(word recognition)是人们通过视觉或听觉,接受输入的词形或语音信息,最终通达语义的过程,这个过程涉及人类加工信息的基本认知过程.词汇识别的认知理论主要探讨形、音信息如何编码和表征,以及在语义通达过程中形、音信息的相互作用和关系.双通道交互激活模型(bi-modal interactive activation model,BIAM)是目前词汇识别中最为成功和全面的一个理论模型.该模型不仅能够解释视觉词汇的加工过程,而且能够解释听觉词汇以及默读、出声阅读过程中词汇的加工问题[2].本文阐述BIAM模型的基本理论和观点,在此基础上介绍近年来围绕该理论所进行的ERP研究,并对视觉词汇识别研究中所获得的ERP成分及心理意义进行分析和比较.

1 词汇识别的双通道交互激活模型

1.1 双通道交互激活模型的结构和特征

双通道交互激活模型源于传统双通道模型(dual rout model,DRC),最早由Grainger和Ferrand提出.为了使这一模型可以在各种词汇识别任务中更好地模拟人类的反应,研究者在DRC模型基础上增加了听觉通道的词汇认知加工过程,并在正字法表征和语音表征通道上分离出亚词汇水平和词汇水平,从而建构和完善了双通道交互激活模型[3].

如图1所示,BIAM模型是一个分等级的层级系统.词汇识别包括正字法加工和语音加工两条路径,每条路径自下而上依次为视觉特征(听觉特征)、亚词汇水平、词汇水平(整词水平)加工过程,最后通达语义.以视觉词汇识别为例,首先激活了刺激视觉特征群(V-features).视觉特征群接下来激活了亚词汇水平的正字法编码单元(O-units),紧接着这些激活的信息传至正字法和语音的中心交界面

(O⇔P),在该交界面亚词汇水平的正字法表征与所对应的语音表征形成相互映射,反之亦然.在这个系统中,正字法和语音可以在每条加工路径的不同节点建立连接.该模型的另一个特点是,最终语义系统的激活是正字法和语音的整词水平加工共同作用的结果.

图1 词汇识别的双通道交互激活模型Fig.1Architecture of a bi-model

interactive activation model of word recognition

1.2 双通道交互激活模型对词汇识别机制的解释

1.2.1 低水平视觉特征的加工 词汇识别的最初阶段是对特定字母串刺激的视觉特征群进行快速的元素分析,以计算方式确认字母特征及其排列位置.字母串中的每个字母识别都能同时、平行地进行.字母的识别和位置的确定呈现出“W”形曲线的趋势,处于中心注视点和首、尾位置的字母识别程度最高[4].字母离中心注视位置越远其视敏度就越低,受到相邻字母的干扰就越小.也有证据表明,字母识别中存在微弱的不对称性,位于左边的字母可能获得优先加工,Tydgat等[5]认为,这反映了词首字母的优势效应而不是从头到尾加工的等级趋势.

Grainger等[6]用“字母排列组合”(alphabetic array)来描述这一过程中众多字母检测器(letter detectors)的执行过程.这些字母检测器具有位置特定性,能将视觉特征特定结构的存在信息传递到视网膜上特定的位置.“字母排列组合”的主要功能是对特定字母在视网膜上成像的相对位置进行编码.这里并不指字母串中特定字母相对于其他字母的位置,因为每个字母都是单独进行加工的.因此,在“字母排列组合”水平的加工并不受字符串正字法规则的影响.然而,为了对特定词汇的识别,这种位置特定的映射必须转换成“以词汇为中心”的编码,这样与字符串内位置相联系的字母识别才能独立于空间的位置编码.这个过程沿着正字法加工和语音加工两条路径完成.

1.2.2 亚词汇水平的加工 从视觉特征到形态的加工到语义的通达,存在正字法加工

和语音加工两条路径.正字法加工路径(图1中的左半部分)依靠字母和字母组合达到唯一的整词水平的正字法表征.语音加工路径(图1中的右半部分)利用语音信息(音素和音素组合)达到唯一的整词水平的语音表征.这种特定的双通道模型认为,视觉词汇识别的一个关键动力系统是词汇识别的空间维度(大量的视觉对象)和时间维度(大量的出声语言)的组合.对于熟练的读者来说可能会很好地利用这种特定模型,利用空间维度的结构使正字法到语义的映射达到最优化,利用时间维度的结构使正字法到语音的映射达到最优化.

在正字法的加工路线中,首先是比较粗线条的正字法编码过程,以保证能够迅速地导向唯一的词汇识别和对应的语义表征(快速指向语义信息).语音加工路线是一个精细的加工过程,需要完成字母特征的计算(字母和字母的表征以及对应给定语言的音素)和其在字符串中精确的顺序.这些字母接下来激活对应的音素,接着依次激活适当的整词的语音表征和对应的语义表征[7].在这一水平上的加工,所有类型的正字法加工都是位置恒定,以词汇为中心表征的,因此字母识别的编码是指向词汇中的位置而不是他们的空间位置.字形的编码采用一种标准的类似早先出声阅读中使用的双路线模型的从头到尾位置编码.相反,粗线条的编码采用连续和非连续字母顺序配对的方式.

1.3 双通道交互激活模型对语音加工的解释

传统的双通道模型无法解释快速掩蔽语音启动效应[8].根据Ziegler等[9]对词汇识别时间进程的分析,相对于正字法编码的激活,语音编码落后约20~30ms.这对于传统的双通道模型来说,语音加工的太快了,该模型认为亚词汇的语音表征通过语音输出来影响词汇的识别过程,也就是说音素表征主要作用于大声朗读而不是词汇理解.BIAM模型则认为亚词汇水平的语音信息对词汇识别的影响主要是通过语音输入过程,也就是说语音表征涉及词汇识别的过程.语音表征能够迅速激活随后的视觉词汇的表征,但是这种激活需要一个额外的与正字法加工路径核证的过

程,这样就使字母与音素形成映射.因此BIAM模型可以正确预测快速语音启动效应稍落后于正字法启动效应.

2 词汇识别与ERP研究

事件相关脑电位(ERP)技术具有精确的时间分辨率,通过特定的实验设计能够将语言的形态加工与语义加工过程分离,通过电位模式的对比考察不同实验条件下词汇加工的基本特征.ERP技术也是研究认知自动加工过程的理想工具.近来研究者将快速掩蔽启动范式与ERP技术结合来考察词汇识别的基本认知过程,成功分离出不同的ERP成分,主要包括N/P150、N250、P325和N400.

2.1 N/P150成分

N/P150是一个具有相同时间窗口的双极性脑电成分.P150主要分布在头皮靠后的枕区部分,且在右半球的波幅较大.重复启动条件下比无关条件下P150的波幅更正一些.与此相反,N150主要分布在头皮的前部.两种成分也许没有相同的产生机制,但就目前的研究数据来看,它们可能反映了相似的反应,因此将其初步划归为相同的ERP成分[1].

N/P150成分可能反映了启动刺激和目标刺激的重复程度,当目标刺激和启动刺激的每个字母在相同位置重复时效应最大,这种效应大小受字母重复程度的调节.使用多种实验材料的研究均证明了这种效应.Petit等[10]以单个字母为研究对象,发现当启动字母和目标字母不匹配时激活的N/P150的波幅显著偏大,尤其是在启动和目标刺激所采用大、小字母的物理特征不匹配时能激活更大的N/P150成分(例如:A-A vs a-A;C-C vs c-C).Eddy等[11]以图片为实验材料,发现相对于重复呈现的图片而言,当启动刺激和目标刺激的图片在物理特征上不同时,在头皮的后部和前部分别发现一个早期的正成分和负成分.图片条件下的N/P150成分和先前采用文字和字母材料研究发现的N/P150成分具有类似的极性、时间进程和头皮分布,只不过是图片材料的潜伏期较迟(大约在190ms)、波幅

更大.

Chauncey等[12]通过操纵启动刺激和目标刺激的字号(大vs.小)和字体(相同vs.不同),结果发现,字体的改变影响重复启动中N/P150的波幅变化;字号和重复启动的交互作用在N/P150成分上没有体现.更具体地说,N/P150成分的重复启动效应不受字号大小的影响而受字体的影响,说明N/P150反映了视觉特征水平大小恒定性的加工过程.Dufau等[13]以字符串为刺激材料,发现启动刺激和目标刺激字母位置的改变也影响N/P150成分.

总之,N/P150成分受启动和目标刺激物理特征重叠水平的调节,它反映了词汇识别中早期视觉特征(BIAM 模型中的“V-features”)的加工过程.

2.2 N250成分

N250是一个从170ms开始出现,到250ms达到峰值的负走向成分.这个成分同样受到词汇掩蔽重复启动的影响,无关启动比重复启动诱发的N250更负,称之为N250效应[14].N250可以分离出两个时间窗口,第1个时间窗口主要反映了正字法的加工,第2个窗口反映了语音的加工.N250成分具有较广泛的头皮分布,且在头皮的额区和大脑左半球前部具有较大波幅.

N250成分受到启动刺激和目标刺激共享字母数多少的影响.与完全重复启动相比,当目标刺激稍作改变(如改变词汇中一个字母,tebal-TABLE)时就能诱发更负的N250[15].N250对启动刺激词汇中字母位置的轻微移动并不敏感,这说明N250反应了BIAM模型中位于视网膜特定区域特征字母加工之后的正字法和语音路径的加工过程,可能涉及从字母到整词形态表征映射的亚词汇水平的正字法和语音表征.

Grainger等[3]发现了语音启动的N250效应.在他们的研究中,启动刺激为与目标刺激语音重复、正字法匹配的假词(如bakon-BACON vs bafon-BACON),结果发现,与控制条件相比,目标词呈现225ms后假同音词启动导

致N250(包括N400)波幅显著减小.他们还比较了语音启动和词汇字母位置更改的启动效应(如barin-BRAIN vs bosin-BRAIN),结果在语音启动之前出现了明显的位置改变启动效应.通过操纵字母位置获得的N250启动效应在目标刺激呈现之后的200ms就能出现,相对于分布在头皮前部并且出现较晚的语音启动效应,位置的启动效应在大脑后部具有明确的分布.Carreiras等[16]成功地分离了元音和辅音的启动效应,辅音的N250效应出现的相对较早,而元音的效应相对靠后.这种差别反映了具有不同语言学属性的元音和辅音细微差别的精细化加工过程.

2.3 P325成分

Holcomb等[15]在研究词汇识别的时间进程中,首次发现刺激呈现后325ms时出现了一个正成分,称之为P325,位于N250和N400之间,波幅在325ms时达到峰值,主要分布在右半球后部靠左的部位.P325也受刺激重复程度的调节,但只有在完全重复启动的条件下波幅更正,部分启动和无关启动之间波幅没有差异.P325反映了内在的整词水平表征的加工过程.

Kiyonaga等[17]也发现了这一成分,重复启动的波幅显著大于无关启动的波幅,然而假词重复启动和假词无关启动激活的波幅没有差异,因为假词没有词汇水平的表征过程,所以在整词的内部表征加工过程中就不会产生重复效应.Grainger等[18]发现了假同音词启动的P325效应,证明该成分既反映了整词水平语音表征的加工也反映了整词水平正字法表征的加工(BIAM模型中的O-words和P-words部分).早先的研究者利用ERP和MEG技术也在与P325相同的时间窗口发现了类似的成分,认为这一成分反映了词汇水平的识别.

2.4 N400成分

N400成分最初由Kutas和Hillyard(1980)报道,是目前语言研究所公认的反映语义加工的脑电成分.N400的波幅与刺激的词汇或者语义属性和背景的关系有

关,语义违反条件下诱发的N400波幅更负.

在词汇识别中,N400是否反映词汇的自动加工过程尚存争论.Brown等[19]最先探讨了语义启动中无意识加工/自动激活对N400的影响问题.他们分别对语义启动刺激进行了掩蔽和非掩蔽,结果发现,N400效应只有在非掩蔽条件下才受到调节,由此认为N400反映了高度有序化(有意识)的语义整合过程(或者叫词汇后的加工过程),而不是自动的词汇通达过程.后来的研究[20]发现,在掩蔽语义启动的条件下也有明显的N400效应,并认为N400反映了词汇加工中的自动激活过程,对早先的结论提出了挑战,并且在较短的SOA条件下也观察到了N400的掩蔽启动效应,N400可以反映词汇的无意识自动加工过程.

另一种观点认为,N400可能反映了词汇识别中形-义连接的加工过程.Holcomb等[21]通过操纵目标词汇正字法邻居词汇的多少,发现正字法邻居多的词汇比正字法邻居少的词汇所诱发的N400波幅明显偏负.所以N400不仅反映了词汇的整体激活,还部分地反映了形-义连接的加工过程.Massol等[22]探讨了真词和假词的正字法邻居启动效应,进一步证明N400反映了整词水平的表征到语义表征的映射.按照BIAM模型的观点,这种整合发生在整词正字法和语音表征(O-words,P-words)与更高水平的语义表征(S-units)之间.N400反映了这些水平之间形成联结的强弱程度,波幅越大说明联结越困难.

也有研究者[23]认为N400并不是反映了词汇后加工的语义整合过程,也不是直接地反映了单一的自动激活过程,而是受到启动刺激自动激活的调节,这种调节作用反映了目标刺激的加工过程中从启动刺激获取的字形信息或语义信息对形-义连接的影响.

3 结语

双通道交互激活模型主要是基于拼音文字提出的,它成功地解释了拼音文字阅读(默读和朗读)过程中词汇识别的认知过程,是目前最为完整的认知模型.采用

ERP技术探讨词汇识别的认知过程,深化了人们对语言加工脑机制的认识.不同的ERP成分为揭示词汇识别的不同过程和不同阶段提供了具体的指标,但各脑电成分的心理学意义尚未达到一致认识.今后的研究需从以下几方面拓展.

首先,进行跨语言、跨文化的研究.以英语为代表的拼音文字存在明确的形音对应规则,BIAM模型对这类语言的加工给予了合理的解释.近来的研究[24-25]发现,汉语词汇识别过程中可能并不存在明显的语音加工路径,或者说N250成分并不受语音的影响.蒙语词汇识别的过程中,语音的加工要早于正字法的加工[26].还有研究[27]表明,汉语的词汇加工存在整体优先加工效应,所以不同语言加工的普遍性和差异性问题还有待进一步研究.

其次,采用多范式和多技术进行研究.采用ERP的研究大多以词汇为单位结合启动范式进行研究,而ERP如何反映自然语言加工过程还未澄清,有必要采用能反映语言即时加工过程的其他范式和技术进行研究,如眼动追踪技术.

最后,按照前述BIAM模型的观点,语音加工能够诱发N250成分.Braun等[28]则认为早期的P150成分可能反映了早期的语音加工.Sauseng等[29]也认为早期的N/P160成分反映了语音的加工过程.因此对不同实验条件下获得的ERP成分的心理意义还待深入研究.

参考文献:

[1] Grainger J,Holcomb P ng the word go by:On the time-course of component processes in visual word recognition[J].Language

and Linguist Compass,2009,3(1):128-156.

[2] Diependaele K,Ziegler J C,Grainger phonology and the

Bimodal Interactive Activation Model[J].European Journal of Cognitive

Psychology,2010,22(5):764-778.

[3] Grainger J,Diependaele K,Spinelli E,et repetition and

phonological priming within and across modalities[J].Journal of

Experimental Psychology:Learning,Memory,and Cognition,2003,29(6):1256-1269.

[4] Stevens M,Grainger visibility and the viewing position effect

in visual word recognition[J].Perception and Psychophysics,2003,65:133-151.

[5] Tydgat I,Grainger position effects in the identification of

letters,symbols,and digits[J].Journal of Experimental Psychology:Human Perception and Performance,2009,35(2):480-498.

[6] Grainger J,Van Heuven ng letter position coding in

printed word perception[C]//Bonin Mental York:Nova Science Publishers,2003:1-24.

[7] Perry C,Ziegler J C,Zorzi incremental modeling in the

development of computational theories:The CDP+model of reading

aloud[J].Psychological Review,2007,114:273-315.

[8] Frost R,Ahissar M,Gotesman R,et phonological effects

fragile?The effect of luminance and exposure duration on form priming

and phonological priming[J].Journal of Memory and Language,2003,48:346-378.

[9] Ziegler J,Ferrand L,Jacobs A M,et and phonological

codes in letter and word recognition:Evidence from incremental priming[J].Quarterly Journal of Experimental Psychology,2000,53A:671-92.

[10] Petit J,Grainger J,Midgley K J,et the time-course of

processing in letter perception:A masked priming ERP investigation

[J].Psychonomic Bulletin and Review,2006,13:674-681.

[11] Eddy M,Schmid A,Holcomb P J.A new approach to tracking the

time-course of object perception:Masked repetition priming and event-related brain potentials[J].Psychophysiology,2006,43:564-568.

[12] Chauncey K,Holcomb P J,Grainger s of stimulus font and

size on masked repetition priming:An ERP investigation[J].Language

and Cognitive Processes,2008,23:183-200.

[13] Dufau S,Grainger J,Holcomb P ERP investigation of location

invariance in masked Repetition Priming [J].Cognitive,Affective and

Behavioral Neuroscience,2008(8):222-228.

[14] Holcomb P J,Grainger ing the temporal dynamics of visual

word recognition in the masked repetition priming paradigm using event-related potentials[J].Brain Research,2007,1180(5):39-58.

[15] Holcomb P J,Grainger time-course of masked repetition

priming:An event-related brain potential investigation[J].Journal of

Cognitive Neuroscience,2006,18:1631-1643.

[16] Carreiras M,Duñabeitia J A,Molinaro ants and vowels

contribute differently to visual word recognition:ERPs of relative position

priming[J].Cerebral Cortex,2009,19(11):2659-2670.

[17] Kiyonaga K,Midgley K J,Holcomb P J,et cross-modal repetition priming:An ERP investigation [J].Language and

Cognitive Processes,2007,22:337-376.

[18] Grainger J,Kiyonaga K,Holcomb P time-course of

orthographic and phonological code activation[J].Psychological Science,

2006,17:1021-1026.

[19] Brown C,Hagoort processing nature of the N400:evidence

from masked priming [J].Journal of Cognitive Neuroscience,1993,5(1):34-44.

[20] Grossi,dness proportion effects on masked associative

priming:An ERP study[J].Psychophysiology,2006,43:21-30.

[21] Holcomb P J,O’Rourke T,Grainger event-related brain

potential study of orthographic similarity[J].Journal of Cognitive

Neuroscience,2002,14:938-950.

[22] Massol S,Grainger J,Dufau S,et priming from

orthographic neighbors:An ERP investigation[J].Journal of

Experimental Psychology:Human Perception and Performance,2010,36(1):162-174.

[23] Holcomb P J,Anderson A,Grainger electrophysiological

investigation of cross-modal repetition priming at different stimulus

onset asynchronies[J].Psychophysiology,2005,42:493-507.

[24] 张学新,方卓,杜英春.等.顶中区 N200:一个中文视觉词汇识别特有的脑电反应 [J].科学通报,2012,57(5):332-347.

[25] 侯友,白学军.词汇识别中语音激活的时间进程及作用:来自ERP的证据

[J].内蒙古师范大学学报:自然科学汉文版,2012,41(1):51-57.

[26] 侯友,白学军,沈德立.等.蒙语词汇识别中语音自动激活的 ERP研究

[J].心理与行为研究,2012,10(3):177-182.

[27] 黄鹤,王权红,梁珊珊,等.视觉中文词汇识别的整体优先效应和词内核证原则:来自ERP的证据 [J].现代生物医学进展,2009,9(2):322-326.

[28] Braun M,Hutzler F,Ziegler J,et homophone effects

provide evidence of early lexico-phonological processing in visual word

recognition[J].Human Brain Mapping,2009,30(7):1977-1989.

[29] Sauseng P,Bergmann J,Wimmer does the brain register

deviances from standard word spellings?An ERP study[J].Cognition

Brain Reseach,2004,20:529-532.

本文标签: 词汇启动字母识别加工