Általános Nyelvészeti Tanulmányok XXV - PDF Free Download (2024)

Általános Nyelvészeti Tanulmányok XXV.

Alapító főszerkesztő: Telegdi Zsigmond 1963–1995 (I–XVIII.) Alapító társszerkesztő: Szépe György 1964–1995 Főszerkesztő: Kiefer Ferenc 1998–2008 (XIX–XXII.)

Szerkesztőbizottság Ackerman, Farrell | University of California at San Diego, CA, USA É. Kiss Katalin | MTA Nyelvtudományi Intézet, Budapest Hunyadi László | Debreceni Egyetem, Debrecen Kecskés István | State University of New York, Albany, NY, USA Kiefer Ferenc (tiszteletbeli tag) | MTA Nyelvtudományi Intézet, Budapest Lipták Anikó | Universiteit Leiden, Leiden, Hollandia Molnár Valéria | Universitet Lund, Lund, Svédország Moravcsik, Edith A. | University of Wisconsin-Milwaukee, Milwaukee, WI, USA ˝ Pléh Csaba | Eszterházy Károly Foiskola, Eger

Sherwood, Peter A. | University of North Carolina, Chapel Hill, NC, USA Szabó Zoltán | Yale University, New Haven, CT, USA Szépe György

| Pécsi Tudományegyetem, Pécs

Vago, Robert M. | City University of New York, New York, NY, USA

Technikai szerkesztő: Siptár Péter

Általános Nyelvészeti Tanulmányok XXV. A kognitív szempont a nyelv pszichológiájában Főszerkesztő:

Kenesei István Szerkesztette:

Pléh Csaba

Akadémiai Kiadó, Budapest

A kiadvány a Magyar Tudományos Akadémia támogatásával készült

ISBN      Kiadja az Akadémiai Kiadó, az 1795-ben alapított Magyar Könyvkiadók és Könyvterjesztők Egyesülésének tagja 1117 Budapest, Prielle Kornélia u. 21–35. www.akademiaikiado.hu Első magyar nyelvű kiadás: 2013 © Akadémiai Kiadó, 2013 A kiadásért felelős az Akadémiai Kiadó Zrt. igazgatója Felelős szerkesztő: Vajda Lőrinc Termékmenedzser: Egri Róbert A számítógépes szerkesztés G. Kiss Zoltán munkája LATEX ε rendszerrel A nyomdai munkálatokat a Prime Rate Kft. végezte Felelős vezető: Tomcsányi Péter Budapest, 2013 Kiadványszám: TK Megjelent 39,5 (A/) ív terjedelemben HU ISSN - Minden jog fenntartva, beleértve a sokszorosítás, a nyilvános előadás, a rádió- és televízióadás, valamint a fordítás jogát, az egyes fejezeteket illetően is. Printed in Hungary

Tartalomjegyzék Szerkesztői bevezetés (Pléh Csaba) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

A kognitív szempont a nyelv átfogó értelmezésében: nyelv, megismerés és agy Kenesei István: A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  Pléh Csaba – Thuma Orsolya: A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső: Szavak és memória: a komplex morfológiájú szavak feldolgozásának kapcsolata a munkamemóriával . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . .  Mády Katalin: A beszédpercepció helye a teljes megértési folyamatban . . . . . . . . . . . . .  Prószéky Gábor – Miháltz Márton – Kuti Judit: Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán . . . . . . . . . . . . . . . . . . . . . . .  A kognitív szempont a fejlődésben Kis Anna – Miklósi Ádám – Topál József: Kutya, ember, csimpánz: kognitív szempontok a fajok kommunikációs eltéréseinek értelmezésében . . . . . . . . . .  Gervain Judit: Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban . . . . . . . . . . . . .  Kovács Ágnes Melinda: Korai kétnyelvűség és tudatelmélet: A kétnyelvűség előnyei a versengő mentális reprezentációk kezelésében . . . . . . . . . . .. . . . . . . .  A kognitív szempont a nyelvi zavarok értelmezésében Bánréti Zoltán – Szücs Márta – Mészáros Éva: Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban . . . . . . . . . . . . . . . . . .. . . . . . . .  Győri Miklós: Az irónia megértése autizmusban: egy kognitív pragmatikai modellhelyzet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . .  Kultúra, pragmatika és a nyelv kognitív modelljei Dan Sperber – Deirdre Wilson: A metafora leleplezése . . . . . . . . . . . . . . . . . . . . . . . . . . . .  Olivier Morin: A kulturális diffúzió és a kognitív vonzerő: a nyelvi változás kutatásának egy lehetséges kerete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .  Forgács Bálint: Agy és megismerés a figuratív nyelv megértésében . . . . . . . . . . . . . . . . .  Fekete István – Babarczy Anna: Kognitív templátumok és a valóság illesztése környezeti hangokra utaló nyelvi megértés során . . . . . . . . . . . . . . . . .. . . . . . . .  Főszerkesztői utószó . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 

Szerkesztői bevezetés Az utóbbi évtizedeknek, a huszadik század végének és a huszonegyedik század elejének egyik kulcsszava lett a kognitív. Ha megnézzük a webes forrásokat, 2013. június 12-én a Google 131 millió (!) találatot ad a cognitive jelzőre és 3 810 ezret a cognitive linguistics-re. Magyarul sem állunk éppen rosszul: a kognitív szóra 3 070 ezer, a kognitív nyelvészet szókapcsolatra 20 100 találatot kapunk ugyanezzel a keresővel. Olyan kifejezésről van itt szó, amely a 20. század második felében megjelenő vagy újra megjelenő megismerő emberkép révén vált központi szerepűvé. Sokértelmű lett a kognitív mint tudományos önmeghatározó vagy önjellemző jelző, amely a viselkedést előtérbe helyező korábbi emberképpel szemben vált dominánssá az amerikai társadalomtudományokban. Miközben tudományos kifejezésként is több értelmezési változata alakult ki ötven év alatt (l. Pléh 2013), köznyelvi sorsa is figyelemre méltó. Amikor közelebbről a nyelvre alkalmazzuk, érdemes elgondolkodnunk azon is, hogy az utóbbi fél évszázadban milyen sokféle jelentéstartalommal telítődött a kognitív szó a tudományos és a köznapi használatban egyaránt. Nyelvészként eltűnődhetünk e széles jelentésmező feltárása közben, hogy milyen oppozíciókban jelenik meg a kognitív jelző. Viselkedési vs. kognitív A kognitívat először is szembe szoktuk állítani a viselkedésivel, amely szembeállításban a kognitív eszmetörténetileg nagyjából egyenértékű a mentalisztikussal. A mind, mens, Geist kifejezéseknek két értelme volt a 19. századi eszmetörténeteben. Az abszolút szellem, mint Hegelnél, és az egyén gondolati működése, mint John Stuart Millnél. Amikor Chomsky és követői a mentalizmus kifejezést népszerűvé tették a modern nyelvészetben, a második hagyományhoz kapcsolódtak (Katz 1964; Chomsky 1968). Vagyis nem a személyek fölötti Geist értelmében vett mentalizmusra gondoltak; az ő mentalizmusuk pszichológiai volt abban az értelemben, hogy mintegy az egyes rendszerhasználók fejében helyezték el magát a nyelvi rendszert. A viselkedésivel szembeállított kognitív jelző arra utal, hogy az emberi viselkedés magyarázatában mind az ingereknek, mind a reagálásoknak

 csak egy belső modellre vonatkoztatva van értelmük. A nyelvre nézve – s ez a legszélesebb használata a kognitív jelzőnek, amely mára átvette a mentális helyét – annyit sugall, hogy maga a rendszer valahogyan helyet kap a használók fejében. Affektív vs. kognitív Egy másik szembeállítás az affektívvel állítja szembe a kognitív mozzanatot. Ez különösen népszerűvé vált a pszichológia utóbbi két évtizedében, amikor elkezdtek affektív pszichológiáról beszélni (Bányai–Varga 2012). Ebben a szembeállításban a kognitív valamiféle száraz, kontemplatív, hideg dolgot jelent, ezzel szemben az affektív az élmény valamilyen nedves, szaftos, vagy éppenséggel tüzes oldalát fejezi ki. Ez az, amit már Pascal megfogalmazott nevezetes Descarteskritikájában. Az embert szerinte nem úgy kell értelmeznünk, mint hideg és száraz megismerőt, hanem mint az élet értelmét kereső állandó kérdezőt. „A szívnek vannak érvei, miket nem ismer érvelő eszünk; ezt ezer dologból tudjuk” (Pascal 1660/1983, 138; Pődör László ford.) A nyelvszemléletre vonatkoztatva is él ez a kognitív–affektív szembeállítás, de a jelzők használatában beállt különös fordulattal. A kognitív nyelvészek egy jelentős tábora ebben a pszichológiai tekintetben „affektív nyelvészetet” művel. Hiszen a magukat kognitívnak deklaráló nyelvészek jó része azt hangsúlyozza, hogy az 1960-as években kibontakozott és mára klasszikussá vált Chomsky-követő mentalizmus túlzottan száraz, helyette olyan kognitív modellekre van szükség, amelyek a testi és az affektív elemet is beépítik a nyelv értelmezésébe: „nőkről, tűzről, s más veszélyes dolgokról” szólnak (Lakoff 1987). Ilyen értelemben az affektívet mint kognitív mozzanatot állítják előtérbe a kiterjesztett metaforaelméletek, Lakoff és Johnson (1980) munkájától egészen Kövecses (2005) koncepciójáig. Megismerés, érzelem és akarat Végül él a kognitív jelző a kanti triászra visszavezethető hármas szembeállításban is, ahol a kognitív, az affektív és a konatív áll egymással szemben (Hilgard 1980). Ha a triászból a kognitív–konatív szembeállítást tekintjük, akkor itt a passzivitás és aktivitás megkülönböztető szerepe ugrik elő a mai kognitív kutatás világában is. A klasszikus kognitív hozzáállás olyan reprezentációs nyelvszemlélet, amely leképezések kialakításaként és átalakításaként képzeli el a nyelv működését is. A konatív szemlélet viszont valamilyen értelemben beemeli a cselekvés mozzanatát. Az emberi elme egészében – s ezen belül a megismerés kutatásában is – a cselekvési oldalt állítja előtérbe, az elme „kezdeményező” aktivitása értelmében. A nyelven belül pedig a használati mozzanatot, a pragmatikát hangsúlyozza.

 Amikor a nyelvészetre – és tágabban: a nyelvre – alkalmazott kognitív szemléletet értelmezzük, tudnunk kell, hogy mindhárom fenti szembeállítás megjelenik a modern, a magát mindig alternatívaként beállító nyelvszemléletben.

A kognitív nyelvszemlélet változatai Az utolsó fél évszázad nyelvészetében is megjelent az az átfogó hatás, amely ugyanezen időszak humán tudományaiban és pszichológiájában kognitív forradalomként, vagy ha szerényebben akarunk fogalmazni, kognitív szemléletváltásként jelenik meg (l. Pléh 2013; Pléh et al. 2013). Természetesen van ennek egy végső absztrakt értelme, amelyben a nyelvet önálló és formaközpontú rendszernek tekintő chomskyánus felfogás maga is a kognitív hangsúlyeltolódás része, a Chomsky (1968) által oly vitriolosan bírált klasszikus viselkedéselvű leíró nyelvészettel szemben. Így értelmezi például a kognitív mozzanatot a nyelvészetben Kiefer (2000). Van azonban a kognitív kifejezésnek egy sajátos iskolát azonosító értelme is a nyelvészetben, amely éppen a Chomskyról való leválást fejezné ki, azt az igényt, hogy többel és másként szeretne foglalkozni, mint a Chomsky-követők. Ez a felfogás a kognitív nyelvészet kifejezést a nyelvészet bizonyos irányzatainak önazonosításában a Chomsky-követők megoldásaira adott reakcióként értelmezi. Három területen kezdi el ezt a reaktív építkezést. Ezt a hármasságot emeli ki a kognitív nyelvészet kézikönyve (Geeraerts–Cuyckens 2007), s Kövecses Zoltán és Benczes Réka (2010) magyar tankönyve is. Az önállóság helyett a fogalmi modelleket, a mondattan helyett a jelentést, a szerkezet helyett a használatot. Ezt hangsúlyozza a hazai irodalomban Bańczerowski (1999, 78) is: „A kognitív nyelvészek azt vallják, hogy az emberi nyelv megértésének a kulcsa az emberi megismerés folyamatainak a megértésében és modellálásában rejlik.” A. Megkérdőjelezi a nyelvészet önállóságát. A nyelvet az emberi megismerés (kogníció) általános rendszereinek egyikeként képzeli el, amelynek szabályszerűségeit az általános kognitív rendszer szabályszerűségei magyarázzák. B. Megkérdőjelezi a forma (ezen belül többnyire a szintaxis) központi szerepét, s az emberi nyelv – tényszerűségében nem tagadott – kreatív jellegét sokkal inkább a gondolati kombinatorika nyitottságára vezeti vissza. C. Általános mechanizmusokat állít előtérbe az elsajátításban, a tanulásban és a használatban is. Ahogy a Chomsky-követők az 1970-es évek elején hangsúlyozták, sajátos „kognitív ellenforradalmat” valósít meg abban

 az értelemben, hogy a nyelvet mint rendszert és a nyelv használatát egyaránt az akkorra már nem behaviorista tanuláselmélet és emlékezeti szerveződés rendszerében értelmezi. Ennek az általános kognitív szemléletmódnak számos grammatikai modell, illetve általános nyelvelméleti felfogás felel meg, amelyeket a magyar nyelvészetben is kiemelkedő formában művelnek. Bár kötetünk nem ezzel kapcsolatos, szeretném mégis röviden érinteni őket. A nyelv „erős fogalmi modelljei” Ezek a modellek valójában abból a nyelvészeti értelemben radikális feltevésből indulnak ki, amelynek lényege a szó szerinti és a metaforikus nyelvhasználat közötti különbségtétel megkérdőjelezése, és annak megmutatása, hogy a nyelv központi eleme a metaforikus típusú gondolatmenet. Ez az elképzelés a hagyományos, száraz mentalisztikus nyelvészet elkötelezettségeit vagy vélt elkötelezettségeit igyekszik kritizálni. Maga az elmélet is metaforikus azonban. Igyekszik feltárni, mint Lakoff és Johnson (1980; 1999) számos munkája tanúsítja, hogy valójában a nyelv mint rendszer működésében egy megtestesült világképet alkalmazunk. A saját testünkre vonatkozó modellek áthatják a nyelvi értelmezést, mint amikor beleszeretünk egy lányba, vagy kiábrándulunk egy fiúból. Mindenütt testi modellek és mindenütt az érzelem és a megismerés közötti áthatóság jellemző. Valójában minden mindennel összefügg, és a nyelv modellálása egy sajátos kulturális metaforarendszer visszaadása lenne. A hazai irodalomban ennek az iránynak legerőteljesebb képviselője Kövecses Zoltán (1990; 2005) munkássága. Lexikai-fogalmi modellek Valójában a nyelvészet szigorúbb irányzatai közül is minden lexikai indulású nyelvmodell egyben kognitív is, hiszen feltételez néhány alapelvet arról, hogy a nyelvet egybefonódott fogalmi és lexikai elvek irányítják. Ezekről átfogóan l. Kálmán et al. (2002) tankönyvét. A. A kijelentések átfogó struktúrája az egyes elemek kombinatorikai és megszorítási mozzanataira vezethető vissza. B. Sajátos áthallás van az emberi megismerés fogalmi modelljei és a nyelv szótári modelljei között. Ide tartoznak a különböző, a szavak megszorításaiból kiinduló mondattani modellek is Fillmore (1968)-tól kezdődően, de ide tartoznak a szemantikai emlékezet és a nyelv kapcsolatát előtérbe állító

 modellek Collins és Quilian (1968) hierarchikus keresési hálójától kezdve Kintschen keresztül (Kintsch 1974; Kintsch–Mangalath 2011) Tomasello (2003) használati elvű, szabályok helyett példányokból s példákból kiinduló nyelvfelfogásáig. Ezek a gondolatmenetek olyan fogalmi primitívumokból indulnak ki, amelyek valahonnan máshonnan adottak: nem a nyelvi tapasztalatból, hanem például preverbális megfigyelésekből származnak. A primitívumok magyarázatára más elmélet kell, például kulturális tanulás, evolúciós meghatározottságok, társas együttműködési elvek. Tehetjük őket kiindulóponttá, mint például Schank (1974; 1999) modelljeiben, s ezzel valójában egy sajátos fogalmi innátizmust képzelünk el, vagy magukat ezeket a primitívumokat is egyszerű tanulási modellek segítségével elsajátítottnak tekintjük, ahogy Tomasello (2003) felfogása teszi. Használati indítás Számos olyan kognitív modell is van, amely Grice (2011) és Sperber (Sperber–Wilson 1986) ihletésének megfelelően a nyelvi rendszert is a használat keretein keresztül próbálja meg értelmezni. Ezek a modellek néhány egyszerű elvből, a Grice-féle maximákból – vagy Sperbernél egyenesen egyetlen elvből, a relevancia elvéből – indulnak ki. Azt próbálják rekonstruálni, hogyan kapcsolódik a partner ahhoz, amit a másik mond. Feltételeznek egy igen erőteljesen működő kognitív gépezetet. Hiszen, ha csak a relevanciaelvnél maradunk, a relevancia állandó előtérbe állítása és működtetése kimerítően használja a partner emlékezeti rendszereit, illetve a partnernél feltételezetten meglévő következtetési modelleket. Ezek a használati indítások sajátosan összekapcsolódnak a gondolattulajdonítási modellekkel a modern pszichológiában. A nyelvészet területén ebben a keretben működik nálunk Tolcsvai Nagy Gábor (2001) vagy Kertész András (2004); a pszichológiában pedig tulajdonképpen ezt teszi a gondolattulajdonítási modelleket előtérbe állító csecsemőfejlődési iskola, Csibra Gergely és Gergely György (2007) munkáival.

A kognitív szemlélet a pszicholingvisztikában A kötetben nem a nyelvelmélet általános kérdéseire, hanem a nyelvhasználó pszichológiai mechanizmusaira vonatkozó kognitív modelleket és vizsgálódásokat mutatjuk be. A tanulmányok azt érzékeltetik, hogyan jelennek meg a kognitív

 modellek az egyéni nyelvhasználó földhözragadt megértési és fejlődési folyamataiban. Kötetünk tanulmányai azt próbálják megmutatni, hogy milyen módon jelennek meg a kognitív nyelvszemlélet alapkérdései az egyes nyelvhasználatokra vonatkoztatva. Ezekben a többnyire pszicholingvisztikai felvetésekben is megjelennek mindazok a témák, amelyek kérdésként a kognitív nyelvszemlélet egészét feszítik. A nyelv és a nyelvhasználat architektúrája Vajon hogyan épül fel az emberi nyelvi képesség rendszere s mik benne a vezető, illetve újító mozzanatok? Ilyen alapkérdés a nyelvi rendszer kreativitása. Kenesei István tanulmánya a kreativitás eltérő oldalait mutatja be, mint a nyelv mondattani, szemantikai és gondolattulajdonító kreativitásának kulcsát. Bánréti Zoltán és munkatársai is érintik ezt, amikor a nyelv fél évszázada definíciós jegyének tekintett rekurzió meghatározóit keresik. Pléh Csaba és Thuma Orsolya a feldolgozási architektúra kulcskérdéseként elemzik a megértés összetevőinek önállóságát (modularitás). Érvelésük szerint bár van moduláris feldolgozás, ez is szabályozott, s nem annyira automatikus, mint sokan szerették volna gondolni. A tudás szerepe a nyelvi feldolgozásban A pszicholingvisztikában ez a kérdéskör kapcsolódik mind az ún. alulról felfelé vs. felülről lefelé információáramlás kérdéséhez, mind a tudásforrások viszonyához, különösen a jelentés és a világismeret hatásához. Természetesen már a modularitás-tanulmány is érinti ezt. Mády Katalin a beszédészlelésben megjelenő szerkezeti és felülről lefelé érvényesülő hatásokat tekinti át. Heilmann Ágnes és munkatársai a morfológiai feldolgozásban mutatják meg a kölcsönhatásokat a nyelvi elemzés és a munkaemlékezet között. Prószéky Gábor és munkatársai analógiákat keresnek a lexikai mozzanat szerepében a nyelvtechnológiában és az emberi nyelvfeldolgozásban. Fekete István és Babarczy Anna pedig a nyelvi rendszer testi beágyazottságát mutatja meg, nem a metaforák újabb metaforákkal történő elemzésében, hanem a kísérleti eredmények nyelvén. Evolúció, fejlődés, a nyelv és az agy Mind a nyelv önállóságát, mind teljes kognitív és társas beágyazottságát képviselő felfogások központi szerepet adnak az evolúciós és az idegtudományi érvelésnek. Kis Anna és munkatársai a fajközi összehasonlítás segítségével mutatnak rá, hogy mi is lehet sajátosan nyelvi s mi átfogó kognitív eltérés az egyes fajok nyelvi képességeiben. Gervain Judit az evolúciós felvértezettséget újszülöttek nyelvi

 reakcióiban mutatja meg. Bánréti Zoltán, Szücs Márta és Mészáros Éva pedig az afázia komplex meghatározottságában. Heilmann és munkatársai a neurális eredetű emlékezetzavar és a nyelvi teljesítmény összevetésében mutatják meg a sajátosan humán neurális szerveződés sokirányú megalapozó szerepét. Forgács Bálint pedig a metafora-megértés féltekei viszonyait elemezve tárja fel idegtudományi és kísérleti lélektani eszközökkel, hogy a jobb félteke = metafora azonosítás nem tartható. A társas mozzanat a nyelvben A magyar kognitív pszichológia kitüntetett oldala a társas megismerés elemzése a gondolattulajdonító rendszereken keresztül. Kenesei és Bánréti és munkatársai írásaiban is megjelenik ez. Sperber és Wilson, valamint Morin átfogó dolgozataikban azt mutatják meg, hogy a relevanciaelmélet és az antropológiai módszer milyen sokat ad e társas tulajdonító rendszerek megértéséhez. Felfogásuk szerint ezek az emberi véleményintegráció és társas együttműködés általános értelmezési rendszerét ígérik, amelyben a nyelv „csupán” a legfontosabb felhasználó. Dan Sperbert és Olivier Morint hagyományteremtő szándékkel kérte fel a kötet szerkesztője itt közreadott írásaik elkészítésére. Mindketten a Középeurópai Egyetem Kognitív Tudományi Tanszékén dolgoznak már néhány éve, s így a hazai kognitív nyelvészeti szakmai élet szerves részét képezik. Legfőbb ideje, hogy ez magyar nyelvű fórumokon is megmutatkozzék. Kovács Ágnes megmutatja, hogy a korai kétnyelvűség a gondolattulajdonítás sajátosan korai éréséhez vezet, ez a korai érés azonban elvezetett ahhoz a kérdéshez is, nincsen-e már midannyiunknál meg korábban is ez a rendszer. Győri Miklós autisták pragmatikai zavarairól állapítja meg, mennyiben a gondolatolvasásnak s mennyiben a gondolati összefüggések megteremtésének zavarai vezetnek a gondjaikhoz.

Merre tovább? Van-e közvetlenül látható közeljövője a kognitív szemléletnek a nyelv kutatásában? A tartalmakat nehéz előre vetíteni, de néhány szerkezeti extrapoláció megkockáztatható: • Világosabban fogjuk látni, hogy az irányzat jellegű kognitív nyelvészet(ek) mellett létezik a tágabb kérdés is: megismerés és nyelv viszonya. • A kísérleti és korpuszmódszerek együtt vezetnek adatgazdagabb nyelvészethez a kognitív oldalon is.

 • A nyelvészet a maga finomabb jellemzéseivel segít kiegészíteni a neurolingvisztikai és modellálási törekvések leegyszerűsítéseit, mindig emlékeztetve a rendszer komplexitására. • A klinikai nyelvészet és a fővonalbeli idegtudomány újra összekapcsolódik a nyelv megértésében.

*** A szerkesztő köszöni Kenesei István sorozatszerkesztőnek a megelőlegezett bizalmat, a sok menet közbeni szakmai tanácsot, valamint Siptár Péter és G. Kiss Zoltán, a kiadó részéről pedig Vajda Lőrinc sokoldalú segítségét. A kötet szerkesztése során Lyonban a Collegium Lyon vendégszeretete támogatott. Az egri Eszterházy Károly Főiskolán pedig egy TÁMOP program. Mindkettejüknek köszönöm a kiváló munkafeltételeket és a bizalmat. A könyv a Társadalmi Megújulás Operatív Program IKT a tudás és tanulás világában – humán teljesítménytechnológiai (Human Performance Technology) kutatások és képzésfejlesztés címet viselő, TÁMOP-...C-//KONV- azonosító számú projekt keretében készült. A projekt az Európai Unió támogatásával, és az Európai Szociális Alap társfinanszírozásával valósult meg. Pléh Csaba Irodalom Bańczerowski, Janusz 1999. A kognitív nyelvészet alapelvei. Magyar Nyelvőr 123: 78–87. Bányai, Éva – Katalin Varga (szerk.) 2012. Affektív pszichológia. Budapest: Medicina Kiadó. Chomsky, Noam. 1968. Language and mind. New York: Harcourt, Brace & World. Collins, Alfred – Maurice Quilian 1968. How to make a language user? In: Endel Tulving – Wayne Donaldson (szerk.): Organization of memory. New York: Academic Press. 124–165. Csibra, Gergely – György Gergely (szerk.) 2007. Ember és kultúra. A kulturális tudás eredete és átadásának mechanizmusai. Budapest: Akadémiai Kiadó. Fillmore, Charles J. 1968. The case for case. In: Emmon Bach – Robert T. Harms (szerk.): Universals in linguistic theory. New York: Holt, Rinehart and Winston. 1–88. Geeraerts, Dirk – Hubert Cuyckens (szerk.) 2007. The Oxford handbook of cognitive linguistics. Oxford: Oxford University Press. Grice, H. Paul 2011. Tanulmányok a szavak életéről. Budapest: Gondolat. Hilgard, Ernest R. 1980. The trilogy of mind: Cognition, affection, and conation. Journal of the History of the Behavioral Sciences 16: 107–114.

 Katz, Jerrold J. 1964. Mentalism in linguistics. Language 40: 124–137. Kertész, András 2004. Cognitive semantics, and scientific knowledge. Amsterdam & Philadelphia: John Benjamins. Kiefer, Ferenc 2000. A kognitív nyelvészet: új paradigma? In: Csaba Pléh – György Kampis – Vilmos Csányi (szerk.): A megismeréskutatás útjai. Budapest: Akadémiai Kiadó. 120–144. Kintsch, Walter 1974. The representation of meaning in memory. Mahlah, NJ: Erlbaum. Kintsch, Walter – Peter Mangalath 2011. The construction of meaning. Topics in Cognitive Science 3: 346–370. Kálmán, László – Viktor Trón – Károly Varasdi (szerk.) 2002. Lexikalista elméletek a nyelvészetben. Budapest: Tinta Könyvkiadó. Kövecses, Zoltán 1990. Emotion concepts. Berlin & New York: Springer. Kövecses, Zoltán 2005. A metafora. Gyakorlati bevezetés a kognitív metaforaelméletbe. Budapest: TypoTEX. Kövecses, Zoltán – Réka Benczes 2010. Kognitív nyelvészet. Budapest: Akadémiai Kiadó. Lakoff, George 1987. Women, fire, and dangerous things: What categories reveal about the mind. Chicago: The University of Chicago Press. Lakoff, George – Mark Johnson 1980. Metaphors we live by. Chicago: The University of Chicago Press. Lakoff, George – Mark Johnson 1999. Philosophy in the flesh. The embodied mind and its challenge to western thought. New York: Basic Books. Pascal, Blaise 1660/1983. Gondolatok. Budapest: Gondolat. Pléh, Csaba 2013. A megismeréstudomány alapjai. Az embertől a gépig és vissza. Budapest: TypoTEX. Pléh, Csaba – Lilia Gurova – Ropolyi László (szerk.) 2013. New perspectives on the history of cognitive science. Budapest: Akadémiai Kiadó. Schank, Roger 1975. The structure of episodes in memory. In: Daniel G. Bobrow – Allan N. Collins (szerk.): Representation and understanding. New York: Academic Press. 237–27. Schank, Roger 1999. Dynamic memory revisited (2nd edition). Cambridge: Cambridge University Press. Sperber, Dan – Deirdre Wilson 1986/1995. Relevance: Communication and cognition. Cambridge MA & Oxford: Blackwell. Tolcsvai Nagy, Gábor 2001. A magyar nyelv szövegtana. Budapest: Nemzeti Tankönyvkiadó. Tomasello, Michael 2003. Constructing a language. A language based theory of language acquisition. Cambridge MA: Harvard University Press.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme* Kenesei István Magyar Tudományos Akadémia, Nyelvtudományi Intézet és Szegedi Tudományegyetem, Nyelvtudományi Doktori Iskola [emailprotected]

Kivonat: Az áttekintő tanulmány a nyelvészetben a közelmúltban lezajlott kognitív fordulat hátterébe a nyelv kreatív természetének kutatását állítja. A formai kreativitás, vagy más szóval a nyelvnek mind a szavak, mind a mondatok terén tapasztalt rekurzív jellege határozza meg a kreativitás további területeit, azaz a jelentésbeli és tudatelméletbeli kreativitást, lehetővé téve ezek korlátozatlan és változandó természetét. A szavak és mondatok szintjén bemutatott rekurzióval a nyelvben működő lokális, azaz kis távolságra ható viszonyokat és ezek idegrendszeri vonatkozásait illusztráljuk. A neurolingvisztikai kísérletek azt bizonyítják, hogy a jelentések metaforikus kiterjesztése természetes jelenség, amely nem ró terhet a mentális feldolgozás folyamataira, jóllehet a szó szerinti jelentéseket a metaforikusaktól különböző módon dolgozzuk fel. A mondatjelentések elsődlegesek a szójelentésekkel szemben, ámbár a mentális szótár alapelemei a szavak és nem a mondatok. A metaforák megértéséhez tudatelméletre van szükség, amely a gyermekekben a komplex mondattani szerkezetek elsajátításával egyidőben fejlődik ki, amit a mentális igékkel végzett „hamis vélekedés” tesztek mutatnak. A tudatelméleti szintek száma szoros kapcsolatot mutat a természetes nyelv mondattani komplexitásával is. Kulcsszavak: kreativitás, rekurzió, morfológia, szintaxis, jelentések, metaforák, tudatelmélet

. Bevezetés Ez a részben összefoglaló jellegű, részben új összefüggéseket felmutatni szándékozó tanulmány alapvetően a nyelvészet kognitív fordulatáról szól. Mielőtt ezt a kifejezést értelmezném, hadd utaljak vissza arra a megjelölésre, amellyel kezdő kutató koromban ismerkedtem meg, amikor „a filozófia nyelvi fordulatáról” * Köszönettel tartozom elsősorban Bánréti Zoltánnak, akivel a 2009. május 7-i budapesti MAKOG konferencián tartott előadásom egyes tételeit, illetve a jelen cikk kéziratát megbeszéltem, továbbá az ezen és a szegedi Kognitív struktúrák: Az interdiszciplinaritás lehetőségei és korlátai c. konferencián (2011. november 14.), valamint a Közép-európai Egyetem (CEU) Filozófia Tanszékén tartott előadásomon részt vett hallgatóságnak kérdéseikért és hozzászólásaikért, valamint Pléh Csabának, aki a jelen változat megírására biztatott, és Kertész Andrásnak, aki volt szíves ezt elolvasni és megjegyzéseket fűzni hozzá. Természetesen az esetleges tévedésekért a felelősség engem terhel. A tanulmány az OTKA NK  „Átfogó magyar nyelvtan” c. kutatásának keretében készült.



Kenesei István

beszéltek, és azt értették rajta, hogy a 19. század végén, a 20. század elején az addig főként metafizikai kérdésekkel foglalkozó filozófia egyszeriben felfedezte: ahhoz, hogy megértsük, miképpen vagyunk képesek a körülöttünk lévő világot és benne saját gondolatainkat, érzéseinket felfogni, a nyelv szerepét mindebben tisztáznunk kell.1 Ehhez a megújuláshoz hasonlítható az, ami a 20. század közepe óta a nyelvtudományban lezajlott: a korábban valamilyen módon, és leginkább egyfajta platonikus idea-szinten az embereken kívül létező nyelvtől jutottunk el addig, hogy az egyes ember agyában/tudatában/elméjében létező neurális folyamatok feltérképezésének a segítségével azonosítjuk a nyelvi jelenségeket. Itt jegyzem meg, hogy a „kognitív” legalább olyan általános varázsszó lett a nyelvészetben, mint például a „környezeti ártalom” az orvostudományban. A hazai nyelvészeti irodalomban tudomásom szerint Kertész (2000b) használta (és határozta meg) először „a nyelvészet kognitív fordulata” kifejezést, Winfried d’Avis (1998, 37) nyomán az alábbi módon: Amilyen bizonytalanok még ennek az új tudománynak az elméleti alapjai, annyira bizonyosak lehetünk születési évében: 1956. Akkor Chomsky, Newell és mások az MIT-n, egy információelméleti szimpóziumon találkoztak, és új alapokra helyezték a kogníció kutatását. Az újdonság abban rejlett, hogy megkísérelték az elme lényegére vonatkozó nagyon régi filozófiai kérdéseket az elme működésére vonatkozó kérdésekké átalakítani és interdiszciplinárisan és empirikus úton megválaszolni. Születési évéhez hasonlóan vitán felül áll az, hogy a kognitív tudományhoz a következő résztudományok tartoznak: nyelvészet, számítógéptudomány, pszichológia, neurobiológia és az elme filozófiája. (Kertész András fordítása)2 1 A filozófiatörténetben akár ironikus momentumnak is tekinthető, hogy az idézett megjelölést éppen annak a Richard Rortynak (1967) a cikkgyűjteménye tette széles körben ismertté, aki azután igen messzire távolodott a nyelvi fordulatot indukáló analitikus filozófiától. 2 L. még Kertész (2000a) és Kertész (2004, 14skk). A világhálón egyébként e kifejezésnek az első (angol nyelvű) említését – jóllehet nem a Kertésztől hivatkozott, illetve az általunk is elismert jelentésben – Ponterotto (1994) cikkében találtam. Mások, pl. Surányi (2009), későbbre teszik a „fordulat” időpontját. Annyi azonban bizonyos, hogy a Skinner-kritika (Chomsky 1959) után az Aspects (Chomsky 1965), de különösen a Language and mind (Chomsky 1968) idejére a (generatív) nyelvészet kognitív fordulata lezajlott. Annak idején a „hívószó” persze nem a kognitív, hanem a mentális volt, de ez az elmére/tudatra/szellemre utaló kifejezés nagyjából abban az értelemben volt akkoriban használatos, amelyre később a kognitív jelentése is kiterjedt. Itt nincs terem a könyvtárnyi Chomsky-kritikából Chomsky kognitív fordulatának (egyesek szerint nem is egy fordulatának) különféle időzítéseit, értékeléseit bemutatni, illetve vitatkozni velük, de l. pl. Hyman (2010, 292) sommás véleményét, aki szerint „Chomsky nagyúri módon tekint el az evolúciós elmélet főáramának kulcstételeitől” („Chomsky’s cavalier disregard for the key principles of maintstream evolutionary theory”), illetve „antiempirizmusa eltávolítja őt a kortárs pszichológiától, amely egyre inkább empirikussá válik” („his

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



Az utóbbi két évtizedben a kognitívnak nevezett kutatások jelentős mértékben elterjedtek, önmeghatározásukban egyrészt – és jellemzően a neuro-, pszicho-, illetve bioliongvisztikai irányzatok – a megismerési (azaz kognitív) folyamatokra visszavezetve a nyelvi jelenségeket, másrészt – és különösen a magát „kognitív nyelvészetnek” nevező irány – a nyelv formai tulajdonságait alapul vevő megközelítésekkel szemben a nyelv szimbolikus-konceptuális funkcióit állítva a középpontba.3 Ezért hát nem minden magát „kognitívnak” nevező nyelvészet tekinthető kognitívnak abban az értelemben, amelyben a fentiekben jellemeztük. A jelen tanulmányban a nyelvészet egy alaptézis-során keresztül illusztrálom tudományom kognitív fordulatát. Kiindulásként a következő tételt állítom fel: akár az emberi kommunikáció, akár a gondolatok kifejtése eszközeként fogjuk fel, a nyelv három, egymástól látszólag független téren teszi lehetővé és valósítja meg az új tartalmak megalkotását: (a) a forma, a szerkezetek területén; (b) a jelentések metaforikus kiterjesztésének, bővítésének területén; és (c) a más emberek (azaz nyelvhasználók) gondolatainak, tudattartalmainak az ábrázolásában (reprezentációjában). Az elsőt (a) szerkezeti vagy formai kreativitásnak, a másodikat (b) jelentésbeli kreativitásnak, a harmadikat (c) tudatelméleti kreativitásnak fogom hívni, és a mellett fogok érvelni, hogy e három különállónak gondolt tulajdonság végső soron összefügg: a jelentésbeli és a tudatelméleti kreativitás a nyelv formai kreativitásából vezethető le. Számos kezdeti bizonyítékkal és ezek alapján ígéretes érvekkel rendelkezünk az agykutatás előrehaladtával e tézisek vonatkozásában. Ha pedig ezek a feltevések helytállóak, akkor érdekes kutatási programokat lehet rájuk építeni.

. A formai kreativitás A mai nyelvtudomány Ferdinand de Saussure-től, azaz Saussure-nek a 20. század első évtizedeiben tartott genfi előadásaitól, illetve az 1916-ban megjelent Bevezetés-től kezdi az időszámítását – jó okkal. Ő foglalta össze és mondta ki anti-empiricism separates him from contemporary psychology, which is a maturing empirical discipline”), és akinek nyilvánvalóan nincs tudomása Hauser–Chomsky–Fitch (2002)ről, illetve az „empirizmus” és az „empirikus kutatás” közötti különbségről. 3 L. pl. Evans–Green (2006), illetve a magyar nyelvű irodalomból Banczerowski (1999) cikkét vagy Kertész–Pelyvás (2005) sokszínű tanulmánygyűjteményét.



Kenesei István

azokat az alaptételeket, amelyekre a modern nyelvtudomány mára jókorára növekedett építménye támaszkodik. Jelen írásom szempontjából számunkra legfontosabb tézise így szól: „A nyelv forma, nem szubsztancia.” Vagyis a nyelv alaptulajdonságait nem az általa közvetített tartalmakból, nem az alapfogalmaihoz: a szavakhoz, a kifejezésekhez, a mondatokhoz köthető jelentésekből, hanem alkotóelemeinek egymáshoz való kapcsolódási lehetőségeiből kell tudnunk meghatározni. Sokszor idézett sakk-analógiája szerint tulajdonképpen mindegy, hogy a bástyának milyen az alakja, hiszen akár egy papírdarabbal is helyettesíteni lehet, ha tudjuk, hogy milyen lépések vannak megengedve számára. Ez a hasonlat egyébként arra is jó, hogy a nyelv, azaz a nyelvi jel konvencionális és önkényes jellegét illusztráljuk vele: ugyanis a játékosoknak elég megállapodniuk abban, hogy a sakktáblán ezentúl mondjuk a kék színű papírfecni fogja a bástya szerepét „eljátszani” – és minden nyugodtan folyhat tovább. A múlt század első felében elterjedt strukturalizmus sok feladatot elvégzett, de sok alapkérdés megválaszolásával adós maradt. Hely hiányában és – követve az idézett analógiát – lóugrás szerint haladva, az egyik legfontosabb kérdés az, hogy tulajdonképpen mit is értünk a „nyelvi jel” kifejezésen? Nyilvánvaló, hogy mind Saussure, mind elődei, valamint közvetlen utódai a szót, majd – ahogy a strukturalista alapokon nyugvó kutatás előrehaladt és a fogalmak pontosabbá váltak – a morfémát tartották „a nyelvi jelnek”, hiszen ezek „a nyelv legkisebb jelentéshordozó egységei”. Ha például az (1) szósorban a nyuszi szót tigris-re cserélem, mindjárt más kép ugrik elénk. ()

Nyuszi ül a fűben.

És akkor is más jelentéssel van dolgunk, ha az ül szó helyett az ült szót használom, vagyis a (2) mondatot mondom ki. ()

Nyuszi ült a fűben.

Ekkor a múlt idő morfémáját adom hozzá, bár ilyenkor aligha tudok két különböző mentális képet vagy ideát hozzárendelni az eltérő állításokhoz.4 De ahhoz, hogy a -t elemnek morféma státuszt tulajdonítsunk, elég csak arra figyelnünk, hogy valóban van itt egyfajta jelentéskülönbség. Persze könnyű dolgunk van, amikor a nyuszi,a tigris, az ül típusú elemekkel, illetve ezeknek a jelentésével van dolgunk; becsukjuk a szemünket és máris látjuk 4 Itt kifejezetten mentális képről, nem pedig jelentésről van szó – bármit értsünk is az utóbbin, jóllehet alább igyekszem érinteni ezt a problémakört is.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



a megfelelő képet (bár egyáltalán nem mindegy, hogy nyuszi, tigris, vagy ember ül – vagy éppen egy szerencsés találat vagy jól sikerült poén „ül”, hiszen mindegyik valahogy másként „ül” – de erről majd később). Hanem amikor a múlt idő végződésének vagy a határozott névelőnek a jelentését kell elképzelnünk, már hiába zárjuk akármilyen szorosra a szemünket – nem valószínű, hogy bárki is látna valamit. Természetesen ezeknek is van jelentésük: épp az ő jelentésüket mutattuk be azzal, hogy az (1) és (2) mondatokat egymással szembeállítottuk, vagy azzal, ha a következő két mondatot állítjuk szembe: ()

a. Nyuszi ül a fűben. b. A nyuszi ül a fűben.

Erre is rövidesen visszatérek. Mint ismeretes, Saussure nagyszabású és rendkívül előremutató elveket fogalmazott meg. Pontos nyelvelemzési módszereket azonban nem fejlesztett ki: ilyeneket a már többször hivatkozott strukturalisták (Bloomfield 1933; Wells 1947; Harris 1951; Hockett 1958) dolgoztak ki – az előbb lazán bemutatott eljárások szerint. Nagyjából egy fél évszázaddal Saussure után azonban felbukkant egy 28 éves fiatalember, aki alapjaiban kérdőjelezte meg az addig általánosan elfogadott elveket és jelentősen átalakította a nyelvészet épületét. Noam Chomsky (1955) disszertációja, illetve az annak nyomán publikált vékony könyv (Chomsky 1957) a nyelv alapegységének a mondatot tekintette. Chomsky azt bizonyította be, hogy a mondatok száma korlátlanul növelhető. Egy rendkívül egyszerű demonstrációval bemutatta a nyelvnek azt a lényegi tulajdonságát, amelyet formális rekurzivitás néven ismerünk és itt olyan példákkal illusztrálhatunk, mint a tagmondatok sokszoros beágyazása (4a–b) vagy a birtokos szerkezetek ismételhetősége (5). ()

a. A diák azt mondta, hogy a tanár azt képzelte, hogy az igazgató tudta, hogy . . . b. A diák, aki látta a képet, amely ott volt, ahol az a ló állt, amely addig futott, ahol . . .

()

Anna szomszédja felesége gyereke (. . . ) tanárának a kalapja

A példák bizonyos értelemben primitívek, egyszerűek, legalábbis ami a tartalmukat illeti, de illusztrációnk célja pontosan ez: itt egy formai tulajdonságról van szó, amely azonban bármely tartalmat lehetővé tesz.5 A nyelv gyakorlatilag vég5 A rekurzivitás általános formai elvét nem mindenki fogadja el, l. pl. Everett (2005), továbbá Evans–Levinson (2009), valamint a tárgyban folytatott vitákat a Language 85. kötetében, illetve a Behavioral and Brain Sciences-ben az idézett cikket követően.



Kenesei István

telen tartalmi változatossága mögött pontosan ez a formai rekurzivitás, formai kreativitás húzódik meg. Erre vezethető vissza mindaz a lehetőség, amit a nyelv megvalósít. Az elmúlt évtizedekben kiteljesedett generatív nyelvelmélet egyetemes elveket kísérel meg felállítani, amelyekből az egyes nyelvek tulajdonságait kívánja levezetni. Ugyanakkor az ezek mögött az elvek mögött meghúzódó implicit tudást az emberi elmébe/tudatba/agyba helyezi és genetikailag kódoltan örökölhetőnek tartja. Egyrészt tehát evolúciós, másrészt kognitív-neurológiai hipotéziseket állít fel, szokásához híven igen erős állításokat megfogalmazva. Tekintsünk el most attól, hogy az igencsak apró részletekig terjedő kezdeti univerzális nyelvi elvek sora mára jelentősen lecsökkent, mind számukat, mind tartalmukat tekintve, és koncentráljunk arra, hogy milyen előnyökkel járt ez a folyamat. Rendkívül sok rendszerszerű megfigyeléssel, egy nyelven belüli és több nyelv közötti összefüggéssel lettünk okosabbak, számtalan új problémát fedeztünk fel, és minden válasz révén újabb és az előzőeknél is érdekesebb kérdéseket tudtunk feltenni. Emellett olyan kézzelfogható haszonnal is járt ez a folyamat, hogy például a korábban magába zárkózott nyelvészeti jelentéstan közvetlen kapcsolatba, mintegy szimbiózisba kerülhetett a tőle addig függetlenül fejlődő analitikus nyelvfilozófiával és logikával (gondoljunk csak vissza arra bizonyos „nyelvi fordulatra”) és új kutatási programokat valósíthatott meg (Kenesei 2003a). De hogyan működik ez a formális rendszer? Egy-egy mondat vagy főnévi kifejezés sok szóból álló bonyolult szerkezetű elemsorozat is lehet. Hol vannak a „szabályok”? Hova és hogyan van kódolva a rekurzivitás „alapképlete”? Az alábbiakban adott válaszaimban számos egyszerűsítéssel fogok élni, jónéhány részletkérdést elhanyagolok, miközben az elmélet főbb vonásait felvázolom. Ma úgy látjuk, hogy mindezek a tulajdonságok a „szavakban” vannak rögzítve – persze ezt is „egy csipet sóval” értjük, de kiindulásnak jó lesz a valódi szavakkal kezdenünk. Mit is tudunk, amikor ismerünk egy szót a nyelvünkben, pontosabban szólva az anyanyelvünkben? Mit tudunk például a kor, kár, kér, vagy a fut, olvas, gondol szavakról? Tisztában vagyunk először is a hangalakjukkal: ha például k betűvel (azaz /k/ hanggal, illetve fonémával) kezdődő szavakat keresünk, akkor felsorolhatjuk az első hármat. Aztán „implicit tudásként” minden anyanyelvi beszélő tudja, hogy a kor és a kár névszó és azon belül főnév, a kér meg ige. Van itt azonban egy csomó további tudás is, ami számunkra ennél érdekesebb. Honnan tudjuk például, hogy a (6b) mondat a jó és nem a (6a)? ()

a. *Kor, hogy elkéstél. b. Kár, hogy elkéstél.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



Nyilván onnan, hogy valahol a szó szótári jellemzésében rögzítve van az is, hogy a kor-hoz nem tartozhat ún. hogy kötőszós mellékmondat (rövidítve: HKM), a kárhoz viszont igen. Vagyis: a kár-nak lehet HKM vonzata, a kor-nak nem. Ugyanígy a fut-nak nincs HKM vonzata, a gondol-nak, az olvas-nak és a kér-nek van. Ráadásul az is rögzítve kell legyen, hogy a „Mit csináltál tegnap ötkor?” kérdésre olyasmit lehet válaszolni, mint (7a), de olyat nem, mint (7b). ()

Mit csináltál tegnap ötkor? a. Olvastam. b. *Gondoltam.

Azt is tudjuk, hogy a kár kétféle mondatvonzatot (HKM-et és főnévi igenevet: INF) enged meg, a kér csak egyet, de főnévi vonzatot (NP) csak a kér engedélyez, azaz ezek a szavak különbözőképpen szabják meg a vonzat kategóriáját. ()

a. Kár, hogy elmentél. b. Kár volt elmenni/elmenned. c. *Kár volt a távozásod.

()

a. Kértem, hogy elmenjél. b. *Kértem elmenni/elmenned. c. Kértem a távozásodat.

Sematikusan ezt így ábrázolhatjuk: 1. táblázat: Vonzatszerkezetek a szótárban

kár + HKM ☺

kár + INF ☺

kár + NP L

kér + HKM ☺

kér + INF L

kér + NP ☺

Ezen túl még azt is tudjuk, hogy bár mind a kér, mind a gondol HKM-et vonz, ezt nem egyformán teszik, pl.: ()

a. Kértem, hogy elmenjen/*elmegy/*elment. b. Gondoltam, hogy elmegy/elment/*elmenjen.

Azaz a vonzatot előíró szó nemcsak a vonzat kategóriáját, hanem a HKM modalitását is meghatározza. Természetesen az itt példaként felhozott szavak és vonzatok típusokat, azaz lexikális kategóriákat képviselnek, amelyekbe egyenként számos szó, illetve vonzatként számtalan, mert korlátlanul variálható kifejezés tartozik.



Kenesei István

Fogadjuk el tehát, hogy a vonzatokról szóló információk a szavakban vannak rögzítve. A következő kérdés akkor az, hogy milyen módon vannak ezek a tulajdonságok elraktározva? Az előbbi kár–kér példákban a vonzat főnévi vagy mondatszintű kategóriájára vonatkozó információk, majd a mondatvonzaton belül az, hogy a mondat vajon igeneves vagy ragozott igés mondat-e, illetve hogy ez utóbbinak milyen a modalitása – szóval mindezek a jellemzések feltevéseink szerint mindig egy szigorúan szoros, kis hatókörű vagy távolságú, szakszóval lokális viszonyban vannak kódolva, illetve ilyen lokális viszonyokban valósulnak meg. Az így felfogott szó mint a legkisebb lexikális egység az adott szerkezet meghatározó tagja, „feje”, amely azt írja elő, hogy az általa vonzatként megkövetelt szerkezet fejének, vagyis annak a szónak milyen tulajdonságai legyenek, amely meghatározza a vonzatszerkezet további jellegzetességeit. Amikor például a kár „fej” azt írja elő, hogy HKM kövesse, valami olyat tartalmaz, amit a (11)-ben mutatunk be. ()

kár, fnév, . . . , [

hogy] −kötmód

A kér pedig azt, amit a (12)-ben ábrázolunk. ()

kér, ige, . . . , [

hogy] +kötmód

A (11)–(12)-ben látható hogy kötőszó pedig maga a mellékmondati vonzat feje: ő határozza meg ezek után, hogy a mellékmondat kijelentő módban (elmegy/elment) vagy kötőmódban (elmenjen/menjen el) legyen, méghozzá ez esetben is úgy, hogy meghatározza az önálló lexikális címszóként felfogott mondatbeli igemód morfémáját, mint a következő szerkezet fejét. ()

hogy, mondatfej, +kötmód, . . . , [

mód] +kötmód

A mód morfémája azután előírja, hogy ige álljon mellette, az ige behozza a szerkezetbe a saját vonzatkeretét, és így tovább. A tanulság világos: egy szónak mindig csak a következő szerkezet fejéig kell „ellátnia”, annak a kategóriáját, illetve egyes formális jellemzőit kell megadnia. Onnan már a következő szó határozza meg a szerkezet további tulajdonságait.6 6 Valójában a grammatikában mindez „a fejéről a talpára állítva” működik: a nyelvtan rendszere mindig két szót, illetve egy szót és egyetlen kifejezést (szintagmát, frázist) kapcsol össze (egyesít, merge) a rajtuk jelzett tulajdonságok alapján és így „építi föl” az egyes mon-

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



De van egy további tanulság is: Az eddig „szavaknak” nevezett lexikális elemek között nemcsak az általunk hagyományosan szóként ismert egységek találhatók, nemcsak a testes jelentésű „valódi szavak”, hanem a lexikonban, a nyelv mentális szótárában rögzítendő minden olyan elem, amelynek vonzatszerkezetet kell tulajdonítanunk. Ezek közé pedig azok a grammatikai szavak, morfémák stb., újabb nevükön „funkcionális kategóriák” tartoznak, amelyeknek oroszlánrészük van a mondat „csontvázának” felépítésében. Ilyen például a névelő, a tagadószó, az igeidő, az igenév -ni végződése, az -e kérdőszó, a középfok -bb jele stb.7 Nekik, mint fentebb említettem, nincsen „kézzelfogható” jelentésük, továbbá az ő számuk nem szaporítható tetszés szerint, sőt vannak közöttük olyanok is, amelyek „láthatatlanok”, mint amikor elhagyjuk a kötőszót az ige mellől, vagy mint amilyen a jelen idő zérus alakú ragja a (14) példában. ()

Azt gondoltam, (hogy) holnap érkez--el

A mondatok szerkezete tehát az ilyen módon tágan értelmezett „szavakban” van rögzítve. Azaz a szavak vonzatkerete és további (itt most nem tárgyalt) tulajdonságai határozzák meg azt, hogy milyen formát ölt a mondat, milyen bonyolult lesz egy-egy mondat szerkezete. És – ismételjük – ehhez nincs másra szükség, csak arra, hogy egy szó „ellásson” a következő szóig, pontosabban egy „fej” a következő „fejig”. Hogy a két típusú szó között az agyi reprezentációjukban is van különbség, azt például Setola és Reilly (2005) tanulmánya is bizonyítja: szerintük a grammatikai, azaz a funkcionális elemek szigorúan a bal periszilviánus kéregben lévő sejt-együttesekben vannak jelen, míg a fogalmi jelentésű szavak kevésbé vannak féltekéhez, illetve a periszilviánus régióhoz kötve. A különféle szófaji kategóriákat a sejtegyüttesek különböző elhelyezkedésekben képviselik. Egyfelől az inkább a nyelvi szerepüket, semmint dolgokat vagy cselekvéseket tükröző jelentésű funkciószavakat kizárólag az erősen balféltekés együttesek képviselik, amelyek a Sylvius-árok körüli területekre korlátozódnak. Másfelől a tartalmas szavakat kevésbé oldalhoz kötött (lateralizált) együttesek képviselik, mind a Sylvius-árok körüli kérgen belül, mind azon kívül. (Setola–Reilly 2005, 252)8 datok szerkezetét. Az elemek közötti viszonyok szigorúan lokális jellege természetesen így is érvényesül. 7 Vö. pl. Roeper (2011), illetve a magyarra Kenesei (2008). 8 „Critically, different word categories are represented by cell assemblies with a different topography. On the one hand function words, whose meanings reflect their linguistic use rather than objects or actions, should be represented exclusively by strongly left-lateralised assemblies limited to the perisylvian cortices; on the other hand, content words should be represented by less lateralised assemblies, including neurons both within and outside the perisylvian regions.”



Kenesei István

A „szavakban” rögzített és a mai terminológiában edge feature-nek („széljegynek”) nevezett tulajdonságnak köszönhetően mindig két elemből rakunk össze egy újabb egységet, amely újabb egység ismét csak egy darab szóhoz vagy szerkezethez csatlakozhat, és így tovább. Az így kialakult szerkezetnek mindig van egy „uralkodó” tagja, amelyet a szerkezet „fejének” hívunk. A „széljegyek” létrejötte Chomsky szerint a nyelvi evolúció egyik legfontosabb eseménye volt (Chomsky 2005; Piattelli-Palmarini 2008). Mielőtt a szó és a mondat viszonyát tovább vizsgálnánk, tekintsük a szavaknak azt a tulajdonságát, amely rokonítja őket a mondatokkal. A szavakat ugyanis látszólag éppúgy lehet szaporítani, ahogy mondatokat. Ráadásul a nyelvhasználó egész életében képes új szavak megtanulására, illetve megalkotására, és ez is a mondatokhoz köthető formai kreativitásra emlékeztet bennünket. A szóalkotás formai eljárásai jól szabályozottak: vannak termékeny képzők, pl. cipő, cipőzik, cipőzés, cipőtlen, cipőtlenít, cipőtlenítés stb. (bármit jelentsen is némelyikük), illetve termékeny szóösszetételi eljárások, mint amiket a közrémületben álló főszemély aláhúzott elemei9 vagy a négyéves gyerek alkotta óracukor szó mutat be.10 Figyeljük meg azonban, hogy a szóalkotási eljárások is mindig csak két elemet raknak össze, akárhány elemből álljon is a végeredmény. És persze a termékeny szóalkotási eljárások is különbséget tesznek a szerkezet feje és másik tagja között: a merevlemez az lemez, a számítógép-merevlemez pedig merevlemez (és a számítógép pedig gép): a magyarban mindig a jobb oldalon áll a szóösszetétel feje. A nyelven belüli szóalkotás továbbá kiegészülhet a máshonnan származó szavak befogadásával, a rulez-től a torrent-ig. Erre az eljárásra a nyelvek általában teljesen nyitottak: vagy olyan módon, hogy saját hangrendszerükbe illesztik az idegen szót, vagy pedig úgy, hogy tükörfordításokat alkalmaznak, mint amilyen a németből átvett felad, feladat.11 A szavak azonban mégis máshogy korlátozatlanok, mint a mondatok: a szavak esetében a rekurzivitásnak vannak, ha pontosan nem is megadható, de jól érzékelhető korlátai – nyilvánvalóan azért, mert a szavakra emlékeznünk kell, illetve emlékezni tudunk, a mondatokra pedig nem. A szavakat el kell tudnunk raktározni a tartós (nyelvi) memóriában, a mondatokat nem, illetve amely mondatokat pedig elraktározunk, pl. a közmondásokat, azokat nyilván a szavakhoz 9 A kifejezés Kertész Imre Az angol lobogó c. művéből származik. 10 Kézenfekvő, de önmagától talán nem adódó jelentése: a tic-tac néven ismert mentolos cukorka. 11 Sally McConnell-Ginet (2008) áttekintése – más szempontból – sok példát ad a szavak és jelentéseik itt röviden összefoglalt tulajdonságaira.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



vagy a több szót magába foglaló ún. állandósult szókapcsolatokhoz (pl. elhúzza a csíkot) hasonlóan rögzítjük a memóriánkban. Ennélfogva a szavak részei a mentális szótárnak, míg a mondatok nem. (Ez még akkor is igaz, ha bármikor alkothatunk új szavakat, pl. (az utasok) lecipőtleníthetetlenség(e) – gondoljunk például újabbkori repülőtéri kalandjainkra.) Ráadásul a nyelv formai kreativitásának nem előfeltétele a szavak szabad megalkotásának tulajdonsága: könnyen el tudunk képzelni olyan nyelvet, amely nem rendelkezik szóalkotási eljárásokkal, de a mondatszerkezet rekurzív jellege tökéletesen elegendő a korlátlan számú mondat létrehozásához. Éppenséggel a szélsőségesen analitikus nyelvek, pl. a kínai vagy a vietnámi, nagyjából ebbe a típusba tartoznak. A szóalkotás kreativitása ilyenformán tehát másodlagos a mondatéhoz képest.

. A jelentésbeli kreativitás A szavak nemcsak formai-szerkezeti vonatkozásban másodlagosak a mondathoz képest. Hivatkoztunk már arra, hogy a közkeletű elképzelés szerint a grammatikai szavak jelentése nem ragadható meg, szemben az ún. fogalmi jelentésű szavakkal: ()

a. Nyuszi ül a fűben. b. Nyuszi ült a fűben.

()

a. Edgár súlyemelő és nagyon okos. b. Edgár súlyemelő, de nagyon okos.

Ezekre a grammatikai elemekre, illetve szavakra azt szokták mondani, hogy a jelentésük a mondatból derül ki, például abból a különbségből, amit a múlt idő képvisel a jelen idővel szemben, vagy abból, amit a de szó ad hozzá a mondathoz az és-hez képest. E mondatpárok szembeállított tagjai más-más körülményekre, tényállásokra vonatkoznak, más-más igazságfeltételek mellett lehetnek igazak. Csakhogy valójában a fogalmi jelentésű szavaknak is a mondatokból derül ki a jelentésük. Az a tény, hogy használatuk esetében jelen lehet (valóságosan vagy képzeletünkben) egy adott dolog, illetve a dolog képzete, az pusztán annak köszönhető, hogy olyan kifejezéseket lehet alkotni velük, amelyek a körülöttünk lévő világ tárgyaira, jelenségeire tudnak utalni és ezeket idézzük fel, amikor fogalmi jelentésként azonosítjuk az ilyen kifejezések referenciájának azonos momentumait. A szó jelentése általánosítva ezek után nem más, mint amivel a szó



Kenesei István

rendszeresen hozzájárul az őt tartalmazó kifejezések, illetve mondatok jelentéséhez: ez többnyire – de nem feltétlenül – állandó. Abban a végső soron Gottlob Frege-re (1892/2000) visszavezethető elképzelésben, aminek a híveként itt a jelentésről beszélek, a szavak jelentése két nagyobb szerkezeti egységben azonosítható: egyrészt a referáló kifejezésekben, amelyek a dolgokra utalnak, másrészt a referáló kifejezéseket tartalmazó mondatokban. Ha a referáló kifejezést megértjük, akkor tudjuk, mire utal a kifejezés. Ha a mondatot megértjük, tudjuk, milyen tényállást (illetve állítást, kérdést, felszólítást stb.-t) fejez ki. Így, mintegy visszamenőlegesen tudjuk, illetve tudjuk meg (!), hogy a benne előfordult szavak mit jelentenek.12 Ebben az értelemben nincs különbség a „szó szerinti” és a „kiterjesztett”, a „metaforikus” jelentés között, amint arra mindjárt rátérek. Itt jegyzem meg, hogy amikor mondatról beszélek, akkor szándékosan nem teszek különbséget az igazságértékkel bíró propozíció, illetve az azt tartalmazó beszédaktus, az állítás, parancs, kérés stb. között, mivel azt állítom, hogy ugyanazok a folyamatok, illetve eljárások adják meg mindegyik esetben a szavak és a mondatok jelentését. Aminek tehát elsődlegesen jelentése van, az a mondat. Amit viszont a mentális nyelvi modul, a fejünkben lévő szótár elraktároz, az a szó. A nyelv, a gondolkodás, a közlés, a kommunikáció minimális egysége a mondat. A nyelvi emlékezet, a mentális tár alapegysége viszont a szó. Ez a dinamikus szembenállás teszi többek között azt is lehetővé, hogy a szavaknak, és közülük is elsősorban a fogalmi jelentésű szavaknak ne legyen kötött, egyszer és mindenkorra rögzített jelentésük. A paradox helyzetet összefoglalva tehát: A szónak állandó a formája, de bizonytalan a jelentése, a mondatnak változó a formája, de biztos a jelentése. Térjünk akkor rá a második típusú kreativitásra: a jelentéskiterjesztésre. Hatalmas irodalma van annak, hogy a szavak jelentése hogyan változik, mi a különbség többértelműség (poliszémia) és azonos alakúság (hom*onímia) között, miképpen jutnak a szavak metaforikus jelentéseikhez, egyáltalán mi a metaforikus jelentés és hogyan értjük meg.13 Ami világosan látható a problémakör újabb kezelésében, az ugyanaz, ami a szemantika átalakulásában is végbement: egyre inkább eltávolodnak a szóközpontú magyarázatoktól a szavakat nagyobb egységekbe, közlésekbe, vagy fogalmi metaforákba, szerkezetekbe ágyazó elgondolások felé, azaz a mondatcentrikus magyarázatok felé. A múlt század első felében egyrészt egyre világosabbá vált, 12 A szavaknak alkalmilag akár ellenkező értelmük is lehet, mint az alapjelentésük, pl. ironikus megnyilatkozásokban: Nagyon ügyes voltál! Alább erre is kitérünk még. 13 Csak két (magyar) szerzőre utalok itt: Ullmann (1959; 1972) és Martinkó (1955/2001).

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



hogy a metafora sokkal általánosabb jelenség a nyelvben és a gondolkodásban, mintsem hogy csak irodalmi, stilisztikai eszkönek tekintsük, másrészt a hatvanas évek óta nem is a szó tulajdonságai közé soroljuk. Amikor például Lakoff és Johnson (1980) a fogalmi metaforák egyik csoportját, a (17)-ben illusztrált ontológiai metaforát megállapítják, akkor egy általános állításba foglalják azt, ami szerint értelmezni lehet az olyan mondatokat, mint a (18). ()

az elméletek épületek

()

Feltevése nincs kellőképpen alátámasztva.

Más szóval egy olyan mentális eljárást, folyamatot tulajdonítanak a (18) mondat értelmezésének, amelyben egyrészt a (18) alanyát (feltevés) a (17) alanya (elmélet) alá rendeljük (A feltevések elméletek [részei]), másrészt a (18) állítmányát (alátámasztva) a (17) állítmánya (épület) alá rendeljük (Alátámasztása az épületeknek van). A szubszumálásnak, azaz a fogalmak egymás alá rendelésének rendkívül kiterjedt gyakorlata van, mint azt például a jogi nyelv szemantikájának a vizsgálatában is ki lehetett mutatni (Kenesei 2003b). Persze egyszerre több ilyen fogalmi séma is alkalmazható lehet ugyanarra a dologra. Ha például a (19) állítást tesszük, akkor a (20) sémát követjük. ()

Elméletének megszületése fordulópont volt.

()

az elméletek éllények

De akár mindkét sémát is alkalmazhatjuk egyetlen mondatban: ()

Roskadozó elmélete sok sebből vérzik.

A fordulópont szót pedig azért használhattuk, mert van egy olyan sémánk is, hogy ()

az élet utazás

Vagyis ha valami vagy valaki megszületik, akkor él, vagyis utazik, és akkor eljuthat egy fordulóponthoz az utazás során. Jóllehet azt nem tudjuk, milyen módon vannak az értelmező személyben reprezentálva a fogalmi metaforák, mivel Lakoff és Johnson mindig az itt idézett formátumban közli őket, és mivel fogalmak, aligha létezhetnek nyelvi lehorgonyzás nélkül, azt állítjuk, hogy ezeknek a fogalmi metaforáknak létezik valamiféle strukturált és/vagy hierarchikus listája, mint afféle értelmezési elvek, amelyeket felidézhetünk, ha nehézségeink vannak.



Kenesei István

A következő idézet megmutatja, milyen típusú nehézségekre gondolhatunk. ()

Tudjuk, a Leonardo-mítosz több pillérének egyike Mona Lisa mosolyából szökkent föl (elnézést. . . !), legendáriumának másik tartóeleme az innovatív gépimádatból épült, mely az anatómiai megfigyelések rögzítésével együtt a mestert a reneszánsz művészfigurák szimbólumává, kvintesszenciájává, valamint az első pictor doctusszá tette; s nem kevésbé játszottjátszik fontos szerepet az életére és művészetére rárakódó pára-füst-homály (sfumato), vagyis a feltevés-értelmezés-félreértés hármasságából összevegyülő különös fluidum, mely valami univerzális titokzatosság gyanánt mélyen átitatta magát az életművet, de még az európai kultúra történetét is, jó néhány évszázadon keresztül. (Hajdú István, Magyar Narancs 2009/11)

A számos metafora közül, amelyeket közvetlenül, természetesen és villámgyorsan felfogunk, az egyik két sémát kever, azaz képzavart hoz létre, amivel a szerző tisztában van – ezért is kér elnézést. Az ilyen disszonanciák esetében kérjük számon a sémaváltás indokolatlanságát. Ugyanakkor az idézett szöveg arra is jó példát ad, amit szintén sokan említenek: hogy bizonyos mentális folyamatokat egyszerűen nem lehet másképp, mint metaforikusan leírni. Ebben a szövegben ilyen a megfigyelések rögzítése, vagy folytathatjuk az olyan szavakkal, mint a rájön, felfog, megtalál (megoldást) stb. Figyelmen kívül hagyva a több, esetleg egymásnak is ellentmondó sémákkal operáló metaforaértelmezéseket, irányítsuk figyelmünket arra, hogy az elképzelés mögött az a gondolat húzódik meg, hogy minden metaforikus értelmezés csak adott sémákhoz vagy séma-csoportokhoz képest létezhet. Ez a közelítés tehát feleslegessé teszi, hogy a metaforikus kifejezések szó szerinti jelentését előhívjuk. Az irodalom egyébként megoszlik a tekintetben, hogy szükséges-e a szó szerinti jelentés, hogy vajon a szó szerinti jelentésen keresztül kell-e eljutni a metaforikusig. Egyes nyelvfilozófusok, pl. H. Paul Grice (1975) és John Searle (1985) például azt állítják, hogy a szó szerinti jelentés hamis vagy hiányos volta kényszeríti a hallgatót arra, hogy új értelmezést keressen az olyan mondatok számára, mint: ()

a. Sárika egy jéghegy. b. Robi egy gorilla.

Ekkor egy következtetéses folyamat indul be, aminek a végén eljutunk a metaforikus jelentésig. Akár a fogalmi metafora, akár a logikai következtetésen alapuló elképzelés a jobb, mindkettő azzal a következménnyel jár, hogy a metaforikus jelentések bonyolultabb módon hívhatók elő, mint a szó szerintiek.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



Minket ezekben az elképzelésekben az érdekel a legjobban, hogy ha már a szavak alapjelentése is csak a mondatban valósulhat meg, akkor az átvitt, az ún. nem szó szerinti, azaz metaforikus (vagy ironikus) jelentések még ennél is erőteljesebben és plasztikusabban csak és kizárólag a mondatban realizálhatók. Ebben az értelemben valójában nincs is különbség a szó szerinti és a metaforikus jelentések között. Ha csak egy olyan egyszerű szót veszünk elő, mint az ül ige, amire az előbb már utaltam, a szótárban a következő jelentésekkel van jellemezve: 2. táblázat: Az ül szótári jelentései (egy része) az ÉKSz.-ben

ül

1. nyugszik (alsó testrészén) 2. marad vhol 3. börtönben van 4. vmely állapotban van 5. hivatalt betölt 6. ülést tart 7. ellep, borít 8. szilárdan ott van, odaillik

– ül a széken – egész nap a zongoránál ül – adósságban ül – trónon ül – köd ül a tájon, könny ül a szemében – ez a fog jól ül, – az érvei rendre ültek (!)

De az, hogy melyik jelentést hívjuk elő, az – legalábbis részben – a mondattól függ, amelyben elhelyezzük az igét. Ha azt kérdem: Jenő meddig ül még? – akkor az 1., a 3. és a 6. jelentések a legvalószínűbbek. Ha viszont azt mondom, hogy Jenő már három éve ül, aligha fogunk az első kettőre gondolni, pedig elvben egyáltalán nem összeegyeztethetetlen velük. Viszont ha tárgyasan használom: Jenő három évet ült, akkor a dolog egyértelmű lesz – de vajon ez a jelentés metaforikus-e? A kérdés így értelmetlen: a konvencionális metaforák, vagyis a szótározott jelentések alapjelentéseknek számítanak, még akkor is, ha a nyelv beszélője számára felfedezhető, kideríthető, hogy mi az összefüggés a konkrét és a nyelvész által átvittnek minősített jelentések között. Ebben az értelemben a 8. jelentés második példája (az érvei rendre ültek) különösen érdekes, hiszen a már metaforizált jelentésű ige egy további metaforikus kontextusba kerül – igaz, mivel ez is szótárazva van, nyilván konvencionálisnak minősül. De hogy értjük meg például a következő mondatot? ()

Ez az új árfolyam most még nem ül.

Felteszem, hogy olyan jelentésekkel látjuk el, mint „még nincs általánosan elfogadva”, „még nem állapodott meg”, „még nem követik a többi bankban”, és így tovább. Mivel ezt a mondatot az itteni illusztráció számára találtam ki (és az



Kenesei István

internetes keresők sem adnak meg egyetlen előfordulást sem), itt egy bármikor létrehozható vadonatúj metaforával van dolgunk, amit értelmeznünk kell. Azt állítom, hogy ezt mindannyian könnyedén meg tudjuk tenni, még ha nem mindig értünk is egyet az új jelentésben vagy annak egyes momentumaiban. Erre a problémakörre alább még visszatérek. Az új metaforákat eszerint tehát ugyanolyan nyelvi mechanizmusok alapján értjük meg, mint a régieket. A neurolingvisztikai vizsgálatok azonban nem egyértelműek ebben a kérdésben. Vannak tanulmányok, amelyek szerint még az új metaforák sem igényelnek több mentális munkát. Blasko és Connine (1993) kísérlete egy bevett mintát követett. A doktor szó után az ápoló szóról gyorsabban döntik el az alanyok, hogy szónak számít-e, mint a rádió szóról. Ugyanilyen ún. szemantikai előfeszítést alkalmaztak az új metaforák esetében. Az alany meghallgatta a (26) mondatot, és a csillaggal jelölt ponton a képernyőn megjelenő három eltérő típusú szóról kellett eldöntenie, hogy (angol) szavak-e, pl.: isolate ’izolál’, sand ’hom*ok’, mustache ’bajusz’, amelyek közül az egyik (isolate) a metaforikus, a másik (sand) a szó szerinti értelmet támogatja, a harmadik pedig a kontrollszó volt. Mind a metaforikus, mind a szó szerinti célszavakról gyorsabban döntöttek, mint a kontrollokról, ráadásul ugyanolyan gyorsan. A vizsgálat eredményeit azóta többen is megerősítették. ()

Jerry már akkor tudta, hogy a magány sivatag, ∗ amikor még nagyon fiatal volt.

Egy másik kísérletben Glucksberg (2003), aki már korábban is szkeptikus volt a Lakoff–Johnson-féle metaforaelmélettel szemben (Glucksberg–Keysar 1990; Glucksberg–McGlone 1999), azt kérdezte az alanyoktól, hogy szó szerinti értelemben igazak vagy hamisak-e az ilyen mondatok: ()

a. szó szerinti értelemben igaz:

némely gyümölcs alma

b. szó szerinti értelemben hamis:

némely gyümölcs asztal

c. metaforák:

némely sebész hentes; némely munka börtön

d. elrontott metaforák:

némely út börtön; némely munka hentes

Az alanyok nagyon nehezen tudták hamisként jellemezni a metaforákat, amiből arra következtettek, hogy egyszerűen nem tudták legátolni a metaforikus értelmezés lehetőségét. Az 1. ábrán ezt a jobb oldali oszlop mutatja. Mindez arra enged következtetni, hogy a metaforikus jelentéseket éppolyan automatikusan értjük meg, mint a szó szerintieket. Van azonban két olyan körülmény, amely új irányokba lökheti a gondolkodásunkat. Az első az, hogy az agyi funkciók csökkenésével járó betegségek, például az Alzheimer-kór, az új metaforák megértésének növekvő nehézségével

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



Reakcióid! (ms)

1240

1200

1160

1120

LF

SM

M

1. ábra: Glucksberg (2003) eredményei: A kísérleti személyek reakcióidői (LF = szó sze-

rinti értelemben hamis, SM = elrontott metaforák, M = metaforák).

járnak együtt (Amanzio et al. 2008). Ez a jelenség ahhoz hasonlít, amikor az afáziás betegnek a „becsali” (garden path) mondatok okoznak nehézséget. (Pl. Péter leszokott a cigarettáról . . . vakarni minden márkajelzést, Felmentem a legmagasabb hegyre . . . vezető úthoz.) Vagyis az elemzőrendszer létezik, de az egészséges agyban a feldolgozás sebességével nem lehet kimutatni. Másfelől egyes kutatók, pl. Giora és munkatársai (2000), arról számolnak be, hogy a metaforikus értelmezés során más agyi területek vannak érintve, mint a szó szerinti értelmezésben. Míg a szó szerinti jelentések megértéséhez csak a bal félteke van igénybe véve, a metaforák esetében mindkét félteke működik. Világos bizonyítékot szolgáltattak erre azok a kísérletek, amelyek során kiderült, hogy a metaforikus értelmezés sokkal nehezebben előhívható, ha a jobb oldali agyi funkciók sérültek. A szójelentés változandósága világos következménye a mondatokban megvalósuló jelentéskiterjesztési lehetőségeknek, annak, hogy a szó csak a mondatban nyeri el a jelentését, hogy csak a mondatnak biztos a jelentése. De mi biztosítja, hogy a feltételezett új metaforikus jelentést jól állapítjuk meg? Itt térhetünk rá a nyelvi kreativitás következő területére.

. Tudatelméleti kreativitás Ahhoz, hogy a hallgató eldöntse, mit értek az előbbi (25) – és akkor még vadonatúj – mondaton, arról kell elképzelésének lennie, hogy én mire gondolhattam. Ez pedig nem más, mint a tudatelmélet (TE) néven ismert jelenségcsoport, vagyis az, hogy képesek vagyunk mások (és a magunk) gondolatait, vágyait, szándékait



Kenesei István

stb. reprezentálni a saját tudatunkban. Könnyű belátni, hogy számtalan különböző ágens tudatát, illetve egy-egy ágens számtalan, sokszor egymásnak is ellentmondó mentális állapotát vagyunk képesek kezelni. Ahhoz pedig, hogy ezt meg tudjuk tenni, megint csak nyelvi mechanizmusokra van szükség. Az irodalom ugyan megoszlik a tekintetben, hogy a nyelv alapvető feltétele-e a TE-nek vagy a TE veleszületett kognitív képesség-e és a nyelv csak a képesség kifejezéséhez kell-e (vö. Astington–Filipova 2005), de kevesen vonják kétségbe a nyelv szerepét a TE-ben.14 Akár független a TE a nyelvi képességtől, akár nem, a kutatások eredményei alapján azt látjuk, hogy a nyelvi készségek kialakulása szorosan összefügg a TE egyik meghatározó feladatában elért eredményességgel, a hamis vélekedés (false belief) feladatokkal. Happé (1995) szerint a 3–4 évesek verbális képességei szorosan korreláltak a hamis vélekedéses feladatokban és érzelmi megértésben mutatott teljesítménnyel. Astington és Jenkins (1999) 600 gyereket megvizsgálva arra jutott, hogy a hamis vélekedéses feladatok varianciájának 28-áért a gyerekek szintaktikai tudása volt felelős, ami egybevágott az olyan korábbi longitudinális kísérletekkel, amelyek ugyancsak a szintaktikai tudás és a hamis vélekedéses feladatok megoldásának öszefüggését vizsgálták. Jóllehet vannak, akik tagadják a nyelv és a TE összefüggését (l. pl. Slade–Ruffman 2005), Milligan és munkatársai (2007) metaelemzéséből egyértelműen kiderül, hogy a TE, és különösen a hamis vélekedéses feladatok kezelése szorosan kapcsolódik a nyelvi képességek kialakulásához. Wellman és Bartsch (1988) az akarati és vélekedési reprezentációk különbségét mutatta ki 3,0–4,6 éves gyermekek TE-i kísérletei alapján: eszerint az utóbbiak később „érnek be”. A legérdekesebb eredmények a mentális igékre vonatkozó felmérésekből születtek. A hamis vélekedéses feladatok jó megoldásához ugyanis azzal kell tisztában lenni, hogy az olyan mondatok, mint a (28), akkor is igazak lehetnek, ha a dőlt betűvel jelzett tagmondat hamis. ()

Misi azt hiszi, hogy a csoki a szekrényben van.

A gyerekek már kétéves korukban elkezdik használni az ilyen mentális igéket a mondatvonzatukkal együtt, kezdetben csak néhányat, pl. lát, néz, hisz, tud – anélkül, hogy a vonzatot teljesen értenék. A vonzatmondatot csak egy-két évvel a szerkezettípus első alkalmazása után tudják megbízhatóan kezelni – épp amikorra a hamis vélekedéses feladatokat is jól oldják meg. Ugyanezek az összefüggések 14 De l. pl. Kovács et al. (2010). Wellman és munkatársai (2001) 1977-től kezdve 178 tanulmány adatait vizsgálták meg, elemezték és összesítették a gyermeki TE területén.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



állnak fenn az autista, illetve a születetten siket és a jeleléstől elzárt gyerekek esetében a vonzatos mentális igék és a hamis vélekedéses feladatok között. Evolúciós pszichológusok és biológusok hosszabb ideje vitatják, milyen mértékben felelős a nyelv a TE-típusú jelenségekért. Abban azonban a túnyomó többségük egyetért, hogy mindazok az állatkísérletek, amelyek főemlősöknek vagy madaraknak TE-t tulajdonítottak, a kísérletek helytelen értelmezésén alapultak (Penn–Povinelli 2007; Emery–Clayton 2009). A kísérletek azt mutatták, hogy az állatok – valamint a 3–4 éves kor alatti gyermekek is – az intencionalitásnak csupán a második szintjét (Én tudom, hogy te tudod . . . ) képesek reprezentálni, a hamis vélekedések felfogásához szükséges harmadik szintet (Én tudom, hogy te tudod, hogy én tudom. . . ) már nem (Call–Tomasello 1999). A hamis vélekedés tulajdonítása tehát egészen más szinten működik, mint a közvetlen következményekkel járó szándékok vagy érzelmek felderítése a másik lényben. És itt van az a pont, ahol a nyelvfilozófia, például Grice (1975) együttműködési elve, illetve az azt kifejtő maximák, valamint Searle (1985) közvetett beszédaktusai, illetve az általa a metafora és az irónia kapcsán elemzett átvitt jelentések is a TE-re mutatnak. Grice implikatúráit és Searle következtetéseit ugyanis TEhivatkozások vagy eljárások nélkül egyszerűen lehetetlen elvégezni. Hadd idézzek csak egyetlen Grice-i levezetést: ()

A: Nincs benzinem. B: Van egy szerelőműhely a sarkon túl. Értelmezés: B megsértené a „Légy releváns” maximáját, ha nem gondolná, illetve nem tartaná lehetségesnek, hogy a műhely nyitva van, hogy benzint is árusít, . . .

Azt, hogy a metaforák és a hozzájuk hasonló jelentéskiterjesztések, mint pl. az irónia, tudatelméleti folyamatokkal járnak együtt, az is mutatja, hogy milyen agyi területeket indítanak be. Régóta ismert tény, hogy a pragmatikai műveletekhez a jobb féltekére is szükség van. Jóllehet a korai vizsgálatok a metaforák értelmezésében csak a jobb félteke működésére koncentráltak (l. pl. Giora 2007 összefoglalóját), újabban a frontális területek aktivitása is előtérbe került. Jobbféltekés sérült betegek a végrehajtó diszfunkcióknak különféle mintázatait mutatják (gátlás hiánya szemben a rugalmasság hiányával), amelyek együtt jártak a TE-deficit melletti pragmatikai hiányosságok különböző mintázataival (metaforaés nem szó szerinti értelmezések, mint pl. közvetett kérések, szemben a szó szerinti értelmezésekkel) [. . .] Az eredmények azt mutatják, hogy a nyelv pragmatikai aspektusának megértésére irányuló képesség szoros kapcsolatban áll a más emberek szándékairól tett következtetések képességével. (Champagne-Lavau–Joanette 2009, 423)15 15 „RHD [right hemisphere damaged] individuals may exhibit different patterns of executive dysfunction (lack of inhibition versus lack of flexibility), which co-occurred with different



Kenesei István

Ugyanezt mutatta ki Gallagher és Frith (2003), akik a középső prefrontális kéreg működését tapasztalták a metaforaértelmezési feladatok alatt (l. még Amodio– Frith 2006). Ezek pedig éppenséggel a TE jellemző régiói, amint Ahrens és munkatársai (2007) mágneses rezonancia alapú kísérleteiből látjuk; eredményeik szerint az új metaforák a halánték- és a homloklebeny mindkét oldali aktivitását váltják ki – szemben a szó szerinti értelmű mondatokkal. A TE tehát alapvető feltétele a nyelvi megértésnek, a tudatelméleti következtetések tartalmai nem explikálhatók a mondatvonzattal ellátott mentális igék segítsége nélkül. Ugyanakkor a TE a kreativitás egy újabb területét nyitja meg: a számtalan „más elme” (other minds) egyenként is korlátlan számú tudatállapotának reprezentálási képességét. A „párhuzamos” értelemben vett korlátlanságot, azaz azt, hogy meghatározatlan számú egyed elméjét tudjuk egymástól függetlenül reprezentálni saját tudatunkban, kiegészíti a „sorosan kapcsolt” elmék reprezentálhatósága, vagyis az, hogy hányszor tudjuk egymásba ágyazni az ilyen típusú szerkezeteket, azaz – metaforikusan szólva – a TE hányadik hatványáig tudunk eljutni. Dunbar (2005) beszámolója szerint ez a szám hattal egyenlő – méghozzá egy valószínűleg anekdotikusnak minősülő érvelés alapján, amely Shakespeare Othello c. drámájára támaszkodik. Eszerint a néző úgy gondolja, hogy Jágónak az a szándéka, hogy Othello azt higgye, hogy Desdemona valaki mást akar szeretni. Ez eddig négy szint, amihez hozzáadódik a kívülálló értelmezőnek (például e tanulmány írójának) az ötödik szintje, és mindehhez az eredeti szerzőnek, azaz Shakespeare-nek az ezeket a szinteket meghaladó saját, hatodik lépcsője. Ezt a felülmúlhatatlan komplexitást azonban a hétköznapi viszonyokban rendszerint nem tapasztaljuk: itt megelégszünk a négyes nagyságrenddel, amint azt most már kísérletes bizonyítékokkal támasztotta alá Stiller és Dunbar (2007). A TE-re vonatkozó korlátozás felidézi a grammatika elvei és a nyelvi produkció korlátai közötti különbséget. Azt állítom, hogy itt egy ahhoz hasonló jelenséggel van dolgunk, mint amelynek az alapján Chomsky (1965) szembeállította a grammatikai szerkezetek lehetséges komplexitását a beszélő véges feldolgozási, (rövid távú) memóriabeli képességeivel, az akkori idők terminológiájában a kompetenciát a performanciával. Chomsky eredeti példái ilyenek voltak: ()

a. Az a fiú, aki azt a lányt, aki azt a kutyát, amelyik a kertben ugatott, megsimogatta, észrevette, már elment. patterns of pragmatic impairments (metaphor and non-literal interpretation such as indirect request versus literal interpretation) concomitant with a ToM deficit. [. . .] The results suggest that the ability to understand pragmatic aspects of language is closely associated with the ability to make inferences about other people’s intentions.”

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



b. Az a fiú már elment, aki azt a lányt észrevette, aki azt a kutyát megsimogatta, amelyik a kertben ugatott.

Jóllehet a (30a) épp annyira grammatikus, mint a (30b), gyakorlatilag feldolgozhatatlan az egymásba ágyazott tagmondatoknak az elfogadható küszöbértéken túli száma miatt. Más szóval, a grammatika elvileg korlátlan beágyazást enged meg, ahogy elvben a TE is korlátlan számú tudatállapot „beágyazására” ad lehetőséget, a munkamemória azonban határt szab ezeknek mind a grammatikai, mind a TE-komponensben.

. Összegzés A három itt elemzett kreativitástípus logikailag, de valószínűleg evolúciósan is ugyanarra a szűk hatókörű lokális viszonyra vezethető vissza: a ma „széljegynek” (edge feature-nek) nevezett kapcsolatra, amely egyebek között a mentális szótárban rögzült szót köti a vonzataként vele együtt álló szerkezethez, illetve annak fejéhez. Közülük a leginkább a bal féltekéhez köthető funkcionális (vagy más terminussal: grammatikai) szavak játsszák a kapcsolóelemek formális szerepét, míg a fogalmi jelentéssel bíró szavak teszik lehetővé a jelentés változandóságát, a jelentés metaforikus kiterjesztését, amelyet az ugyancsak nyelvi háttérben megvalósuló tudatelmélet szabályoz, tart kordában, illetve enged szabadjára. Így lesz nyelvészetileg is értelme Jung-Beeman (2005, 514) ábrájának (2. ábra), ahol a mi értelmezésünk szerint a bal féltekében éles vonalakkal körülírt szavak azok formai, grammatikai, szintaktikai jellegzetességeit, valamint alapjelentéseit hordozzák, és a jobb féltekében bemutatott megfelelőik a homályos és összefolyó ábrákban pedig változandó, új, metaforikus jelentéseiket. A két félteke együttműködő munkamegosztására Forgács és mások (2012) kutatásai újabb bizonyítékokat szolgáltattak, amelyek mind a grammatikai-szintaktikai információkat feldolgozó bal félteke, mind a hagyományosan az új jelentések esetén aktiválódó jobb félteke aktiválódását mutatták. A nyelvi kreativitás három fő területét: a formálisat, a jelentésbelit és a tudatelméletit, és a formálisnak két részterületét: a szintaktikai és szókészleti kreativitást mutattuk be. Arra hívtuk fel a figyelmet, hogy mindezen jelenségek mögött a nyelvnek, a nyelv alapelemeinek, amelyeket itt az egyszerűség kedvéért szavaknak neveztünk (és amelyeknek két osztályát mutattuk be: a lexikális és a funkcionális elemeket), az a tulajdonsága húzódik meg, hogy a széljegyek (edge features) és az „egyesítés” (merge) művelete révén megadhatják, milyen más tulajdonságú nyelvi egységek (szavak, szerkesztett kifejezések stb.) állhatnak közvetlen környezetükben, és hogy ezek a szigorúan véve lokális, kis távolságú viszonyok hogyan



Kenesei István

2. ábra: Agyféltekék és szemantikai mezők (Jung-Beeman 2005 nyomán)16

építhetnek fel igen bonyolult konstrukciókat, kifejezéseket és végső soron mondatokat, amelyek azután az új jelentések megalkotásának és értelmezésének, azaz egy másik szintű kreativitásnak, továbbá a mások szándékai, vélekedései stb. reprezentálása képességének, azaz egy további szintű kreativitásnak, a tudatelméletnek is megteremtik a lehetőségét. 16 Az ábra értelmezése Jung-Beemannál: „(a) A bal félteke (BF) erősen aktivál kicsiny és fókuszált szemantikai mezőket, amelyek az input szavak domináns jelentéseihez szorosan kapcsolódnak. Ezzel szemben a jobb félteke (JF) gyengén aktivál nagy és szétszórt szemantikai mezőket, amelyek lazán kapcsolódnak a szavakhoz, és így csak durva értelmezést enged meg, amely számos nyelvi feladatban elégtelen. (b) A JF nagyobb szemantikai mezői viszont jobban átfedhetnek egymással, ami a gyenge aktiválások összegzését teszi lehetővé, amikor az inputban több egymással laza kapcsolatban álló szó van. A JF tehát a távoli jelentésviszonyokra érzékeny és a természetes nyelv megértésében erre az érzékenységre támaszkodnak a nyelvhasználók, különösen a képes beszéd, illetve a szokatlan kifejezések esetében. (c) A JF és a BF idegsejtjei több olyan vonatkozásban különböznek, amelyek a komputációt befolyásolják; például a JF piramis idegsejtjeinek átlagosan hosszabb kezdeti dendrikus nyúlványuk és több, a sejttestől elvezető szinapszisuk van, mint a mint a BF idegsejtjeinek. Emiatt a JF idegsejtjei sokkal szélesebb és egymással nagyobb átfedésben lévő inputmezőkhöz jutnak, mint a BF sejtjei. (d) A BF kortikális oszlopai sokkal távolabb vannak egymástól, mint a JF kortikális oszlopai, és kevesebb átfedés is van az inputmezőik között.” Az ábrán szereplő szavak magyar megfelelői: foot ’láb (testrész és mértékegység)’, ruler ’vonalzó, mérőléc’, toes ’lábujjak’, cut ’vág’, pain ’fájdalom’, glass ’üveg’.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



Nem megfellebezhetetlen végkövetkeztetéseket vontunk le e helyen, csupán logikai alapon érveltünk a mellett, hogy a formai kreativitás megkerülhetetlen alapját és forrását kell, hogy alkossa a további, „magasabb szintű” kreativitásnak. A vita természetesen tovább folytatódik a nyelv természetéről, a nyelvi képességek és a beszédfeldolgozás neurális hátteréről és reprezentációjáról, s ez – éppen a bevezetőben is hivatkozott kognitív fordulat jóvoltából – az e fordulatban szerepet játszó tudományterületek egyre érdekesebb eredményeihez vezet majd.

Irodalom Ahrens, Kathleen – Ho-Ling Liu – Chia-Ying Lee – Shu-Ping Gong – Shin-Yi Fang – Yuan-Yu Hsu 2007. Functional MRI of conventional and anomalous metaphors in Mandarin Chinese. Brain and Language 100: 163–171. Amanzio, Martina – Giuliano Geminiani – Daniela Leotta – Stefano Cappa 2008. Metaphor comprehension in Alzheimer’s disease: Novelty matters. Brain and Language 107: 1–10. Amodio, David M. – Chris D. Frith 2006. Meeting of minds: The medial frontal cortex and social cognition. Nature April 2006: 268–277. Astington, Janet Wilde – Eva Filipova 2005. Language as the route into other minds. In: Bertram F. Malle – Sara D. Hodges (szerk.): Other minds: How humans bridge the divide between self and others. New York: Guilford Press. 209–219. Astington, Janet Wilde – Jennifer M. Jenkins 1999. A longitudinal study of the relation between language and theory-of-mind development. Developmental Psychology 35: 1311–1320. d’Avis, Winfried 1998. Theoretische Lücken der Cognitive Science. Journal for General Philosophy of Science 29: 37–57. Bańczerowski, Janusz 1999. A kognitív nyelvészet alapelvei. Magyar Nyelvőr 123: 78–87. Blasko, Dawn G. – Cynthia M. Connine 1993. Effects of familiarity and aptness on metaphor processing. Journal of Experimental Psychology: Learning, Memory, and Cognition 19: 295– 308. Bloomfield, Leonard 1933. Language. New York: Holt, Rinehart and Winston. Call, Josep – Michael Tomasello 1999. A nonverbal false belief task: The performance of children and great apes. Child Development 70: 381–395. Champagne-Lavau, Maud – Yves Joanette 2009. Pragmatics, theory of mind and executive functions after a right-hemisphere lesion: Different patterns of deficits. Journal of Neurolinguistics 22: 413–426. Chomsky, Noam 1955/1975. The logical structure of linguistic theory. New York: Plenum. Chomsky, Noam 1957. Syntactic structures. The Hague: Mouton. Chomsky, Noam 1959. A review of B. F. Skinner’s Verbal behavior. Language 35: 26–58. Chomsky, Noam 1965. Aspects of the theory of syntax. Cambridge MA: MIT Press. Chomsky, Noam 1968. Language and mind. New York: Harcourt, Brace & World. Chomsky, Noam 2005. Three factors in language design. Linguistic Inquiry 36: 1–22.



Kenesei István

Dunbar, Robin I. M. 2005. Why are good writers so rare? An evolutionary perspective on literature. Journal of Cultural and Evolutionary Psychology 3: 7–21. Emery, Nathan J. – Nicola S. Clayton 2009. Comparative social cognition. Annual Review Psychology 60: 87–111. Evans, Nicholas – Stephen C. Levinson 2009. The myth of language universals. Behavioral and Brain Sciences 32: 429–448. Evans, Vyvyan – Melanie Green 2006. Cognitive linguistics: An introduction. Edinburgh: Edinburgh University Press. Everett, Daniel L. 2005. Cultural constraints on grammar and cognition in Pirahã. Another look at the design features of human language. Current Anthropology 46: 621–646. Forgács, Bálint – Isabel Bohrn – Jürgen Baudewig – Csaba Pléh – Arthur M. Jacobs 2012. Neural correlates of combinatorial semantic processing of literal and figurative noun noun compound words. NeuroImage 63: 1432–1442. Frege, Gottlob 1892/2000. Jelentés és jelölet (Fordította: Máté András). In: Gottlob Frege: Logikai vizsgálódások. 118–147. Budapest: Osiris. Gallagher, Helen L. – Christopher D. Frith 2003. Functional imaging of ‘theory of mind’. Trends in Cognitive Science 7: 77–83. Giora, Rachel 2007. Is metaphor special? Brain and Language 100: 111–114. Giora, Rachel – E. Zaidel – N. G. Soroker – A. Kasher 2000. Differential effect of right- and lefthemisphere damage on understanding sarcasm and metaphor. Metaphor and Symbol 15: 63–83. Glucksberg, Sam 2003. The psycholinguistics of metaphor. Trends in Cognitive Science 7: 92–96. Glucksberg, Sam – Boaz Keysar 1990. Understanding metaphorical comparisons: Beyond similarity. Psychological Review 97: 3–18. Glucksberg, Sam – Matthew S. McGlone 1999. When love is not a journey: What metaphors mean. Journal of Pragmatics 31: 1541–1558. Grice, H. Paul 1975. Logic and conversation. In: Peter Cole – Jerry L. Morgan (szerk.): Syntax and semantics, vol. 3: Speech acts. New York: Academic Press. 41–58. Happé, Francesca G. E. 1995. The role of age and verbal ability in the theory of mind task performance of subjects with autism. Child Development 66: 843–855. Harris, Zellig S. 1951. Methods in structural linguistics. Chicago: University of Chicago Press. Hauser, Marc D. – Noam Chomsky – W. Tec*mseh Fitch 2002. The faculty of language: What is it, who has it, and how did it evolve? Science 298: 1569–1579. Hockett, Charles 1958. A course in modern linguistics. New York: Macmillan. Hyman, Malcolm D. 2010. Chomsky between revolutions. In: D. A. Kibbee (szerk.): Chomskyan (r)evolutions. Amsterdam & Philadelphia: John Benjamins. 265–292. Jung-Beeman, Mark 2005. Bilateral brain processes for comprehending natural language. Trends in Cognitive Science 9: 512–518. Kenesei István 2003a. A filozófia a nyelvészetben, avagy hová tűnt a nyelvfilozófia? In: Farkas Katalin és Orthmayr Imre (szerk.): Bölcselet és analízis. Budapest: Eötvös Kiadó. 100–117. Kenesei István 2003b. Jogi szemantika: problémafelvetés és kutatási program. Világosság 44: 63– 70.

A kreativitás mint a nyelvészet kognitív fordulatának kulcseleme



Kenesei István 2008. Funkcionális kategóriák. In: Kiefer Ferenc (szerk.): Strukturális magyar nyelvtan 4. A szótár szerkezete. Budapest: Akadémiai Kiadó. 601–638. Kertész András 2000a. A kognitív nyelvészet lehetőségei és korlátai. Magyar Nyelv 46: 402–418. Kertész András 2000b. A kognitív nyelvészet szkeptikus dilemmája. Magyar Nyelvőr 124: 209–226. Kertész, András 2004. Cognitive semantics, and scientific knowledge. Amsterdam & Philadelphia: John Benjamins. Kertész András–Pelyvás Péter (szerk.) 2005. Tanulmányok a kognitív szemantika köréből. Budapest: Akadémiai Kiadó. (Általános Nyelvészeti Tanulmányok 21) Kovács, Ágnes – Ernő Téglás – Ansgar Denis Endress 2010. The social sense: Susceptibility to others’ beliefs in human infants and adults. Science 330: 1830–1834. Lakoff, George – Mark Johnson 1980. Metaphors we live by. Chicago: The University of Chicago Press. Martinkó András 1955/2001. A szó jelentése. Szeged: Lazi Könyvkiadó. McConnell-Ginet, Sally 2008. Words in the world: How and why meanings can matte. Language 84: 497–527. Milligan, Karen – Janet Wilde Astington – Lisa Ain Dack 2007. Language and theory of mind: Meta-analysis of the relation between language ability and false-belief understanding. Child Development 78: 622–646. Penn, Derek C. – Daniel J. Povinelli 2007. On the lack of evidence that non-human animals possess anything remotely resembling a ‘theory of mind’. Philosophical Transactions of the Royal Society London 362: 731–744. Piattelli-Palmarini, Massimo 2008. New tools in the service of old ideas. Biolinguistics 2: 237–246. Ponterotto, Diane 1994. Metaphors we can learn by: How insights from cognitive linguistic research can improve the teaching/learning of figurative language. English Teaching Forum 32: 2–7. Roeper, Tom 2011. The acquisition of recursion: How formalism articulates the child’s path. Biolinguistics 5: 57–86. Rorty, Richard (szerk.) 1967. The linguistic turn: Recent essays in philosophical method. Chicago: The University of Chicago Press. Saussure, Ferdinand de 1916. Cours de linguistique générale. Paris: Payot. Searle, John R. 1985. Expression and meaning. Studies in the theory of speech acts. Cambridge: Cambridge University Press. Setola, Patrizia – Ronan G. Reilly 2005. Words in the brain’s language: An experimental investigation. Brain and Language 95: 251–259. Slade, Lance – Ted Ruffman 2005. How language does (and does not) relate to theory of mind: A longitudinal study of syntax, semantics, working memory and false belief. British Journal of Developmental Psychology 23: 117–141. Stiller, James – Robin I. M. Dunbar 2007. Perspective-taking and memory capacity predict social network size. Social Networks 29: 93–104. Surányi Balázs 2009. Probléma-eltolódások a chomskyánus nyelvészetben: A generatív nyelvészet ma. Magyar Tudomány 170: 1052–1058. Ullmann, Stephen 1959. Principles of semantics (Second edition). Glasgow & Oxford: Basil Blackwell.



Kenesei István

Ullmann, Stephen 1972. Semantics: An introduction to the study of meaning. Oxford: Basil Blackwell. Wellman, Henry M. – Karen Bartsch 1988. Young children’s reasoning about beliefs. Cognition 30: 239–277. Wellman, Henry M. – David Cross – Julanne Watson 2001. Meta-analysis of theory-of-mind development: The truth about false belief. Child Development 72: 655–684. Wells, Rulon S. 1947. Immediate constituents. Language 23: 81–117.

Creativity underlying the cognitive turn in linguistics Abstract: This paper regards research into the creative nature of language as underlying the cognitive turn in linguistics in recent years. Formal creativity or, in other words, the recursive nature of language (with respect to both the basic units, such as words, and the end products, i.e., sentences) is what determines further domains of creativity, viz., at the level of meanings and in the theory of mind, providing for their unlimited and variable nature. Principles of the formal properties of language are presented at the levels of words and sentences, showing that recursion occurs both in words and sentences, indicating the local nature of syntactic relations, and demonstrating their neural correlates. Evidence from neurolinguistic experiments is invoked to argue that metaphorical extensions of meanings are a natural phenomenon placing no burden on mental processing, even though literal meanings are not handled the same way as metaphors. It is claimed that sentential meanings have a primacy over word meanings, while words, and not sentences, are the basic units of the mental lexicon, i.e., long-term memory. In order to understand metaphors it is essential to have theory of mind (ToM), which develops in children parallel with the acquisition of complex syntactic structures involving mental verbs, as is shown by false-belief tasks. The nature and limits of the complexity of ToM is related to the limits of syntactic complexity in natural language. Keywords: creativity, recursion, morphology, syntax, meanings, metaphors, theory of mind

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái* Pléh Csaba Eszterházy Károly Főiskola, Eger és Collegium de Lyon, ENS Lyon [emailprotected]

Thuma Orsolya Budapesti Gazdasági Főiskola [emailprotected]

Kivonat: A tanulmány először áttekinti a modularitás különböző értelmezéseit az idegtudományitól a megismerési modelláláson keresztül a nyelvi feldolgozás moduláris értelmezéséig. Bemutatja, hogy a nyelvi modularitásnak van evolúciós, fejlődéslélektani és feldolgozási értelmezése. Feldolgozási értelemben mind a moduláris, mind a tudásalapú megközelítések elfogadják a kontextus és az ismeretek hatását. A vitakérdés e felülről lefelé ható tényezők időzítése. A kétértelműség példáján, részben magyar adatokon mutatjuk be, hogy milyen hajlékony rendszerről van itt szó. Bár vannak adatok a két ciklusú, gyors és lapos feldolgozású és lassú és kiterjedt keresést végző feldolgozás mellett (ami alátámasztja a moduláris értelmezést), ugyanakkor a gyors ciklus is érzékeny a nyelvtani mozzanatokra. A moduláris feldolgozás kérdése összekapcsolódik az automatikusságtudatosság-metakogníció, illetve a gyors és lassú döntések átfogó irodalmával. Kulcsszavak: modularitás, kontextus, tudás, tudat, kétértelműség

Kis emberek parlamentjével van dolgunk, akik közül, ahogy az igazi parlamentben is, mindegyiknek csak egy gondolata van. Lange (1881, iii, 124)

. Az emberi elme moduláris felfogása. Általánosabb kérdések Mint a fenti idézet mutatja, az emberi agyműködés és gondolkodás részekre bontó felfogása klasszikus eszme, amely már a 19. század közepén oly általános, hogy irónia forrásává is válik. Valójában a címben jelölt kettősség és vita is múltba nézéssel indul, a generatív nyelvészet és az ehhez kapcsolódó pszicholingvisztika kettős karteziánus ihletésére vezethető vissza. Az egyik értelmezés Descartes * A dolgozat készítése során az első szerző a Collegium de Lyon és a TÁMOP ...C pályázat támogatását élvezte. Mindkét támogatómnak köszönöm a zavartalan munkafeltételek biztosítását.



Pléh Csaba – Thuma Orsolya

örökségéből az egységes és oszthatatlan gondolkodást állítja előtérbe, s innen eljut az átfogó, áthatolható és egységes, a tudást és az észlelést (feldolgozást) együtt kezelő felfogásig. A másik karteziánus ihletés a speciális feladatokra kialakult rendszereket állítja előtérbe, és az emberi nyelvből, mint különleges alrendszerből kiindulva minden kognitív teljesítményt feladatra, vagy ahogy később mondják, területre sajátos rendszerek működésének eredményeként értelmez.

.. A modulkoncepciók sokfélesége A modul és a modularitás a mai kognitív kutatásokban meglehetősen nagy népszerűségre szert tett kifejezés. Maga a „modularitás” igen fényesen villog a tudáshordozókban. A Google 2013. március 12-én 6 millió feletti találatot hoz a modularity kifejezésre, s ebben vezet Fodor (1983) könyve 8000 feletti hivatkozással, ezt követi Karmiloff-Smith (1992) 2500 feletti találattal. Vagyis a sokféle modulkoncepció között igen karakteres a kognitív alapú. A PsychLit tudományos adatbázisban ugyanekkor 1140 közlemény érinti a modularitást, 1974-től kezdve. A nyelv modularitása ugyanitt 393 találatot eredményez. Legalább három területről származik maga a kifejezés és a mögötte álló architekturális képalkotás, s a kognitív területen belül is három különböző általánosságú felfogást jelent. a. A modul technikai fogalma. Egy számítógép vagy egy televízió akkortól moduláris felépítésű, amikor egyes feladatra specializált áramköreit, mint alkatrészeket kivehetjük és kicserélhetjük. Egy-egy modulon belül viszonylag sűrűbb az információáramlás, mint a modulok között, és a modulok csak kimenetük és bemenetük tekintetében érintkeznek a készülék egészével. b. Neurobiológiai elmélet. Ilyen elméletként először és leghatásosabban Szentágothai (1975; 1979) munkáiban jelent meg annak az idegrendszer felépítésére vonatkozó korábbi felismerésnek az általánosításaként, amely szerint az agykéreg anatómiailag oszlopos szerkezetű. Az oszlopok, ha például a látórendszer példáját vesszük, az egyes retinális receptív mezőkből kérgi receptív mezőkké való szerveződés kitüntetett egységei. Az oszlopok sok száz nagyobb funkcionális egységet, modult alkotnának. Míg az oszlopok például egy-egy vonás (pl. egy ferde vonal / vagy /) felismeréséért lennének felelősek, egy-egy modul viszont a fenomenológiailag is elkülöníthető érzéki minőségekért válik felelőssé, a mozgás, a forma, a szín látásáért felelős. Az agykéregben és a kéreg alatt is számos központ „foglalkozik a látással”. Ezek egy része között a kapcsolatokra a hierarchia jellemző. Például az elsődleges

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



látókéreg, a V1 munkája, az elemi jegyek kiemelésével megelőzi a bonyolultabb jegyek azonosítását, vagy a tárgyfelismerést. Mások között viszont párhuzamossági viszony van: ilyen például a szín és a mozgás feldolgozása. A neurobiológiai modulfelfogás nem támogatja sok pszichológiai elméletalkotó kizárólagos elképzelését, amely vagy hierarchikus, vagy párhuzamos feldolgozások keretében gondolkozik. Megjelenik a modulok olyan értelmezése is, amelyekben a neurobiológiai kulcskérdés a szervezeti bonyolódás. Az emlős agykéreg óriási fejlődésével a teljes kérgen belüli kommunikáció lelassul, ezért szerveződnek olyan területek, amelyeken belül intenzív a közlekedés, és olyanok, amelyek között csak kitüntetett fő pályák közvetítenek (Buzsáki 2006). Vagyis a méretoptimalizáció vezet a feladatoptimalizációhoz, és ahhoz, hogy sok belső, de kevés külső kapcsolattal rendelkező központok alakuljanak ki. c. A nyelvi feldolgozás és a nyelv mentális reprezentációjának több komponensű, mondattanközpontú felfogása. Noam Chomsky (1957; 1995) igen régóta hangoztatott elméletének, a szintaxis autonómiája felfogásnak a modern kiterjesztése, és az alábbi, (d) alatti felfogás nyelvre történő alkalmazása. E szerint egy nyelvtan alrendszerei úgy működnek, hogy e komponensek egymással csak az eredményeik szintjén vannak kölcsönhatásban. A nyelvre alkalmazott moduláris felfogások ennek a nyelvfeldolgozási koncepciónak az általánosításai. Chomsky (1957) eredeti kiinduló kocepciójában a modularitás elsősorban a klasszikus neopozitivista nyelvfilozófiából örökölt Carnap-féle szintaxis–szemantika szétválasztás gondolati letéteményese, a tartalmatlan mondatok – Színtelen zöld eszmék dühödten alszanak – nyelvtani helyessége révén. Valójában a forma elsődlegességének poétikai elve jelenik itt meg újra, mint a nyelv szerveződésének irányítója, azzal a finomítással, hogy a gondolat formája is a szintaxis része (Chomsky 1986). d. Az emberi megismerés szerveződésének feladat- és területspecifikus elmélete. E felfogás szerint az emberi elme valójában feladatspecifikus rendszerek sokaságaként képzelendő el. Az egységes (unified abban az értelemben, ahogy ezt a szót Newell 1989 használja, l. erről Pléh 1994a) elméletek helyett a megismerést akkor modelláljuk helyesen, ha feladatspecifikus és általános rendszerek kettősségében gondolkozunk (Fodor 1983; 1990; 1996). Ez a felfogás a filozófiai, a nyelvészeti, a nyelvfeldolgozási és a neurobiológiai modulfogalom közötti közvetítést kísérel meg (Coltheart 1999). Az ezredfordulón megjelenik ennek radikálisabb változata: a masszív modularitás. „A különböző adaptációs problémák megoldására különböző agyi



Pléh Csaba – Thuma Orsolya

áramkörök specializálódtak” mondja az evolúciós modularitás két leghatározottabb képviselője, Cosmides és Tooby (2000, 108). Míg Fodor modulok és központi gondolati reprezentáció kettőségében gondolkodik, Pinker (2002), Sperber (2000) és számos evolúciós pszichológus számára a gondolati reprezentáció sem szent, az is beilleszkedik a modulok közé. Úgy is tekinthetjük, hogy a negyedszázada radikálisnak tekintett felújítása a „frenológiai lélekképnek”, melyet Fodor hirdetett meg, mára az általános megismerés feltételezésével túl konzervatívnak bizonyult. A radikális evolúciós felfogások mindent felbontanak feladatspecifikus részletekre. Kettejük közt igen élénk viták zajlanak. Fodor (2000) polemikus munkáiban keményvonalasoknak nevezi azokat, akik még nála is modularistábbak. A modul felfogás eredeti javaslója nagyon megkérdőjelezi a radikális dekompozíciót, és kiáll a Központi Gondolati Folyamatok megléte mellett. Az emberi lélek feladatspecifikus részekre bomlik ugyan, de ez csak a „bemeneti szintekre” igaz. Nem lehet az egész elmeműködést feloldani a területspecifikus számítások világában. Kell, hogy legyen valamilyen FŐNÖK, egy olyan interaktív hely, amely megfelel a köznapi értelemben vett Énnek. Az 1. táblázat mutatja a pszichológiailag értelmezett moduláris felfogás jellemzőit és ellentétét az egészleges felfogásssal. 1. táblázat: Három eltérő felfogás a modularitás és az általános megismerés kapcsolatá-

ról a fejlődésben Architektúra

Evolúciósan

Egyedfejlődésileg

Fő képviselő

Modulok és általános A modulok egy része megismerés is sajátosan emberi, a gondolkodás nem moduláris és nem evolúciós eredetű

A moduláris rendsze- Fodor (1983) rek korán és automatikusan működnek, a gondolati rendszerek későbbiek

Csak modulok vannak: teljes dekompozíció

Minden vonás evolúciós adaptáció, a gondolkodás is felbontható részmodulokra

Különböző fejlődési időzítéssel, de minden genetikus, a gondolkodás tartalmai kulturálisak, de szerkezete genetikus

Cosmides–Tooby (2000); Sperber (2000)

Vezető modulok is vannak

Az átfogó architektúrák biológiai eredetű, de nyitott rendszerek

A kulturális tanulás rendszerei a társas tanulás biológiájára alapoznak

Tomasello (2001)

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



. A modularitás nyelvi értelmezései A nyelvre nézve a moduláris felfogás három formát ölt: – a feldolgozás moduláris elve – modulok mint genetikai, fejlődési egységek – a modulok mint az evolúciós folyamat adaptációs egységei Fodor (1983) szóhasználatában a megismerés moduláris összetevői az alábbiakkal jellemzett bemeneti rendszerek. 1. Területspecifikus. Látásunk például csak elektromágneses hullámokkal foglalkozik, mondaná Johannes Müller. Fodor és követői szerint ezek a „területek” elvontabbak is lehetnek, irányulhatnak szófelismerésre, arcfelismerése, de akár mások gondolatainak értelmezésére is (Győri 2006). 2. Kötelező és determinisztikus feldolgozást végez. Anyanyelvemen a hallott dolgokat akkor is szónak hallom, ha tartalmát ignorálom, vagy nem is értem. 3. Korlátozott hozzáférésű. Más feldolgozó rendszerek és az általános tudás számára nem hozzáférhető, csak a feldolgozás kimenete az. 4. Gyors. A moduláris feldolgozás, szemben a nagy keresést igénylő, tudáson alapuló feldolgozással, Fodor elképzelésében igen gyors, „reflexszerű”, automatikus. 5. Enkapszulált. A modulok önmagukba zártak. Tudásunk nem képes beléjük hatolni, ilyen értelemben nem intelligens rendszereket képeznek. 6. Lapos komputáció. A moduláris feldolgozó rendszer nem végez következtetéseket, végső kimenetében egyedi propozíciókhoz juthat csak el.

.. Mit kezd a moduláris feldolgozás a tapasztalati hatásokkal? A moduláris hangsúlyú feldolgozás egyik célja, hogy másodlagossá tegye mindazokat a hatásokat, amelyeket évtizedek alatt a pszichológia a kontextus, a gyakoriság, az elvárás és hasonló tényezők feldolgozást segítő szerepéről hirdetett. Fodor követőinek két alapvető eszközük van erre.



Pléh Csaba – Thuma Orsolya

A. Annak bizonyítása, hogy minden kontextuális hatás utólagos. A gyakorisági és egyéb hatások valójában nem az érzékenységet befolyásolják, hanem pusztán a döntési kritériumokat. A dolgokat az elvárások hatására nem „másként látjuk”, pusztán utólag „másként értelmezzük”. Hasonlóképpen, e felfogás szerint a megértés során nincsen kölcsönhatás a szótári, a mondattani és a szemantikai összetevők között (Forster– Olbrei 1973). Mint önmagukban megálló rendszerek működnek, a kölcsönhatások csak kimeneteik szintjén jelennek meg, számításaik eredményeivel kapcsolatban. B. Bővítjük a moduláris feldolgozást. Ennek egyik eszköze, amint Fodor (1990) maga is kifejti, a következtetés fogalma. A helyesen értelmezett bemeneti feldolgozó rendszerek esetén algoritmikus, automatikus és nem tudásalapú következtetéseink vannak. Ha megfelelő, kanonikusan leképezett a nyelvi bemenet, ebből automatikusan jutunk el valamilyen szándék feltételezéséhez a beszélőnél. Visszacsempésszük azt, amit a tudásalapú szerzők következtetési komponensnek tartanak, csak a következtetések egy jó részét elsődlegesnek, gyorsnak, algoritmizálhatónak deklaráljuk és betesszük a modulba.

. Háttértudás és forma szerepe a megértésben A modern nyelvpszichológiának a hatvanas évek elejére kialakult kereteitől kezdve mindmáig középponti kérdése egymással összefüggésben két probléma: – Milyen hatása van a magasabb szerveződési szinteknek az alacsonyabb szinten zajló feldolgozásra? – Hogyan befolyásolja a tudás a mondat megértését? Az első kérdésre (vagyis, hogy milyen szerepe van a mondatmegértés során az alacsonyabb szintek feldolgozásában a magasabb szinteknek) klasszikus kiindulópont Miller és Isard (1963) kísérlete. Különböző erősségű zajok mellett a kísérlet azt mutatta ki, hogy a valódi mondatok hallgatása esetén adott erősségű fehér zajban a személyek több szót ismernek fel (1), mint ha nem mondatokat hallgatnak, hanem összekevert szósalátákat (2). ()

A fekete macska leült a magas lépcsőre.

()

Ült macska le fekete lépcsőre a magas.

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



A kísérlet máig érvényes érdekessége az, hogy a magasabb szerveződési szint (a mondatszerűség) egy látszólag alacsonyabb szint, a szófelismerés segítésében is kifejti hatását. Miller ebben a kísérletben azt is kimutatta, hogy a grammatikai szerveződésnek nagyobb hatása van, mint a szemantikai anomáliáknak. A (3)–(5) típusú mondatok zaj melletti hallgatása közben megfelelő beállítódásnál kiderült, hogy a teljes mondat felidézésére nézve a szemantikai anomáliának kisebb hatása van, mint a nyelvtanszerűség megtörésének. ()

Helyes mondat: Egy tanú aláírta a hivatalos jogi dokumentumot.

()

Szemantikai anomália: Egy tanú felbecsülte a csillogó szövetséges almát.

()

Agrammatikus mondat: Tanú csillogó almát szövetséges egy felbecsülte.

E kezdeti kísérletek a magasabb szerveződés „lefelé ható” befolyásoló szerepét emelték ki. Ez a magasabb szint a mondat mint forma volt. A pszicholingvisztikának ebben a klasszikus korszakában is megfogalmazódott azonban már az a nézet is, amely szerint a megértésben a pragmatikus-tudásalapú tényezőknek döntő szerepük lehet. A „magasabb szint hatása” nem a forma, hanem a tartalom, a tudás révén érvényesül. Slobin (1966) sokat idézett kísérletében összehasonlította a szenvedő mondatok megértésének közismert nehézségét olyan esetekben, amikor a mondatban szereplő állítás megfordítható (reverzibilis, vagyis mindkét szereplő végezhetné a cselekvést) azokkal az esetekkel, amikor egyértelmű tudásalapú kijelölés van arra nézve, hogy melyik szereplő melyik argumentum szerepet töltheti be (irreverzibilis, megfordíthatatlan szerkezet). A (6) és (7) példa kicsit magyarítva, a szórendet variálva mutatja a Slobin kísérletében használt példákat. ()

a. A kecske kergeti a bárányt. b. A bárányt kergeti a kecske.

()

a. A kutya rágja a csontot. b. A csontot rágja a kutya.

Óvódáskorú gyermekek mondatmegértési teljesítményeiben az derült ki, hogy (6) esetében az (a) típusú mondatok sokkal könnyebbek, mint a (b) típusúak, vagyis gyorsabban és kevesebb hibával értelmezik őket a gyermekek. Ez felelne meg a szenvedő szerkezet nehézségének. A (7) példáknál azonban eltűnik ez a különbség. A hatás alapértelmezése az lenne, hogy a gyermek először megpróbál egy szemantikai függvényt felállítani a mondatban részt vevő szereplők és a predikátum alapján. Ha ez tudása alapján egyértelműen sikerül (tudása azt mutatná,



Pléh Csaba – Thuma Orsolya

hogy a mi lehetséges világunkban a csontok nem rágnak kutyákat), akkor nem kell törődnie a formai elemzéssel. Mindezek az első próbálkozások még a pszicholingvisztikának arra a klaszszikus korszakára tehetőek, amikor pontos menet közbeni mutatók nem álltak rendelkezésre, illetve nem érdekelték a kutatókat. Utólagos mércéket használó vizsgálatokról van tehát szó, ezért ezek nem alkalmasak annak a kérdésnek az eldöntésére, hogy menet közben, már a közvetlen elemzés során hasznosítjuk-e a tudást, vagy ez (bár igen gyorsan, de) pusztán utólag érvényesíti hatását. A lazán megfogalmazott kérdés, vagyis hogy miféle szerepe van a magasabb integrációknak, és milyen szerepe van a tudásnak, a technikai fejlődéssel és a modellek irányváltásával fokozatosan finomodott és több részkérdésre vált szét. A formai modellek sokkal analitikusabbá váltak, és ha megengedték is a felülről-lefelé ható információáramlást, fokozatosan elhatárolódtak a tudás lefelé ható szerepétől. Először a hetvenes évek közepe táján körvonalazódott kétféle hozzáállás a pszicholingvisztika úgynevezett stratégiaközpontú koncepciójának keretében (Clark–Clark 1977). A. Formán alapuló megértés A mondatmegértést alapvetően olyan eljárások biztosítanák, amelyek a nyelvi bemenet nyelvtanilag kitüntetett formai jegyeire (szórend, ragok, formaszók stb.) alapoznak. Olyan stratégiák lennének ezek, mint például „ha találkozol az a illetve egy névelővel, akkor nyiss meg egy elemzési dobozt a főnévi csoportnak, és várj a főnévre, amely majd ezt lezárja”, vagy „ha egy főnév végén -t végződést találsz, akkor ezt vedd az ige tárgyának”. B. Tartalmi alapú stratégiák A megértést olyan eljárások biztosítanák, amelyeknek lényegi mozzanata, hogy abból indulnak ki: a beszélő együttműködik velünk (Grice 1997 együttműködési elvére hasonlít ez). Ezért a legegyszerűbb eljárás az, ha a szavak azonosítása után meglévő tartalmi tudásunkat (világismeretünket) és a partner tudására vonatkozó feltételezéseinket felhasználva próbálunk felállítani kijelentésfüggvényeket a beérkező anyagról, a forma részleteivel nem törődünk.

.. Interakció, autonómia és modularitás a megértésben A hetvenes évek második felétől sokkal határozottabb formában, az elsődlegességi és idői elrendezési kérdéseket is világosan felvetve fogalmazódott meg újra a tudás, a szintek interakciója és a forma szerepe a megértésben. Végeredményben három különböző felfogás bontakozott ki. A viták közöttük csak azon foly-

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



nak, hogy ez a szövegösszefüggésbe való integrálás és tudásfelhasználás elsődleges vagy másodlagos folyamat-e.

... Az interakciós felfogás Ez a koncepció is feltételezi, hogy a megértésnek különböző elemzési szintjei vannak. Az ember azonban alapvetően kompromisszumokat keres a gyorsaság érdekében, és mindegyik elemzési szintet állandóan felhasználja a többi elemzési szint eredményeinek befolyásolására. Ráadásul szokványos körülmények között a rendszer mindegyik elemzési szintjében nyitott, vagyis áthatolható a tudásalapú betolakodások számára, a megértés összetevői nem elválasztottak a működés során. Bár a mondat szintaktikai formájával és az egyes szavak közti lehetséges propozíciókat felállító függvényviszonyokkal egyszerre kezdünk foglalkozni, ha ezek az utóbbiak előbb vezetnek eredményre, leblokkoljuk a formai elemzést. Az interakciós felfogást számos kísérlettípus támasztja alá. Egyik jellegzetes példája ennek a Forster (1970; Foss–Swinney 1973) bevezette hangkövetési reakcióidő kísérlet. A kísérleti személy feladata az, hogy (egy kiegészítő mellékfeladat mellett, amely biztosítja, hogy komolyan odafigyeljen) a mondat elhangzása előtt specifikált szókezdő hangok felismerését jelezze, és akkor nyomja le a reakcióidő-billentyűt, amikor ilyen hangok megjelennek. Képzeljük el, hogy a (8)–(12) példákban mindig a b, b mint Béla hangra kell figyelni. A példákban szisztematikusan az (a) változat a könnyebb, a (b) változat a feltételezés szerint a nehezebb eset. ()

a. Vera látta a bal oldali széket. b. Vera látta a bézs széket.

()

a. Jenő felemelte a bal oldali széket. b. Jenő precizírozta a bal oldali széket.

()

a. Mária nem tudta, hogy ballagásra mennek-e. b. Mária nem tudta, ballagásra mennek-e

()

a. A rádiós beolvasta az új szöveget. b. A rádiós az új szöveget olvasta be.

()

a. A cserkész elővette új bicskáját. b. A cserkész elővette új Braille-könyvét.

A kísérleti módszer, ahogy Cutler (1989) összefoglalója is mutatja, nagyon érzékeny a legkülönbözőbb megértési nehézségekre. A célszó ritkasága (8) vagy



Pléh Csaba – Thuma Orsolya

váratlansága, illetve nehezen kiejthetősége (12) ugyanúgy befolyásolja, mint a megelőző szó ritkasága (9), illetve a szintaktikai nehézségek (10)–(11). A lassulások 30–100 ms közöttiek. Úgy tűnik, hogy a feldolgozás szempontjából egyaránt nehézséget, és ezzel a célhang felismerésének lassulását okozza, ha a szófelismeréssel, a kiejtéssel kapcsolatos vagy a mondattani feldolgozással összefüggő problémáink vannak. Ez arra utalna, hogy valamiféle konvergencia megy végbe a megértés során. Ha a kognitív pszichológia klasszikus modelljeinek szóhasználatát alkalmazzuk, közös erőforrásokat (Kahneman 1973) használnának fel a különböző elemzési szintek. A sok módszer közül a legérdekesebb Marslen-Wilson és Tyler (1980) kísérleti eljárása, a szófelismerési idők vizsgálata különböző utasítások mellett. Képzeljük el, hogy a (13) mondatot hallgatva a személyek egyik csoportja azt az utasítást kapja, hogy nyomjon le egy gombot, ha azt a szót hallja, hogy kabát. Egy másik csoport tagjainak azt mondják, nyomja le a gombot, ha azt a szót hallja, amely rímel azzal, hogy lapát. Végül a harmadik, a szemantikai vagy kategóriacsoport azt a feladatot kapja, hogy nyomja le a gombot, ha egy ruhadarab nevét hallja. A (13) mondatban ténylegesen a kabát szó szerepel. ()

A tél lassan, de biztosan közeledett. Sok kabát felkerült a didergő vállakra.

A személyek a kategóriadöntés, vagyis a szemantikai alapú feladat esetén ugyanolyan, meglehetősen gyors reakcióidőt produkáltak, mint a rímelő feladat alapján (2–300 ms). Szokvány kontextusban a szemantikai alapú értelmezés és feldolgozás ugyanolyan gyorsan végbemegy, mint a formai alapú. Egy szó megfelelően előhíva és előfeszítve a kontextus által, teljes jelentésével ugyanolyan gyorsan aktiválódhat, mint a szó hangteste. Hogy itt a kontextusnak nagy szerepe van, azt jól mutatja a (14) példa. ()

Az egyetemeken megindult a doktori képzés. Sok kabát felkerült a didergő vállakra.

Ilyenkor, amikor az előmondat és a célmondat között nincsen értelmes összefüggés, felbomlik a szokásos (opportunisztikus) interaktív megértés, és a személyek áttérnek egy „forma alapú” megértési modellre, vagyis gyorsabban ítélnek a szó hangalakja, mint jelentése alapján. Pontos hangalak alapján a reakcióidő 358 ms, rímnél 492 ms, és kategóriánál 578 ms.

... A moduláris koncepció a mondatmegértésben Mit is jelent közvetlenül a mondatmegértésre vonatkoztatva ez a moduláris felfogás? Nyilvánvalóan a formai koncepció folytatását. A mondat megértésében

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



meg kell különböztetnünk több egymást követő szintet. Frazier és Janet Fodor (1978) híres kolbásztöltő-modellje például ezt egyszerűen úgy képzeli el, hogy a megértési folyamatnak van egy elsődleges szerkezetösszecsomagoló része, és egy második, nagyobb ablakokat és nagyobb lépéseket használó szisztematikus mondattani összegző eleme. Egy olyan mondat esetén, mint (15), az első lépésben szűklátókörű feldolgozónk villámgyorsan főigének értelmezi az olvasta szót, hogy azután a könyv szó feldolgozásakor visszatérjen és újraértelmezze saját korábbi döntését. ()

A fiú olvasta könyv az asztalon hever.

A modularitást képviselő szerzők tovább finomították a kétféle elemzési szint feltételezését. Azt hangsúlyozzák, hogy ha az interakciós feldolgozás igaz, akkor a szemantikai megkötések a mondatok szerkezetében megakadályoznák a (15) példákhoz hasonló csapdahelyzetek kialakulását. De ez mégsem történik meg. Sőt, ahogy Frazier (1990) említi, például még a híres Slobin-féle mondatokban (A csontot rágja a kutya) is az az igazság, hogy finom azonidőbeli (on-line) elemzések mellett kiderül, hogy nem zár rövidre a csont és a rágás közötti egyértelmű szemantikai megfeleltetés, az angolban a szenvedő szerkezet ilyen irreverzibilis szemantikájú mintázatoknál is okoz megértési nehézséget. A modularitási koncepció egy szempontból kiegészül szemantikára emlékeztető hatásokkal. A moduláris koncepció képviselői feltételezik, hogy a korai szintaktikai szerepelemzést kiegészíti egy tematikus feldolgozó rendszer (Frazier 1990), de ugyanezt a koncepciót képviseli Carlson és Tanenhaus (1988) is. Ez a tematikus feldolgozó mintegy ellenőrzi a korai szintaktikai elemzés eredményét. A korai elemzés nyelvészeti értelemben a predikátum alapján mozgósítja a szerepeket a főnévi csoportokhoz, mint Ágens, Téma, Instrumentum és így tovább. A tematikus elemző ezeket viszonyítja a világhoz és a szövegreprezentációhoz. A moduláris koncepcióban valójában a tematikus kategóriák szintje az a kölcsönhatási terep vagy felület, ahol a szövegmodell, a formai elemzést és a világról való tudásunk kölcsönhatásba lépnek egymással. Nem triviális kérdés, hogy jogos-e a tematikus elemzést csak másodlagos ellenőrző funkcióban felvenni. Lehet például, hogy egy időben zajlik a tulajdonképpeni mondattani elemzéssel.

. A kétértelműségek feldolgozása mint a moduláris és interaktív modellek nagy próbája Egy példát mutatunk be saját kísérleteinkből arra, hogy hogyan képzelendő el különböző összetevők kezelése valóságos nyelvpszichológiai modellekben, és



Pléh Csaba – Thuma Orsolya

milyen nehéz technikai problémákat vet fel az interakciós és a moduláris felfogások közötti empirikusan motivált választás. A természetes nyelv, bármennyire igyekezzünk is ezt kerülni, meglehetősen tele van kétértelműségekkel. A moduláris és interakciós feldolgozáselméletek vitájában, a két felfogás pontos helyének tisztázása során nagy szerepet játszik a kétértelműség vizsgálata. A (16)–(18) mutat néhány példát az egyszerűség kedvéért nem foglalkozva azzal, hogy hom*onímiáról vagy poliszémiáról van-e szó. ()

Szótári kétértelműség: A nyúl emlős állat. (nyúl1 = FN, nyúl2 = IGE)

()

Szerkezeti kétértelműség: Nem helyeslem a misszionáriusok főzését. (főzés1 = mellékmondati alany, főzés2 = mellékmondati tárgy)

()

Szótári, szerkezeti és pragmatikai kétértelműség: Török követ.1

A dolog komplexitását mutatja, ha elgondolkozunk azon, hogy a Török követ (18) kijelentésnek hányféle jelentése van, kezdve attól, hogy Én töröm a követ, egészen odáig, hogy bemutatok egy Török Lajos nevű franciaországi magyar nagykövetet, vagy odáig, hogy egy török származású személy jön utánam. A moduláris és interakciós elméletek számára különleges jelentőségre tettek szert a szótári kétértelműségek. Swinney (1979) volt az első, aki kimutatta, hogy a megértés során – bármennyire is intuícióellenes ez – egy-egy kétértelmű szó mindkét jelentése aktiválódik. Ha egy olyan mondatot veszünk (a későbbiekben használt magyar példáinkat elővételezve), mint a (19), akkor a nyomok szó igei jelentése is aktiválódni fog, annak ellenére, hogy csak a főnévire van szükség. ()

Reggelre eltűntek a nyomok a hóban.

Swinney ezt a meglehetősen intuícióellenes tézist modalitásközi előfeszítési helyzetekben igazolta. A nyomok szó irreleváns jelentésének aktiválását úgy lehet igazolni, hogy a nyomok szó hallása nemcsak a relevánsnak tekinthető foltok, hanem az adott mondatban irreleváns tolok szó kiolvasását is facilitálja, természetesen egy semleges kontrollhelyzethez képest. Ami a fejünkben levő lexikonhoz, szótárhoz való hozzáférést illeti, ez a modell azt sugallná, hogy az egyes szóalakok alatt rendezve szerepelnének azok jelentései. Ezt az egész információhalmazt azonban csak mint egy dobozt, együttesen tudnánk elővenni a fejünkből, 1 Ez a példa tisztelgés Szépe György, sok egyéb mellett az Általános Nyelvészeti Tanulmányok egyik mozgató szellemének emléke előtt. 1971-ben egyik első mondattan óránkon kaptuk házi feladatnak a lehetséges értelmezések kibogozását.

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



nem lennénk képesek arra, hogy előre felnyissuk a dobozt, és csak azt a jelentést vegyük elő, amelyre az adott helyzetben szükségünk van. A megelőző kontextus segítené, mégpedig asszociatív-szemantikai alapon a hozzáférést a szóhoz, de nemcsak annak releváns jelentéséhez. A releváns jelentés kiválasztása egy második, már a mondat szövegbe történő integrációjával kapcsolatos lassabb folyamat eredménye lenne. Az interakciós elmélet képviselői sem hagyták azonban annyiban a dolgot. Kiger és Glass (1983) munkái óta megjelent visszafelé aktiválási magyarázat is. E szerint a kétféle jelentés aktiválódása valójában annak következtében állna elő, hogy az irreleváns jelentést egy igen gyors másodlagos folyamat (ez lenne a visszafelé ható előfeszítés) valósítaná meg, amely a tesztszóból indul. Hallom azt a szót, hogy nyomok főnévi jelentéssel, és megjelenik az az olvasandó tesztszó, hogy tolok. Visszanézek ahhoz a szóhoz a reprezentációban, hogy nyomok, és gyorsan észreveszem, hogy ennek van egy igei jelentése is. Ez a séma a (20) alatt láthatónak felelne meg. ()

nyomok → főnév tsz. → tolok ?? ige 1.sz. 1.sz.

Bár igen erős adatok, például elektrofiziológiai eredmények is szólnak a mellett (van Petten–Kutas 1987), hogy a visszafelé aktiválás és a párhuzamos aktiváció legalább egyforma erős magyarázatok, magyar nyelven végzett kísérleteink szerint néha ki lehet zárni a visszafelé aktiválás lehetőségét. Ugyanis a kétértelműségi hatáshoz előbb el kell jutni a ragozott alaktól a kétértelmű tőig. Laboratóriumunkban végzett munkák (Gergely–Pléh 1994; 1995; Thuma– Pléh 1995; 2000) kimutatták, hogy bizonyos helyzetekben még nagyon erős grammatikai kontextusok sem képesek azonnal rövidre zárni az értelmezést pusztán a nyelvtanra alapozva az egyértelműsítésben. Az olyan szótövek, amelyek kétértelműek a főnévi és igei olvasat közt, mint például a dob, előfeszítik mind a releváns jelentést, mind az irreleváns jelentést, és a hozzájuk kapcsolódó asszociátumokat, miközben a (23) példában az -sz rag egyértelművé teszi, hogy a kulcsszó csak ige lehet. Egy kétértelmű szóalakokat használó kísérletben (Gergely–Pléh 1994; 1995) a (21)–(23)-nak megfelelő példákat használtuk. Az ismertetett példáknál a kiinduló kétértelmű tő mindig a dob, és mindig az igei egyértelműsítő kontextust használtuk. Az egyértelműsítő kontextust úgy kell elképzelni, hogy a mondatban nincsen másik ragozott igealak, tehát a dob különböző alakjai csakis igei formák lehetnek. A hallott mondatokat közvetlenül követte egy kiolvasandó írott



Pléh Csaba – Thuma Orsolya

szóinger, amely egyrészt a hajít volt (ez felelne meg a releváns igei olvasatnak), másrészt a hegedű (ez felelne meg az irreleváns, itt nem szükséges főnévi olvasatnak). ()

Te is tudod, hogy János mindig nagyot dob.

()

A labdát mindig bal kézzel dobom.

()

Nem is tudtam, hogy ilyen messzire dobsz.

A kísérlet eredményei szerint volt facilitáció az irreleváns jelentésre. Még abban az esetben, a dobsz alaknál is előjött, amikor ezt igen nehéz lenne megmagyarázni visszafelé való előfeszítéssel. Ugyanis amikor megjelenik a hegedű tesztinger, a személy számára már csak a dobsz forma egésze áll rendelkezésre. Ha ehhez térne vissza reprezentációjában, itt semmi nyomát nem találja a kétértelműségnek, hiszen az sz pusztán igei rag. A kétértelműségi hatás mégis megvan, amint a 2. táblázat összegzi. Kontrollszavakkal összehasonlítva az irreleváns szavaknál 49 ms-os, a relevánsoknál 44 ms-os facilitációt kaptunk. Vagyis az irreleváns jelentés rövid ideig – itt a késleltetések általában 100 ms nagyságrendűek – még olyankor is aktív, amikor a mondatkontextus egyértelműsítene az igei és a főnévi olvasat között. Ez egy kétlépcsős feldolgozási modellt körvonalaz, amelyben egy ostoba, automatikus, moduláris megértési szakasz működne először, néhány tizedmásodpercig. Ezt követné a tudáskeresésen alapuló, lassabb, jól tájékozott szakasz, amely a relevanciára törekszik. Minden jelentés kötelező aktiválását, vagyis a többszörös hozzáférést követné a pragmatikai, tudáson és kontextuson alapuló mozzanatok mérlegelése. Ez egy gazdag alaktanú agglutinatív nyelvben sajátosan azt is jelenti, hogy a morfológiai elemzésnek nincs közvetlen visszajelentő hatása arra az asszociatív tovaterjedő aktivációra, amelyet a lexikai reprezentációk indítanak el. Mindkét folyamat a saját útját követi, először egy forma összes jelentését aktiválnánk, és az automatikus folyamatoknak köszönhetően még arra is elég idő van, hogy az asszociátumok mozgósítódjanak. A formai feldolgozás eredményeit csak egy későbbi szakaszban vennénk figyelembe, és a többszörös kétértelműségeket csak a diskurzusrelevancia későbbi kiszámítási szakaszában egyértelműsítenénk. Thuma és Pléh (2001) további kísérletei finomították az értelmezést. A fentiekhez hasonló kísérleti mondatokat használtak, de mind igei, mind főnévi olvasatot vagy kontextust alkalmaztak. Vagyis olyanokat is, mint (24)–(25), ahol a kétértelmű szó az adott helyen éppen főnév. ()

Ott van a sarokban a dob.

()

Holnap hozd el a dobot.



A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái 2. táblázat: A szókiolvasási idők és a kontextuális hatás (Gergely–Pléh )

Igei előfeszített

Főnévi nem előfeszített

Célszó Kontroll Eltérés

Célszó Kontroll Eltérés

Kétértelmű tő (dob)  Kétértelmű ragozott (dobod)  Egyétértelmű ragozott (dobsz) 

  

− − −

  

  

− − −

A főnévi szerep akkor is facilitálódik, ha ez a jelentés az irreleváns, és akkor is, ha ez a releváns, amint az 1. ábra mutatja. 25 20 15 10 5 0 "5 "10 "15 "20

F!név Ige

Releváns

Irreleváns

1. ábra: A főnévi jelentés aktiválódik, akkor is, ha az adott mondatban az az irreleváns

(Thuma–Pléh 2001)

Mindez csak úgy magyarázható, ha két feltételezéssel élünk: a. a magyar beszélők morfémánként elemzik a több formából összeálló szavakat, vagyis azt, hogy dobsz úgy, hogy dob-sz, b. a főnévi jelentés mindig aktiválódik, és legalább addig fennmarad, amíg a végződés jelentésének integrálódása folyik. Thuma (2008) hasonló szóanyagot használva megvizsgálta azt is, hogy mi történik akkor, ha a gyakoriságot is elemezve a kétértelmű tövek egy-, illetve kétértelmű ragokhoz kapcsolódnak. Korábbi kísérletei kimutatták, hogy magában a ragok kétértelműsége egyértelmű tövek mellett is lelassítja a szóra vonatkozó döntést. Ezt az alaphelyzetet a 3. táblázat mutatja az eredményekkel.



Pléh Csaba – Thuma Orsolya 3. táblázat: Szódöntési reakcióidő-átlagok a rag és a tőgyakoriság függvényében, ezred-

másodpercben, zárójelben a standard hibával (Thuma 2008 nyomán) Rag

Ritkább tő

Gyakoribb tő

Kétértelmű rag (-nak) Egyértelmű rag (-ból)

735 ms (13,9) csuklónak 713 ms (13,7) burokból

735 ms (14,1) gombnak 693 ms (13,5) csapból

A tövek és a végződések kétértelmúségét együtt variáló ingeranyagot (26) mutatja. ()

gyakoribb a főnévi olvasat: fejnek, fejből, fejsz gyakoribb az igei olvasat: dobnak, dobból, dobsz

Az eredményeket egy szódöntési feladatban a 2. ábra mutatja.

2. ábra: Reakcióidő-átlagok a rag és a hom*onim tő gyakoribb olvasata szerint bontva

(Thuma 2008)

A kétértelmű (-nak) és az egyértelmű főnévrag (-ból) mellett azokról az alakokról döntöttek gyorsabban a kísérleti személyek, amelyeknek a főnévi olvasata volt a gyakoribb. Ezzel szemben az egyértelmű igerag (-sz) esetében a személyek azokról az alakokról döntöttek gyorsabban, amelyeknek igei olvasata fordul elő gyakrabban. Tehát a hom*onim szótő igei és főnévi olvasatának viszonylagos előfordulása szignifikánsan befolyásolta a döntési időket a lexikai döntési helyzetben.

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



. Összegzés és kitekintés Ezek a kísérletek tehát arra utalnak, hogy a szótár és a mondattani elemzés egymáshoz illesztésében moduláris hatások figyelhetők meg. Felkészületlenül, ostobán, a kontextust figyelembe nem véve értelmezzük először a szavakat, sőt még a morfológiai elemzés, az egyes tövek és végződések egymáshoz kapcsolása is ilyen informálatlanul folyik, ugyanakkor a szófaji információ döntő szűrő. A szükséges jelentésekre való korlátozás csak később lép fel. Mint Gernsbacher (1990; 1997) kimutatta, ebben a koherenciateremtésben a facilitáció mellett elnyomást, az irreleváns jelentések legátlását is ki lehet mutatni. Gernsbacher (1993; Gernsbacher–Faust 1991) kimutatta a gátlási hatást például hom*onimák nem releváns jelentésénél is. Faust és Gernsbacher (1996) lateralizált ingeradással pedig feltárta, hogy a bal félteke hatékonyabb az irreleváns információ elnyomásában. Arra is rámutattak, hogy a gátlás fontos megkülönböztető jó és rossz olvasók között. A rossz olvasók nehezen képesek irreleváns jelentéseket gátolni, és ez lehet olvasási gondjaik egyik alapja is. Korai automatikus „buta” morfológiai folyamatokra utalnak Meunier és Longtin (2007) kísérletsorozatának eredményei. Meunier és Longtin vizuális maszkolt előfeszítéssel kimutatta, hogy a lexikai azonosítást megelőzően a morfológiai felbontás a szóalakok minden olyan betűsorán megtörténik, amely az adott nyelven létező morféma: létező képzett alakok (gardener), pszeudo-képzett alakok (corner), és képzett pszeudo-szavak (quickify) esetében egyaránt. Ha a szó látszólag tartalmaz egy tövet, de a végződése nem önálló morféma az adott nyelvben, akkor a pszeudo-tő nem aktiválódik (pl. abri-cot és abri a franciában). Nem létező összetett szavak, amelyek létező morfémákból állnak, ugyanolyan jól feszítették elő a tövet, mint a létező alakok. Maszkolva még olyan alakok is előfeszítették a tövüket, amelyek két morfémája szintaktikailag kizárja egymást (pl. sportation). Tehát a feldolgozás korai, nem tudatosuló szakaszában sem a jelentés értelmezhetősége, sem az alkotó morfémák szintaktikai illeszkedése nem játszik szerepet. Tudatos előfeszítésben a nem értelmezhető pszeudo-szavak nem feszítették elő a szótövet, viszont előfeszítés volt mérhető a létező alakok, a nem létező, de lehetséges tő–képző kombinációk és a tövek között. Mindez nemcsak azt jelenti, hogy bizonyos információtípusok használatában késleltetések vannak, hanem egy sajátos modellt képvisel a tudatosságról is: a 200–400 ms-os hosszúságú időablakban azért aktívak az irreleváns jelentések, mert még nem lépett fel a háttérinformációval való összekapcsolás és az azon alapuló tudatos szelekció. Ez az értelmezés a kétszakaszos modelleket összekapcsolja a mai kognitív tudományban oly központi kérdéssel, a tudatos integráció



Pléh Csaba – Thuma Orsolya

problémájával (Dennett 1991; Dennett–Kinsbourne 1992). Ez a felfogás megfelel Marcel (1983) gondolatmenetének, aki szavak felismerésekor kimutatta, hogy a tudatosan nem látott, maszkolt, elfedett ingernek megvannak a hatásai más szavak észlelésre, anélkül, hogy ez tudatosuló észlelést eredményezne. Többen (Badecker–Allen 2002; Meunier–Longtin 2007) az empíriák alapján úgy vélik, hogy a feldolgozás korai szakaszában az automatikus morfológiai elemzés minden olyan alakon megtörténik, amely a nyelvben létező morfémákra bontható. Ezt követi az elemek integrációja a jelentés és a szó szintaktikai jellemzői alapján. Az integrációs folyamatok részét képezi az össze nem illő elemek közötti kölcsönös gátlás. Talán annak függvényében alakulnak ki, vagy maradnak fenn szóalak-reprezentációk a mentális szótárban, hogy az integrációs folyamat mennyire könnyű, illetve használható eredményre vezet. A kétértelműségek például megnehezítik a forma és jelentés integrációját, ezért az alak megőrzése a feldolgozást lokálisan előrelendítheti. Szabályos ragozott alakok morfémái szabályszerű és egyértelmű forma–jelentés kapcsolatban állnak, ezért az egészleges tárolás felesleges. Nem átlátható jelentésű képzett szavakról, amelyek bár morfémákra felbonthatók, de a jelentés ezek alapján mégsem kiszámítható, szintén egészleges reprezentációt tárol a szótár. A tartalmas és grammatikai morfémák között a szintaktikai és szemantikai össze nem illés különböző fajtái valószínűleg a feldolgozás eltérő szakaszaiban okoznak gondot. Tudatos előfeszítési (priming) helyzetben például az alakok hasonlósága gátol, a tövek kétértelműsége és a ragok összeférhetetlensége együtt szintén gátol, ugyanakkor a kétértelmű grammatikai morféma vagy a rendhagyó, de szabályosságot követő alak önmagában nem eredményez megfigyelhető gátlást. A lexikai döntéshelyzet viszont ezekben az esetekben is feldolgozási nehézségeket sejtet. Véleményünk szerint az idézett megfigyelések kevéssé összeegyeztethetők azokkal az interakcionista és konnekcionista nézetekkel, amelyek szerint minden információ azonnal, egymással kölcsönhatásban alakítja a feldolgozás menetét. A tudatosulást megakadályozó maszkolásos eljárásokkal ugyanis feltárható egy olyan automatikus morfológiai elemző folyamat, amely kizárólag arra érzékeny, hogy az adott nyelven a mentális szótár milyen morfémákat tartalmaz. A szóelem jelentése és szintaktikai jellemzői a feldolgozásnak csak egy későbbi szakaszában hatnak. Ez inkább a kettős mechanizmus modelljét és a szakaszos feldolgozási modelleket támogatja (Chialant–Caramazza 1995; Pinker–Prince 1994; Schreuder–Baayen 1995). Még ha szigorú szakaszosság nincs is a nyelvi feldolgozás során, ahogy azt néhány modularista modell feltételezi, a feldolgozási folyamat időben előre haladva bontakozik ki, és az ingerbemutatástól számított idő függvényében eltérő folyamatok mérhetők.

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



Főbb állításaink tehát, a magyar kísérletek alapján: 1. A nyelvi feldolgozást illetően vannak olyan területek, ahol szigorú modularitás érvényesül. Ilyen például az alaktani és a szótári feldolgozás. 2. Vannak aztán olyan területek, ahol a moduláris hatásokat nehéz elválasztani a tudás figyelembevételétől, egyszerűen azért, mert a formán alapuló moduláris elemző rendszer kategóriái és a tudás kategóriái nagyon hasonlítanak egymáshoz. Ennek felelne meg az információs integráció a szintaktikai feldolgozó kimenetek, a tematikus feldolgozó és a szöveg, illetve a tudás konceptuális reprezentációt használó rendszere között. 3. Végül vannak olyan rendszerek, mint például az anaforaértelmezés a magyarban (Pléh 1994b; 2000) ahol egyértelműen egymás után rendeződnek a moduláris elveken működő informálatlan és „tiszta” kategóriákat használó, valamint az interaktív, minden kategóriát tájékozottan felhasználó lépések. A modellálás nagy kérdése természetesen, hogy finom idői mutatókkal tényleg el tudjuk-e választani a különböző lehetséges megoldásokat egy-egy részkérdésnél. 4. A feldolgozási alapú tovaterjedő aktivitás érzékeny a szófajra, és más módon, mint ez általában fel szokott merülni. A kontextuálisan irreleváns jelentések viszonylag hosszabb aktivációját eredményezi, ha ezek a szó domináns jelentéséhez tartoznak. Vagyis a feldolgozás első szakasza mégsem teljesen érzéketlen a kontextusra: az irreleváns jelentés aktiválása akkor jelenik meg, ha ez felel meg a szó domináns jelentésének. Vagyis itt a hosszabb távú hatásból származó (domináns jelentés) és a rövid távú, kontextuális információk felhasználásának viszonyáról, kétféle pragmatikai információ idői versengéséről lehet szó, ahol a hosszabb távú információkat használjuk fel korábban. 5. Mindez az önmagába zárt modularitást megkérdőjelezi, és inkább arra utal, hogy az eltérő pragmatikai információk támadáspontja eltérő.



Pléh Csaba – Thuma Orsolya

Irodalom Badecker, William – Michael Allen 2002. Morphological parsing and the perception of lexical identity: A masked priming study of stem hom*ographs. Journal of Memory and Language 47: 125–144. Buzsáki, György 2006. Rhythms of the brain. Oxford: Oxford University Press. Carlson, Gregory N. – Michael K. Tanenhaus 1988. Thematic roles and language comprehension. Syntax and Semantics 21: 263–288. Chialant, Dorian – Alphonso Caramazza 1995. Where is morphology and how is it processed? The case of written word recognition. In: Feldman (1995, 55–76). Chomsky, Noam 1957. Syntactic structures. The Hague: Mouton. Chomsky, Noam 1986. Some observations on language and language learning: Reply to Macnamara, Arbib, and Moore and Furrow. New Ideas in Psychology 4: 363–377. Chomsky, Noam 1995. Mondattani szerkezetek. Nyelv és elme. Budapest: Osiris/Századvég. Clark, Eve V. – Herbert H. Clark 1977. Psychology and language: An introduction to psycholinguistics. New York: Harcourt Brace Jovanovich. Coltheart, Michael 1999. Modularity and cognition. Trends in Cognitive Sciences 3: 115–120. Cosmides, Leda – John Tooby 2000. Evolúciós pszichológia: Alapozó kurzus. Replika 40: 101–124. Cutler, Anne 1989. A lexikai komplexitás és a mondatmegértés. In: Pléh Csaba (szerk.): A beszédmegértés és a beszédproduklció pszichológiája. Budapest: Tankönyvkiadó. 139–173. Dennett, Daniel 1991. Consciousness explained. Cambridge MA: MIT Press. Dennett, Daniel – Marcel Kinsbourne 1992. Time and the observer. The where and when of consciousness in the brain. Behavioral and Brain Sciences 15: 183–247. Faust, Mark E. – Morton Ann Gernsbacher 1996. Cerebral mechanisms for suppression of inappropriate information during sentence comprehension. Brain and Language 53: 234–259. Feldman, Laurie Beth (szerk.) 1995. Morphological aspects of language processing. Hillsdale, NJ: Lawrence Erlbaum. Fodor, Jerry A. 1983. The modularity of mind. An essay on faculty psychology. Cambridge MA: MIT Press. Fodor, Jerry A. 1990. Why shoud the mind be modular? In: Jerry A. Fodor (szerk.): A theory of content and other essays. Cambridge MA: MIT Press. 207–230. Fodor, Jerry A. 1996. Összefoglalás Az elme modularitásához. In: Pléh Csaba (szerk.): Kognitív tudomány. Budapest: Osiris Kiadó – Láthatatlan Kollégium. 197–206. Fodor, Jerry A. 2000. The mind doesn’t work that way. Cambridge MA: MIT Press. Forster, Kenneth 1970. Some effects of ambiguity on sentence comprehension. Journal of Verbal Learning and Verbal Behavior 9: 699–706. Forster, Kenneth I. – Ilmar Olbrei 1973. Semantic heuristics and syntactic analysis. Cognition 2: 319–347. Foss, Donald J. – David Swinney 1973. On the psychological reality of the phoneme: Perception, identification and consciousness. Journal of Verbal Learning and Verbal Behavior 12: 246– 527. Frazier, Lyn 1990. Exploring the architecture of the language system. In: Gerry T. M. Altmann (szerk.): Cognitive models of speech processing. Cambridge MA: MIT Press. 409–433.

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



Frazier, Lyn – Janet D. Fodor 1978. The sausage machine: A new two stage parsing model. Cognition 6: 291–325. Gergely, György – Csaba Pléh 1994. Lexical processing in an agglutinative language and the organization of the lexicon. Folia Linguistica 28: 175–204. Gergely György – Pléh Csaba 1995. Az alaktani kétértelműségek a megértés folyamatában: Avagy ,,nyomok a hóban”. Magyar Pszichológiai Szemle 51: 269–292. Gernsbacher, Morton Ann 1990. Language comprehension as structure building. Hillsdale, NJ: Erlbaum. Gernsbacher, Morton Ann 1993. Less skilled readers have less efficient suppression mechanisms. Psychological Science 4: 294–298. Gernsbacher, Morton Ann 1997. Two decades of structure bulding. Discourse Processes 23: 265– 304. Gernsbacher, Morton Ann – Mark E. Faust 1991. The mechanism of suppression: A component of general comprehension skill. Journal of Experimental Psychology: Learning, Memory, and Cognition 17: 245–262. Grice, H. Paul 1997. Jelentés és a társalgás logikája. In: Pléh Csaba – Síklaki István – Terestyéni Tamás (szerk.): Nyelv – kommunikáció – cselekvés. Budapest: Osiris Kiadó. 203–214. Győri, Miklós 2006. Autism and cognitive architecture. Domain specificity and cognitive theorising on autism. Budapest: Akadémiai Kiadó. Kahneman, Daniel 1973. Attention and effort. Englewood Cliffs, NJ: Prentice Hall. Karmiloff-Smith, Annette 1992. Beyond modularity: A developmental perspective on cognitive science. Cambridge MA: MIT Press. Kiger, John I. – Arnold L. Glass 1983. The facilitation of lexical decisions by a prime occuring after the target. Memory and Cognition 11: 356–365. Lange, Friedrich A. 1881. History of materialism. I–III. London: Trübner. Marcel, Anthony J. 1983. Conscious and unconscious perception: An approach to the relations between phenomenal experience and perceptual processes. Cognitive Psychology 15: 238– 300. Marslen-Wilson, William D. – Lorraine K. Tyler 1980. The temporal structure of spoken language understanding. Cognition 8: 1–71. Meunier, Fanny – Catherine-Marie Longtin 2007. Morphological decomposition and semantic integration in word processing. Journal of Memory and Language 56: 457–471. Miller, George A. – Stephen Isard 1963. Some perceptual consequences of linguistic rules. Journal of Verbal learning and Verbal Behaviour 2: 217–228. Newell, Allen 1989. Unified theories of cognition. Cambridge MA: Harvard University Press. Petten, Cyma van – Marta Kutas 1987. Ambiguous words in context: An event-related potential analysis of the time course of meaning activation. Journal of Memory and Language 26: 188–208. Pinker, Steven 2002. Hogyan működik az elme? Budapest: Osiris Kiadó. Pinker, Steven – Alan Prince 1994. Regular and irregular morphology and the psychological status of rules of grammar. In: Susan D. Lima – Roberta L. Corrigan – Gregory K. Iverson (szerk.): The reality of linguistic rules. Amsterdam & Philadelphia: John Benjamins. 321–351.



Pléh Csaba – Thuma Orsolya

Pléh Csaba 1994a. A megismerés egységes elmélete. Magyar Pszichológiai Szemle 50: 99–111. Pléh Csaba 1994b. Mondatközi viszonyok feldolgozása: az anafora megértése a magyarban. Magyar Pszichológiai Szemle 50: 287–320. Pléh Csaba 2000. Moduláris és interakciós felfogások a nyelvfeldolgozásban. In: Pléh Csaba – Kampis György – Csányi Vilmos (szerk.): A megismeréskutatás útjai. Budapest: Akadémiai Kiadó. 207–248. Schreuder, Robert – R. Harald Baayen 1995. Modeling morphological processing. In: Feldman (131– 154). Slobin, D. 1966. Grammatical transformations and sentence comprehension in childhood and adulthood. Journal of Verbal Learning and Verbal Behaviour 5: 219–227. Sperber, Dan 2000. Metarepresentations in an evolutionary perspective. In: Dan Sperber (szerk.): Metarepresentations: a multidisciplinary perspective. Oxford: Oxford University Press. 117– 137. Swinney, David A. 1979. Lexical access during sentence comprehension: (Re)consideration of context effects. Journal of Verbal Learning and Verbal Behavior 18: 645–59. Szentágothai, János 1975. The “module concept” in cerebral concept architecture. Brain Reserach 95: 475–496. Szentágothai János 1979. Egységes agyelmélet. Utópia vagy realitás? Magyar Tudomány 139: 601– 616. Thuma Orsolya 2008. Gyakorisági hatások és nyelvi kétértelműségek vizsgálata a mentális szótárban magyar nyelven. Dooktori értkezés. ELTE, Budapest. Thuma Orsolya – Pléh Csaba 1995. Lexikális előfeszítés a mentális lexikonban az anyanyelv és egy tanult második nyelv között. Magyar Pszichológiai Szemle 51: 293–304. Thuma, Orsolya – Csaba Pléh 2000. Ambiguity and morphological decomposition in Hungarian. In: Chris Schaner-Wolles – John Rennison – Friedrich Neubarth (szerk.): Naturally! Linguistic essays in honour of Wolfgang Ulrich Dressler on the occasion of his 60th birthday. Torino: Rosenberg & Sellier. 128–142. Thuma Orsolya – Pléh Csaba 2001. Kétértelműség és dekompozíció a magyar nyelvben. In: Pléh Csaba – Lukács Ágnes (szerk.): A magyar morfológia pszicholingvisztikája. Budapest: Osiris. 39–53. Tomasello, Michael 2001. Gondokodás és kultúra. Budapest: Osiris Kiadó.

A moduláris és a tudás alapú kognitív nyelvfeldolgozás vitái



Debates of modular and knowledge based cognitive approaches to language processing Abstract: The paper first surveys diverse interpretations of modularity from neuroscience through cognitive modelization to the modular interpretations of language processing. Linguistic modularity has an evolutionary, a developmental, and a processing interpretation. In the processing sense, both modular and knowledge based approaches accept the effects of context and knowledge on processing. Their divergences come up regarding the temporal allocation of top-down effects. The example of ambiguity resolution in context partly based on Hungarian data is used to illustrate the flexibility of the system. Though some data support a two-cycle approach differentiating between a fast and shallow and a slow processing characterized by extensive search (thus supporting the modular ideas), at the same time the fast cycle is also sensitive to grammatical features. The issue of modular processing is thus related to the literature on automaticity-consciousness-metacognition and the issue of slow and fast in processing. Keywords: modularity, context, knowledge based processing, ambiguity, consciousness

Szavak és memória: a komplex morfológiájú szavak feldolgozásának kapcsolata a munkamemóriával* Heilmann Ágnes Szegedi Tudományegyetem, Pszichológiai Intézet [emailprotected]

Szépfalusi Noémi Szegedi Tudományegyetem, Pszichológiai Intézet [emailprotected]

Janacsek Karolina Eötvös Loránd Tudományegyetem, Pszichológiai Intézet [emailprotected]

Németh Dezső Eötvös Loránd Tudományegyetem, Pszichológiai Intézet [emailprotected]

Kivonat: Egyre több pszicholingvisztikai kutatás bizonyítja, hogy a nyelvi működések hátterében nemcsak nyelvspecifikus rendszerek állnak, hanem más kognitív rendszerek, folyamatok is, így például az emlékezet. Két magyar nyelvű ingeranyaggal dolgozó empirikus kutatáson keresztül mutatjuk be, hogy az emlékezeti működések milyen szerepet játszanak a ragozott és az összetett szavak feldolgozásában. Az első vizsgálat célja a szabályos és rendhagyó ragozású ragozott alakok feldolgozásának összehasonlítása egy rövidtávú memória feladatban és egy azonnali feldolgozást igénylő lexikális döntési feladatban. Ez alapján a teljesítményben eltérés van az offline (memóriafeladat) és az online (reakcióidő) feldolgozás között. Az előbbit mérő szóterjedelem-teszten a ragozott szavak visszamondási arányában nem volt különbség a szabályos és a rendhagyó alakok között, míg reakcióidőt tekintve a kísérleti személyek gyorsabban és pontosabban válaszoltak a szabályos ragozású szavakra a rendhagyó ragozású szavakhoz képest. A második vizsgálat célja azon faktorok feltárása volt (memóriafunkciók, életkori változások), melyek szerepet játszanak az összetett szavak feldolgozásában. Az összetett szavak feldolgozását nézve kiemelendőnek bizonyult a komplex munkamemória szerepe, melyhez mind a fonológiai hurok, mind a végrehajtó funkciók együttes működése szükséges. Tehát a rövidtávú tárolási kapacitás mellett a rendelkezésre álló komputációs erőforrások és az információmanipulálás egyaránt modulálja az összetett szavak időbeli feldolgozását serdülőknél. Ezzel szemben felnőttkorban már nem érhető tetten sem a tárolási kapacitás, sem pedig a munkamemória és végrehajtó funkciók szerepe az összetett szavak feldolgozásában. Összefoglalva tehát az életkor előrehaladtával a feldolgozás terület-általánosból terület-specifikussá válik. Kulcsszavak: ragozás, nyelvtan, szóterjedelem, lexikális döntési helyzet, összetett szavak

* A kutatást az OTKA MBA  és az OTKA NF támogatta.



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

Az emberi nyelvi készség mögött bonyolult mentális folyamatok és rendszerek állnak. A gyermekben szinte spontán módon és különösebb erőfeszítés, formális oktatás nélkül fejlődik ki ez az összetett és speciális képesség. Működése annyira természetes, hogy a mögötte rejlő logika nem is tudatosul. Egyre több pszicholingvisztikai kutatás bizonyítja, hogy a nyelvi működések hátterében nemcsak nyelvspecifikus rendszerek állnak, hanem más kognitív rendszerek, folyamatok is, így például az emlékezet. A legtöbb elmélet azonban az angol nyelvre alapozza a megállapításait, éppen ezért lényeges lehet más nyelvcsaládba tartozó nyelvek vizsgálatával tesztelni a modellek érvényességi körét. A következőkben két, magyar nyelvű ingeranyaggal dolgozó empirikus kutatáson keresztül mutatjuk be, hogy az emlékezeti működések milyen szerepet játszanak a ragozott és az összetett szavak feldolgozásában.

. A morfológiailag komplex szavak feldolgozása A nyelvi üzenetek megértése és produkciója szempontjából alapvető fontosságú a mentális lexikon, amely a szavakat, azok jelentését, a nyelvi jeleket és a kivételes alakokat egyaránt tárolja. Asszociatív szerveződésű, emlékezeti tárként működik, tartalma nem teljesen állandó, hisz folyamatosan új szavakat tanulunk meg, egyes szavakhoz való hozzáférésünk pedig nehezebbé válhat. A mentális lexikon szerveződésének fontos kérdése, hogyan tárolódnak pontosan a szavak, illetve a morfológiailag komplex alakok. A szófelismerés egyik legrelevánsabb pszichológiai elmélete Marslen-Wilson (1980) nevéhez fűződik. E szerint a szófelismerés első részében a bejövő akusztikai és fonetikai ingerek alapján a célszóhoz hasonló szavak is aktiválódni kezdenek, majd az elemek között versengés indul, végül pedig egyetlen szó marad, amelyre a lexikai hozzáférés és a jelentés feldolgozása egyaránt végbemegy. Marslen-Wilson et al. (1994) szerint a komplex vagy többmorfémás szavak hozzáférése analitikus módon történik, vagyis a felismerés a szótövön keresztül megy végbe, de csak abban az esetben, ha a szótő és a toldalékokkal ellátott elem között transzparens kapcsolat van, például: por–poros. Ha a szótő és a képzett szó között más szemantikai kapcsolat is fellép, például: ház–házas, a szóhozzáférés nem elemekre bontás révén történik, hanem egész elemként zajlik a szó előhívása. A továbbiakban három modell kerül bemutatásra a komplex szavak feldolgozását illetően: az egészleges tárolás, a kötelező dekompozíciós elmélet és a kevert modell. Az egészleges tárolást feltételező modellben minden szó külön, egészleges formában tárolódik a mentális lexikonban, vagyis mind az összetett, mind a

Szavak és memória



toldalékos szavak egyben tárolódnak, továbbá minden egyes szótő minden egyes toldalékolt változatával külön elemet képez a szótárban (Butterworth 1983; Bybee 1995; El Yagoubi et al. 2008). A modellnek a gyorsaság az előnye, azaz a szóelőhívás tekintetében időbeli takarékossággal jár, hiszen nincs szükség összeegyeztetési folyamatra. Hátránya viszont, hogy a gazdagabb morfológiájú nyelvek esetében nehezen alkalmazható a modell. Ha minden egyes szóalakot külön kellene tárolni a lexikonban, az óriási kapacitást igényelne, és a szókeresés lelassulna. A másik probléma pedig, hogy egy átlagos nyelvhasználó az élete során nem találkozhat minden egyes szóalakkal, mégis képes felismerni őket. Továbbá új, még ismeretlen szótövekhez is könnyen kapcsol szuffixumot. Az egészleges tárolással ellentétben a dekompozíciót feltételező modellek az egyes szavak tárolását morfológiai alkotóegységeikre bontva képzelik el. Az elmélet szerint csak a morfémák, azaz a legkisebb önálló nyelvi jelentéssel bíró egységek tárolódnak a szótárban, és ezeket összeillesztve kapjuk az összetett alakot (Libben et al. 1999; McKinnon et al. 2003; Taft 2004; El Yagoubi et al. 2008). Fontos azonban megemlíteni, hogy a mai kutatások eredményei a kevert modelleket támasztják alá, melyek szerint az összetett alakok tárolódhatnak egészként és elemekre bontva is. Pontosabban a gyakori szavak és a nem transzparens alakok elérését egészleges módon képzelik el, mind az alaktanilag egyszerű, mind a komplex szavak esetében. A kevésbé gyakori, transzparens vagy ismeretlen alakok tárolása és előhívása pedig feltehetően dekompozíció útján valósul meg, vagyis szükséges a különböző elemek összeegyeztetése (Caramazza et al. 1988; El Yagoubi et al. 2008). Mennyiben alkalmazhatóak tehát ezek a modellek a magyar nyelvre? A magyar, mint agglutináló nyelv, több szempontból is eltérést mutat az angolhoz képest, így például a gazdag szuffixumkészletben. Egyetlen magyar köznévnek 864 különböző alakját különböztethetjük meg egymástól az allomorfokat nem is számolva (Kiefer 2000). Ehhez kapcsolódóan az is elmondható, hogy a rendhagyó alakok száma lényegesen több, illetve a gyakoriságuk is változatosabb, mint az angol nyelv esetében. A legtöbb angol nyelvre alapozott modell nem feltételez dekompozíciót rendhagyó alakok esetében, a magyar nyelvben viszont a rendhagyó alakok elérése is dekompozíció útján valósulhat meg. Azonban feltételezhető, hogy a morfológiai feldolgozás a magyar nyelv esetében is kettéválik a szabályos és a rendhagyó alakok esetében. Egy, a ragozott alakoknak a szótőre gyakorolt előfeszítő hatását vizsgáló kutatásban mind a szabályos, mind a rendhagyó alakok esetében facilitálódott a szótövek kiolvasása (Lukács 2001). Azonban a szabályos alakok nagyobb mértékben gyakoroltak előfeszítési hatást a szótöveikre, mint a szabályos alakok. Valószínűsíthető tehát, hogy a dekompozíció a nem produktív tőosztályokban is megvalósul. A szabályos és rendhagyó tőosztályok kettéválását



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

egy későbbi kísérlet is igazolta (Németh et al. 2006). A kutatásban szabályos és rendhagyó főnevekből készített szóterjedelemteszteket használtak fel és szabályos alakok esetében nagyobb szóterjedelem-értéket kaptak, mint a rendhagyó alakok esetében. Fontos megjegyezni, hogy az ilyen jellegű offline feladatok esetében általában az az alapfeltevés, hogy amennyiben egy szó elérése közvetlen, tehát egészleges tárolású, akkor kisebb emlékezeti terhelést jelent, mint a komplex szavak esetében a dekompozíció. A fent említett kísérlet eredménye éppen ezért érdekes, mivel a szabályos alakoknak kisebb kapacitásigénye volt, mint a rendhagyóaknak.

. A nyelv és az emlékezet kapcsolata A nyelvfeldolgozásban az emlékezeti folyamatoknak kiemelt szerepük van. A nyelvfeldolgozás egyéni különbségeinek hátterében részben a munkamemóriakapacitás áll. Baddeley és Hitch (1974) szerint olyan munkafelületről van szó, amely fenntartja és manipulálja az információt a különböző, tanulást igénylő helyzetekben. A modellben több alrendszer működése figyelhető meg, az egyik az ún. fonológiai hurok, mely a verbális információk átmeneti megtartásáért és frissítéséért felel, a másik az ún. téri–vizuális vázlattömb, amely a téri–vizuális információkat manipulálja, és jelen van az ún. epizodikus puffer, amely az alkomponensekből származó információt a hosszú távú memóriával kapcsolja össze egy egységes epizodikus reprezentációba szerveződve. Az alrendszereket pedig a korlátozott kapacitású, modalitásfüggetlen központi végrehajtó irányítja, szervezi. Komplex munkamemóriáról akkor beszélünk, ha a fonológiai hurok és a végrehajtó funkciók egyidejűleg működnek. Ezek a komponensek relevánsak az olyan bonyolultabb nyelvi feladatok feldolgozásánál, mint például az összetett mondatok megértése, a szövegmegértés vagy az idegen nyelvű mondatok fordítása. Baddeley munkamemória-modellje azért is kiemelkedő, mert a rövid távú emlékezetet olyan aktív, többkomponensű és dinamikus rendszernek képzelte el, amelyben nemcsak tároljuk az információt, hanem műveleteket is végzünk vele. Amikor a fonológiai hurokról vagy a rövid távú emlékezetről beszélünk, nem szabad megfeledkeznünk a hosszú távú memória hatásáról sem. Kimutatható, hogy azok a feladatok, amelyekben olyan értelmetlen szavakat kellett megjegyezni, amelyek az adott nyelv fonológiai mintázatába illeszkednek, könnyebbek, mint amelyek hangzásban is eltérnek (Gathercole 1999). Kimutatták azt is, hogy azok a személyek, akik jobban teljesítenek a verbális munkamemória-teszteken, jobbak a szintaktikai feladatokban, és hosszabb kijelentéseket és több morfémából álló alakokat produkálnak. Feltételezhető tehát, hogy a hosszú távú fonológiai

Szavak és memória



reprezentációk kialakítása az átmeneti tárak kapacitásán is múlik (Baddeley et al. 1998; Speidel 1993). Továbbá Pinker (1997) kettős modellje szerint a nyelvi teljesítményért két eltérő rendszer a felelős, egy szabály alapú és egy asszociatív rendszer. Ezt az elképzelést bővítette ki Ullman (2001), aki összekapcsolta a nyelvi teljesítményért felelős rendszereket az emlékezeti rendszerekkel. E szerint a szabály alapú rendszer a procedurális memóriához, míg az asszociatív rendszer a deklaratív memóriához köthető. A procedurális rendszer elsősorban a motoros és kognitív képességek megtanulásáért felel, ide kapcsolhatók a nyelvtani szabályok is. A deklaratív rendszer feladata pedig a ténybeli tudás tárolása és új asszociációk kiépítése; a mentális lexikon is ezen emlékezeti rendszerhez köthető. Egy további, az emlékezet és nyelv kapcsolatát feltáró modellben Clahsen (1999) a nyelvi rendszer nyelvtani részét az implicit emlékezethez, a lexikai rendszert pedig az explicit emlékezeti rendszerhez kapcsolja. A nyelvi kapcsolatok tehát szorosan összefüggnek az emlékezeti folyamatokkal. A nyelvi teljesítmények (például: ragozott és összetett szavak feldolgozása) egyéni különbségeinek hátterében sok esetben az eltérő munkamemória-kapacitás állhat. Azok a személyek, akik nagyobb munkamemóriával rendelkeznek, jobban teljesítenek a megértési feladatokban, mivel nagyobb kapacitás áll rendelkezésükre, mint az alacsonyabb munkamemóriával rendelkező személyeknek. Just és Carpenter (1992) empirikus vizsgálatában a kísérleti személyek munkamemória-kapacitását olvasási terjedelemmel tesztelték (sztenderdizált magyar változatát l. Racsmány et al. 2005), a nyelvfeldolgozás sebességét pedig szemmozgásos vizsgálatokkal mérték. Azt az eredményt kapták, hogy akik ebben jobban teljesítettek, jobban megértették az összetett mondatokat, a lexikailag kétértelmű mondatokat és a garden-path (szintaktikailag kétértelmű) mondatokat is. Az általános munkamemória-kapacitástól függ az is, hogy az adott személy a szintaktikai feldolgozás során mennyire vesz figyelembe más, esetleges szemantikai ingereket. A kis munkamemóriával rendelkezőknél inkább modulszerűen (zártan) történik a feldolgozás, míg a nagy kapacitással ellátott személyek felhasználnak egyéb erőforrásokat, és inkább figyelembe vesznek más kontextuális ingereket is (Just–Carpenter 1992). További kutatások is rávilágítottak a munkamemória és a nyelvi rendszerek szoros kapcsolatára. Több vizsgálatot végeztek annak felderítésére, hogy milyen szerepet játszik a munkamemória a lexikális kétértelműség feldolgozásában. Lexikális kétértelműség az a jelenség, amikor egy szónak több jelentése van, feldolgozását pedig többnyire a kontextus befolyásolja, kisebb mértékben a szógyakoriság (Turi et al. 2010). A szakirodalom több modellt említ abban a tekintetben, hogy miképp befolyásolja a munkamemória a lexikális kétértelműség



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

feldolgozását. Az aktivációs hipotézis alapján (Miyake et al. 1994) a lexikális kétértelműség helyzetében az egyéni különbségek mögött az áll, hogy a nagy munkamemóriával rendelkező személyeknek elegendő erőforrásuk van, így mindkét jelentés fenntartására van kapacitásuk, képesek tehát egyszerre több szót is aktívan tartani. Ezzel ellentétben a kis munkamemóriával rendelkező személyeknél elsődlegesen a gyakoribb jelentés áll rendelkezésre. Ezt az elméletet erősíti az a kutatás is, amely szintén a lexikális kétértelműség helyzetét vizsgálta, figyelembe véve a szógyakoriságot, a mondatkontextust és a munkamemóriában jelentkező egyéni különbségeket is. A kísérletben intermodális priminghelyzetet alkalmazva szó–nem szó lexikális döntési feladatban vettek részt a személyek. A kétértelmű szavak pedig három típusú mondatkörnyezetben szerepeltek: 1. a gyakoribb jelentést korán implikáló mondatkontextusban; 2. ritkább jelentést korán előfeszítő kontextusban; 3. semleges (gyakoribb, illetve ritkább jelentést később előfeszítő) helyzetben. A komplex munkamemória mérésére a hallási mondatterjedelem-tesztet alkalmazták, amely együttesen vizsgálja mind a tároló, mind a feldolgozó komponenseket, tehát nemcsak az egyszeri tárolást méri. Az eredmények azt igazolják, hogy a komplex munkamemória-teszten jobban teljesítő személyeknél a szavak mindkét jelentése elérhetővé vált, ellentétben a gyengén teljesítő személyekkel, akiknél elsődlegesen a gyakoribb jelentés állt rendelkezésre (Turi et al. 2010). Az inhibíciós megközelítés alapján viszont az egyéni különbségek mögött nem a tárkapacitás áll, hanem a gátlási folyamatok flexibilitása. E szerint a nagy munkamemóriával rendelkező személyek sokkal rugalmasabban alkalmazzák a gátlást bizonyos alternatív helyzetekben, mint a kisebb munkamemóriával rendelkező társaik (Mason–Just 2007).

. A nyelv és a munkamemória fejlődési aspektusai Fontos megjegyeznünk, hogy arra a kérdésre, hogy pontosan milyen szerepet tölt be a munkamemória és aspektusai a nyelvi megismerő folyamatokban, nem lehet egységesen kialakult választ adni. Vannak, akik úgy tartják, hogy a felnőtt neuropszichológiai adatok nem nyújtanak kellő bizonyítékot a kognitív folyamatokat tekintve, mindezek bizonyításához ugyanis szükség van olyan adatokra, amelyek a korábbi életkorból származnak (Racsmány 2004). Éppen ezért a nyelv és a munkamemória kapcsolatának feltárásában a fejlődési aspektusokat is figyelembe vettük. A fent említett empirikus vizsgálatokból látható, hogy a nyelvi működést nézve nemcsak a tárkapacitásnak, illetve a fonológiai huroknak van szerepe, hanem a komputációért, a gátlási és monitorozási folyamatokért felelős végrehajtó

Szavak és memória



funkcióknak is. Vagyis nyelvi feldolgozásnál nemcsak az egyszerű tárolás bír relevanciával, hanem a komplex munkamemória-funkciók is, amelyeknek a fejlődési vonala kulcsfontosságú lehet a nyelvi működésben és teljesítményben. Ezt jól bizonyítja az a vizsgálat, amelyben kisiskolás korú gyermekek lexikai feldolgozását vizsgálták morfológiailag összetett szavak esetében. A kutatási eredmények alapján azok a gyermekek, akik jobban hozzáfértek a morfológiailag komplex elemekhez, később jobbnak bizonyultak az olyan összetett kognitív művelet elvégzésében, mint az értő olvasás (Carlisle–Fleming 2003). Egy másik hasonló vizsgálatban is alátámasztották, hogy a morfológiailag összetett szavak feldolgozása függ a komplex munkamemória-feladaton nyújtott teljesítménytől. Azok, akik gyorsabban hozzáfértek a morfológiailag összetettebb alakokhoz, jobb eredményt mutattak a komplex munkamemória-feladatokon is (Service–Tujulin 2002). Látható, hogy gyermekeknél, amíg a nyelvi mechanizmusok nem készségszinten működnek, a munkamemória-kapacitásban felfedezhető egyéni különbségek hatással lehetnek a nyelvi teljesítményre.

. Az első vizsgálat Az első vizsgálat célja a szabályos és rendhagyó ragozású ragozott alakok feldolgozásának összehasonlítása egy rövidtávúmemória-feladatban és egy azonnali feldolgozást igénylő szó–nemszó döntési feladatban. Az előbbi egy offline, elsősorban hibázásokra érzékeny szóvisszamondás teszt, az utóbbi pedig egy online, menetközbeni feldolgozást mérő, reakcióidőn alapuló lexikális döntési teszt. Ez a vizsgálati elrendezés lehetővé teszi, hogy a feldolgozás idői dimenzióira eltérő módon érzékeny két módszer segítségével mind idői, mind pedig hibázási mintázat alapján vonjunk le következtetéseket a szabályos és a rendhagyó alakok feldolgozását befolyásoló mechanizmusokra vonatkozóan, különös tekintettel a magyar morfológiára.

.. Hipotézisek Amennyiben korábbi magyar kutatások eredményeit és felvetéseit elfogadva dekompozíciót feltételezünk rendhagyó alakok feldolgozása során, akkor: 1. Rendhagyó alakok dekompozíciója esetén a helyesen visszamondott szavak számát tekintve különbséget várunk szabályos és rendhagyó tőtípusok között (összhangban Németh et al. 2006 korábbi eredményeivel). Ugyanakkor miután fonológiai komplexitás, szógyakoriság, illetve az alkalmazott



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

ragok megjelenése tekintetében kiegyenlített listát hoztunk lére, megengedhetőnek tartjuk azt a lehetőséget is, hogy a helyesen visszamondott szavak számában nem fogunk jelentős különbséget találni a szabályos és rendhagyó lista között. Ez önmagában nem mondana ellent a rendhagyó szavak dekompozíciójának, abban az esetben, ha rag- és tőhibákat egyaránt tapasztalunk mindkét (szabályos–rendhagyó) lista visszamondásakor. 2. A szóvisszamondás (word recall) teszten nyújtott hibázás során rag- és tőhibát egyaránt várunk rendhagyó alakok visszamondásakor. Ezen hipotézisünk szerint tehát a szabályos szavakhoz viszonyítva egyenlő vagy közel egyenlő mértékben kell megjelenniük dekompozíciós folyamatokkal összhangban álló hibatípusoknak rendhagyó alakok esetében is. 3. Első hipotézisünkkel összhangban lexikális döntési helyzetben is különbséget várunk szabályos és rendhagyó alakok között. A rendhagyó szavakra lassabb reakcióidő, illetve pontatlanabb válaszok fognak születni, ami Németh et al. (2006) megállapításával összhangban lenne. E szerint rendhagyó szavak esetén kettős műveleti igény lép fel, mivel a rendhagyó allomorfhoz kell hozzákapcsolni a szabályos inflexiós szuffixumot.

.. Módszerek ... Kísérleti személyek, ingeranyag A kutatásban 37 egészséges egyetemista, 8 férfi és 29 nő vett részt, az életkoruk átlaga 19,54 év (SD = 1,17). A standard munkamemória-teszteken kívül minden alany mind egy memória- (ragozott szóterjedelem-teszt), mind pedig egy reakcióidő-feladatban (lexikális döntési feladat) részt vett. Fontos, hogy a két feladat ingeranyaga megegyezett. Az ingeranyag összesen százhúsz ragozott valódi, egyjelentésű, kétszótagú (CVCVC) szóból és százhúsz ragozott álszóból állt. A százhúsz valódi szóból hatvan szabályos ragozású, hatvan pedig rendhagyó ragozású volt. A rendhagyó ragozású főnevek ingeranyaga egyaránt tartalmazott v-betoldást és magánhangzó-rövidülést. Néhány példát az 1. táblázat szemléltet. A kutatás során az ingeranyagból a szóterjedelem-teszthez (word span) hasonló, ragozott szavakból álló tesztet készítettünk, külön kezelve a szabályos és rendhagyó ragozású szavakat, három-három sorozatot alkotva. Egy-egy példát a 2. táblázat szemléltet. Mind a három sorozat ugyanazt a húsz tőmorfémát és ugyanazokat a toldalékmorfémákat (többes szám jele, tárgyrag, helyhatározórag, birtokos személyrag E/, E/, T/) tartalmazta. Listánként a ragok előfordulása



Szavak és memória 1. táblázat: Példák a ragozott szóterjedelem-teszt ingerszavaira

Valódi szavak Szabályos ragozás

juhod, körök padom, hegyet

Álszavak

Rendhagyó ragozás

Szabályos ragozás Rendhagyó ragozás

v-betoldás

rövidülés

tavon, havad művem, lovon

ludat, jegek legyet, nyuluk

höröd, fogot lojat, tyokak

hövet, dőrük dizem, szevön

kiegyenlített volt. A vizsgálati személynek először kettő, majd három szót kellett visszamondania és így tovább, egészen hat szóig. A szóterjedelem értékét a három sorozat átlaga adta meg, külön értékkel jelölve a helyesen visszamondott teljes szóterjedelmet, illetve a helyesen visszamondott tövek terjedelmét. Három szabályos és három rendhagyó ragozású lista került felhasználásra, amelyek a felszíni gyakoriság szempontjából statisztikailag kiegyenlítettek voltak (F(1, 118) = 0,116; p = 0, 743). A felszíni gyakoriságok alapjául a Magyar Webkorpusz szolgált, a Szószablya nyílt morfológiai elemző gyakorisági szótárát használva (Kornai et al. 2006). A ragozott szavakat független, a kísérletben részt nem vevő alanyok osztályozták annak alapján, hogy milyen gyakran hallják, milyen gyakran használják, illetve milyen az adott szó képkiváltó értéke. A megítélt gyakoriságok mind a hallás (r = 0,535; p < 0,05), mind a használat (r = 0,556; p < 0,05) tekintetében erős, szignifikáns korrelációt mutatnak a Magyar Webkorpuszban rögzített gyakoriságokkal. A listák a megítélések alapján a képkiváltó érték szempontjából is kiegyenlítettek (t(1, 118) = 1, 074; p = 0,285). 2. táblázat: Példa a ragozott szóterjedelem-teszt sorozataira

Szabályos sorozat

Rendhagyó sorozat

sörök tejük zsebed tagom körön poruk juhot lapon rumok hegyed nyakuk hasak padot helyem hajon fület boruk halam sorod fogak

ludat jegek legyet nyulak nyilak hidam tavon kutak levük havad nyüvem kezek lovon terük csövek füvön kövük művem vized tövet

A kutatásban szereplő szabályos és rendhagyó ragozású szavakból álszavakat hoztunk létre, amelyekből szintén három-három sorozatot alkotva a szóterjedelem-teszthez hasonló feladat készült. Tehát ebben az esetben is külön kezeltük a szabályos alakokból létrehozott és a rendhagyó alakokból létrehozott álszavakat.



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

Az eredeti szavak szótövében az első mássalhangzóban és az utána következő magánhangzóban történt változtatás, odafigyelve arra, hogy a létrehozott szó megfeleljen a magyar fonológia szabályainak, és hogy a magánhangzók harmóniája megmaradjon. A ragokban változtatás nem történt. A létrehozott álszavak eredeti szavakhoz viszonyított hasonlóságát szintén a kísérletben részt nem vevő, független személyek (N = 20) becsülték meg. Ennek alapján az álszavak kitalálási valószínűsége 1,041. A szóterjedelem-tesztek ingeranyagát felhasználva E-Prime program segítségével szó–nem szó döntési helyzetet hoztunk létre, amelyben az alanyoknak el kellett dönteniük, hogy a képernyőn látott szó valódi magyar szó-e vagy sem. A feladatban a sorrend pszeudorandom volt, tehát az ingeranyag két csoportra oszlott, ezzel biztosítva, hogy azonos csoportba ne kerülhessen a valódi szó és az abból létrehozott álszó. A csoportokon belül a sorrend random volt. A lexikális döntési helyzet során a vizsgálati alanyok egy számítógép előtt ülve végezték el a feladatot. A képernyő közepén először egy fixációs kereszt volt látható, majd egy szó következett, amelyről a vizsgálati alanyoknak döntést kellett hozniuk. Amennyiben úgy ítélték meg, hogy valódi szót látnak, az enter billentyűt, ellenkező esetben a space billentyűt kellett lenyomniuk (a billentyűket az alanyok felénél megcserélve alkalmaztunk).

... Eljárás A vizsgálat felvétele két alkalommal történt, egy hét elteltével az alkalmak között. A mintát véletlenszerűen két csoportra osztottuk. Az egyik csoportba tartozók az első héten a ragozott szavak visszamondásával kezdtek, következő alkalommal pedig a szó–nem szó döntési feladattal folytatták. A másik csoportba tartozóknál a sorrend fordított volt. A munkamemória-teszteket mindig a szóterjedelem-tesztekkel együtt vettük fel, kivétel a hallási mondatterjedelem-teszt, amit mindig az első alkalom végén vettünk fel. A minta felénél a valódi ragozott szavak és a ragozott álszavak visszamondásának sorrendje fordított volt, ezzel kizárva a tanulási hatást. A résztvevők az első alkalommal informált beleegyező nyilatkozatot töltöttek ki. A vizsgálati alanyok válaszait írásban rögzítettük, majd kategorizáltuk. Vizsgálatunkban alapvetően három lehetséges hibát ejtettek a vizsgálati személyek a ragozott szavak visszamondásakor. Raghibának minősült minden olyan hiba, amikor a megfelelő szótő visszamondása mellett hibás inflexiós szuffixum szerepelt (például lovak helyett lovon). Tőhibának számított minden olyan hiba, ahol a megfelelő rag mellett eltérő szótövet mondtak vissza (például lapon he-



Szavak és memória

lyett padon). Végül rag- és tőhibának az olyan hibázásokat neveztük, amelyeknél sem a rag, sem a tő nem bizonyult helyesnek (például réten helyett tavak).

.. Eredmények ... Szóterjedelem elemzése

Átlagos ragozott szóterjedelem

A szóterjedelem-teszt elemzésénél függő változó először a helyesen visszamondott szavak száma. Az adatokat ismételt méréses varianciaanalízis segítségével elemeztük, amelyben az összetartozó mintás faktor a szabályosság (2: szabályos, rendhagyó), illetve a szóforma (2: valódi, álszó) volt. Szignifikáns szóforma főhatást találtunk (F(1, 36) = 9,236; p = 0,004), vagyis a személyek szignifikánsan több valódi (átlag: 2,671), mint álszót (átlag: 2,405) jegyeztek meg és mondtak vissza (1. ábra). Továbbá a szabályosság főhatás tendenciaszintű volt (F(1, 36) = 3, 290; p = 0,078): a vizsgálati személyek több rendhagyó (valódi és álszó összevont értéke: 2,459), mint szabályos (összevont értéke: 2,671) szót tudtak visszamondani. Nincs azonban statisztikailag jelentős különbség a szabályos és a rendhagyó valódi szavak között, illetve a szabályos és a rendhagyó álszavak között sem. szabályosság (2: szabályos, rendhagyó) ∗ szóforma (2: szó, álszó) interakciója nem szignifikáns (F(1, 36) = 2,741; p = 0,106). 2,9

n.sz.

n.sz.

2,7 2,5 2,3 2,1 1,9

1,7 1,5

szóterjedelem szabályos

szóterjedelem rendhagyó

Valódi szavak

szóterjedelem szabályos

szóterjedelem rendhagyó

Álszavak

1. ábra: A ragozott szóterjedelem-tesztek eredményei szótípusok szerint. Szignifikáns

különbség van a valódi és álszavakra adott teljesítmény között, a valódi szavak szóterjedelem-eredménye jobb, mint az álszavaké. Nincs statisztikailag szignifikáns különbség a szabályos és rendhagyó alakok között sem a valódi, sem pedig az álszavak esetében. A hibasávok az átlagos standard hibát mutatják.

További elemzéseket végeztünk a helyesen visszamondott szótövekre vonatkozóan is. Szignifikáns különbséget találtunk a szóforma (2: valódi, álszavak) esetében (F(1, 36) = 60,011; p < 0,001), továbbá tendenciához közeli hatás volt



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

megfigyelhető (F(1, 36) = 3,129; p = 0,085) a szabályosság (2: szabályos, rendhagyó) esetében. A szabályosság ∗ szóforma interakciója nem szignifikáns (F(1, 36) = 0,239; p = 0,628) (2. ábra). A post-hoc elemzések szerint nem mutatkozott szignifikáns különbség a valódi szavakon belül a visszamondott szabályos (átlag: 3,422) és rendhagyó (átlag: 3,514) tövek száma között (p = 0,450). Ugyancsak nem találtunk szignifikáns különbséget álszavak esetében sem (p = 0,091; szabályos átlaga 2,775, rendhagyóé 2,946). 4

Átlagos t!terjedelem

3,5 3 2,5 2 1,5 1 0,5 0

szabályos t!

rendhagyó t!

Valódi szavak

szabályos t!

rendhagyó t! Álszavak

2. ábra: A ragozott szóterjedelem-tesztek tőterjedelmei. A szótövek terjedelmében sta-

tisztikailag jelentős különbség van szavak és álszavak között mind a szabályos, mind a rendhagyó alakok tekintetében. Nem mutatkozik azonban különbség a szabályos és a rendhagyó ragozású szavak között sem valódi, sem álszavak esetében. A hibasávok az átlagos standard hibát mutatják.

A hibázások számának elemzésekor a szabályosság (2: szabályos, rendhagyó), illetve a hibatípus (3: raghiba, tőhiba, rag- és tőhiba) összetartozó mintás faktorok bevonásával futtattuk le az ismételt méréses varianciaanalízist, külön a valódi és álszavak esetén. A hibázásokat tekintve nem találtunk szignifikáns főhatást a szabályosság (2: szabályos, rendhagyó) esetében (F(1, 36) = 0,001; p = 0,973), azonban a hibatípus (3: rag-, tőhiba, rag- és tőhiba) (F(1, 36) = 72,978; p < 0,001) esetén szignifikáns főhatás mutatkozott. A szabályosság ∗ hibatípus interakció ugyancsak nem volt szignifikáns (F(1, 36) = 1,757; p = 0,180). Az eredmények alapján tehát nem volt különbség a hibák megjelenésében a tekintetben, hogy a visszamondott szó szabályos (átlag: 2,838) vagy rendhagyó (átlag: 2,847) ragozású. Mindkét esetben a leggyakoribb hibatípus a raghiba (átlag: 5,527) volt, amelyet a rag- és tőhiba hibatípus (átlag: 1,878), illetve a tőhiba (átlag: 1,122) követett. A post-hoc elemzések alapján nem találtunk ugyanakkor szignifikáns különbséget a szabályos és rendhagyó szavaknál a három hibatípus közül egyik esetében sem (minden p > 0,315).



Szavak és memória

A hibázások álszavak esetében a valódi szavakhoz hasonló mintázatot mutattak. Nem volt szignifikáns főhatás sem a szabályosság (2: szabályos, rendhagyó) (F(1, 36) = 0,666; p = 0,420), sem pedig a hibatípus (3: rag-, tőhiba, rag- és tőhiba) (F(1, 36) = 0,020; p = 0,980) esetén. A szabályosság ∗ hibatípus interakció ugyancsak nem volt szignifikáns (F(1, 36) = 1,373; p = 0,260). Az eredmények alapján tehát nem volt különbség a hibák megjelenésében a tekintetben, hogy a visszamondott szó szabályos (átlag: 2,225), vagy rendhagyó (átlag: 2,090) ragozású. A post-hoc elemzések során az álszavak esetében sem találtunk szignifikáns különbséget a szabályos és rendhagyó szavaknál egyik hibatípus vonatkozásában sem (minden p > 0,162).

Hibázások (db)

30 25

20 15 10 5 0 raghiba

t!hiba

mindkét hiba

raghiba

szabályos

t!hiba rendhagyó

Valódi szavak

mindkét hiba

raghiba

t!hiba

mindkét hiba

raghiba

szabályos

t!hiba

mindkét hiba

rendhagyó Álszavak

3. ábra: Hibázások a szóterjedelem-teszten valódi és álszavak esetén. Nem mutatkozik

különbség a szabályos és rendhagyó ragozású szavak között. Az álszavak hibázási mintázata a valódi szavakéhoz hasonló. A hibasávok az átlagos standard hibát mutatják.

... Lexikális döntési helyzet A reakcióidő-adatok elemzésének első lépéseként a hibás válaszok kivonásra kerültek. A szélsőértékek kiszűrésére medián alapú normalizálást alkalmaztunk. Az adatokat ismételt méréses 2 ∗ 2-es varianciaanalízis segítségével elemeztük, amelyben a független mintás faktor a szabályosság (2: szabályos, rendhagyó), illetve a szóforma (2: valódi, álszó) volt. A post-hoc elemzések során, ahol szükséges volt, Bonferroni-féle korrekciót használtunk a szfericitás sérülése esetén. .... Reakcióidő-elemzés Szignifikáns különbséget találtunk a valódi szavakra és álszavakra adott reakcióidőkben (F(1, 36) = 22,465; p < 0,001), mint ahogyan a szabályos és rendhagyó ragozású szavakra adott reakcióidőkben (F(1, 36) = 6,578; p = 0,015) is (4. ábra). Az eredmények azt mutatják, hogy gyorsabb reakcióidő született a valódi



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

szavakra (átlag: 830,041 msec), mint az álszavakra (átlag: 970,777 msec), illetve az összevont szabályos (szabályos valódi és álszó: 892,574 msec), illetve a rendhagyó (rendhagyó valódi és álszó: 908,243 msec) szavak esetében is. Ezen felül a szóforma (2: valódi szó, álszó) ∗ szabályosság (2: szabályos, rendhagyó) interakciója is szignifikáns (F(1, 36) = 5,538; p = 0,024). A post-hoc elemzés szerint a valódi szavak esetében szignifikáns különbség volt a szabályos (átlag: 815,703 msec) és a rendhagyó alakok (átlag: 844,378 msec) között (p < 0,001). Nem találtunk ugyanakkor különbséget álszavak esetében, ahol a szabályos (átlag: 969,446 msec) és a rendhagyó (átlag: 972,108 msec) alakok között nem mutatkozott szignifikáns eltérés (p = 0,782). 1100

Reakcióid! átlag

n.sz.

**

1000 900 800 700

600 500

szabályos szó

rendhagyó szó

Valódi szavak

szabályos álszó

rendhagyó álszó Álszavak

4. ábra: Reakcióidők a szó–nem szó döntési helyzetben. Szignifikáns különbség található

a szabályos és a rendhagyó valódi szavakra adott reakcióidőben. Nincs azonban statisztikailag jelentős a különbég a szabályos és a rendhagyó álszavak reakcióideje között. A hibasávok az átlagos standard hibát mutatják.

.... Hibázások Szignifikáns főhatás volt tapasztalható a szóforma (2: szavak, álszavak) (F(1, 36) = 30,873; p < 0,001), illetve a szabályosság faktor (2: szabályos, rendhagyó alakok) (F(1, 36) = 8,411; p = 0,006) esetében (5. ábra). Az adatok alapján kevesebb hibázás született az álszavak esetén (98,4), mint a valódi szavaknál (93,7), illetve az összevont szabályos (szabályos valódi és álszó: 96,7), mint a rendhagyó (rendhagyó valódi és álszó: 95,5) szavak pontossága esetében. Ezen felül szignifikáns különbség figyelhető meg a szóforma ∗ szabályosság interakcióban (F(1, 36) = 10,205; p = 0,003). A post-hoc elemzések alapján szignifikáns eltérés mutatkozik a valódi szavak esetében a szabályos (95,0) és a rendhagyó (92,5) alakok között (p = 0,002). Nem mutatkozott azonban különbség álszavak esetében, ahol a szabályos



Szavak és memória

(98,3) és a rendhagyó (98,4) alakok esetében közel azonos volt a pontosság (p = 0,770). 1,05

n.sz.

*

Pontosság

1 0,95 0,9 0,85 0,8

szabályos szó

rendhagyó szó

Valódi szavak

szabályos álszó

rendhagyó álszó Álszavak

5. ábra: Hibázások a szó–nem szó döntési helyzetben. A hibázások tekintetében szigni-

fikáns különbség van a valódi szavak esetében, illetve a szabályos és rendhagyó valódi szavak között. Az álszavak esetében nem figyelhető meg különbség. A hibasávok az átlagos standard hibát mutatják.

.. Az első vizsgálat megvitatása A kutatás célja a szabályos és rendhagyó ragozású szavak közötti különbség feltárása volt, valamint a szabályos és rendhagyó morfológia feldolgozását befolyásoló faktorok magyar nyelvű tesztelése egy olyan komplex vizsgálatban, amelyben két különböző módszerrel, de ugyanazon ingeranyagon vizsgáltuk meg a hibázási mintázat, illetve a reakcióidő alakulását. További cél volt annak a kérdésnek a megválaszolása, hogy a rendhagyó ragozású alakokat egészlegesen tároljuk vagy éppen ellenkezőleg, ugyanúgy képezzük őket, mint a szabályos alakokat. Korábbi kutatások alapján (l. például Lukács 2001; Németh et al. 2006) azt vártuk, hogy a rendhagyó alakok feldolgozása során is olyan hibázási mintázatot fogunk tapasztalni, amely dekompozíciós folyamatokkal áll majd összhangban. Eredményeink ezen feltételezéseinket támasztották alá. A szóterjedelem-tesztben a két tőosztály között eltérést vártunk Németh és munkatársai (2006) korábbi magyar nyelvű kutatásának megfelelően, amelynek során azt az eredményt kapták, hogy a szabályos módon ragozott szavakból álló lista esetén több szóra emlékeztek a vizsgálatban részt vevők, mint rendhagyó szavak esetében. Mindezt azzal magyarázták, hogy rendhagyó szavak esetében is dekompozíció valósul meg, mivel a magyarban az inflexiós szuffixumok minden esetben azonosíthatóak rendhagyó módon ragozott szavak esetén is, így rendhagyó szavak esetén a kettős folyamat (rendhagyó szótőhöz kell hozzákap-



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

csolódó inflexiós szuffixum) miatt az extra műveletek nagyobb memóriaigénnyel járnak a szabályos alakokhoz képest. Jelen kutatásban nem találtunk különbséget a szabályos és a rendhagyó alakok között. Ez az eredmény ellentmond Németh et al. (2006) megállapításainak. Úgy tűnik, hogy a rendhagyó alakok szabály alapú képzése és az ezzel járó plusz művelet nincs hatással a munkamemóriára. A két kutatás közötti különbség egyik lehetséges magyarázata, hogy Németh et al. (2006) kutatásában nem volt kiegyenlítve az egyes ragok megjelenésének valószínűsége. A kiegyenlítés hiánya különbséget okozhatott a két ingerlista között, így tehát nem feltétlenül extra műveleti igény jelent meg a rendhagyó alakok esetében, hanem a ragok interferáló hatása miatt mutatkozott különbség. Jelen vizsgálat eredménye ugyanakkor a kétutas modell predikcióival sincsen összhangban, amely szerint a szabályos alakok, mivel nem egészlegesen tárolódnak, nagyobb kapacitásigénnyel bírnak a rendhagyó alakokhoz képest. Tehát azonos mértékű kapacitásigény lépett fel mindkét tőosztály esetén; ennek alapján valószínűbbnek tartjuk azt a lehetőséget, amely szerint rendhagyó szavak esetében is dekompozíció valósul meg. Eredményeink ugyanakkor megerősítik a finn SAID modellt (Laine 1996), illetve Marslen-Wilson és Tyler (1993) modelljét, amely dekompozíciót feltételez rendhagyó szavak esetén is. Erre további bizonyítékot a szóterjedelem-teszt során ejtett hibázások szolgáltatnak. Vizsgálatunkban alapvetően három lehetséges hibát ejtettek a vizsgálati személyek a ragozott szavak visszamondásakor. Feltételeztük, hogy amennyiben dekompozíció következik be a ragozott szavak feldolgozásakor, nagyobb mértékben jelenik meg rag-, vagy tőhiba, mint rag- és tőhiba. Mindemellett azt vártuk tehát, hogy egyenlő mértékben kell megjelennie ezen hibatípusoknak a szabályos és rendhagyó szavak esetében (Németh et al. 2006). Vizsgálatunkban a szóterjedelem-teszten megfigyelt hibázások esetén nem volt szignifikáns különbség a szabályos és s rendhagyó szavak visszamondásakor, azaz egyenlő mértékben jelent meg rag-, tő-, illetve rag- és tőhiba a két tőtípus esetében. Eredményeink, amelyek szerint a rendhagyó szavak esetében is megjelent rag- és tőhiba, a dekompozíciós hipotézist támasztották alá. Ezek alapján úgy tűnik, a magyar nyelvben a rendhagyó alakok képzése hasonló módon történik, mint a szabályos alakoké. Mindez ellentmond a kétutas modellek azon elképzelésének, hogy dekompozíció kizárólag szabályos alakok képzése során jelenik meg, ugyanakkor összhangban van a magyar morfológia sajátosságaival, hiszen a magyarban rendhagyó szavak esetében is azonosítható minden esetben a rag (például lovak vs. lapok). Nem tartjuk ugyanakkor valószínűnek azt a felvetést, hogy raghibák esetén valójában az egészlegesen tárolt reprezentációk (lovak vs. lovat) versengenek. Ezen elképzelés ugyanis nem magyarázza meg, hogy miért jelent meg tőhiba, amelynek esetén ugyancsak különválást tapasztalhatunk. Az egészleges reprezentációk versengé-

Szavak és memória



se hipotézissel leginkább a rag- és tőhiba (például lovak helyett tavon) állnának összhangban. További elemzések azt is megmutatták, hogy a személyek szignifikánsan több raghibát produkáltak, mint tő-, illetve rag- és tőhibát. Mindezidáig a korábbi kutatások nem terjedtek ki a szavak visszamondásakor megjelenő hibatípusok értékelésére, további kutatások szükségesek tehát jelen eredmények megerősítésére. Vizsgálatunkban szó–nem szó döntési helyzetben is megvizsgáltuk a ragozott szavakra adott reakcióidőt és hibázást. A szó–nem szó döntési helyzet gyors, automatikus feldolgozást jelent, szemben a szóterjedelem-teszttel, amely kevésbé érzékeny a menet közbeni folyamatokra. A módszer mögött az a feltételezés húzódik meg, hogy a dekompozíciós folyamatok lelassítják a döntési helyzetet a dekompozíciót nem igénylő szópárokhoz képest. Eredményeink azt mutatják, hogy szignifikánsan gyorsabb és pontosabb válaszok születtek szabályos, mint rendhagyó alakokra. Ebben a feladatban tehát különbség mutatkozott a szabályos és a rendhagyó szavakra adott reakcióidő között összhangban van Lukács (2001) előfeszítéses kísérleti eredményével, aki nagyobb mértékű előfeszítést talált szabályos, mint rendhagyó tövek esetében, jóllehet a ragozott rendhagyó alakok is előfeszítették a szótöveiket. Mind Németh és munkatársai (2006), mind Lukács (2001) vizsgálatai jelentős utalást tettek arra, hogy rendhagyó szavak esetében is dekompozíciós folyamatokra kerül sor. Jelen reakcióidő-vizsgálat is cáfolni látszik a rendhagyó alakok egészleges tárolását feltételező elgondolásokat, mert ha ezek egészlegesen tárolódtak volna, rövidebb reakcióidőt kellett volna tapasztalnunk a rendhagyó alakok esetében. Ennek a mintázatnak ugyanakkor épp az ellenkezője valósult meg. Az eredmények magyarázatára a szóterjedelem-teszten megfigyelt hibázások alkalmasak. Tekintve, hogy a szabályos és a rendhagyó szavak esetében is azonos mértékben jelentkeztek dekompozícióra utaló hibatípusok (például raghibák), a meghosszabbodott reakcióidőre nem lehet magyarázat a szabályos és a rendhagyó szavak feldolgozásakor megjelenő eltérő dekompozíciós folyamat, mivel mindkét esetben azonos hibázási mintázatot és szóterjedelmet találtunk. Véleményünk szerint a meghosszabbodás azzal magyarázható, hogy a dekompozíciót megelőzően vagy azzal párhuzamosan a rendhagyó szótő megfelelő allomorfját is aktiválni kell. Rendhagyó szavak esetén ugyanis a szótő bizonyos morfológiai változáson kell, hogy keresztülmenjen, mielőtt az inflexiós szuffixum hozzákapcsolódik a megfelelő allomorfhoz. Egy lényeges és megválaszolatlan kérdés marad: a rendhagyó szótövek alaktani változását szabály generálja-e, vagy külön lexikalizálódott elemként a mentális lexikonból történik az előhívása. Jelen vizsgálat eredményei összhangban állnak a finn SAID (stem allomorph/inflectional decomposition) modell alapgondolatával, amely szerint az



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

inflexiós ragoknak önálló reprezentációik vannak a mentális lexikonban (Laine 1996). A modell másik feltevése, hogy a tőallomorfok is önálló bemeneti egységei a lexikonnak, amely a magyar nyelv esetén igen valószínűnek tűnik, bár az sem kizárható, hogy szabály által generálódik a szótőből. Eredményeink alapján úgy tűnik, hogy az olyan gazdag alaktannal rendelkező nyelvek esetében, ahol az inflexiós rag azonosítható a rendhagyó szavak esetén is, dekompozíció fog megvalósulni. Ez Marslen-Wilson és Tyler (2003) elképzeléseivel is összhangban áll, amelyek szerint a dekompozíció minden olyan esetben megtörténik, amikor az inflexiós rag azonosítható. A menet közbeni feldolgozást vizsgáló módszerek a reakcióidő- és pontossági adatok révén érzékenyebbek a morfológiai információ feldolgozása által igényelt többletlépésekre, ugyanakkor nem sok mindent árulnak el azzal kapcsolatban, hogy pontosan mi az oka a meghosszabbodott reakcióidőnek. A szóterjedelem-teszten nyújtott teljesítmény és hibázás ugyanakkor kevésbé érzékeny az időbeli változásokra, jóllehet a hibázások elemzésén keresztül fontos információt szolgáltat a morfológiai feldolgozás egyes lépéseiről. A reakcióidő- (lexikális döntési helyzet) és a memóriafeladat együttes alkalmazása révén mélyebb bepillantást kaphatunk a rendhagyó alakok feldolgozásakor megjelenő dekompozícióba, amely nem csak a reakcióidő-adatok (Lukács 2001) és a szóterjedelem (Németh et al. 2006), hanem a hibázási mintázat alapján is alátámasztást nyert.

. A második vizsgálat .. A második vizsgálat célja Második vizsgálatunkban szintén a komplex szavak voltak a fókuszban, de túlmentünk a ragozott alakokon és az összetett szavakra helyeztük a hangsúlyt: a szemantikailag összetett szavak feldolgozását befolyásoló kognitív faktorok szerepét vizsgáltuk. Eddig egyetlen kutatás sem tesztelte a transzparens és nem transzparens összetett szavak feldolgozását egy olyan összetett vizsgálati helyzetben, amely figyelembe veszi mind az egyszerű tárolási kapacitást, mind a komplexebb munkamemória-funkciókat, mind pedig a különböző életkori övezeteket. Így tehát arra kerestük a választ, hogy vajon a szemantikailag összetett alakok tárolásában mi az a tényező, amely releváns szereppel bír a fejlődés különböző szakaszaiban. Van-e eltérés a különböző korosztályokat tekintve abban, hogy milyen kognitív mechanizmus befolyásolja a nyelvi feldolgozást? Miyake és munkatársai (1994), Mason és Just (2007), Németh (2006), Turi és munkatársai (2010) eredményei alapján feltételeztük, hogy akik nagy komplex munkamemóriával rendelkeznek, azoknál ugyanolyan gyors a transzparens

Szavak és memória



és a nem transzparens szavak feldolgozási ideje, hisz elegendő tárkapacitással és komputációs erőforrással rendelkeznek, s ez esetben az, hogy egészben tárolják a szavakat vagy az összeegyeztetési folyamat során kapcsolják össze őket, nem releváns. Viszont akiknek alacsony a tárkapacitásuk, és kevés komputációs erőforrással és gyenge végrehajtó funkciókkal rendelkeznek, azoknál lelassul a transzparens alakok feldolgozási ideje – feltehetően a szavak összeegyeztetési folyamata miatt – a nem transzparens alakokhoz képest, alátámasztva ezzel a dekompozíciós elméletet (Libben et al. 1999; McKinnon et al. 2003; Taft 2004; Taft–Forster 1976; El Yagoubi et al. 2008). A kutatás arra is próbál választ adni, hogy a tárolási kapacitás önmagában szerepet játszik-e az összetett szavak feldolgozásában, vagy csak a végrehajtó funkciókkal együttműködve befolyásolja a komplex munkamemória a feldolgozást. Gathercole (1999) elmélete alapján pedig feltételeztük, hogy a fiatalabb korcsoportnál modulál inkább a komplex munkamemória összetett alakok feldolgozását tekintve, mintsem a későbbi felnőttkorban.

.. Módszerek ... Résztvevők A vizsgálatban összesen 61 fő vett részt, 24 férfi és 37 nő. A középiskolás csoportban 30 fő volt, 15 fiú és 15 lány, az átlagéletkor 16,43 (SD = 0,5). A felnőtt korosztályba 31 fő került, 9 férfi és 22 lány, az átlagéletkor: 19,72 (SD = 4,05). A személyek iskolai végzettségét tekintve, mindannyian rendelkeznek érettségivel, és első vagy második diplomájukat szerzik az egyetemen. Kényelmi mintavételre került sor, majd az informált beleegyezést követően vettük fel a teszteket. A kísérlet során az etikai szabályokat betartottuk, és a feladatok elvégzése előtt minden esetben megkérdeztük a személyektől, hogy van-e bármilyen egészségügyi problémájuk (legfőképp pszichiátriai betegségeket és szív- és érrendszeri betegségeket érintve). A válaszok alapján egy személy kivételével mindenki egészségesnek bizonyult. Egy személy számolt be epilepsziás betegségről, de az ő adatait kizárva is hasonló eredményeket kaptunk.

... Vizsgálati eszközök .... Munkamemória-tesztek A kísérlet során a munkamemóriát és végrehajtó funkciókat vizsgáló teszteket használtunk. A tárolási kapacitás vizsgálatára a verbális munkamemóriát mérő eljárások közül a számterjedelem-tesztet alkalmaztuk (Racsmány et al. 2005). A feladat során egyenként olvastuk fel a számokat 1 másodperces szünetet tartva



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

minden elem után. Csak a pontosan megismételt számsorozatot tekintettük jónak, a kihagyott és felcserélt elemeket egyaránt hibásnak vettük. Egy adott blokkon belül négy számsorozatra került sor, és csak akkor mentünk tovább a következő blokkra, ha négyből minimum három számsorozat hibátlan volt. A sorozat kezdetben három számot tartalmazott, majd a blokkok során a számok egyre növekedtek, így a végén – ha eljutott odáig a vizsgálati személy – már kilenc elemet kellett visszamondania. A komplex munkamemória tesztelésére a számlálási terjedelem (counting span) tesztet használtuk (Case et al. 1982; sztenderdizált magyar változatát l. Janacsek et al. előkészületben). A kísérleti személyeknek azt az instrukciót adtuk, hogy számolják meg a képernyőn megjelenő sötétkék köröket egyesével hangosan, a végeredményt ismételjék, és jegyezzék meg, majd egy adott blokk végén idézzék fel sorrendben az általuk kimondott végeredményeket. Abban az esetben haladtunk tovább a következő szettre, ha a helyes sorrendben sikerült visszaidézni a végeredményeket. A teszt három részből állt, a feladaton nyújtott végeredmény pedig a három rész átlaga volt. A végrehajtó funkciókat a fluenciatesztekkel mértük (Troyer 2000). A betűfluencia-teszt során a vizsgálati személyeknek az volt a feladata, hogy a megadott kezdőbetűvel mondjanak annyi szót, amennyi eszükbe jut. A szemantikus fluencia-teszt során pedig állat- és gyümölcsneveket mondtak a kísérleti személyek. Mindkét esetben egy-egy perc állt a rendelkezésükre. A fluenciamutatók számát pedig az adott utasításnak megfelelő, hibát, perszeverációt nem tartalmazó elemek adták meg. .... Az összetett szavak vizsgálata A pszicholingvisztikai kísérlet az E-Prime program segítségével történt. Lexikális döntési helyzetben a vizsgálati személyeknek a vizuálisan bemutatott ingerekről kellett eldönteniük, hogy értelmes magyar szó-e, amit látnak, vagy sem. A személyek random módon 150 ingert kaptak (valódi és álszavakkal együtt) 1 másodperces szünetekkel. Az összetett alakok vizsgálatánál a valódi szavak között szerepelt: 25 transzparens összetett szó (például vízcsap, tehéntej, díszpárna), 25 nem transzparens összetett szó (például tűzcsap, madártej, zsírpárna), és 25 kontrollszó (például barack, esernyő, spagetti) (1. sz. melléklet). A szavak átlagos szótagszáma (transzparens: 3,12; nem transzparens: 3,08 kontroll: 3,08 (F(2, 72) = 0,03; p = 0,97) és logaritmus alapú felszíni gyakorisága (transzparens: 2,25, nem transzparens: 2,10 kontroll: 2,30 (F(2, 72) = 0,8; minden p = 0,45) kiegyenlített volt. A szavak gyakoriságánák megállapításához a Váradi (2002) által készített gyakorisági szótárt használtuk. Az összetett szavak esetében egy rövid elővizsgálat keretében két további szempontot is figyelembe

Szavak és memória



vettünk: 1–5-ig terjedő skálával ellenőriztük, hogy mennyire tartják őket ismerősnek, illetve mennyire tudnak képet társítani hozzájuk a személyek (képkiváltó érték). Az összetett szavak sem az ismerősség (transzparens szavak átlagpontszáma 4,34, nem transzparens szavaké pedig 4,43, t(48) = −0,62; p = 0,52), sem pedig a képkiváltó érték tekintetében nem különböztek egymástól (transzparens szavak átlagpontszáma 4,32, nem transzparens szavaké pedig 4,26, t(48) = 0,41; p = 0,68). A 75 valódi szó mellett 75 álszó is bemutatásra került a lexikális döntés igen–nem válaszainak kiegyenlítése érdekében, utóbbiakat azonban az elemzés során nem használtuk fel.

... A vizsgálat leírása A középiskolásokkal való kísérlet minden alkalommal a Garay János Gimnázium könyvtárában zajlott, ahová egyesével jöttek a tanulók. A felnőtt korcsoporttal való vizsgálatra pedig a Szegedi Tudományegyetem Pszichológiai Intézetében került sor. A tesztek felvétele személyenként kb. 40 percet vett igénybe. Minden feladat előtt pontos instrukciót adtunk, így a számterjedelem-tesztnél arra kértük a személyeket, hogy a hallott sorrendben mondják vissza a számokat, a számlálási terjedelem tesztnél arra, hogy számolják meg egyesével a sötétkék köröket, a végeredményt ismételjék meg, majd a szett végén idézzék fel őket a megfelelő sorrendben, a fluenciafeladatoknál pedig arra kértük a vizsgálati személyeket, hogy mondjanak minél több olyan szót, amely az adott utasításnak megfelel.

.. Eredmények A mintát a fiatalabb korcsoport és az idősebb korcsoport képezte. A korcsoportoknál a számterjedelem, a számlálási terjedelem, és a végrehajtó funkciókat mérő teszteknél egyaránt meghatároztuk az átlageredményt, és ennek alapján további két alcsoport képezte a mintánkat. Így mind a három tesztnél voltak, akik az átlageredményhez képest alacsonyabban és voltak, akik magasabban teljesítettek. Az összetett szavak elemzésére összetartozó mintás varianciaanalízist alkalmaztunk, ahol a transzparens, nem transzparens és kontrollszavak képezték az összetartozó mintás típus faktort, a független mintás faktorok pedig a csoport (serdülő és felnőtt), a számterjedelem (alacsony és magas), a számlálási fluencia (alacsony és magas), a betfluencia (alacsony és magas), és a szemantikus fluencia (alacsony és magas) voltak. Az utóbbi négy változót külön varianciaanalízisben vizsgáltuk. A továbbiakban csak a reakcióidő-eredmények kerülnek bemutatásra, ugyanis a pontosságnál plafonhatás jelentkezett.



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

A számterjedelem-teszt eredményeinél a típus faktor nem mutatott szignifikáns főhatást (F(2, 114) = 1,874; p = 0,158), vagyis a személyeknél nem volt reakcióidőbeli eltérés a különböző szavakra adott válaszokban. A különböző típusú szavakra eső reakcióidőt nem befolyásolta sem az életkori csoport, sem a számterjedelem-teszten nyújtott teljesítmény (minden p > 0,524) (6. ábra). (B) Feln!ttek

(A) Serdül!k 1500 1400

reakcióid! (ms)

1300 1200 1100 1000 900

alacsony számterjedelem magas számterjedelem

1500

K alacsony számterjedelem 1128,773 1152,773 magas számterjedelem 917,3684 993,7632 K T alacsony 1092,818 1101,318 magas 1011,675 1047,775

1400 1300 1200 1100 1000 900

800

800

700

700 600

600 K

T

feltétel

NT

K

T

NT

feltétel

6. ábra: A kontroll, a transzparens és a nem transzparens szavak felismerési ideje a szám-

terjedelem függvényében serdülőknél (A) és felnőtteknél (B). A szóródási mutató az átlag standard hibája.

A számlálási terjedelem teszt eredményeit vizsgálva a típus faktor nem mutat szignifikáns főhatást (F(2, 114) = 2,273; p = 0,108), vagyis az összetétel típusát tekintve a vizsgálati személyek összességében ugyanolyan gyorsan reagáltak mindegyik szóra. A típus ∗ csoport (F(2, 114) = 0,201; p = 0,818) tekintetében nincs szignifikáns interakció, vagyis a két életkori övezetben ugyanúgy válaszoltak az összetett szavakra. Azonban a típus * számlálási (F(2, 114) = 2,509; p = 0,086), valamint a típus ∗ csoport ∗ számlálási terjedelem teszt tekintetében tendenciaszintű eredmény született (F(2, 114) = 2,637; p = 0,076). Az LSD post-hoc teszt alapján megállapítható, hogy a fiatalabb korcsoportban az alacsonyabb munkamemóriával rendelkezők eltérően válaszolnak a háromféle ingertípusra (F(2, 56) = 4,511; p = 0,015). A transzparens szavak felismerési ideje szignifikánsan lassabb a kontrollszavakénál (p = 0,004) (1086 vs. 969 ms) és a nem transzparens szavak felismerési idejénél is (p = 0,034) (1086 vs. 1019 ms). A kontroll és a nem transzparens alakok tekintetében viszont nincs szignifikáns különbség (p = 0,11). Ugyancsak ebben a korcsoportban a magas



Szavak és memória

munkamemóriával rendelkező személyeknél viszont nincs szignifikáns különbség a kísérleti feltételekben (F(2, 569 = 0,215; p = 0,807) (A ábra). A felnőtt korosztályt nézve a részletes post-hoc elemzés azt mutatja, hogy az alacsony munkamemóriával rendelkező személyeknél tendenciaszintű változás figyelhető meg a transzparens és a nem transzparens szavak felismerési ideje között (p = 0,079) A személyek lassabban ismerik fel a transzparens szavakat (pl. tehéntej) a nem transzparens (pl. madártej) alakokhoz képest (1143 vs. 1088 ms). A transzparens és a kontroll (p = 0,49) valamint a nem transzparens és a kontrollszavak (p = 0,35) tekintetében viszont nincs szignifikáns különbség. Ugyancsak felnőtteknél a magas munkamemóriájú személyeknél nincs szignifikáns különbség (minden p > 0,185) egyik feltételben sem (B ábra). (B) Feln!ttek

reakcióid! (ms)

(A) Serdül!k 1500

1500

1400

1400

1300

1300

1200

1200

1100

1100

1000

1000

900

900

800

800

700

700

alacsony számlálási terjedelem magas számlálási terjedelem

600

600 K

T

feltétel

NT

K

T

NT

feltétel

7. ábra: A kontroll-, a transzparens és a nem transzparens szavak felismerési ideje a

számlálási terjedelem függvényében serdülőknél (A) és felnőtteknél (B). A szóródási mutató az átlag standard hibája.

A betűfluencia-teszt eredményeit nézve a típus faktor nem mutat szignifikáns főhatást (F(2, 112) = 1,632; p = 0,303), vagyis az összetétel típusában nincs jelentős eltérés a vizsgálati személyek reakcióideje között. A típus ∗ csoport (F(2, 112) = 0,164; p = 0,858), valamint a típus ∗ betfluencia (F(2, 112) = 1,689; p = 0,112) tekintetében sincs szignifikáns különbség, azaz önmagában sem az életkor, sem a fluenciateszt eredménye nem mutat jelentős eltérést. A típus ∗ csoport ∗ betfluencia (F(2, 98) = 3,752; p = 0,026) hármas interakció szignifikáns kapcsolatot mutat. Az LSD post-hoc teszt alapján megállapítható, hogy a gyenge végrehajtó funkciókkal rendelkező serdülők eltérően válaszolnak a különböző feltételekre.



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

A vizsgálati személyek szignifikánsan (p = 0,001) lassabban ismerik fel a transzparens szavakat (pl. gyümölcstorta) a nem transzparens (pl. dobostorta) alakokhoz képest (1130 vs. 1031 ms). Ugyancsak szignifikánsan (p = 0,01) lassabb a transzparens szavakra adott reakcióidő a kontrollalakokhoz képest (1130 vs. 1029 ms). A nem transzparens és a kontrollalakok felismerési ideje között azonban nincs szignifikáns kapcsolat (p = 0,939). Ezzel szemben a jó végrehajtó funkciókkal rendelkező serdülőknél nincs szignifikáns kapcsolat a szavak felismerési ideje között (minden p > 0,085) (A ábra). A felnőtt csoport tekintetében viszont nincs szignifikáns eltérés az ingerekre adott válaszokban sem gyenge (p = 0,978), sem jó végrehajtó funkcióban (p = 0,507), vagyis a felnőttek megegyezően válaszoltak a transzparens, a nem transzparens és a kontrollszavakra (B ábra). (B) Feln!ttek

reakcióid" (ms)

(A) Serdül!k 1500

1500

alacsony szemantikus !uencia

1400

1400

1300

1300

magas szemantikus !uencia

1200

1200

1100

1100

1000

1000

900

900

800

800

700

700 600

600 K

T

feltétel

NT

K

T

NT

feltétel

8. ábra: A kontroll-, a transzparens és a nem transzparens szavak felismerési ideje a be-

tűfluencia függvényében serdülőknél (A) és felnőtteknél (B). A szóródási mutató az átlag standard hibája.

A szemantikus fluenciában a típus faktor tekintetében nincs szignifikáns főhatás (F(2, 112) = 1,169; p = 0,315), vagyis a válaszokban nincs jelentős eltérés az összetétel típusát nézve. A típus ∗ csoport tekintetében nem figyelhető meg szignifikáns interakció (F(2, 112) = 0,006; p = 0,994), vagyis a különböző életkori övezetekben ugyanúgy válaszoltak a személyek. A típus ∗ szemantikus fluencia tekintetében tendenciaszintű eredmény figyelhető meg (F(2, 112) = 2,512; p = 0,086), a típus ∗ csoport ∗ szemantikus fluencia hármas interakció szignifikáns különbséget mutat (F(2, 112) = 4,503; p = 0,013).



Szavak és memória

Az LSD post-hoc teszt alapján a serdülőknél gyengébb végrehajtó funkcióban szignifikáns különbség figyelhető meg a szavak reakcióideje között. A vizsgálati személyek szignifikánsan (p = 0,005) lassabban reagálnak a transzparens szavakra (pl. marhahús) a nem transzparens alakokhoz (pl. gyümölcshús) képest (1109 vs. 1027 ms), továbbá ugyancsak szignifikáns különbség (p = 0,002) figyelhető meg a transzparens és kontrollszavak felismerési ideje között. A vizsgálati személyek szignifikánsan lassabban reagáltak a transzparens alakokra a kontrollszavakhoz képest (1109 vs. 995 ms). A kontroll és a nem transzparens elemek feldolgozási ideje között viszont nincs szignifikáns kapcsolat (p = 0,266). Szintén serdülőknél a jó végrehajtó funkciókkal rendelkező csoportban nincs szignifikáns különbség a szavak felismerési idejében (minden p > 0,260) (A ábra). A felnőtt korosztályban viszont nincs szignifikáns eltérés a három kísérleti feltételben sem gyenge (p = 0,371) sem jó végrehajtó funkcióban (p = 0,425), vagyis megegyezően ismerték fel a vizsgálati személyek a transzparens, a nem transzparens és a kontrollszavakat egyaránt (B ábra). (B) Feln!ttek

reakcióid# (ms)

(A) Serdül!k 1500

1500

1400

1400

1300

1300

1200

1200

1100

1100

1000

1000

900

900

800

800

700

700

alacsony bet!"uencia magas bet!"uencia

600

600 K

T

NT

feltétel

K

T

NT

feltétel

9. ábra: A kontroll, a transzparens és a nem transzparens szavak felismerési ideje a sze-

mantikus fluencia függvényében serdülőknél (A) és felnőtteknél (B). A szóródási mutató az átlag standard hibája.

.. A második vizsgálat megvitatása Ebben a vizsgálatunkban arra kérdésre kerestük a választ, hogy a rövid távú tárolási kapacitás, illetve a rendelkezésre álló végrehajtó funkciók és komputációs erőforrások hogyan befolyásolják az összetett szavak feldolgozását 16–17 évesek-



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

nél és felnőtteknél. Eddig ugyanis egyetlen kutatás sem tesztelte a transzparens és nem transzparens szavak feldolgozását egy olyan összetett vizsgálati helyzetben, amely figyelembe veszi mind az egyszerű tárolási kapacitást, mind a komplexebb munkamemória- és végrehajtó funkciókat, mind pedig a különböző életkori övezeteket. A vizsgálat alapján megállapítható, hogy az összetett alakok nyelvi feldolgozását az egyszerű tárolási kapacitás nem befolyásolja sem serdülőknél, sem felnőtteknél. A komplexebb munkamemória- és végrehajtó funkciók – amelyeknél a tárolás és a feldolgozás egyaránt releváns – viszont modulálják az összetett szavak feldolgozását. A fiatalabb korcsoportban az alacsonyabb munkamemóriával és végrehajtó funkciókkal rendelkező személyek lassabban ismerik fel a transzparens szavakat a nem transzparens és a kontrollszavakhoz képest. Ezzel szemben felnőttkorra már nem érhető tetten sem a tárolási kapacitás, sem pedig a komplexebb munkamemória-funkciók relevanciája az összetett szavak észlelésében. A rövid távú tárolási kapacitás és a szemantikailag összetett alakok időbeli feldolgozása között nem találtunk kapcsolatot. A számterjedelem-teszt eredményei azt mutatják, hogy sem a serdülők, sem a felnőttek nem különböznek egymástól a transzparens, a nem transzparens és a kontrollszavak feldolgozása tekintetében. Megállapítható, hogy sem az egyszerű rövid távú tárolási kapacitás, sem pedig az életkor nem modulálja az összetett alakok nyelvi feldolgozását. Mindez pedig összhangban van azon kutatások eredményeivel, amelyek a lexikális kétértelműség feldolgozását vizsgálták a komplex munkamemória, a szógyakoriság és a mondatkontextus függvényében (Turi et al. 2010). A komplex munkamemória-funkciók azonban fontos szerepet játszanak az összetett alakok feldolgozásában. Megfigyelhető serdülőknél, hogy a mind a komplex munkamemória-teszten, mind a végrehajtó funkciókat mérő feladatokban gyengén teljesítők eltérően válaszoltak a különböző ingerekre a jobban teljesítőkhöz képest. A gyengébben teljesítő személyeknél ugyanis lelassul a transzparens szavak feldolgozási ideje a nem transzparens és a kontrollalakokhoz képest. A dekompozíciós elmélet alapján a szavak összeegyeztetési folyamata az alacsony munkamemóriájú és gyenge végrehajtó funkciókkal rendelkező személyeknél – a szűk tárkapacitás és a komputációs erőforrások hiánya miatt – jelentősen több időt vesz igénybe A felnőtt korosztályt vizsgálva viszont a gyengébben teljesítőknél sem volt jelentős eltérés a szavak időbeli feldolgozásában, csak tendenciaszinten jellemző, hogy a személyek lassabban dolgozzák fel a transzparens szavakat a nem transzparensekhez képest. Mindezen eredmények pedig azt implikálják, hogy mind a komplex munkamemóriáért és a végrehajtó funkciókért felelős mechanizmusok, mind az életkor befolyásolják a szemantikailag összetett szavak feldolgozását Az életkori különbségek hátterében egyrészt feltételezhető az is, hogy felnőttkorra a szemantikailag transzparens összetett szavak – a gya-

Szavak és memória



kori használat miatt – egész alakként működnek, másrészt a jól teljesítő személyeknél azért nincs különbség a szavak feldolgozását tekintve, mert ők elegendő erőforrással rendelkeznek a különböző szavak felismeréséhez. Ez egyaránt igaz a serdülő és a felnőtt korcsoportra. Mindezen eredmények összhangban vannak a korábbi kutatási eredményekkel, amelyek szerint a nagyobb munkamemória-kapacitású személyeknél automatikusabbak a feldolgozási folyamatok, és például a kétértelmű szavak esetében mindkét jelentést aktívan tudják tartani. A pontossági adatokat tekintve megállapítható, hogy az életkor, a rövid távú tárolási kapacitás, illetve a komplex munkaemlékezeti és végrehajtó funkciók sem befolyásolják az összetett alakok észlelését. Az eredményeket tekintve ennek hátterében az állhat, hogy a plafonhatás miatt nem jelentkezett jelentős eltérés a különböző feltételekben. A vizsgálati személyek ugyanis nagyon jól teljesítettek a szavak észlelésében, legrosszabb esetben 90-os pontossággal reagáltak a képernyőn megjelenő ingerekre. Másrészt nem szabad figyelmen kívül hagyni azt sem, hogy a pontosságnál – szemben a reakcióidővel – inkább akaratlagos figyelmi funkciók dominálnak, nagyobb szerepe van a kontrollnak, és az automatikus folyamatok kevésbé érvényesülnek.

. Végső konklúzió A két empirikus vizsgálat eredményei alapján is megállapítható, hogy a nyelvi teljesítmények (ragozott és összetett szavak feldolgozása) sajátos működésében fontos szerepet kap a munkamemória. A ragozott szavak vizsgálatával nyert eredmények azt mutatják, hogy a teljesítményben eltérés van az online és az offline (memóriafeladat) feldolgozás között. A szóterjedelem-teszten a ragozott szavak visszamondási arányában nem volt különbség a szabályos és a rendhagyó alakok között, míg a reakcióidőt tekintve a kísérleti személyek gyorsabban és pontosabban válaszoltak a szabályos ragozású szavakra. Ennek alapján feltételezhető, hogy a két feladat eltérő működésmódot követel. Mind a hibázások esetében, mind pedig a szóterjedelem, illetve a reakcióidő tekintetében megmutatkozik az eltérés. A szabályos és a rendhagyó alakok körül kialakult vitában ezeket az eredményeket érdemes figyelembe venni. Kérdés, hogy két külön rendszer felelős-e a szabályos és a rendhagyó alakokért. A memóriafeladatok tehát a rendhagyó alakok esetében azt támasztják alá, hogy hasonló módon működnek és tárolódnak, mint a szabályos alakok. Ez esetben akár egy rendszer is lehet értük felelős. A reakcióidő-feladatok viszont azt mutatják, hogy a rendhagyó alakok képzése több műveletet igényel (Németh et al. 2006). Így két külön szabályalapú rendszerrel lehetne leírni a ragozott ala-



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

kok működését. Feltételezhetjük, hogy a rendhagyó szavak esetében is létezik külön egy szótő, amit raktározunk az emlékezeti rendszerben, és amelyből szabály alapján létrehozzuk a rendhagyó szótövet, amelyhez hozzákapcsolunk egy toldalékot. Fontos megemlíteni, hogy mindenképp képezni kell a rendhagyó szótövet, hiszen amennyiben külön tárolnánk, nem lenne különbség a szabályos és a rendhagyó ragozású alakok reakcióidejében. Mindez mindenképpen arra utal, hogy a rendhagyó alakokat is valamilyen szabály alapján képezzük. Úgy tűnik, hogy a rendhagyó alakok esetében raktározunk egy szótövet és egy ragot, amelyeket ugyanúgy, mint a szabályos alakok esetében, egy szabály alapján kapcsolunk össze. Fontos azonban, hogy ennek a szabálynak tartalmaznia kell a szótő megváltoztatását is. Amennyiben külön tárolnánk egy rendhagyó szótövet is, akkor a reakcióidőkben nem kellene különbségnek mutatkoznia a szabályos és rendhagyó alakok között. A magyar nyelvben a rendhagyó alakok sokféle különböző felszíni gyakoriságának köszönhetően és a gazdag szuffixumkészlet miatt nem magyarázhatjuk a jobb szóterjedelem-eredményt és a hosszabb reakcióidőt a szógyakorisággal. További kérdés azonban ennek kapcsán, hogy memória és online feldolgozás különválásán kívül mivel magyarázható, hogy ugyan a rendhagyó alakok képzése több műveletet igényel, de a ragozott szóterjedelem-teszten hasonló mennyiségű rendhagyó ragozású szót tudunk megismételni, mint szabályosat, tehát a teljesítmény nem mutat romlást. Nem egyértelmű tehát a rendhagyó alakok képzése és tárolása. A szó–nem szó döntési helyzet és a memóriafeladat eltérő eredményeit magyarázhatja, hogy a szó–nem szó döntési helyzetben éppen a procedurális, szabályalapú tárolás miatt a szabályos alakok már a tő alapján könnyen megjósolhatók. Ez nagyobb pontosságban és kisebb reakcióidőben nyilvánul meg. Ezzel szemben a rendhagyó alakok szótöve a ragozás során változáson megy keresztül, tehát maga a szótő kevésbé szolgálhat a pontos döntés alapjául. Nem szabad azonban figyelmen kívül hagynunk azokat a kompenzációs mechanizmusokat sem, amelyek a memóriafeladatnál működésbe léphetnek, míg az online feladat esetében nincs rájuk idő. Visszautalva a nyelvi működést leíró modellekre: a konnekcionista felfogás hálózatai és csomópontjai jól modelleznék a szabályalapú működést. Ez esetben a hálózatokon belüli kapcsolatok megerősödése jelentené magát a szabály elsajátítását. Hiszen a nyelvtani szabályok leírhatók valószínűségekként is. Például a toldalékoknak a magyar nyelvben egyetlen meghatározott sorrendje lehetséges: igekötő–szótő–képző–jel–rag. A szabály ebben az esetben egyszerű. A képző, jel és rag előtt állhat még kötőhang, azonban a rag után már nem állhat semmi. Az ehhez hasonló szabályok rögzülése leírható lenne a hálózatok csomópontjainak és bizonyos összeköttetéseiknek megerősödésével. Arra, hogy nem pusztán

Szavak és memória



összeköttetésekről, hanem tényleges szabályalapú működésről van szó, könnyen megtapasztalható bizonyíték lehet, hogy minden nehézség nélkül képesek vagyunk elragozni egy eddig ismeretlen szót, amely szükségszerűen nem szerepelt eddig a hálózatban. Az összetett szavak feldolgozását nézve kiemelendő a komplex munkamemória szerepe a fiatalabb korcsoportban, amelyhez mind a fonológiai hurok, mind a végrehajtó funkciók együttes működése szükséges. Látható ugyanis, hogy serdülőknél a különböző emlékezeti és végrehajtó funkciók befolyásolják a nyelvi feldolgozást. A rövid távú tárolási kapacitás mellett a rendelkezésre álló komputációs erőforrások és az információmanipulálás egyaránt modulálja az összetett szavak időbeli feldolgozását, ugyanis azoknál, akiknek nincs elegendő komputációs erőforrásuk, lelassul a transzparens szavak feldolgozási ideje a nem transzparens és a kontrollalakokéhoz képest. Ezzel szemben felnőttkorra már nem érhető tetten sem a tárolási kapacitás, sem pedig a munkamemória és végrehajtó funkciók szerepe az összetett szavak tekintetében. Ez összhangban van azon kutatási eredményekkel, amelyek a komplex munkamemória szerepét hangsúlyozzák a nyelvi produkcióban. A kutatás módszertani jelentősége abban rejlik, hogy kétfajta vizsgálati eljárást ötvöz, és így egyszerre ad lehetőséget reakcióidő és memóriateljesítmény vizsgálatára. Ráadásul – bár a nyelvi feldolgozás felkapott kutatási terület – az eddigi vizsgálatok főleg az angol nyelvet érintették, ezért is különösen érdekesek a magyar nyelvvel kapcsolatos vizsgálatok. Az eredmények nemcsak a nyelvi reprezentációk jobb megértését segítik, hanem további kutatások után új módszereket adhatnak a különböző nyelvi és nyelvpatológiai vizsgálatokhoz is. A kutatás rávilágít arra is, hogy a nyelvi zavarokban a terápiás utak kidolgozásánál a végrehajtó funkciók fejlesztésének kulcsfontosságú szerepe lehet. Irodalom Baddeley, Alan David – Susan E. Gathercole – Costanza Papagno 1998. The phonological loop as a language learning device. Psychological Review 105: 158–173. Baddeley, Alan David – Graham Hitch 1974. Working memory. In: Gordon H. Bower (szerk.): The psychology of learning and motivation (Vol. 8). New York: Academic Press. 47–89. Butterworth, Brian 1983. Lexical representation. In: Brian Butterworth (szerk.): Language production, Volume 2. London: Academic Press. 257–294. Bybee, Joan 1995. Regular morphology and the lexicon. Language and Cognitive Processes 10: 425–455. Caramazza, Alfonso – Alessandro Laudanna – Cristina Romani 1988. Lexical access and inflectional morphology. Cognition 28: 297–332. Carlisle, Joanne F. – Jane Fleming 2003. Lexical processing of morphologically complex words in the elementary ears. Scientific Studies of Reading 7: 239–253.



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

Case, Robbie – D. Midian Kurland – Jill Goldberg 1982. Operational efficiency and the growth of short-term memory span. Journal of Experimental Child Psychology 33: 386–404. Clahsen, Harald 1999. Lexical entries and rules of language: a multidisciplinary study of German inflection. Behavioral and Brain Sciences 22: 991–1013. El Yagoubi, Radouan – Valentina Chiarelli – Sara Mondini – Gelsomina Perrone – Morena Danieli – Carlo sem*nza 2008. Neural correlates of Italian nominal compounds and potential impact of headedness effect: An ERP study. Cognitive Neuropsychology 25: 559–581. Gathercole, Susan E. 1999. Cognitive approaches to the development of short-term memory. Trends in Cognitive Sciences 3: 410–419. Janacsek Karolina – Ujvári Katalin – Fekete Regina – Gyüre Tamás – Filep Orsolya – Németh Dezső előkészületben. A munkamemória fejlődésének vizsgálata: Új magyar nyelvű neuropszichológiai mérőeljárások, a számlálási és a műveleti terjedelem teszt. Just, Marcel Adam – Patricia A. Carpenter 1992. A capacity theory of comprehension: Individual differences in working memory. Psychological Review 99: 122–149. Kiefer Ferenc (szerk.) 2000. Strukturális magyar nyelvtan 3. Morfológia. Budapest: Akadémiai Kiadó. Kornai, András – Péter Halácsy – Viktor Nagy – Csaba Oravecz – Viktor Trón – Dániel Varga 2006. Web-based frequency dictionaries for medium density languages. In: Adam Kilgarriff – Marco Baroni (szerk.): Proceedings of the 2nd International Workshop on Web as Corpus. Trento: Association for Computational Linguistics. ACL–06: 1–9. (http://acl.ldc.upenn.edu/W/W06/W06-1701.pdf) Laine, Matti 1996. Lexical status of inflectional and derivational suffixes: Evidence from Finnish. Scandinavian Journal of Psychology 37: 238–248. Libben, Gary – Bruce L. Derwing – Roberto G. de Almeida 1999. Ambiguous novel compounds and models of morphological parsing. Brain and Language 68: 378–386. Lukács Ágnes 2001. Szabályok és kivételek: a kettős modell érvényessége a magyarban. In: Pléh Csaba – Lukács Ágnes (szerk.): A magyar morfológia pszicholingvisztikája. Budapest: Osiris. 119–152. Marslen-Wilson, William D. 1980. The temporal structure of spoken language understanding. Cognition Sciences 2: 428–435. Marslen-Wilson, William D. – Lorainne Komisarjevsky Tyler 1993. Capturing underlying differentiation in the human language system. Trends in Cognitive Science 7: 62–63. Marslen-Wilson, William D. – Lorainne Komisarjevsky Tyler – Rachelle Waksler – Lianne Older 1994. Morphology and meaning in the English mental lexicon. Psychological Review 101: 3–33. Mason, Robert A. – Marcel Adam Just 2007. Lexical ambiguity in sentence comprehension. Brain Research 1146: 115–127. McKinnon, Richard – Mark Allen – Lee Osterhout 2003. Morphological decomposition involving non productive morphemes: ERP evidence. NeuroReport 14: 883–886. Miyake, Akira A. – Marcel Adam Just – Patricia. A. Carpenter 1994. Working memory constraints on the resolution of lexical ambiguity: Maintaining multiple interpretations in neutral contexts. Journal of Memory and Language 33: 175–202. Németh Dezső 2006. A nyelvi folyamatok és az emlékezeti rendszerek kapcsolata. Budapest: Akadémiai Kiadó.

Szavak és memória



Németh Dezső – Ivády Rozália Eszter – Miháltz Márton – Krajcsi Attila – Pléh Csaba 2006. A verbális munkamemória és a morfológiai komplexitás. Magyar Pszichológiai Szemle 61: 265– 298. Pinker, Stephen 1997. Words and rules in the human brain. Nature 387: 547–548. Racsmány Mihály 2004. A munkamemória szerepe a megismerésben. Budapest: Akadémiai Kiadó. Racsmány Mihály – Lukács Ágnes – Németh Dezső – Pléh Csaba 2005. A verbális munkamemória magyar nyelvű vizsgálóeljárásai. Magyar Pszichológiai Szemle 60: 479–505. Service, Elisabeth – Anna-Marie Tujulin 2002. Recall of morphologically complex forms is affected by memory task but not dyslexia. Brain and Language 81: 42–54. Speidel, Gisela E. 1993. Phonological short-term memory and individual differences in learning to speak: A bilingual case study. First Language 13: 69–91. Taft, Marcus 2004. Morphological decomposition and the reverse base frequency effect. Quarterly Journal of Experimental Psychology: Human Experimental Psychology 57: 745–765. Taft, Marcus – Kenneth I. Forster 1976. Lexical storage and retrieval of polymorphemic and polysyllabic words. Journal of Verbal Learning and Verbal Behavior 15: 607–620. Troyer, Angela K. 2000. Normative data for clustering and switching on verbal fluency tasks. Journal of Clinical and Experimental Psychology 22: 370–378. Turi Zsolt – Janacsek Karolina – Németh Dezső 2010. A munkamemória, a szógyakoriság és a kontextus szerepe a lexikális kétértelműség feldolgozásában. Pszichológia 30: 295–315. Ullman, Michael Thomas 2001. The declarative/procedural model of lexicon and grammar. Journal of Psycholinguistic Research 1: 37–69. Váradi, Tamás 2002. The Hungarian National Corpus. In: Mark T. Maybury (szerk.): Proceedings of the Third International Conference on Language Resources and Evaluation. Las Palmas: European Language Resource Association. 385–389.



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

Mellékletek . melléklet: Az összetett és a kontrollszavak Transzparens szavak

Nem transzparens szavak

Kontrollszavak

szemüveg marhahús tölgyfa vízcsap gyümölcstorta tehéntej díszpárna gombaleves napernyő birkapásztor bőrrák búzaszem cseréptető vasszög búzavirág záporeső bőröv bársonynadrág pázsitfű sminkmester fácánkakas padláslépcső cápafog kutyanyál halszáj

tejüveg gyümölcshús családfa tűzcsap dobostorta madártej zsírpárna nyakleves képernyő villanypásztor tarisznyarák tyúkszem sátortető derékszög borvirág aranyeső erényöv cicanadrág kakukkfű gyepmester szélkakas csigalépcső szemfog ökörnyál nyúlszáj

körözvény tornádó heverő bitó szolárium esernyő spagetti padlózat csillagzat liliom biciklizés zörej orchidea vetemény áfonya kaparó meredély törölköző tekervény cukorka padlizsán hurrikán korcsolya pipacs csoroszlya

. melléklet: A ragozott szóterjedelem-tesztek Eljárás: A vizsgálatvezető egyenként olvassa fel a szavakat  másodperces szünetet tartva minden szám után. Csak a pontosan megismételt sorozat fogadható el, kihagyott és felcserélt szavak egyaránt hibásnak számítanak. Akkor megyünk tovább, ha a töveket még helyesen mondja vissza. Instrukció: „A következőkben ragozott szavakat fogok mondani egymás után, neked pedig ugyanolyan sorrendben kell elismételned azokat. Példa: falon–gyeped.” Szabályos ragozású szavak I. sorozat sörök tejük zsebed tagom körön poruk juhot lapon rumok hegyed nyakuk hasak padot helyem hajon fület boruk halam sorod fogak

Teljes



Szavak és memória

Szabályos ragozású szavak II. sorozat

Teljes

Teljes

Teljes

Teljes

Teljes

borod sorom rumon foguk fülek nyakat hasam tagon körük tejet hajak porod söröm halon helyek juhuk lapod zsebet padon hegyem Szabályos ragozású szavak III. sorozat juhod körök padom hegyet soruk hajat helyed boron haluk füled lapom zsebek rumot fogon tejem nyakak poron söröd tagot hasuk Összesen (a három sorozat átlaga): Rendhagyó ragozású szavak I. sorozat ludat jegek legyet nyuluk nyilak hidam tavon kutak levük havad nyüvem kezek lovon terük csövek füvön kövük művem vized tövet Rendhagyó ragozású szavak II. sorozat nyilam művön jeget kutad nyüvek kezem füved legyük vizek tövük csövön tavad hidat kövem lovad havat ludam terük nyulak leven Rendhagyó ragozású szavak III. sorozat tered kövön vizem tövön lovat nyulad tavat csövük havon művük legyem leved ludak füvet nyüvön kezed hidak nyilat kutam jegük Összesen (a három sorozat átlaga):



Heilmann Ágnes – Szépfalusi Noémi – Janacsek Karolina – Németh Dezső

. melléklet: A ragozott szóterjedelem-tesztek (álszavak) Eljárás: A vizsgálatvezető egyenként olvassa fel a szavakat  másodperces szünetet tartva minden szám után. Csak a pontosan megismételt sorozat fogadható el, kihagyott és felcserélt szavak egyaránt hibásnak számítanak. Akkor megyünk tovább, ha a töveket még helyesen mondja vissza. Instrukció: „Most kitalált szavakat fogok neked mondani. A feladatod az lesz, hogy pontosan megismételd őket. Ebben az esetben is figyelj a szavak sorrendjére! Példa: dolon–tyibed.” Szabályos ragozású álszavak I. sorozat

Teljes

Teljes

Teljes

Teljes

höröd fogot lojat hopom tyokak topod gigyem fürök maruk dagak momon narük bosam fijet szibed taruk bamok filyem tölet kojon Szabályos ragozású álszavak II. sorozat kijem daron laron tyibek kilyed solon nyibet tohuk kohod garuk darom cogon jarod gojak süjük zogom bopon tahot sigyed dosak Szabályos ragozású álszavak III. sorozat cagon jusuk joluk döled zamot bilyek zodon codom figyet parod naguk mölek tyokat güröm tarök dürön fodot zsukuk darod folam Összesen (a három sorozat átlaga): Rendhagyó ragozású álszavak I. sorozat hövet dőrük dizem szevön fized szüvön dedat gived todak lüvük düvet szövek fevad molam tadat datak tyaluk lezem favon gired



Szavak és memória

Rendhagyó ragozású álszavak II. sorozat

Teljes

Teljes

medak szilat goron mavat szolad dezek hevön gavad fiven figyük szevek dővem figet löved divük higek tigyet dovon fezed szelam Rendhagyó ragozású álszavak III. sorozat kigük matam szüvük povat kigyem fovat szalak mirük devön dizek pővön fatad küvük devem szolak fadam rovad työvem dirük hövön Összesen (a három sorozat átlaga):

Words and memory: Relationship between the processing of morphologically complex words and working memory Abstract: The aim of our studies was to explore the relationship between memory systems and mental lexicon. The organization of the mental lexicon and word retrieval are still critical issues in psycholinguistics. The investigation of complex words provides an ideal avenue for investigating the relationship between language and memory systems. The main question of our study was to investigate how the working memory capacity affects the processing of inflectional and compound words. The aim of the first study was to investigate the processing and the production of regular and irregular nouns by means of two different tasks, namely a word recall task and a lexical decision task. Our primary question was whether irregulars are stored as whole representations or they are composed/decomposed as regulars. Our further aim was to investigate the relationship between online linguistic processes and offline memory processes. According to our results participants showed shorter reaction time and better accuracy for regulars then irregulars in the lexical decision task, but no significant difference was found between regulars and irregulars in the word recall task. In the latter task, errors occurred for the stems and the suffixes in the same extent, suggesting composition/decomposition processes for both regulars and irregulars. The novelty of our study is the combination of online (RT measurement in lexical decision task) and offline (memory task) methods which can help us to reveal different aspects of morphological processes. In the second study we investigated compound words in a lexical decision task. Our results showed that complex working memory capacity had significant effect on lexical decision in adolescents but not in young adults. We conclude that in adolescence the processing of compound words appears to be more domaingeneral, while these processes become more automatic and independent from working memory and other cognitive systems in later ages. Keywords: inflection, grammar, word recall, lexical decision task, compound words, working memory

A beszédpercepció helye a teljes megértési folyamatban* Mády Katalin Magyar Tudományos Akadémia, Nyelvtudományi Intézet [emailprotected]

Kivonat: A hangzó nyelvi feldolgozás alulról felfelé építkező modelljeinek bemenete az akusztikai jel, amely absztrakt fonológiai leképezés után kerül be a magasabb kognitív folyamatokba. Nem világos azonban, hogy hogyan lesz a fizikailag mérhető, folytonos, és erőteljes variabilitásnak kitett akusztikai jelből absztrakt, diszkrét, kis számú egységből álló fonémasorozat. A cikkben először a szegmentális és szupraszegmentális szint észlelését jellemezzük pszichoakusztikai szempontból. Ezután bemutatunk hat, napjainkban is meghatározó, egymásnak részben látszólag ellentmondó beszédpercepciós modellt, amelyek az akusztikai jelből vagy az artikulációs folyamatokból kiindulva jutnak el a megkülönböztető jegyeket hordozó fonémák azonosításához. Ezek a motoros elmélet, a kvantális elmélet és a LAFF, a közvetlen realista elmélet, a H&H elmélet, a példányelmélet és a nyommodell. Végül a modelleket összegezve tárgyaljuk a beszédpercepció és a magasabb szintű nyelvi folyamatok összefüggéseit. Kulcsszavak: beszédpercepció, hallás, pszichoakusztika, percepciós modellek, kogníció

. Bevezetés A pszicholingvisztikai modellek többsége a beszédhangok szintjét tekinti a nyelvi feldolgozás legkisebb egységének. A modellek – a strukturalista nyelvészet szemléletének megfelelően – többnyire különbséget tesznek az absztrakt, azaz fonológiai, és a konkrét, azaz fonetikai kategória között. Utóbbi közvetlen kapcsolatban áll a beszéd fizikai megvalósulásával, tehát a percepciós láncban a bemenet utáni első, a produkciós láncban a kimenet előtti utolsó mentális láncszemet alkotja. Az absztrakt fonológiai egységeket egyrészt az jellemzi, hogy szoros kapcsolatban állnak a nyelv felsőbb szerkezeti egységeivel (morfológia, szintaxis, szemantika, lexikon), tehát ekként a nyelvi rendszer részei, másrészt hogy a legtöbb hipotézis szerint állandó tulajdonságokkal rendelkeznek, azaz invariáns nyelvi kategóriákat alkotnak. A beszédhangok, azaz a fonetikai szint elemei viszont igen sokfélék * Köszönöm mindazok segítségét, akik hozzájárultak e tanulmány elkészüléséhez: Vicsi Klára, Uwe Reichel, Hartmut Pfitzinger, Bőhm Tamás és Markó Alexandra. Az írás ideje alatt az Alexander von Humboldt Alapítvány és a Deutsche Forschungsgemeinschaft, majd az OTKA támogatását élveztem (PD  sz. pályázat).



Mády Katalin

lehetnek, és sokszor korántsem könnyű eldönteni, milyen közös jegyek alapján ítél egy anyanyelvi beszélő két hangot azonos osztályhoz tartozónak. Például az alveoláris, azaz a felső fogmeder érintésével képzett /n/1 hang a környezet hatására jelentős változásokon megy keresztül: a len szóban alveoláris, a kengyel szóban palatális, a ménkű szóban veláris, a kénbűz szóban labiális. Ez a hely szerinti hasonulás könnyen megmagyarázható a követő mássalhangzó képzési helyével, az azonban már kevésbé, hogy miért hajlamosabb a hasonulásra az /n/, mint más nazális mássalhangzók, vagy hogy bizonytalan képzés esetén miért hajlunk inkább arra, hogy egy hangot alveolárisként halljunk, mint hogy valamely más képzési helyet tulajdonítsunk neki. A fonetikai szint beszédhangjait tehát a variabilitás, vagy más szóval az állandóság hiánya jellemzi, míg az absztrakt fonémák észlelése nem képzelhető el invariabilitás nélkül – másképp hogyan lennénk képesek a beszédben előforduló elvileg végtelen számú hangot ötvennél kevesebb fonémához hozzárendelni? Általánosságban azt mondhatjuk, hogy a beszédpercepcióval foglalkozó kutatások fő célja a beszédhangok képviselte sokféleségben azokat a felismerési kulcsokat megtalálni, amelyek az emberi agy számára lehetővé teszik a releváns jegyek felismerését és a redundáns jegyek figyelmen kívül hagyását. A beszédpercepció tehát a pszicholingvisztikai modellek fonológiai és fonetikai szintje között található részfolyamatokat igyekszik leírni és modellezni. A beszédészlelés a kommunikációs lánc harmadik egységét képezi a beszédprodukció és a hangzó jel után, következésképpen függ mind a beszélőszervekkel előállítható akusztikumtól, mind magától az akusztikai jeltől. Más szóval: a percepció arra a frekvenciasávra és azokra az időbeli felbontásokra van utalva, amit egy emberi beszélő képes produkálni, és amit a közvetítő közeg – többnyire a levegő – továbbítani tud. Az emberi hallószerv különösen alkalmas az ember által létrehozható rezgések észlelésére, és a levegőben való hallásra rendezkedett be. Számos fonetikai elmélet abból indul ki, hogy nemcsak a hallás alkalmazkodik a beszédprodukcióhoz, hanem a beszélő is a percepcióhoz: öntudatlanul olyan jeleket produkál, amelyekre az emberi fül különösen fogékony. A produkció és a percepció tehát nemcsak az előállított, ill. észlelendő akusztikai jelen keresztül kapcsolódik egymáshoz, hanem azáltal is, hogy a beszélő ismeri a percepció működését, a hallgató pedig a produkciós folyamatokat. Ebben az értelemben 1 A fonetikai leírásokban nem egységes a szögletes és ferde zárójel használata: egyes rendszerekben az /n/ jelölés a fonémára, az [n] pedig a kiejtett beszédhangra vonatkozik, mások viszont a ferde zárójelet használják a durvább, a szögleteset pedig a finomabb fonetikai átírásra. E dolgozat az utóbbi hagyományt követi. A fonetikai jeleket SAMPA-átírás szerint adjuk meg, l. http://www.phon.ucl.ac.uk/home/sampa/hungaria.htm (2013. május 10.). A magyar hangokra esetenként dőlten szedett betűjegyükkel utalunk.

A beszédpercepció helye a teljes megértési folyamatban



a kommunikációs lánc metaforája félrevezető, hiszen nem egymás után csatolt, hanem egyszerre működésben levő folyamatokról van szó. A beszédpercepció leírásakor tehát szem előtt kell tartanunk a beszédprodukció folyamatát is. A következő pontban a hallószerv anatómiájáról és a hallás fiziológiai alapjairól lesz szó. A leírás a percepciós folyamatok megértéséhez szükséges alapvető ismeretekre szorítkozik. A 3. részben az alapvető szegmentális és szupraszegmentális egységek felismerésére térünk ki, amelyeket a 4. részben különféle percepciós modellek fényében vizsgálunk meg újra. Végül az 5. részben a beszédpercepció és a magasabb kognitív műveletek együttműködési mechanizmusaira és neuroanatómiai beágyazására térünk ki.

. Hallás és pszichoakusztika Az emberi észleléssel általános értelemben a pszichofizika foglalkozik. E tudományág azt vizsgálja, hogy konkrét fizikai mennyiségek és az ember által észlelt mértékük között milyen összefüggések vannak: például súly és szubjektív nehézségérzet, hangerő és hangosság. Ezen belül a pszichoakusztika a hanghullámok észlelésének részterülete. A percepciós fonetika vagy pszichofonetika e tudományterülettel részben határos, hiszen szintén az akusztikai jelek észlelésére koncentrál, ám csupán azokra, amelyek a beszéd szempontjából relevánsak, tehát az emberi beszédképző szervekkel létrehozhatók (kb. 50 Hz és 10 kHz között). Mégsem mondhatjuk, hogy a percepciós fonetika a pszichoakusztika része lenne, hiszen nemcsak a jelek észlelésével, hanem azok nyelvi értelmezésével is foglalkozik, ami nem tartozik a pszichofizika vagy -akusztika kutatási területéhez. A beszédpercepció bemeneteként szolgáló akusztikai jel fizikai jellemzői objektíven mérhetőek, azonban az ember ezeket a tulajdonságokat sajátos szűrőkön keresztül észleli. Más szóval a nyelvi feldolgozás bemenete, tehát a perifériás és központi jelfeldolgozás terméke nem azonos a külső fül bemenetével. Mivel az észlelt jelhez közvetlenül nem férünk hozzá, a pszichoakusztika felismerései kísérletek eredményeire épülnek. A tudományág fő célkitűzése, hogy felfedje az akusztikai jel fizikai mérőszámai és az észlelés hozzájuk rendelt pszichikai mérőszámai közötti matematikai összefüggéseket.

.. Intenzitás, hangerő és hangosság Az emberi hangészlelés alsó határa 20 Hz, felső határa 20 000 Hz, azaz 20 kHz. Ez az adat fiatal felnőttek hallására vonatkozik. Idősebb korban a magas frekvenciák



Mády Katalin

észlelése fokozatosan romlik, ezért előfordul, hogy egy idős ember nem hallja meg a csengőt a lakásában, de dörömbölésre ajtót nyit. A hanghullámok a levegőben a hangnyomás változásával terjednek. A hangnyomás és az ebből származtatott hangintenzitás átlagos (effektív) értékét mérjük, és értékeit a több nagyságrendnyi átfogás miatt logaritmikus egységben, decibelben (dB) adjuk meg. A hallószerv anatómiai szerkezetének köszönhetően egyes frekvenciatartományokat jobban felerősít, ebből következően a hallás érzékenysége frekvenciafüggő: az észlelés a 3400 Hz körüli tartományban a legjobb, az 500 Hz-nél mélyebb, ill. 10 kHz-nél magasabb tartományokban kevésbé pontos. Míg a még észlelhető frekvenciatartomány két szélén lévő hangokat csak 70 dB fölötti intenzitással halljuk meg, a 3400 Hz körüli hangokat süketszobában már −10 dB-es intenzitással is. Ezért a frekvenciafüggő hangerőt saját érzeti mértékegységgel, a phonnal szokás megadni. Az azonos phon-értékkel jelölt frekvenciatartományt a kísérleti személyek azonos hangosságúként ítélték meg. A phon-skála alapjául az 1 kHz frekvencia szolgál, amelynek hangereje phonban kifejezve számban megegyezik a hozzá tartozó decibelértékkel. Tehát ha egy 1 kHz-es hang intenzitása 20 dB, akkor ehhez 20 phon-os érték járul, 100 Hz-en viszont azonos hangosságélményhez 30 és 40 dB közötti intenzitásra van szükség. A még éppen észlelhető hangerő alsó határa a hallásküszöb, felső határa pedig a fájdalomküszöb.

1. ábra: A hangnyomás (dB) és hangosság (phon) összefüggése süketszobában mérve

A beszédpercepció helye a teljes megértési folyamatban



Mivel a phon-skála nem arányskála, nem árul el semmit a hanghullámok egymáshoz viszonyított hangosságáról. A szubjektív hangosságarányérzet kifejezésére a son alapú skálát szokás használni. A son-skála sarokpontját 1 kHz-es hangmagasság, 40 dB-es hangerő és 1 másodperces tartam képezi, amelynek hangossága 1 sonnak felel meg. A son-görbe tehát hangosságarány-érzeti skála, azaz kétszeres son-érték kétszeres hangosságélménnyel párosul. A phon-görbék ezzel szemben az egyenlő hangosságérzetet fejezik ki, a phon tehát a hangosságszintérzet mértékegysége (l. ISO Szabvány R 226-1961).

.. A hangmagasság észlelése A relatív hangmagasságot a zenében hagyományosan hangközökkel, azaz félhangokra épülő viszonyszámokkal szokás kifejezni: 12 félhang egy oktáv, amely 1 ∶ 2es frekvenciaaránynak felel meg, tehát a 440 Hz-es zenei hangnál, azaz az egyvonalas a-nál egy oktávval mélyebb kis a frekvenciája 220 Hz. Egymástól egy kvint távolságra lévő hangok frekvenciájának aránya 3 ∶ 2, a kvartnyi távolság viszonya 4 ∶ 3, a nagy szekundé 9 ∶ 8 (részletesebben l. Tarnóczy 1982). A belső fül anatómiai sajátságaiból adódóan (l. Szentágothai 1971; Bolla 1995; Pompino-Marschall 2003) az emberi hallószerv a hangmagasságot különböző frekvenciákon eltérő pontossággal észleli. Míg 20 Hz és 500 Hz között az észlelés nagyjából lineáris, e fölött a frekvencia és az észlelés helye közötti összefüggés logaritmikus. Ennek megfelelően az alacsonyabb frekvenciák észlelése jobb felbontású, mint a magasabbaké. Kísérletek során tesztelték, milyen frekvenciájú tiszta szinuszos hangokat észlelünk egymástól azonos távolságra levőnek. A kapott értékeken alapszik a mel-skála (neve a melody, azaz dallam szóra utal), kiindulásaként pedig egy 1 kHz-es, 40 dB-es hang szolgál, amelynek érzékelt magasságát 1000 mel-ben állapították meg.2 Míg az érzékelés 500 Hz-ig nagyjából lineáris, e fölött a Hertz- és mel-értékek aránya logaritmikus. Így például 100 és 200 Hz távolságának 150 és 283 mel magasságú észlelet felel meg, az 1000 és 2000 Hz-es hangok között viszont már kisebb a távolság: 1000 és 1521 mel, a 10 000 és 20 000 Hz-nek megfelelő értékek aránya pedig még kisebb: 3079 és 3817 mel3 (Tarnóczy 1982). A hangmagasság észlelésében fontos szerepet játszanak a Fletcher (1940) által kimutatott ún. kritikus sávok. Ennek lényege, hogy egy adott frekvenciájú 2 A mel-t egyes források a fentiektől eltérően a Bark-skála alapján definiálják: 1 Bark = 100 mel (l. Pompino-Marschall 2003). 3 Kerekített értékek.



Mády Katalin

szinuszos hang észlelését adott körülmények között befolyásolhatja egy vele egy időben lejátszott széles sávú fehér zaj. Ha a szinuszos hang és a fehér zaj frekvenciatartománya nem fedi egymást, a két hangot egymástól függetlenül észleljük. Ha azonban a szinuszos hang a fehér zaj középső frekvenciájával azonos, akkor a hangot – a két hangforrás intenzitásától függően – halkabban vagy egyáltalán nem észleljük, azaz a fehér zaj elfedi azt. A jelenség a fehér zaj frekvenciatartományának közepétől távolodva is megfigyelhető, de egyre csökkenő mértékben: a zaj intenzitásának nagyobbnak, ill. a szinuszos hang intenzitásának kisebbnek kell lennie a maszkolási jelenség kiváltására. A kritikus sávok módosító hatását a 2. ábra szemlélteti. A csendes környezetre vonatkozó hallásküszöb (szaggatott görbe) fölfelé módosul 60 dB-es fehér zaj bejátszásakor. Ha a zaj középső frekvenciája 250, 1000 vagy 4000 Hz, amint ezt az ábrán láthatjuk, akkor egy 50 dB-es hangerejű szinuszus hangot teljesen elfed. A kritikus sáv szélessége abból a frekvenciasávból adódik, amely egy adott frekvencia körül befolyásolja a sáv közepére eső hang észlelését (az ábrán a folyamatos vonallal jelölt sávok szélessége).

2. ábra: Folyamatos vonalak: 250 Hz, 1 kHz és 4 kHz körüli, 1 kritikus sáv szélességű,

60 dB intenzitású széles sávú zaj által kiváltott hallásküszöb-módosulás. Szaggatott vonal: hallásküszöb csendes környezetben (Fastl–Zwicker 2006, 64 nyomán).

Az ábrán megfigyelhető, hogy az elfedés erőteljesebb a magasabb frekvenciák irányában, mint az alacsonyabbakéban. Ez azzal függ össze, hogy a belső fülben található tonotópiás elrendezésű csiga, amelynek frekvenciaérzékelése helyfüggő, a magasabb frekvenciákra a bemenethez közelebb reagál, tehát ezek a frekvenciák nem, vagy csupán csekély mértékben befolyásolják a csiga bemenetétől távolabbra található alacsonyabb frekvenciák érzékelését. Fordított esetben viszont a hanghullám keresztülhalad a membrán magasabb frekvenciák érzékeléséért felelős területein is, ezért valószínűbb, hogy ezek működését is befolyásolja. A kritikus sávok megfeleltethetők a csiga frekvenciafelbontó képességének, és fontos szerepet játszanak a percepcióban: ha ugyanis fülünket egyszerre több



A beszédpercepció helye a teljes megértési folyamatban

20

15

10

4 5

0,5 1 2

5

10

bark

15

20

hang éri, és ezek egy kritikus sávon belül vannak, akkor intenzitásuk összegződik, de nem észleljük őket különálló hangokként. A kritikus sávok szolgálnak a Zwicker által 1961-ben kialakított, Heinrich Barkhausen tiszteletére elnevezett Barkskála alapjául. A Bark-értékek a szűrők sorszámára utalnak, amelyek az emberi hallásra jellemző alsó 24 kritikus sávnak felel meg 20 és 15 500 Hz között (Tarnóczy 1982; Fastl–Zwicker 2006). A kritikus sávoknak, valamint a csiga tonotópiás felépítését tükröző hangmagasság-skáláknak igen fontos szerepe van az emberi beszédpercepciós folyamatok leírásában, hiszen – ellentétben a frekvencia- és félhangalapú mértékegységekkel – kifejezésre juttatják azt a tényt, hogy az emberi hallás érzékenysége frekvenciafüggő. Éppen ezért a kritikus sávok 500 Hz alatt nagyjából 100 Hz szélesek, efölött egyre nagyobb értéket vesznek fel. Ezt szemlélteti a 3. ábra: az x tengelyen jelölt értékek között egyre nagyobb a távolság, míg a nekik megfelelő Bark-értékek között nagyjából azonos a különbség: 500, 1000, 2000, 4000 és 10 000 Hz hangmagasság-észlelete 4,9; 8,5; 13,0; 17,5 és 21,9 Bark.

kHz 3. ábra: A frekvenviaérték (kHz) és a fül által észlelt hangmagasság (Bark) függvénye



Mády Katalin

.. Az idő szerepe az észlelésben Az időbeli észlelés szintén frekvenciafüggő. Ha az akusztikai jelbe szünetet iktatnak be, akkor a 2 és 6 kHz közötti tartományban a fül már 2–4 ms közötti szünetet is képes felismerni, más frekvenciákon az észlelési küszöb akár 22 ms-t is elérhet. Az elfedési jelenségnek szintén van időbeli vonatkozása. Ha egy hangingerre 200 ms-on belül újabb, alacsonyabb intenzitású hanginger következik, a második ingert nem észleljük bizonyos időtartam- és intenzitáskülönbség esetén. Ez az ún. utóelfedés. A jelenség ellenkező irányban is megfigyelhető: ha egy gyengébb ingerre erősebb inger következik, bizonyos körülmények között csak a második ingert észleljük. Ez utóbbi, az előelfedés csak lényegesen kisebb időbeli eltérés esetén lép fel, és azzal magyarázható, hogy a nagyobb intenzitású második inger felismerési ideje rövidebb, ezért elnyomja a lassabban észlelt gyengébb ingert.4 Ha nagyobb a hangingerek intenzitása, az elfedés nagyobb időbeli eltérés mellett is kimutatható. Az előelfedés esetén szerepet játszik az is, hogy a hangingert azonos vagy különböző fülön keresztül halljuk-e: az azonos fülön történő bejátszás esetében nagyobb időkülönbség is kiváltja az elfedést (l. 4. ábra).

4. ábra: Időbeli elfedés 40, 60 és 80 dB-es fehér zaj esetén. A: utóelfedés hatása, B1 : kü-

lönböző fület érő hangok, B2 : azonos fület érő hangok (l. bővebben Tarnóczy 1984).

. Szegmentális és szupraszegmentális elemek percepciója A percepciós kísérletek alapjául természetes vagy szintetizált beszédet használunk fel. A természetes beszéd hátránya, hogy akusztikai jellemzőit nehéz kontrollálni, a szintetizált beszéd viszont nem feleltethető meg egyértelműen az embe4 Az utóelfedés angol megfelelője forward masking, az előelfedésé backward masking, az elnevezések tehát a magyarral ellentétes irányúak.

A beszédpercepció helye a teljes megértési folyamatban



ri beszédnek. Sok kísérletben a kétféle módszer egyesítésével próbálkoznak, azaz természetes beszédhangokat módosítanak például idő-, frekvenciaszerkezetüket vagy intenzitásukat tekintve, így vonva részleges ellenőrzés alá akusztikai sajátosságaikat. Ez a módszer mindkét típus előnyeit és hátrányait egyesíti. A percepciós kísérletek örök dilemmája éppen ezért az, hogy a kísérletek eredményei mennyire érvényesek a természetes körülmények között zajló beszédérzékelésre. Könnyen elképzelhető ugyanis, hogy ha egy kísérlet arra tanít, hogy egyes akusztikai jellemzőknek különleges figyelmet tulajdonítsunk, akkor ezek jelentősége megnő, miközben a mindennapi beszédértés során messze nem akkora ezen jellemzők szerepe. A laboratóriumi kísérletek eredményeinek értelmezésekor ezt mindig szem előtt kell tartanunk.

.. Magánhangzók ... A magánhangzók percepciója A hangokat fonológiai szinten gyakran bináris szempontok alapján szokás jellemezni: hosszú–rövid, kerek–réses, feszes–laza, zöngés–zöngétlen stb. Ezeket a megkülönböztető jegyeket általában nem lehet egyetlen artikulációs vagy akusztikai mérőszámnak megfeleltetni, és ez különösen igaz a magánhangzókra. A hosszú magánhangzók akusztikailag mérhető tartama például nem feltétlenül hosszabb, mint a rövid magánhangzóké, azonosításuk ettől függetlenül – más akusztikai kulcsok alapján – többnyire nem okoz problémát. Artikulációs szempontból sem igaz, hogy a hosszú magánhangzók esetén a hangképző szervek hosszabban maradnak ugyanabban a pozícióban, hiszen a magánhangzók képzésében igen kevés az állandó elem, ezen hangok fő jellemzője ugyanis épp dinamikus voltuk. A hosszú és rövid magánhangzók közötti eltérés mibenlétét tehát csak nagyobb összefüggések vizsgálatával deríthetjük ki. A magánhangzók jellemzésére leggyakrabban tartamukat (azaz mérhető hosszukat), az alapfrekvenciát (f) és az első két formánst (F és F) szokás használni, továbbá a felsőbb formánsokat (F–F), az intenzitást és egyéb akusztikai mérőszámokat. A mérések céljától függően ezek az értékek mérhetőek adott pontokon (például a magánhangzó középpontjában), vagy a hang teljes tartama alatt, ha a dinamikus tulajdonságokra vagyunk kíváncsiak. Egyes jellemzők, mint a tartam, alapfrekvencia, F és F, könnyen értelmezhető fonetikai jegyeknek felelnek meg, legalábbis a beszédre jellemző frekvenciatartományban: a tartam a hosszúságnak, az f a hangmagasságnak, az F a magánhangzó függőleges képzéshelyének, az F a vízszintes képzéshelynek. A magánhangzók felismerését vizsgáló kísérletek egy része azt példázza, hogy a fenti jellemzők, vagy akár csak egy



Mády Katalin

részük is, elegendőek az azonosításhoz, míg mások további jegyek (energiakontúr, alaphang és egyes formánsok közötti távolság) fontosságát hangsúlyozzák. A magánhangzó-felismerésre vonatkozó legismertebb kísérletet Peterson és Barney végezte. Tíz szót rögzítettek összesen 76 személy (férfiak, nők és gyermekek) kétszeri ejtésében: heed, hid, head, had, hod, hawed, hood, who’d, hud, heard.5 A hívószavakat egy kísérletben összesen 70 kísérleti személy hallgatta meg, akik részben azonosak voltak a beszélőkkel (Peterson–Barney 1952).

5. ábra: Amerikai angol magánhangzók formánseloszlása 76 beszélő ejtésében (x ten-

gely: F, y tengely: F) (forrás: Kent 1996, 337)

A résztvevők az összesen 1520 stimulust 94-ban helyesen ismerték fel, annak ellenére, hogy a magánhangzók 1. és 2. formánsukat tekintve számos átfedést mutattak (l. 5. ábra). A férfiak, nők és gyermekek toldalékcsöve eltérő méretű, ezért az általuk ejtett magánhangzók abszolút formánsértékei is különböznek, arányukban viszont megegyeznek. A kísérlet második részében csak felnőtt férfiak által ejtett magánhangzókat elemeztek, és kizárták azokat, amelyeket a kísérleti személyek nem tudtak egyöntetűen azonosítani. Még ekkor is voltak átfedések a könnyen azonosítható magánhangzók frekvenciatartományai között. A szerzők ezért feltételezik, hogy az abszolút formánsértékek nem elegendőek a magánhangzók kategóriáinak meghatározásához. A kísérlet két további fontos felismeréssel járt. Egyfelől igazolta a produkció és percepció összefonódását a hangok szintjén. Azok a kísérleti személyek ugyanis, akik két különböző fonémát egyforma hangként realizáltak, a percepciós feladatban nem tudták egymástól megkülönböztetni az ezen fonémákhoz tartozó

5 Ezek a szavak az angolban egységesen /hVd/ szerkezetűek, azaz csak a magánhangzóban különböznek egymástól.

A beszédpercepció helye a teljes megértési folyamatban



realizációkat. A kísérlet másfelől rámutat arra, hogy a magánhangzók azonosításának sikere függ az adott nyelv magánhangzórendszerének szerkezetétől. Peterson és Barney kísérletében az /i/ hangot 93-ban helyesen azonosították a kísérleti alanyok, az /a/ hangot azonban csupán 6-ban. Ezt egyrészt az /a/ megvalósulásainak nagy szórása magyarázza (az 1. formáns értéke 600 Hz-ről akár 1200 Hz-re nőhet a kategórián belül), másrészt hogy az /a/-nak több fonológiai szomszédja van, mint például az /i/-nek, ezáltal nő a tévesztés veszélye is. Későbbi kísérletek bizonyították, hogy a magánhangzó-felismerés nem abszolút, hanem relatív frekvenciaértékeken alapszik. Miller (1953) szintetizált hangokkal kimutatta, hogy az alapfrekvencia döntően befolyásolja a magánhangzó nyíltsági fokának észlelését. Ha ugyanis az alapfrekvencia egy oktávval magasabb volt, a kísérleti személyek a magánhangzót – azonos formánsértékek mellett – zártabb hangzóként észlelték. További fontos felismerések adódtak Barkalapú számításokból. Syrdal és Gopal – Peterson és Barney kísérleti anyagát újraelemezve – megállapította, hogy ha a magánhangzók feltérképezésekor Barkértékeket vesznek alapul, valamint figyelembe veszik az f és F, valamint az F és F távolságát, akkor a hangok szórása nagyban csökkenthető, és a kategorizálás az alapfrekvencia és a két alsó formáns alapján egyértelművé válik (Syrdal–Gopal 1986). Traunmüller (1981) rámutatott, hogy a nyíltsági fok észlelését döntően az f és az F Bark-ban mért távolsága befolyásolja. Chistovitch (1985) szerint azokat a formánsokat, amelyeknek távolsága 3–3,5 Bark-nál kisebb, egyetlen formánsként érzékeljük, ennek értéke a két abszolút formánsérték spektrális súlypontjába esik. Lehiste és Peterson (1961), valamint Strange (1989) a magánhangzó-azonosításban kiemeli a dinamikus jellemzők szerepét, különös tekintettel a rövid– hosszú, illetve feszes–laza oppozícióra. Eszerint a magánhangzók azonosításában nemcsak a középső, viszonylag állandó szakasz formánsszerkezete játszik szerepet, hanem a magánhangzót megelőző, ill. azt követő mássalhangzó felé való átmenetek időbeli aránya is. A hosszú magánhangzók állandó szakasza ugyanis relatíve hosszabb, mint a rövid magánhangzóké. Strange kísérleti eredmények alapján a mellett érvel, hogy a magánhangzó-hosszúság megállapításához elegendő a dinamikus szakaszok frekvenciaszerkezetének és tartamának ismerete. A magánhangzók azonosításában egyes modellek az extrinzikus, azaz külső jegyek fontosságát hangsúlyozzák, amelyek elősegítik a képalkotást a beszélőről, s ezzel a jobb magánhangzó-felismerést. Ez lehet az f (hiszen az alapfrekvenciából következtethetünk a beszélő nemére és korára), az egyéni sajátságokat hordozó F, a kísérletben vizsgált magánhangzót körülvevő egyéb nyelvi információ (például a mondat, amelybe a hívószót beágyazták). A külső jegyek szerepét bizonyítja, hogy a célszó magánhangzójának kategorizálása változik, ha a hordozó mondat magánhangzóinak formánsértékét manipuláljuk, valamint hogy



Mády Katalin

a magánhangzó besorolása befolyásolható az egyidejűleg vizuálisan prezentált „beszélő” nemén keresztül. (Az intrinzikus és extrinzikus modelleket átfogóan ismerteti Strange 1999b.)

... Vizsgálatok a magyar magánhangzók percepciójáról A beszédpercepciós modellek főként angol nyelvű kísérletekre épülnek. Ezeket Gósy Mária adaptálta magyar anyanyelvűek észlelésére. A következőkben az ő eredményeiből említünk néhányat, a teljesség igénye nélkül. Gósy eredményei szerint a magyar magánhangzók azonosításához nem feltétlenül szükséges a második formáns megléte, sőt esetenként még az elsőé sem (Gósy 1989). Ezt egy olyan vizsgálatban mutatta ki, amelyben különböző szűrőkön áteresztett, izolált magánhangzók felismerését vizsgálta. Bár az a első formánsa 600 Hz volt, a beszédhangot a kísérleti alanyok akkor is 70-os biztonsággal felismerték, ha a lejátszott hang kizárólag 390 Hz alatti frekvenciatartományból állt. Más magánhangzók, mint például az o hang hasonlóan jó felismeréséhez a szűrt hangnak magasabb frekvenciákat is kellett tartalmaznia, jóval az o első formánsa feletti tartományból. Gósy szerint a magánhangzók viszonylag megbízható azonosításához szükséges frekvenciatartomány felső határa és a magánhangzó F értéke közötti távolság specifikus, tehát magánhangzónként eltérő: az á esetében 100 Hz, az í esetében viszont 1200 Hz. Ez utóbbi magánhangzó alapján Gósy arra a következtetésre jut, hogy az első formáns tartalmaz a második formánsra utaló felismerési kulcsokat, ill. hogy az első két formáns közötti – a formánsokénál alacsonyabb intenzitású – frekvenciasávok is szerepet játszanak a magánhangzó felismerésében. Hasonló eredmények születtek a kísérlet azon részéből, amelyben a sáváteresztő szűrő alsó határát 270 Hz és 2200 Hz között mozgatták, a felső határ pedig 2700 Hz volt. A magánhangzók azonosítása sok esetben akkor is sikeres volt, ha az első és a második formáns egyaránt az áteresztett tartomány alatt volt található. Valószínű tehát, hogy a frekvenciaeloszlás sajátságai, valamint a felsőbb formánsok értéke jellemző az egyes magánhangzókra. Ezek jelentősége azonban csak akkor lesz nyilvánvaló, ha az elsődleges kulcsok (tehát az első két formáns) hiányoznak. Ha ugyanis az F és az F megléte mellett az F értékét manipuláljuk, a magánhangzó azonosításában nem történik változás (Gósy 1989). A redundáns jegyek, azaz a másodlagos felismerési kulcsok csak az elsődleges kulcsok hiánya esetén lépnek előre a felismerési hierarchiában. A kísérlet harmadik részében a felüláteresztő szűrő alsó határa 1000 Hz és 3300 Hz között mozgott. A legjobb az i és ü hangok felismerése volt, hiszen ezen magánhangzók második formánsa 2000 Hz felett található, ezért a felsőbb formánsok az áteresztett tartományon belül voltak. Gósy eredményei arra utalnak,

A beszédpercepció helye a teljes megértési folyamatban



hogy a kerekített és kerekítetlen hangok közötti különbségtételt a részösszetevők eltérő intenzitása teszi lehetővé, hiszen a kerekítetlen i intenzitása általában véve nagyobb, mint a kerekített ü hangé. Gósy egy másik kísérletében (Gósy 1989) a magánhangzók hosszúsága és minősége közötti összefüggést vizsgálja. Ehhez szintetizált, 50 és 400 ms közötti hosszúságú hangokat használ, amelyek első és második formánsa egy skála mentén változik, míg az alapfrekvencia és a felsőbb formánsok értéke változatlan. Eredményei szerint egy adott F érték rövidebb magánhangzó esetén zártabb, hosszabb magánhangzó esetén nyíltabb kategóriába való sorolást eredményez, így például az 500 Hz körüli első formánsokat hol /o/-ként, hol /a/-ként hallották a kísérleti alanyok, azonban ha a hang rövid volt, nagyobb volt az /o/-válaszok száma, a hosszabb hangok esetében pedig az /a/ válaszok aránya. Ez azt mutatja, hogy a hallgató a percepció során beépíti azon ismeretét a kategorizálásba, hogy egy rövid magánhangzó képzésekor a beszélő nehezebben produkál nagyobb ajaknyílást, éppen ezért ergonómiai szempontból valószínűtlenebb, hogy egy /o/ képzésekor viszonylag magas F-értéket produkáljon. Ez a felismerés Liberman motoros elméletét támasztja alá (l. 4.1). A magánhangzók hosszúsága és minősége közötti összefüggés fonológiai szempontból is érdekes. Úgy tűnik ugyanis, hogy a magyarban a fonológiailag hosszú–rövid magánhangzópárok több szempontból egy kontinuum mentén helyezkednek el, ahol a középső nyelvállású o–ó és ö–ő pár átmenetet képez: (1) a felső nyelvállású magánhangzók, mint i–í, u–ú, ü–ű funkcionális terheltsége alacsony, ritkán van jelentésmegkülönböztető szerepük, míg az alsó nyelvállású magánhangzók számos hosszúságalapú minimális párban vesznek részt (a zug-zúg típusú párból nagyon kevés van, a hal–hál, fel–fél típusúból sok). (2) A felső nyelvállású magánhangzók formánsértékei alig vagy nem térnek el egymástól, az alsó nyelvállású párok viszont fonetikai értelemben eltérő osztályokhoz sorolhatók: az elölképzett e–é pár az állkapocs nyíltsági fokában, az a–á pár pedig mind a vízszintes képzéshelyben, mint az ajakműködésben eltér (az a hátsó képzésű és kerekített, az á középső és réses). A Gósy (2004, 119–120) által közölt formánstérképeken is látszik, hogy a rövid és hosszú felső nyelvállású magánhangzók formánsértékei jelentős átfedést mutatnak, a fonológiai értelemben alsóként kategorizált e–é és a–á formánsértékei viszont nem. Mády és Reichel (2007) azt vizsgálta, hogy mennyire megbízható a magánhangzók azonosítása, ha a tartam nem nyújt támpontot a felismeréshez. A kísérletben 40 ms-ra rövidített magánhangzókat használtak, amelyek a magánhangzó középső, viszonylag statikus részét tartalmazták. Azt találták, hogy az alsó nyelvállású magánhangzók azonosítása ilyen rövid tartam mellett sem jelentett nehézséget, különösen az a és á esetében, szemben a felső nyelvállású magánhang-



Mády Katalin

zókkal, amelyeket a kísérleti személyek egyöntetűen rövidnek hallottak. Ez nem is meglepő, hiszen az alsó nyelvállású magánhangzók spektrális jellemzői eltérnek egymástól, a felsőké viszont nem. Érdekes azonban, hogy mind Gósy (2004), mind Mády és Reichel (2007) azt találták, hogy a középső nyelvállású rövid és hosszú magánhangzók formánsértékei nem fedik egymást – ennek ellenére a kísérleti személyek a 40 ms tartamú, eredetileg hosszú magánhangzókat szintén rövidnek hallják. Itt tehát a hosszúság mint fonológiai jegy gátolja az akusztikailag egyértelműen elkülöníthető spektrális jegyek észlelését.

.. Mássalhangzók ... A mássalhangók percepciója A magánhangzók artikulációs jellemzői nagyjából folytonosan változnak egy-egy faktor mentén: az /o/ nyíltabb, mint az /u/, de kevésbé nyílt, mint az /a/. Ugyanez nem érvényes a mássalhangzókra. Bár a képzéshelyek elvileg szintén kontinuumot képeznek, legalábbis a fogmedertől a lágy szájpadlásig, a gyakorlatban a legtöbb nyelvben jól elkülöníthető képzéshelyekkel találkozunk, a magyar zárhangok esetében például labiális (p, b), alveoláris (t, d), palatális (ty, gy) és veláris (k, g) hangzókkal. E képzési helyeken felül ugyan elvileg elképzelhetőek köztes zárhangok is, ám ezekkel nem, vagy igen ritkán találkozunk. A mássalhangzók esetében felvetődik két további probléma is: egyrészt a mássalhangzók sok esetben nem vizsgálhatóak közvetlenül, csupán a szomszédos magánhangzókon keresztül (de l. Vicsi 1981b). Másrészt míg a magánhangzók esetében az artikulációs és akusztikai jegyek között viszonylag egyértelmű összefüggéseket láttunk, a mássalhangzókat a szomszédos magánhangzók függvényében merőben eltérő megvalósulások jellemezhetik. Így például /di/ hangkapcsolatban a /d/ felpattanását követően a rá jellemző F-tranzíció6 2 kHz-től emelkedik az /i/ 2,4 kHz körüli formánsáig, /u/ előtt viszont az átmenet 1,2 kHznél kezdődik és 600 Hz-ig, az /u/ F-jéig esik. Az F-átmenet tehát sem menetében, sem kezdőértékében nem mutat hasonlóságot, mégis mindkét esetben /d/-t hallunk (l. 6. ábra). A jelenség magyarázatára született a lokuszelmélet, amely szerint a CV-átmenet képzeletbeli kezdőpontja mindkét esetben ugyanaz, alveoláris hangok esetében 1800 Hz, de a formáns menete csak a magánhangzó kezdetével válik láthatóvá, ezért térnek el a mérhető kezdőpontok egymástól.7 Feltehetően ezzel függ össze az is, hogy az alveoláris /n/ hajlamosabb az asszimilációra, 6 A tranzíció elnevezés az angolban használatos transition kifejezés magyarítása. Magyarul átmeneti vagy tranziens fázisként is szokás emlegetni. 7 Többen kétségbe vonják, hogy a mássalhangzók képzési helye egyértelmű lokuszdefiníci-

A beszédpercepció helye a teljes megértési folyamatban



mint a más képzéshelyű nazálisok: ha egy alveoláris hang /E/-hez kapcsolódik, akkor a formánsátmenet stagnáló menetű, márpedig a változást (tehát az emelkedő vagy eső tranzíciót) az emberi agy könnyebben észleli, mint a változatlanságot. Az /E/ sok nyelvben gyakori magánhangzó, az alveoláris mássalhangzók előfordulása általában szintén átlagon felüli, így gyakrabban alkotnak hangkapcsolatot. Greenberg ezzel magyarázza azt a tényt, hogy az alveoláris /t/, /d/, /n/ az amerikai angolban szótagvégi helyzetben igen gyakran nem realizálódik (Greenberg et al. 2003). A mássalhangzók percepciójának leírását nehezíti, hogy fonológiai jegyeiket illetően eltérnek egymástól. Más jegyek szükségesek a nazálisok, likvidák vagy réshangok felismeréséhez, mint a zárhangokéhoz. Ezért a következőkben csak olyan kísérletek ismertetésére szorítkozunk, amelyek valamely jelentős percepciós elmélet (l. a 4. pontot) kialakításához járultak hozzá. További kísérletek leírását l. Strange (1999a). Az Egyesült Államok-beli Haskins laboratóriumban az 1950-es évek óta számos kísérlet született a mássalhangzó-kategóriák észlelésével kapcsolatban. Úttörő szerepe volt Liberman et al. (1967) vizsgálatának, amelyben zöngés zárhang és /e/ magánhangzó kapcsolatát modellezték szintetikusan, úgy, hogy az F-átmenetet a /b/-re jellemző értéktől a /d/-n keresztül a /g/ értékéig fokozatosan növelték 120 Hz-es lépésekben, így összesen 14 F-átmenetet kaptak. Az F menetét nem változtatták. A kísérleti személyek a várakozásnak megfelelően az alacsonyabb értékről kezdődő átmenetek kezdőhangjaként /b/-t, majd /d/-t, a felső értékek esetén pedig /g/-t adtak meg. A kutatókat is meglepte, hogy az ítéletek igen egyöntetűek voltak, és a fonémák közötti váltás egyértelműen bizonyos jelek közötti tartományhoz kötődött. Egy diszkriminációs kísérletből az is kiderült, hogy a fonémakategóriák közötti különbségtétel lényegesen könnyebb feladat, mint az azonos kategóriához tartozó hangok azonosságának felismerése. Hasonló eredményre jutott Lisker és Abramson (1967) a zárhangok zöngésségét vizsgálva. CV-kapcsolatokban az alsó három formáns egyidejű megjelenését  ms-nak véve a zöngekezdési időt (voice onset time, VOT) szintetizált anyagon −150 ms-tól 150 ms-ig változtatták, 10 ms-os lépésekben. A kísérleti személyek viselkedése ebben az esetben is egyöntetű volt: a hangkapcsolatok mássalhangzóját −150 és +20 ms zöngekezdési idő között zöngésnek, +30 és +150 ms között zöngétlennek ítélték. Az előző kísérlethez hasonlóan a diszkriminációs tesztben sokkal nagyobb volt a helyes válaszok aránya 20 és 30 ms között (ahol az összehasonlítandó jelek mássalhangzói különböző kategóriákhoz tartoztak), ókat tesz lehetővé, l. pl. Lehiste–Peterson (1961), más kísérletekben viszont igazolták a lokuszelmélet helyességét. A kérdésben nincs egyértelmű konszenzus, bár a lokuszértékeket közelítő jelleggel mindenki elfogadja.



Mády Katalin

mint abban a tartományban, ahol a szomszédos VOT-értékek egyazon kategóriához tartozást sugalltak. A produkciót és percepciót összekötő motoros elmélet egyik fontos állítása, hogy a beszédpercepció hátterében egy speciális nyelvi modul áll (l. 4.1). A heterogén kísérleti eredmények fényében nem egyszerű sem a bizonyítás, sem a cáfolat. Egyrészt több kísérletben is igazolták, hogy a /b/–/d/–/g/ elkülönítéséül szolgáló F-értékek nem-nyelvi jelek esetében nem váltanak ki kategorizálást, ami a speciális nyelvi modul meglétét igazolja. Ezzel szemben Pisoni (1977) kimutatta, hogy a VOT kapcsán megfigyelt 20–30 ms határ nem-nyelvi jelek diszkriminációjában is megfigyelhető, ezen jelenség mögött tehát feltehetően általános pszichofizikai összefüggések állnak.

... A magyar mássalhangzók percepciója Az itt bemutatandó kísérletek arra keresik a választ, hogy az angol anyanyelvű beszélők eredményei alapján kialakított elméletek mennyiben érvényesek magyar anyanyelvű kísérleti alanyokra, és alkalmasak-e magyar anyanyelvűek beszédpercepciójának leírására is. Gósy (1989) a magyar mássalhangzók felismerését szintetizált anyaggal tesztelte (6. ábra). Anyagában a /b/, /d/, /g/ mássalhangzók, valamint különféle magánhangzók szerepeltek CV-kapcsolatokként. A felpattanás pillanatában és a CV-átmenetben az F értéke fokozatosan változott. Gósy eredményei szerint a /b/ felismerésének elsődleges kulcsa a második formáns frekvenciájában rejlik, amely azonban egy viszonylag nagy, 1000 Hz-t átfogó tartományba eshet (800–1800 Hz). A klasszikus lokuszelméletnek megfelelően labiális mássalhangzók környezetében az F kontúrja palatális és veláris magánhangzók esetén eltérő: az itt közölt kísérleti adatokban veláris magánhangzók előtt emelkedő és eső is lehet, a palatális magánhangzók esetében pedig emelkedő. A magánhangzó és mássalhangzó F értékének azonossága csak a hátul képzett magánhangzókra érvényes. /d/-t követően a magánhangzók átmenete lehet emelkedő és eső is (értéke 900 és 2200 Hz között mozog), és az átmenet itt is eltér a magánhangzó palatális vagy veláris voltától függően, hiszen a veláris magánhangzók esetében az F frekvenciaértéke mellett az intenzitásviszonyok is szerepet játszanak a felismerésben. A CV kapcsolat tagjainak azonos F értéke csak a kerekítetlen magánhangzók esetében vezet helyes felismeréshez. A veláris /g/ akusztikai szerkezete összetettebb a másik két zárhangénál. Az F értéke (ami 1740 Hz-nél nagyobb) csak az elöl képzett magánhangzók esetében befolyásolja az azonosítást, együtt az intenzitásviszonyokkal, az F kontúrjával

A beszédpercepció helye a teljes megértési folyamatban



és az időviszonyokkal. A hátul képzett magánhangzók azonosítására csupán az utóbbi három jellemző van hatással. E rövid összefoglalásból kiderül, hogy a vizsgált három zöngés zárhang felismerési kulcsai nem azonosak: a /b/ azonosításában kizárólag az F játszik szerepet, a /d/ felismeréséhez az intenzitásnak is megfelelő értékeket kell felvennie, míg a /g/ felismerési kulcsai komplexebbek: szerepet játszik a temporális szerkezet, valamint az F mozgása is.

6. ábra: /dV/ formánsátmenetek a követő magánhangzó függvényében (forrás: Gósy

1989, 62)

A mássalhangzók képzésmódjuktól függően temporális szerkezetükben is eltérnek egymástól. Vicsi (1981a) és Gósy (1989) kimutatta, hogy a réshangok, affrikáták és zárhangok besorolása nagyban függ a hang relatív hosszától is. Ha az sz hangot rövidítjük, a környező hangok azonossága mellett a percepció előbb cbe, majd t-be csap át (hiszen ezen hangok képzéshelye és zöngéssége egyébként megegyezik). Gósy (1989) tanúsága szerint az azonosítás függ attól, hogy értelmes szót vagy hangkapcsolatot kell-e felismerni. Kísérleti alanyai egy kb. 100 ms-ra rövidített sz hangot 70-ban sz-ként azonosítottak, ha a szél szóban kellett a hangot felismerni, és csak az esetek 30-ban hallottak cél-t. Az sz + é hangkapcsolatot viszont 80-ban cé-ként azonosították. A felismerést nemcsak a magánhangzó hossza, hanem a szomszédos magánhangzó minősége is befolyásolja, méghozzá a magánhangzók intrinzikus, azaz rájuk jellemző tartamától függően. A magyarban a legalsó nyelvállású á a leghosszabb magánhangzó, ezért e hang mellett még egy viszonylag rövid sz hangot is helyesen észlelünk, míg ugyane hangot egy rövidebb intrinzikus tartamú magánhangzó mellett c-nek hallanánk.



Mády Katalin

Meglepő eredményre jutott Vicsi Klára, amikor a magyar zárhangok felismerését tesztelte (Vicsi 1981b). Azt találta ugyanis, hogy szemben a korábbi eredményekkel, a magyar beszélők számára nem a szomszédos magánhangzó tranziens eleme a felismerési kulcs, hanem a felpattanással járó zörej szerkezete. A kísérleti személyek CV-kapcsolatokból kivágott, egységes tartamú szeleteket hallgattak meg. Ha a jel a magánhangzó zöngés periódusával kezdődött, tehát a teljes tranzíciót magában foglalta, de a mássalhangzót nem, a mássalhangzó felismerése igen bizonytalan volt. A mássalhangzó zörejét tartalmazó jel viszont ugrásszerűen megnövelte a helyes találatok számát. Ugyanez volt érvényes VC-kapcsolatokra is. Vicsi feltételezése szerint a korábbi vizsgálatokkal ellentétes eredmény vagy arra vezethető vissza, hogy a magyar zárhangok nem aspiráltak, ellentétben a korábbi kísérletek alapjául szolgáló nyelvekkel, vagy arra, hogy ez a kísérlet nem szintetizált, hanem természetes beszédjelre épült.

.. A szupraszegmentális jegyek percepciója Míg a beszédhangok – absztrakt egységként – diszkrét, azaz egymástól elkülöníthető egységeket alkotnak, a prozódiai jegyek csak a beszédfolyamat egészét tekintve elemezhetőek. Egy mondat hanglejtését például csak a mondat egészének ismeretében értelmezhetjük kérdő, óhajtó vagy egyéb modalitás kifejezéseként. A szupraszegmentális jegyekről nehéz általánosságban beszélni, hiszen a jelenségek nyelvenként nagyon eltérőek lehetnek. A következőkben néhány kísérlet ismertetésén keresztül mutatjuk be a percepciós fonetika e szegletét.

... Mondathangsúly Gósy kísérletében azonos tartalmú és ejtésű mondatok tempójának megítélését vizsgálja az artikulációs tempó (hang/másodperc) és a hanglejtés függvényében (Gósy 1989). A kísérletből kiderül, hogy a monoton (tehát sem emelkedő, sem ereszkedő hanglejtést nem tartalmazó) mondatokat a kísérleti alanyok gyorsabbnak „hallják”, mint az intonációs mozgást tartalmazó mondatokat. A leglassabb besorolást az ereszkedő lejtésű mondatok kapták, míg az emelkedő és a szólameleji, valamint szólamvégi csúcsot tartalmazó mondatokat azonos sebesség esetén a kísérleti személyek inkább hajlamosak voltak gyorsként értékelni. A monoton hanglejtés gyors beszédként való értékelése nem minden esetben, csupán a normálisnál gyorsabb mintánál volt megfigyelhető, tehát ott, ahol az értelmezés a gyorsabb tempóból következően nehezebb volt. Gósy egy további kísérletében 32 mondat dallamának felismerését vizsgálta (Gósy 1989). A résztvevők feladata először az volt, hogy rajzolják le a hallott

A beszédpercepció helye a teljes megértési folyamatban



mondat dallamát. A következő eredmények születtek: (1) A kísérleti alanyok pontosan ábrázolták a mondatok hosszát. (2) A csúcsok mondatbeli helyzete és frekvenciája esetleges az eredetihez képest. (3) A hangterjedelem jelölése következetes. (4) Ha a mondat eleje szökő és ereszkedő ágat egyaránt tartalmaz, az alanyok fele gyakran csak az ereszkedést észleli. Ha viszont a csúcs a mondat elején helyezkedik el, annak észlelése 90 körüli pontosságú. A mondat közepén vagy végén található csúcsok észlelése szintén pontos. (5) A mondatvég intonációjának észlelése ereszkedő dallam esetén megbízható, emelkedő dallam esetén viszont a mondat egészének hanglejtésétől függ, csakúgy, mint a lebegő dallamok felismerése: ha a mondat elején nagyobb csúcs található, valószínűbb az ereszkedőként való észlelés. A kísérlet második részében a résztvevők feladata az volt, hogy határozzák meg a hallott mondat nyelvtani-pragmatikai funkcióját. Gósy a következőket állapítja meg: (1) A szólameleji csúccsal rendelkező mondatok megítélésében a kiegészítendő kérdésként és a kijelentésként való besorolás dominál, részben függetlenül a mondat eredeti tartalmától. (2) Az alacsonyabb frekvenciájú szólameleji csúcsot tartalmazó mondatokat elsősorban kiegészítendő kérdésként hallották a résztvevők. Gósy kimutatta továbbá, hogy a kísérleti alanyok a dallamoknak akkor tulajdonítanak emocionális töltetet, azaz akkor hallják őket felkiáltásnak, ha a dallam csúcsa magasabb frekvenciájú, vagy ha a dallam a mondat nagyobb hányadában magas frekvenciájú marad. A mondatmodalitás tehát relatív, nem pedig abszolút paraméterekben manifesztálódik. A magyar eldöntendő kérdések intonációja jellegzetes, sok nyelvtől eltér, leírásával számos munka foglalkozik (l. pl. Ladd 1996). Prototipikus megvalósulására az utolsó előtti szótag magasabb frekvenciája jellemző. A Gósy által vizsgált anyagban az eldöntendő kérdések arról voltak felismerhetők, hogy a mondat második felében különböző frekvenciájú csúcsok voltak találhatóak. Ezeket a mondatokat a kísérleti alanyok az esetek 100-ában helyesen ismerték fel, tehát az eldöntendő kérdések intonációja igen erős felismerési kulcsokat hordoz magában. Egyes eldöntendő, illetőleg befejezetlen kérdések (mint például És erre a tanár?) a dallam végén emelkedéssel fejeződtek be, ezeket nagyrészt kiegészítendő kérdésként értékelték a résztvevők. A kísérlet összesítéséből kiderül, hogy a kiegészítendő kérdések helyes besorolása az esetek 52-át, a kijelentések helyes besorolása az esetek 75-át teszi ki. A felszólításokat nagyrészt kijelentésként, a felkiáltásokat pedig főként felkiáltásként vagy kiegészítendő kérdésként észlelték a kísérleti alanyok. A mondathangsúly számos nyelvben fontos szerepet játszik a szintaktikai szerkezet közvetítésében. Azt várnánk, hogy a szintaktikai szerkezetnek nem



Mády Katalin

megfelelő hangsúly zavarokat okoz a megértésben – MacWhinney et al. (1985) kísérlete azonban ennek az ellenkezőjét támasztja alá. A kísérleti személyeknek az alany és a tárgy szerepét betöltő főneveket kellett azonosítaniuk olyan mondatokban, mint A macska átugorja a kutyát vs. A macskát átugorja a kutya. A mondatokban változott az összetevők sorrendje, és a főnevek esetragja is – olyan mondatok is előfordultak, amelyekben mindkét főnév rag nélküli volt, tehát a mondatnak két alanya volt. Emellett változott az is, hogy az első vagy a második főnévre esett a mondat fő hangsúlya. A szerzők azt találták, hogy a hangsúly csak ebben az utóbbi esetben befolyásolja a mondat értelmét, vagyis ha a morfológiai jelölés alapján nem állapíthatók meg a szerepek. Ha a második főnévre erősebb hangsúly esett, azaz kontrasztív jelentést sugallt, akkor a kísérleti személyek szignifikánsan gyakrabban választották azt a szituációt, amelyben a második főnév szerepelt ágensként.

... Szóhangsúly A magyar nyelvben a szóhangsúly kötött, mindig a szó első szótagjára esik. Ez nagyban befolyásolja a hangsúlyészlelést, szemben az olyan nyelvekkel, amelyekben a hangsúly más szótagokra is eshet, és helyzete jelentésmegkülönböztető szerepet is betölthet. A magyar hangsúly első vizsgálata Fónagy Iván nevéhez kötődik (Fónagy 1958). Eszerint a hangsúlyrealizáció elsődleges kulcsa az intenzitás növekedése. Gósy egy későbbi kísérletében a mondathangsúly, az alapfrekvenciaváltozás és az intenzitás összefüggését vizsgálta (Gósy 1989). A kísérlet azonos részekből álló mondatokat vizsgált, amelyekben a hangsúly különböző szavakra esett: A városban délben harangoznak. A városban délben harangoznak, vagy amelyek modalitása eltért egymástól (például eldöntendő kérdés). A kísérlet anyaga egyrészt glottográffal rögzített mondatokból állt, amely kizárólag az f változásait, azaz a hanglejtést rögzíti, másrészt imitátorral készült mondatokból, amelyekben az intenzitás is megjelenik. A kísérletből kiderül, hogy a mondathangsúly észlelése kizárólag az f alapján is lehetséges, de lényegesen kevésbé megbízható, mint amikor az intenzitás is rendelkezésre áll. Az intenzitás hiánya ugyan bizonytalanságot eredményez, de nem vezet téves hangsúlyítéletekhez, legfeljebb a fő- és mellékhangsúly felcseréléséhez. Viszonylag kicsi az olyan esetek száma (20), ahol a nagyobb intenzitás hiányzó frekvencianövekedés mellett is hangsúlyélményt idéz elő. Az észlelésben nemcsak a hangsúly, hanem a hangsúly hiánya is szerepet játszik. Ezt igazolja Honbolygó et al. (2004) EEG-vel végzett kísérlete, amelyben kétszótagú szavak helyes és a szabálysértő hangsúlyozású alakját vizsgálják, vagyis olyan szavakat, amelyekben az első helyett a másodikra esik a szóhangsúly.

A beszédpercepció helye a teljes megértési folyamatban



Eredményeik szerint a prozódiai szabálysértésekre jellemző kiváltott negatív potenciál nemcsak a helytelenül hangsúlyos második szótagon jelenik meg, hanem már az első szótagon is, ha az nem kap szóhangsúlyt. Érdekes módon ez csak felnőttekre igaz: a gyerekek csupán a hibás második szótagi hangsúlyra reagálnak, a hangsúly hiányára nem.

. Az emberi beszédpercepció nagy kérdései A hangképző szervek által létrehozott, a nyelvi kommunikáció szempontjából fontos egységek akusztikai összetevőiket tekintve a 60 Hz és 8–10 kHz közötti frekvenciatartományba esnek. A 2. részben láttuk, hogy az emberi hallószerv különösen fogékony a néhány száz Hertz-től 10 kHz-ig terjedő frekvenciasávokra. Ennek alapján született meg az a feltételezés, amely szerint a beszédprodukció és -percepció nem különálló egységként, hanem egymásra épülő és folyamatos kölcsönhatásban álló folyamatként magyarázható meg leginkább. Emellett szól, hogy a nyelvi, beszéden alapuló kommunikáció nem egyirányú, hanem többnyire folyamatosan változó szerepekkel játszódik le. Kézenfekvőnek tűnik tehát, hogy a hallgató a hallottak észlelésekor felhasználja a beszédprodukcióról tárolt ismereteit, a beszélő pedig alkalmazkodjon a hallgató – a beszélő saját tapasztalatai alapján feltételezett – rendelkezésére álló észlelési stratégiáihoz. A kölcsönös alkalmazkodást látványos formájában a mindennapi életben is tetten érhetjük: így például nagyothallókhoz hangosabban, a magyart nem anyanyelvi szinten beszélőkhöz pontosabb artikulációval szólunk. Ugyanígy a hallottak értelmezésekor igyekszünk a beszélő esetleges sajátságait is figyelembe venni. Ha egy kétéves gyermektől ezt halljuk: Ellomlott tlaktó!, akkor különösebb nehézség nélkül rájövünk, hogy a hallott /l/ hangok egy része a beszélő szándéka szerint /r/, ám a gyermek beszédkészsége még nem teszi lehetővé a komplex képzésű vibráns ejtését. A modern percepciós elméletek többsége szerint a kommunikációban részt vevők a fentiekhez hasonlóan alkalmazkodnak kommunikációs partnerükhöz, bár ennek többnyire nincsenek tudatában. Az emberi beszédpercepció kutatása a következő kérdésekre összpontosít: 1. Az emberi agy egyes részei, így például a bal félteke, a nyelvi jelek észlelésére specializálódott. Érvényes-e ez a beszédre is? Elmondható, hogy a beszédészlelés kognitív folyamatai érzékenyebbek az emberi beszéd akusztikumára, mint más hangingerekre? Azaz: létezik-e külön beszédészlelő modul?



Mády Katalin

2. Hogyan lesznek az észlelés során a folytonos akusztikai jelből kategóriák? Szükséges-e egyáltalán a percepcióban kategorizálást feltételezni? Más szóval: a beszédészlelés folytonos vagy kategorikus egységeken alapul? 3. Az emberi beszédet nagyfokú variabilitás jellemzi. Léteznek mindennek ellenére állandó, azaz invariáns egységek, amelyek a percepció alapjául szolgálnak, és ha igen, melyek ezek? 4. Hogyan kapcsolódik a beszédpercepció a nyelvi feldolgozás magasabb kognitív egységeihez? A következőkben bemutatjuk a főbb percepciós elméleteket, amelyek a mai kutatást meghatározzák. Az elméletek mindegyike empirikus adatokra támaszkodik, és meggyőző válaszokat nyújt a fent vázolt kérdésekre egyes részterületek vizsgálata alapján. Ez gyakran ahhoz vezet, hogy a különféle elméletek végkövetkeztetései szöges ellentétben állnak egymással, holott külön-külön minden elmélet hiteles bizonyítékokat sorakoztat fel a maga igaza mellett.

.. Speciális beszédmodul: a motoros elmélet Amennyiben elfogadjuk egy különálló, csak az emberre jellemző beszédpercepciós modul létezését, kézenfekvő, hogy ez a modul tartalmazza a beszédprodukcióról tárolt ismereteket is. Ezen a feltételezésen alapulnak a gesztus alapú percepciós modellek. A motoros elméletről (motor theory, más nevén motoros beszédmegértési hipotézis) korábban már szó esett a mássalhangzók felismerése kapcsán. Kialakulása az 1950-es évekre tehető, a Haskins laboratóriumhoz, ezen belül elsősorban Liberman kutatásaihoz köthető (Liberman et al. 1967, későbbi módosítása Liberman–Mattingly 1985).8 Központi kérdése, hogy az akusztikumukban eltérő hangokat (főként a zárhangokat) hogyan vagyunk képesek invariáns kategóriákhoz kötni. Liberman és kollégái abban látják a megoldást, hogy a hallgató az akusztikai jelen keresztül észleli, hogy a beszélő milyen invariáns gesztust célzott meg, és ebből az adott körülményeknek megfelelően (hangkörnyezet, beszédstílus stb.) milyen konkrét gesztus jött létre. Más szóval a percepció a produkcióról tárolt ismereteinken keresztül lehetséges, és ennek függvénye. A motoros elmélet ebből következően speciális nyelvi modult feltételez, hiszen a beszédészlelést a nyelvről 8 Gósy (1989) felhívja rá a figyelmet, hogy Stricker Salamon már 1880-ban, majd Sarbó Artúr 1906-ban hasonló megállapításokra jutott.

A beszédpercepció helye a teljes megértési folyamatban



alkotott ismeretekhez köti. A beszédpercepció és -produkció közös alapegységének az artikulációs gesztusokat tekinti (artikulációs célpont és az eléréséhez szükséges mozdulatok). A motoros elmélet előnye amellett, hogy a produkciós és percepciós folyamatok között szinte egyetlen elméletként átjárást teremt, az, hogy számos akusztikai jegyet egyetlen gesztusban foglal össze. Így például a zöngés–zöngétlen kontraszthoz kötődő akusztikai jegyeket, mint VOT, zörejenergia, f-ingadozás és felpattanási energia, a gégefő zöngeképzési gesztusára vezeti vissza. A motoros elmélet befolyása máig igen nagy, de az elmélet éppen annyira vitatott is. Mellette szól, hogy ha egy beszélő a képzésben nem tesz különbséget két hang között, akkor a percepcióban sem tudja őket elkülöníteni, amint ezt Peterson és Barney kísérletében láttuk, és amint ezt saját magunkon is tapasztaljuk, ha idegen nyelvet tanulunk. Ellene szól viszont, hogy a gyermeki beszédfejlődésben a percepciós képességek fejlettsége sokszor előbbre jár, mint a produkciós készség (Nem Tabi, hanem Tabi! – mondja a /tr/ hangkapcsolatot képezni még nem tudó gyermek). Másrészt a papagáj beszédét is megértjük, holott a madár más mechanizmusokat használ a beszédhangok előállítására, mint az ember, ezért itt nem beszélhetünk saját tapasztalatról.9 A tapasztalati ellenpéldákon túl megkérdőjelezhető az alapegységként meghatározott invariáns artikulációs gesztus is, hiszen az artikuláció közel sem invariáns, sem végeredményét, sem a neuromuszkuláris folyamatokat tekintve. Egyesek az artikulációs gesztus fogalmát az absztrakcióba való menekülésnek tartják, hiszen a gesztusok kísérleti úton nem tesztelhetők. Az sem tisztázott, hogy a hallgató az általa közvetlenül észlelt variáns akusztikai jelből hogyan tud következtetni a megcélzott invariáns gesztusra. Galantucci et al. (2009) szerint a motoros elmélet nem tudja egyértelműen megválaszolni azt a kérdést, hogy létezik-e speciális beszédmodul, mert nem egyértelmű, hogy a kérdés mire vonatkozik, illetve hogy mit értsünk speciális beszédmodulon: kizárólag a beszédfeldolgozás számára elkülönített idegpályákat, vagy hogy a beszéd azért speciális, mert a percepció magasabb szinten nem az akusztikai jelre, hanem az artikulációra támaszkodik. A motoros elmélet állítása, amely szerint a produkcióért felelős idegpályák részt vesznek a percepcióban, mai ismereteink szerint a tükörneuronok működésével is magyarázható.

.. Folytonos és kategoriális észlelés: kvantális elmélet és LAFF A motoros elmélettel egy időben jött létre az Egyesült Államok-beli Massachusetts Institute of Technology (MIT) fonetikai laboratóriumában az ún. kvantális 9 A papagájnak két pár hangszalagja van, ezzel imitálja a magánhangzók első és második formánsát.



Mády Katalin

elmélet, amely Stevens nevéhez fűződik (Stevens 1989). Az elmélet szerint az artikuláció és az akusztika, valamint az akusztika és percepció közötti összefüggés nem lineáris, hanem kvantális (ugrásszerű). Az akusztikai jelben előfordulnak invariáns elemek, amelyek megkönnyítik ezek percepcióját, az észlelés tehát kategoriális (l. 7. ábra).

7. ábra: Egy adott artikulációs és akusztikai paraméter összefüggése. Az I. és III. sza-

kaszban a beszélőszervek helyzetének változása lassú változást idéz elő az akusztikumban, míg a II., átmeneti szakaszban hirtelen változást vált ki. Az összefüggésben az x és y tengelyen ábrázolt paraméterek felcserélhetőek.

Erre példaként szolgálhatnak a szibilánsok: az sz és az s képzéshelyét tekintve közel áll egymáshoz, akusztikai szerkezetük viszont meglehetősen eltérő: míg az sz és a z spektrumára 5000 Hz körül kezdődő, nagy intenzitású frekvenciasáv jellemző, addig az s és a zs frekvenciaképét 2000 és 4000 Hz körüli nagy intenzitású frekvenciakomponensek határozzák meg. Perkell et al. (1979) a következő kísérletet írják le: a nyelvperem az sz képzésekor a fogmedret érinti, ekkor az akusztikumot 5000 Hz körül kezdődő, nagy intenzitású frekvenciasáv jellemzi. A nyelvperem lassú hátrafelé mozgatásával a jellemző frekvenciasávok először egyenletesen, majd egy ponton hirtelen csökkennek, így az s szűkülete, amely az sz-hez képest csupán néhány milliméterrel hátrébb képződik, jóval alacsonyabb, 2000 és 4000 Hz körüli magas intenzitású frekvenciasávot eredményez.10 10 Az sz magas frekvenciáinak létrejöttét az okozza, hogy a kiáramló levegő visszaverődik a felső, illetvet az alsó fogsorról.

A beszédpercepció helye a teljes megértési folyamatban



A kvantális elméletből nőtt ki a LAFF-elmélet (lexical access from features, lexikális hozzáférés jegyek alapján), amely legújabb változatában (Stevens 2002) az észlelés alapjaként fonémák helyett absztrakt bináris megkülönböztető jegyeket feltételez, amelyek egy vagy több akusztikai kulcsban (cue) manifesztálódnak (például zöngés hangok esetén az alacsony frekvenciatartományban jelen lévő energia). Az akusztikai kulcsok, ill. az általuk reprezentált bináris jegyek felismerése az ugrásszerű változások létrehozta invariancián alapul. Stevens az 1980-as években kidolgozta a Chomsky és Halle (1968) által megadott artikulációs alapú bináris megkülönböztető jegyekhez tartozó akusztikai sablonokat.11 A LAFF-elmélet szerint a mentális lexikon a lexikális egységeket bináris jegyek sorozataként tárolja, azaz az akusztikai jel auditív percepciója közvetlenül a lexikonhoz kapcsolódik. A LAFF-elmélet (és a kvantális elmélet) tehát az akusztikumban és a percepcióban látja az invarianciát, nem pedig az artikulációban. A megkülönböztető jegyek akusztikai megfelelői az elmélet korábbi változata szerint az ún. sablonok (template), a későbbi változat szerint pedig a határjelzők (landmark), azaz a szegmensek határán, egyes esetekben magában a szegmensben található jellegzetes invariáns spektrális minták. A határjelzők az akusztikai jel egyes frekvenciatartományaiban észlelt hirtelen, jelentős változások, mint például egy zárfelpattanás.12 Az akusztikai átmenetből meghatározható, hogy egy hang például mássalhangzó ([+mássalhangzó]), ezen belül pedig zárhang ([−folyamatos]), amivel egyszersmind számos, például a magánhangzókra vagy a szonoránsokra jellemző jegy ([±kerek], [±laterális]) értelmét veszti és a további elemzésből kizárható. Egy határjelző sikeres felismerése után az észlelés során ennek közvetlen környezetében további megkülönböztető jegyre utaló akusztikai kulcsokat keresünk. A bináris jegyekből összeálló mintát folyamatosan összevetjük a mentális lexikonban tárolt mintákkal. Végül az a szó aktiválódik, amelyik a legjobban hasonlít az észlelt jegysorozathoz. Fontos megjegyeznünk, hogy a LAFF, hasonlóan a generatív fonológiához, a fonémákat megkülönböztető jegyek kötegének tartja, amelyek az időtengelyen egymás után, illetve részleges vagy teljes átfedésben léphetnek fel. A LAFF-modell előnye, hogy megszünteti a fonémaegység és koartikuláció között húzódó ellentmondást, és alkalmas a koartikulációs variabilitás leírására, 11 Már a bináris jegyeket elsőként bevezető Roman Jakobson is részben akusztikai alapú meghatározásokat használt. 12 Míg a határjelzők jellegzetesen a hangátmenetekhez kapcsolódnak, pl. egy laterális mássalhangó és egy magánhangzó között a formánsok intenzitásának hirtelen növekedésében és adott esetben frekvenciaváltozásában is manifesztálódnak, a felpattanó orális zárhangok esetében a felpattanás szolgál határjelzőként, amely nem érintkezik közvetlenül a megelőző vagy követő magánhangzó akusztikai leképezésével.



Mády Katalin

mivel a megkülönböztető jegyek temporális információt is hordoznak. Mellette szól továbbá, hogy egyszerű, jól megfogható jegyeken alapszik, nem feltételez nehezen igazolható absztrakt szinteket vagy egységeket, mégis jól magyarázza a percepciós megfigyeléseket. Az elmélet további előnye, hogy empirikus úton jól tesztelhető, egyrészt mert lehetővé teszi a számítógépes modellezést, másrészt mert számos, akusztikailag ellenőrizhető megfigyelésen alapul, és ezáltal jelentősen támogatja a gépi beszédfelismerést is. Az elmélet hátránya azonban, hogy az eredmények szinte kizárólag mesterségesen (azaz laborban) előhívott észlelésen alapulnak, ezért kérdéses, hogy a spontán beszédre is érvényesek-e. Ellene szól továbbá az az összefüggés, hogy a jól felismerhető akusztikai jellemzőkkel rendelkező hangokat a nyelvek nem feltétlenül részesítik előnyben a kevésbé jól felismerhető hangokkal szemben (az ü például CV átmenete alapján könnyen azonosítható, mégsem fordul elő gyakran a világ nyelveiben, mert komplex artikulációs gesztus áll mögötte). Végül, a többi modellhez hasonlóan, a LAFF-modell sem írja le részletesen, hogy milyen lépésekben történik a megkülönböztető jegyek összehasonlítása a mentális lexikonban tárolt egységekkel: mi szolgál az összehasonlítás alapjául? Mekkora súllyal esnek latba az egyes jegyek?

.. Változékonyság és invariancia Az európai ember számára első hallásra értelmetlen kérdésnek tűnik, hogy van-e értelme a beszédhangok állandó kategóriáiról beszélni, hiszen az Európában használatos helyesírások többségükben fonémaalapúak, azaz a hangoknak 30–50 betűt vagy betűkombinációt feleltetnek meg. Amint azonban korábban láttuk, az akusztikai jel egyes esetekben igen, másokban azonban egyáltalán nem sugallja a hangok közötti kategóriahatárok meglétét. Eldöntetlen kérdés, hogy az emberi percepció invariáns egységekre, vagy éppen a változékonyságra, vagyis a varianciára támaszkodik. A következőkben három további percepciós elméletet mutatunk be, amelyek az egyik, illetve a másik oldal mellett érvelnek.

... Közvetlen realista elmélet A közvetlen realista elmélet (direct realist theory) általános percepciós elméletbe ágyazódik, és az artikulációs fonológia alapjául szolgáló artikulációs gesztusokra épít. Eszerint a beszéd egymást követő, elvileg különálló (diszkrét) artikulációs gesztusokból, azaz a beszédképző szervek egyes pontjainak összehangolt mozgásából áll, ami a folyamat végére egymást részlegesen fedő gesztusokat eredményez

A beszédpercepció helye a teljes megértési folyamatban



(Fowler 1986; Browman–Goldstein 1992). A közvetlen realista elmélet szerint a percepció invariáns eleme a gesztusok elkülönítésére irányuló képesség. Az elmélet mögött húzódó általános felfogás lényege, hogy az akusztikai jel önmagában elegendő információt hordoz az általa megjelenített történés felismeréséhez. Az észlelés tehát közvetlenül kapcsolódik a történéshez, a bejövő jel elemzése nem szükséges a feldolgozáshoz – így ebben az elméletben az akusztikai feldolgozás háttérbe szorul az artikulációs folyamatokkal szemben. Ezt olyan kísérletekkel igazolták, amelyekben a kísérleti alanyok fonológiailag megegyező, tehát azonos artikulációs gesztusokból álló hangsorokat nem tudtak megkülönböztetni egymástól, ha azokat eltérő fonetikai kontextusban hallották (Fowler 1984). Az elmélet jelentősége egyrészt az általános észlelési modellekbe való beágyazottság, másrészt az, hogy összekapcsolja az artikulációt, a percepciót és a fonológiát. Ellene szól azonban, hogy az észlelést kiváltó történések ismerete számos esetben nem szükséges a percepcióhoz: így például olyan zenét is képesek vagyunk észlelni, amit számunkra ismeretlen hangszeren játszanak, olyan szagokat is érzékelünk, amelyek forrását nem ismerjük. Ez az elmélet sem ad pontos felvilágosítást arról, hogy az akusztikai jelben milyen módon vannak kódolva a diszkrét artikulációs gesztusok, és hogyan történik ezek felismerése.

... H&H-elmélet Lindblom Hyper and Hypo Speech („túlartikulált és alulartikulált”) elmélete gyakorlati irányultságú: a beszélő és a hallgató között létrejövő kooperatív kommunikációra épül, amely meghatározza a beszédprodukciós és -percepciós folyamatokat (Lindblom 1990). A beszédhelyzettől és a kommunikációs partnerek közötti viszonytól függően a beszélő gondosabban vagy lazábban artikulál, ami alapvetően befolyásolja az akusztikumot, éppen ezért az nem is tartalmazhat invariáns jegyeket. A hallgató a percepciós folyamatban a jel értelmezése közben felhasználja a rendelkezésére álló egyéb információt is a beszédhelyzetről, a beszélőről, a világról. A beszélő a kommunikációs helyzetben kétféle célt követ. Egyrészt érthetővé akarja tenni beszédét a hallgató számára, ezért igyekszik a szegmensek megkülönböztetéséhez elegendő jegyet produkálni (sufficient contrast). Amennyiben ez a cél dominál, hiperartikulált beszéddel találkozunk, például a beszélő anyanyelvét rosszul ismerő külföldivel szemben, fontos információ közlésekor, vagy ha zajban kell kommunikálnunk. A beszélő másrészt törekszik a gazdaságos produkcióra, azaz az artikulációs befektetés minimalizálására, ezért az egyes hangokra jellemző célkonfigurációt nem mindig éri el – vagy mert az értés



Mády Katalin

szempontjából redundánsnak ítéli, vagy mert a szegmens tartama alatt ez túlságosan nagy befektetést igényelne tőle. (Célkonfiguráción az adott beszédhangra jellemző idealizált artikulációs és akusztikai mintát értjük.) Az akusztikai jel tehát a hiper- és hipoartikuláltság közötti kontinuumon helyezkedik el. A hallgató a jel feldolgozásakor képet alkot arról, hogy a beszélő az adott körülmények között milyen fokú artikuláltságot valósít meg, és ettől függően értelmezi a hallottakat. Az előző három elmélettel szemben a H&H-elmélet figyelembe veszi a beszédhangok szintjénél magasabb feldolgozási szinteket, valamint a hallgató világról tárolt tudását is. Nem ad viszont választ arra, hogy a leírt jelenségek mögött milyen neuropszichológiai mechanizmusok húzódnak meg.

... Példányelmélet Az invariancia alapú elméletek ellenpontja az ún. példányelmélet. Alapjául az 1980-as években kialakított példány-alapú (angolul exemplar) elméletek szolgálnak (Nosofsky 1986), amelyeket Johnson (1997) adaptált a nyelvi viselkedésre. Kiindulási pontként olyan kísérleti eredmények szolgálnak, melyek szerint a felismerésben meglepően fontos szerepet játszanak a hívószavakhoz köthető redundáns információk, így például Goldinger (1996) kísérletében. Itt tíz beszélőtől rögzítettek összesen 300 egyszótagú szót. Először a beszélők hangja közötti hasonlóságot határozták meg egy diszkriminációs tesztben.13 A kísérleti személyek egy tanuló fázisban vettek részt: le kellett írniuk a hallott szavakat. A második szakasz kétféle vizsgálatból állt, amelyek a tanuló fázis után öt perccel, egy nappal, és egy héttel következtek. Ebben a kísérletben szavakat hallottak, amelyeknek egy részét már a tanuló szakaszban is hallották, másokat nem. Azt kellett eldönteniük, szerepelt-e a szó az első részben (explicit felismerés). A második feladatban a szavakat fehér zajjal maszkolták, és a kísérleti személyeknek így kellett felismerniük őket (implicit felismerés). Az első kísérlethez hasonlóan a szavak részben ismertek voltak a tanuló szakaszból. Az explicit feladatban biztosabban felismerték azokat a szavakat, amelyeket hasonló hangú bemondó ejtésében hallottak a tanuló szakaszban, ez az effektus azonban csak egy napig tartott. Az implicit feladatban a kísérleti személyek még egy hét után is profitáltak a konkrét ejtésmódból: a hasonló hangú beszélő ejtette szavakat még ilyen távolságban is könnyebben felismerték az akusztikai elfedés ellenére, mint azokat, amelyeket eltérő hangú beszélőtől hallottak. A kísérlet legfontosabb megállapítása az, hogy a percepció során nem egyszerűen felismerjük a magasabb nyelvi egységeket, hanem látszólag redundáns 13 A kísérleti személyek feladata az volt, döntsék el, azonos-e két beszélő. A hasonlósági index alapjául a válaszadás reakcióideje szolgált.

A beszédpercepció helye a teljes megértési folyamatban



információt is tárolunk (mint például a beszélő hangszíne). Ez ellene szól az absztrakt egységekre épülő modelleknek. Nosofsky (1986) szerint a kategóriák ugyanis nem absztrakt elemekből, hanem ezen elemek általunk ismert megvalósulásaiból állnak össze, azaz a példányokból. Egy példány a kategória egy konkrét képviselője, a rá jellemző külső tulajdonságokkal és a hozzá tartozó kategóriák címkéivel (hallott fonéma, beszélő neme, hangszíne stb.). A kategorizálás úgy történik, hogy a hallott elemet összevetjük az eltárolt példányokkal, és a rá leginkább illő kategóriához rendeljük hozzá. A modell működését leíró algoritmus része az euklideszi távolságon alapuló hasonlóság indexszáma, az ún. figyelmi súly (mennyire hangsúlyos az észlelésben egy bizonyos paraméter), az alapaktiváltság, az aktiváltsági fok, valamint a hozzárendelési tendencia. A példányelmélet legnagyobb nyitott kérdése, hogy hogyan lehetséges az életünk során észlelt példányok hosszú távú tárolása. Fennáll továbbá a túlkomplikálás veszélye, hiszen a modellbe számos paraméter beépíthető, amelyeket igen nehéz kontrollálni.

. Beszédpercepció, kogníció és neuroanatómia Míg a kognitív nyelvi modellek magukban foglalják a fonológiai, és részben a fonetikai szintet is, a bemutatott elméletek többsége nem tér ki a beszéd és a magasabb nyelvi kognitív szintek összjátékára. Egyelőre tisztázatlan, hogy a beszédpercepció milyen mértékben használja fel a nyelvi és a világról szerzett tágabb ismereteket. Nem tűnik azonban ésszerűnek, hogy a beszédészlelés során ne támaszkodjunk a nyelvi és a tágabb kommunikációs kontextusra, hiszen ezek az ismeretek minden bizonnyal támogatják a hangsorok felismerését. Az összjátékot valahogy úgy képzelhetjük el, mint amikor egy nehezen olvasható kézírással írt cédula akad a kezünkbe: könnyebb elolvasnunk az írottakat, ha vannak bizonyos előfeltevéseink az üzenet tartalmával kapcsolatban. Kísérletek részben azt mutatják, hogy a magasabb nyelvi szintek (szintaxis, szemantika, pragmatika) nemcsak támogatják a beszédpercepciós folyamatokat, hanem akár el is fedhetik a beszéd bemeneteként szolgáló hangsorok hiányosságait. Warren (1970) kísérletében egy hosszabb mondat egyik /s/ hangját köhögéssel helyettesítette, és megkérte a kísérlet résztvevőit, hogy azonosítsák a köhögés helyét. Érdekes módon a kísérleti személyeknek nemcsak a pontos helyet nem sikerült meghatározniuk, hanem azt sem vették észre, hogy az /s/ hang hiányzott. Az is kiderült, hogy a résztvevők az elfedett hangot a mondat összefüggésének függvényében „azonosítják”. Egy magyar példával szemléltetve, a Mindenki



Mády Katalin

tudta, hogy a _ár. . . utolsó szavának első hangját másként hallották, ha a mondat folytatása milliókra rúg volt, mint ha sikeresen ellenált a török ostromnak követte a hiányos szót. Samuel (1981) későbbi kísérletekkel igazolta, hogy a fehér zajjal elfedett mássalhangzó felismerésében a felülről lefelé ható feldolgozási folyamatok is részt vesznek: a mássalhangzó azonosítása függ a résztvevők előzetes várakozásától, a szó hosszától, azaz a rendelkezésre álló magasabb szintű információtól is. Ezzel magyarázható, hogy az elfedett hangok behelyettesítése jóval ritkábban következett be álszavak, azaz önálló jelentéssel nem bíró szavak esetén. Samuel (1981) egyszersmind az alulról felfelé ható folyamatok jelenlétét is kimutatta: a hallgatók a fehér zaj helyén gyakrabban hallottak olyan hangokat, amelyek akusztikai jellemzőikben hasonlítanak a fehér zajhoz (például frikatívákat). Ez arra utal, hogy a felülről lefelé (top-down) és alulról felfelé terjedő (bottom-up) folyamatok párhuzamosan mennek végbe a beszédészlelés folyamán. Erre utal Kazanina et al. (2006) magnetoenkefalográfiás kísérlete is, amelyben orosz és koreai anyanyelvű beszélők fonémadiszkriminációs képességét vizsgálták. A /t/ és a /d/ hang mindkét nyelvben előfordul, de csak az oroszban bír jelentésmegkülönböztető szereppel, a koreaiban a /d/ intervokális, a /t/ pedig szókezdő pozícióban fordul elő, tehát egy fonéma allofónjai. A kísérletből kiderül, hogy a különböző VOT-jú, azaz eltérő zöngésségű zárhangok az orosz kísérleti személyekben nagyon korai reakciókat váltottak ki, míg a koreai beszélőkben nem – hiszen az ő beszédészlelésük szempontjából ez a megkülönböztetés nem releváns. A szerzők érvelése szerint a beszédhang szintű észlelést tehát befolyásolja a szavak jelentésmegkülönbözető szerepe, azaz tágabb értelemben a jelentés is.

.. Nyommodell A neurális pályák működését modellezi a nyommodell (trace model), amely a pszichológiából és a mesterséges intelligencia kutatásából ismert konnekcionista modellek hagyományát követi (McClelland–Elman 1986). A modell alapja egy háromszintű neuronális háló, amely megkülönböztető jegyekből, fonémákból és szavakból épül fel. A modell kétirányú, azaz lehetővé teszi mind a magasabb egységektől az alacsonyabbak felé történő feldolgozást, mind a fordított irányút. A 8. ábra egy szótalálási folyamatot ábrázol. Az egyes szinten található egységek össze vannak kötve a saját szintjükön és a szomszédos szint(ek)en található minden más egységgel. A modell bemenetét a hangszínképhez hasonló elemzés képezi, amely 5 ms-nyi szeletekre építkezik. Az alsó szint egységei képesek az akusztikai jegyek kiszűrésére, és ha a bemenettel egyező mintát tárolnak, akkor

A beszédpercepció helye a teljes megértési folyamatban



második lépésként a többi egység is aktiválódik a kódolt mintának megfelelő mértékben. A harmadik szinten a folyamat végén egyetlen szó aktiválódik, és ez szolgál a modell kimeneteként. Az egységek közötti kapcsolat lehet excitatorikus vagy inhibitorikus: előbbi növeli a másik egység aktivációs szintjét, utóbbi csökkenti. A szintek közötti kapcsolatok excitatorikusak, azaz mindkét irányban segítik az aktiváltság továbbterjedését. Így például egy magasabb szintű egység aktiválódása támogatja az alsóbb szinteken lévő releváns egységek aktiválását, és természetesen fordítva is, interaktív hálót alkotva. Egy bizonyos egység aktiválódása egyidejűleg gátolja saját szintje konkurens egységeit.

8. ábra: A nyommodell szintjei és kapcsolatuk. Példa a zöngésségi jegy, a /d/ fonéma és

a dél szó összeköttetéseire. Az azonos szinten működő inhibitorikus kapcsolatot szaggatott vonal, a szintek közötti excitatorikus kapcsolatot folyamatos vonal jelzi (Hawkins 1999, 272 nyomán).

A nyommodell számos előnnyel jár. Egyrészt megoldást kínál a koartikuláció okozta varianciaproblémára, mert az egyes szeletekben kódolt információ elősegíti a későbbi szeletek jobb értelmezését, a koartikuláció itt tehát nem gátló tényezőként jelenik meg. Összhangba hozható a kategorikus észleléssel is (kvantális elmélet), mert bele van építve az egy szinthez tartozó szomszédos elemek gátlásának gondolata. Megmagyarázza azt a jelenséget is, hogy ha felismertünk



Mády Katalin

egy szót, akkor utólag „belehalljuk” azokat a fonémákat is, amelyek ugyan a szóhoz tartoznak, de a jelből hiányoztak. Gósy (1989) felhívja rá a figyelmet, hogy ezt a jelenséget már Kempelen Farkas is leírta beszélőgépe kapcsán: ha ismerjük a beszélő (ez esetben a beszélőgép) közlésének tartalmát, akkor könnyebben megértjük, és hajlamosak vagyunk azt hinni, hogy helyes formában hallottuk (Kempelen 1791). A modell hiányosságai közé tartozik, hogy nem ad kellő indoklást arra, miért éppen e három felismerési szintből indul ki. Nem alkalmas továbbá a mentális lexikon elemei között fennálló szemantikai kapcsolatok modellezésére, valamint kizárja azt a lehetőséget, hogy a bemenet nem vezet létező szó aktiválásához (például mert a szó nem a lexikon része, vagy a rendelkezésre álló információ alapján nem azonosítható).

.. Lateralizáció A hangingerek túlnyomórészt kontralaterálisan továbbítódnak, hasonlóan a többi észlelési folyamathoz. Ennek megfelelően a beszédszegmentumok feldolgozásában a jobb fül elsőbbrendűsége (right ear advantage) miatt főként a bal agyfélteke játszik szerepet. A jobb fül elsőbbrendűsége azonban nem minden hang esetén egyforma, így például a zárhangoknál jelentős, a magánhangzók állandó szakaszánál csekély. A dichotikus hallást vizsgáló kísérletekben többféle fúziós jelenségről számoltak be: ha az egyik fülbe /b/-re jellemző, azaz emelkedő tranzíciójú szintetizált hangot játszanak be, a másikba /g/-re jellemző, azaz ereszkedő tranzíciójút, akkor a formánsmenetek összeadódnak, és a kísérleti alanyok /d/-t hallanak, amelynek stagnáló átmenete van (pszichoakusztikai fúzió). Hasonlóan, ha az egyik fül réshang + magánhangzóra emlékeztető kapcsolatot hall, amelyből hiányzik az egyértelmű formánsátmenet, a másik fül pedig változó alapfrekvenciájú hangot, amely megegyezik a hiányzó formánsátmenettel, akkor a kísérleti személy egyértelmű CV-kapcsolatot hall, miközben a változó frekvenciájú hangot is el tudja különíteni (spektrális fúzió). Ugyanez a jelenség megfigyelhető a magasabb feldolgozási egységek szintjén is: a zöngés és labiális megkülönböztető jegyek fúzióját érjük el a /ba/ és /ta/ szótag egyidejű lejátszásával, ekkor a kísérleti személy /pa/ szótagot hall, a /tabi/ és /rabi/ logatomok első fonémái pedig /trabi/-vá egyesülnek (fonológiai fúzió) (Pompino-Marschall 2003). Dehaene-Lambertz et al. (2005) szerint a percepció erősebben lateralizált, ha tudatában vagyunk annak, hogy nyelvi stimulusoknak vagyunk kitéve. Kiváltott potenciállal és fMRI-vel végzett kísérleteikben azt találták, hogy ha a kísérleti személyek előbb szinuszzörejeket hallgattak meg, majd rávezették őket, hogy

A beszédpercepció helye a teljes megértési folyamatban



ezeket nyelvi jelként is lehet észlelni, akkor jelentősen felgyorsult a feldolgozás, és javult a kategóriahatárok észlelése – ugyanakkor a kategórián belüli különbségek felismerése visszaesett. A fonémaalapú észlelés során a bal agyfélteke aktiválása jóval erősebb volt, mint a nem-nyelvi jelként észlelt zörejdiszkrimináció esetén. A bal agyfélteke domináns szerepe természetesen nem jelenti azt, hogy a jobb agyfélteke ne venne részt a beszédpercepcióban. Egyes kísérletek tanúsága szerint a jobb agyfélteke képes zöngésség, ill. aspiráció észlelésére, valamint szavak és egyszerű mondatok felismerésére. A jobb agyfélteke kikapcsolásával sérül továbbá a prozódiai jegyek felismerése is (Gósy 1989). Eckstein és Friederici (2006) arra mutat rá, hogy bár a szintaktikai szerkezet feldolgozása a bal, a prozódiai szerkezeté pedig a jobb féltekében lokalizálható, ezek a folyamatok kölcsönhatásban vannak egymással. Kiváltott potenciálokkal végzett kísérletükben a szintaktikai szerkezettől való eltérések csak akkor jelentkeztek a bal féltekében, ha a mondat prozódiája helyes volt. Azt is megállapították, hogy ha a prozódiai és a szintaktikai szerkezet hibás, akkor a jobb féltekében mérhető a deviáns prozódiai szerkezetekre jellemző eltérési negativitás (EN), ám ha csak a szintaktikai szerkezet tér el a szabályostól, akkor a jobb agyféltekében nem jelenik meg az EN. Ez a prozódia és a szintaxis szoros együttműködésére utal, legalábbis a szerzők által vizsgált német anyanyelvű kísérleti személyeknél.

.. Heteromodális beszédészlelés A hangingerek feldolgozása összefügg a többi érzékszerv működésével, így a vizuális ingerek feldolgozásával is. Ennek egyrészt a fonéma–graféma feldolgozásban van jelentősége, másrészt magában a beszédészlelésben. Fontos szerepet játszik a szájról olvasásban, főként zajos környezetben, vagy ha egy általunk kevéssé ismert idegen nyelvet kell megértenünk. Gósy kimutatta, hogy az értelmetlen hangsorok felismerése 10-kal javítható, ha az auditív információ kiegészül a hangsornak megfelelő ajakmozgás látványával (Gósy 1989). Ha viszont a hangsorokat más hangok artikulációjának megfelelő vizuális inger kíséri, a felismerés 20-kal romlik. Ugyanez fokozott mértékben érvényes az értelmes nyelvi egységek azonosítására. A beszédészlelést azonban nemcsak támogathatja, hanem meg is zavarhatja a vizuális információ, amint McGurk és MacDonald híres kísérletéből kiderül. Ha egy kísérleti személy fejhallgatón a /ba/ szótagot hallja, ezzel egyidejűleg pedig képernyőn egy artikuláló személyt lát, aki a /ga/ szótagot ejti ki, az észlelt szótag /da/ lesz. Ez a McGurk-effektus,14 amelyet számos nyelvre igazoltak, és amely 14 Az interneten számos illusztrációt lehet találni a „McGurk effect” keresőszó beadásával.



Mády Katalin

meglehetősen robusztusnak mutatkozik: ha az auditív inger 180 ms késéssel éri a fület a vizuális ingerhez képest, még mindig megtörténik az egybeolvadás. Egyes vizsgálatok szerint a jelenség auditív alapú, azaz a /ba/ szótag váltja ki, ezért nem hasonlítható a fúziókhoz (Roberts–Summerfield 1981).

.. A percepció neuroanatómiai leképezése A bemutatott kísérletek mindegyike meggyőző bizonyítékokkal támasztja alá az egyes percepciós elméleteket, holott ezek részben meglehetősen ellentmondó nézeteket képviselnek. Valószínűnek látszik, hogy a percepció során mindazokat a folyamatokat felhasználjuk, amelyekre az egyes kísérletek rámutatnak. Ezt a feltételezést támasztják alá a hangingerek agyi feldolgozásáról szerzett eddigi ismereteink is (Péter 1991; Scott–Johnsrude 2003). A jelenlegi kutatások alapján bizonyosnak látszik, hogy mind a hallópálya, mind az elsődleges hallókéreg ingerspecifikusan működik, a feldolgozás hierarchikus és párhuzamos szerkezetű, vagyis az idegpálya egyes szakaszai bizonyos ingereket preferáltan kezelnek más típusú ingerekhez képest. Az agyalap és a thalamus magjai valószínűleg még nem tesznek különbséget a hangforrások között, a beszédspecifikus ingerek megkülönböztetett feldolgozása feltehetően csak az agykéregben kezdődik el. Sajnos ez utóbbi működéséről mindmáig igen kevés információ áll rendelkezésre. Az emlősök hallókérgében az elsődleges hallókéreg több más áreával közvetlen kapcsolatban áll. Így például a tonotópiás ingerfeldolgozás az elsődleges hallókéregben történik, míg a sávok szerinti frekvenciafelismerés (amely a Barkskála alapját is képezi) az asszociált területekre tehető (Scott–Johnsrude 2003). A hangok észlelésében fontos szerepet játszik a Heschl-tekervény (gyrus temporalis transversus), amely a sulcus lateralisban található. Funkcionális MRIvel végzett kísérletek azt mutatják, hogy a hanginger megjelenése, illetve az akusztikus paraméterek változása a Heschl-tekervény aktiválását váltja ki. Az aktivitás bármely, tehát nem csupán beszédspecifikus, auditív inger hatására kimutatható. A központi területhez képest anterolaterális elhelyezkedésű asszociált kéregterületek egyrészt a komplex spektrális tulajdonságú, másrészt az időbeli információ észlelését lehetővé tevő széles sávú és változó amplitúdójú hangingerek észlelésére specializálódtak. A Heschl-tekervényhez képest laterális helyzetű gyrus temporalis superior aktiválható a beszédre jellemző akusztikus ingerekkel és értelmes emberi beszéddel, de egyszersmind nyelvi információt nem tartalmazó komplex periodikus hangokkal és változó frekvenciájú ingerekkel is (Scott– Johnsrude 2003).

A beszédpercepció helye a teljes megértési folyamatban



A nyelvi információt hordozó beszéd feldolgozása a magasabb nyelvi szintekhez hasonlóan a bal féltekében történik. Kimondottan beszédre jellemző hangingerek feldolgozására hivatott területként a baloldali sulcus temporalis superior azonosítható. Erre a területre az emlősöknél az agykéreg több pontjáról érkeznek ingerek, így a halló-, a látó-, és a szomatoszenzoros kéreg felől. Valószínű, hogy az agykéreg e pontján kapcsolódik össze a hanginger a jelentéssel, mivel a szemantikus demenciában szenvedő betegekre éppen e terület sorvadása jellemző. Egyes kísérleti eredmények arra utalnak, hogy az általános auditív és a nyelvi információban részt vevő folyamatok a planum temporale területén kapcsolódnak össze. A planum temporale anterolaterális széle mind a beszéd szempontjából releváns, mind nem-nyelvi auditív ingerek észlelése közben aktív, a vele szomszédos, hozzá képest posterior helyzetű terület viszont artikuláció közben aktiválódik, még hangtalan beszéd közben is. Az itt vázolt kutatási eredmények azt jelzik, hogy a hallórendszer területi és funkcionális szempontból két részre osztható (Scott–Johnsrude 2003). A rendszer első (anterior) részében a beszédakusztikai és a lexikális információ összekapcsolódása figyelhető meg, a hátsó (posterior) rendszer pedig a hangingerek és az artikuláció kapcsolatáról árulkodik. Ez a kutatások egy későbbi pontján megteremtheti annak az alapját, hogy a különféle percepciós elméletek egymásnak részben ellentmondó szemléletét egy neurofiziológiai alapú közös rendszerben foglaljuk össze.

. Zárszó A fentiekben láthattuk, hogy a beszédpercepciós kutatások egyelőre nem tudtak kielégítően válaszolni arra a kérdésre, hogyan absztrahálja és kapcsolja az agy a beérkező beszédjelet magasabb nyelvi egységekké, sőt abban sincs egyetértés, hogy bemenetként az akusztikai jel szolgál-e, vagy az artikulációs gesztus (mint a motoros és a direkt realista elméletben), és hogy a beszédfeldolgozás kimenetét a fonéma, a megkülönböztető jegy vagy a szó képezi-e. Az elméletek sokféleségének hátterében az a probléma áll, hogy a percepcióban nem léteznek egy-az-egyhez típusú kapcsolatok, ehelyett a több-atöbbhöz mintázat a jellemző. Ezért ha egy kísérlet eredményei alátámasztják valamelyik modell helyességét, ez nem jelenti azt, hogy az a modell – és csak az a modell – térképezte fel helyesen a beszédfeldolgozás folyamatát, hiszen az eredmények egyrészt más modellekben is értelmezhetőek lennének, másrészt lehet, hogy a neuropszichológiai valóság egy szeletét képezik csak – főként ha emlékezetünkbe idézzük, hogy az ismertetett kísérletek túlnyomórészt mesterségesen



Mády Katalin

előállított vagy manipulált hangmintákra épültek. Ezért, bár a fentiekben a pszicholingvisztikai modellek percepciós oldalának csupán két szintjét, a fonetikai és fonológiai szintet kíséreltük meg összekötni, még ez sem járhat sikerrel a hangingerek feldolgozásának neurofiziológiai alapjainak pontosabb ismerete nélkül. Irodalom Bolla Kálmán 1995. Magyar fonetikai atlasz: a szegmentális hangszerkezet elemei. Budapest: Nemzeti Tankönyvkiadó. Browman, Catherine P. – Louis Goldstein 1992. Articulatory phonology: An overview. Phonetica 49: 155–180. Chistovitch, Ludmilla A. 1985. Central auditory processing of peripheral vowel spectra. Journal of the Acoustical Society of America 77: 789–805. Chomsky, Noam – Morris Halle 1968. The sound pattern of English. New York: Harper & Row. Dehaene-Lambertz, Ghislaine – Christophe Pallier – Willy Serniclaes – Liliane Sprenger-Charolles – Antoinette Jobert – Stanislas Dehaene 2005. Neural correlates of switching from auditory to speech perception. NeuroImage 24: 21–33. Eckstein, Korinna – Angela D. Friederici 2006. It’s early: Event-related potential evidence for initial interaction of syntax and prosody in speech comprehension. Journal of Cognitive Neuroscience 18: 1696–1711. Fastl, Hugo – Eberhard Zwicker 2006. Psychoacoustics: Facts and models (3rd edition). Berlin: Springer. Fletcher, Harvey 1940. Auditory patterns. Reviews of Modern Physics 12: 47–65. Fónagy Iván 1958. A hangsúlyról (Nyelvtudományi Értekezések 18). Budapest: Akadémiai Kiadó. Fowler, Carol 1984. Segmentation of coarticulated speech in perception. Perception and Psychophysics 36: 359–368. Fowler, Carol 1986. An event approach to the study of speech perception from a direct-realist perspective. Journal of Phonetics 14: 3–28. Galantucci, Bruno – Carol A. Fowler – Michael T. Turvey 2009. The motor theory of speech perception reviewed. Psychonomic Bulletin & Review 13: 361–377. Goldinger, Stephen D. 1996. Words and voices: Episodic traces in spoken word identification and recognition memory. Journal of Experimental Psychology: Learning, Memory and Cognition 22: 1166–1183. Gósy Mária 1989. Beszédészlelés. Budapest: Akadémiai Kiadó. Gósy, Mária 2004. Fonetika, a beszéd tudománya. Budapest: Osiris Kiadó. Greenberg, Steven – Hanna Carvey – Lea Hitchco*ck – Shuangyu Chang 2003. Temporal properties of spontaneous speech – a syllable-centric perspective. Journal of Phonetics 31: 465–485. Hawkins, Sarah 1999. Reevaluating assumptions about speech perception: Interactive and integrative theories. In: Pickett (1999, 232–288). Honbolygó, Ferenc – Valéria Csépe – Anett Ragó 2004. Suprasegmental speech cues are automatically processed by the human brain: A mismatch-negativity study. Neuroscience Letters 361: 84–88.

A beszédpercepció helye a teljes megértési folyamatban



ISO Szabvány R 226-1961 Normal equal-loudness contour for pure tones and treshold of hearing under free field listening condition. Johnson, Keith 1997. Speech perception without speaker normalization: An exemplar model. In: Keith Johnson – John W. Mullennix (szerk.): Talker variability in speech perception. San Diego: Academic Press. 145–166. Kazanina, Nina – Colin Phillips – William Idsardi 2006. The influence of meaning on the perception of speech sounds. Proceedings of the National Academy of Sciences United States of America 103: 11381–11386. Kempelen Farkas 1791. Mechanismus der menschlichen Sprache, nebst der Beschreibung seiner sprechenden Maschine [Az emberi beszéd mechanizmusa, valamint a szerző beszélőgépének leírása]. Wien: J. V. Degen. Kent, Raymond D. 1996. The speech sciences. San Diego & London: Singular Publishing Group. Ladd, D. Robert 1996. Intonational phonology (Cambridge Studies in Linguistics 79). Cambridge: Cambridge University Press. Lehiste, Ilse – Gordon E. Peterson 1961. Transitions, glides and diphthongs. Journal of the Acoustical Society of America 33: 268–277. Liberman, Alvin M. – Franklin S. Cooper – Donald P. Shankweiler – Michael Studdert-Kennedy 1967. Perception of the speech code. Psychological Review 74: 431–461. Liberman, Alvin M. – Ignotius G. Mattingly 1985. The motor theory of speech perception revised. Cognition 21: 1–36. Lindblom, Björn 1990. Explaining phonetic variation: A sketch of the H&H theory. In: William J. Hardcastle – Alain Marchal (szerk.): Speech production and speech modeling. Dordrecht: Kluwer. 403–440. Lisker, Leigh – Arthur Abramson 1967. Some effects of context on voice onset time in English stops. Language and Speech 10: 1–28. MacWhinney, Brian – Csaba Pléh – Elizabeth Bates 1985. The development of sentence interpretation in Hungarian. Cognitive Psychology 17: 178–209. Mády, Katalin – Uwe D. Reichel 2007. Quantity distinction in the Hungarian vowel system – Just theory or also reality? In: Proceedings of the 16th International Congress of Phonetic Sciences, 1053–1056. Saarbrücken. McClelland, James L. – Jeffrey L. Elman 1986. The TRACE model of speech perception. Cognitive Psychology 18: 1–86. Miller, Roger L. 1953. Auditory tests with synthetic vowels. Journal of the Acoustical Society of America 25: 114–121. Nosofsky, Robert M. 1986. Attention, similarity, and the identification-categorization relationship. Journal of Experimental Psychology 15: 39–57. Perkell, Joseph – Suzanne E. Boyce – Kenneth N. Stevens 1979. Articulatory and acoustic correlates of the [s–S] distinction. In: Jared J. Wolf – Dennis H. Klatt (szerk.): Speech communication papers, 97th Meeting of the Acoustical Society of America. New York: American Institute of Physics. 109–113. Péter Ágnes 1991. Neurológia – neuropszichológia 4. kiadás. Budapest: Tankönyvkiadó. Peterson, Gordon E. – Harold L. Barney 1952. Control methods used in a study of the vowels. Journal of the Acoustical Society of America 24: 175–184.



Mády Katalin

Pickett, James M. (szerk.) 1999. The acoustics of speech communication: Fundamentals, speech perception theories, and technology. Boston & New York: Ally and Bacon. Pisoni, David B. 1977. Identification and discrimination of the relative onset time of two component tones: Implications for voicing perception in stops. Journal of the Acoustical Society of America 61: 1352–1361. Pompino-Marschall, Bernd 2003. Einführung in die Phonetik. Berlin & New York: de Gruyter. Roberts, Martin – Quentin Summerfield 1981. Audiovisual presentation demonstrates that selective adaptation in speech perception is purely auditory. Perception and Psychophysics 30: 309–314. Samuel, Arthur G. 1981. Phonemic restauration: Insights from a new methodology. Journal of Experimental Psychology: General 110: 474–494. Scott, Sophie K. – Ingrid S. Johnsrude 2003. The neuroanatomical and functional organization of speech sperception. Trends in Neurosciences 26: 100–107. Stevens, Kenneth N. 1989. On the quantal nature of speech. Journal of Phonetics 17: 3–45. Stevens, Kenneth N. 2002. Toward a model for lexical access based on acoustic landmarks and distinctive features. Journal of the Acoustical Society of America 111: 1872–1891. Strange, Winifred 1989. Dynamic specification of coarticulated vowels spoken in sentence context. Journal of the Acoustical Society of America 85: 2207–2217. Strange, Winifred 1999a. Perception of consonants: From variance to invariance. In: Pickett (1999, 166–182). Strange, Winifred 1999b. Perception of vowels: Dynamic consistency. In: Pickett (1999, 153–165). Syrdal, Ann K. – H. S. Gopal 1986. A perceptual model of vowel recognition based on the auditory representation of American English vowels. Journal of the Acoustical Society of America 79: 1086–1100. Szentágothai János 1971. Functionalis anatomia I–III. Budapest: Medicina. Tarnóczy Tamás 1982. Zenei akusztika. Budapest: Zeneműkiadó. Tarnóczy Tamás 1984. Hangnyomás, hangosság, zajosság. Budapest: Akadémiai Kiadó. Traunmüller, Hartmut 1981. Perceptual dimension of openness in vowels. Journal of the Acoustical Society of America 69: 1465–1475. Vicsi Klára 1981a. Az időtartam szerepe néhány mássalhangzótípus hallás alapján történő megkülönböztetésében. Magyar Fonetikai Füzetek 7: 59–66. Vicsi, Klára 1981b. The most relevant acoustical micro-segment and its duration necessary for the recognition of unvoiced stops. Acustica 48: 53–58. Warren, Richard M. 1970. Perceptual restoration of missing speech sounds. Science 167: 392–393.

A beszédpercepció helye a teljes megértési folyamatban



The role of speech perception in language processing Abstract: The input to models of spoken language processing is the acoustic signal that is projected on abstract phonological units which participate in higher cognitive processes. However, it is not clear in what way the physically measurable, continuous, and highly variable acoustic signal is transformed into a sequence of abstract and discrete units forming a closed set. The paper starts with a description of the perception of segmental and suprasegmental units based on psychoacoustics. In the next part six relevant models of speech perception are presented that seem to be partly contradictory at first sight. They take either the acoustic signal or articulatory processes as their input and result in the identification of phonemes with distinctive features as their output. The theories are: motor theory, quantal theory and LAFF, direct realist theory, H&H theory, exemplar theory and the trace model. Finally, the models are summarised and the relationship between speech perception and higher linguistic processes is discussed. Keywords: speech perception, hearing, psychoacoustics, perceptual models, cognition

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán Prószéky Gábor MTA–PPKE Magyar Nyelvtechnológiai Kutatócsoport, Pázmány Péter Katolikus Egyetem, Információs Technológiai Kar és Morphologic Kft, Budapest [emailprotected]

Miháltz Márton MTA–PPKE Magyar Nyelvtechnológiai Kutatócsoport és Magyar Tudományos Akadémia, Nyelvtudományi Intézet [emailprotected]

Kuti Judit Magyar Tudományos Akadémia, Nyelvtudományi Intézet [emailprotected]

Kivonat: Tanulmányunkban bemutatjuk a hazai és nemzetközi nyelvtechnológiai kutatások egyik központi szereplőjét, a WordNet adatbázist, különös tekintettel a kognitív tudományi szempontból is érdekes jellemzőire. Először történeti kontextusba helyezzük az adatbázistípus keletkezését, és megmutatjuk, hogy az a tény, hogy a nyelvészet, a pszicholingvisztika és a mesterségesintelligenciakutatás fejlődésének szerencsés találkozási pontján születettek a wordnetek, nagyban hozzájárult az elterjedésükhöz. Bemutatjuk továbbá a Magyar WordNetet, illetve ennek néhány, kognitív tudományi szempontból releváns jellegzetességét. Végül felvázolunk két, a Magyar WordNethez kapcsolódó kutatást, amelyek közül az egyik a Magyar WordNet jelentésegyértelműsítésben való felhasználására, a másik a Magyar WordNet igéinek szemantikus megszorításaival való automatikus kiegészítésére irányul. Kulcsszavak: lexikális szemantika, számítógépes nyelvészet, ontológiák, wordnet, jelentés-egyértelműsítés

. A lexikon a nyelvészet, a mesterséges intelligencia, a pszicholingvisztika és a nyelvtechnológia világában Tanulmányunkban megpróbálunk egyrészt madártávlatból ránézni a wordnetekre, mint olyan „műfajra” (valójában: adatbázis-típusra), amely a nyelvészet, a pszicholingvisztika és a mesterségesintelligencia-kutatás fejlődésének szerencsés találkozási pontján született. Másrészt bemutatjuk a Magyar WordNetet, mint a mai nyelvtechnológiában fontos szerepet játszó, újításokat is tartalmazó lexikális



Prószéky Gábor – Miháltz Márton – Kuti Judit

adatbázist, néhány kognitív tudományi szempontból releváns újítást kiemelve. Végül bemutatunk néhány, a Magyar WordNethez kapcsolódó aktuális hazai kutatást. A lexikon a szinkrón – akár elméleti nyelvészeti, akár nyelvtechnológiai indíttatású – nyelvi rendszerek számára központi jelentőségű, hiszen a mindenkori háttértudást, a szinkrón adatokból ki nem számítható információt tárolja. A lexikon tehát a nyelvi egységek egyfajta tárháza, és a benne szereplő elemekkel kapcsolatban olyan ismereteket tartalmaz, amelyek az adott nyelvi elem valamely kontextusban való megjelenésekor a feldolgozást, illetve értelmezést végző kognitív rendszer számára szükségesek lehetnek. A lehetséges lexikális reprezentációk közti különbségek itt kezdődnek: attól függően, hogy milyen a feldolgozás jellege és mélysége, más és más adatra lehet szükség. A lexikális szemantika a nyelvi egységekhez, a szavakhoz és kifejezésekhez kapcsolódó enciklopédikus tudást kutatja; foglalkozik a nyelvi elemek különböző jelentéstani szempontok alapján történő osztályozásával, és próbálja megérteni, hogy milyen alapelemekből épül fel a nyelvi egységek jelentése a különböző nyelvekben. Kutatása tárgya továbbá, hogy a nyelvi egységek jelentése hogyan járul hozzá a mondat jelentéséhez és milyen viszonyban áll a mondatszintaxissal. A lexikális szemantika kutatói nem utolsó sorban a nyelvi egységek és a mögöttük meghúzódó fogalmak közötti relációk természetéről is igyekszenek többet megtudni. A generatív grammatika eredeti elképzelése szerint a mondattan nincs tekintettel a szemantikára. A sztenderd elméletben a mondatjelentést a mondat mélyszerkezete határozza meg (Chomsky 1965). A hatvanas évek folyamán mondattani és szemantikai meggondolásokból a mélyszerkezet egyre absztraktabbá vált, és egyre többször jelentek meg a mondatszintaxis mellett másféle, többnyire a predikátumkalkulusból ismert és a jelentésábrázolás irányába mutató formulák is. Az önálló lexikális reprezentációra utaló egyik első jel a jegyek megjelenése volt a lexikonban. A Katz és Fodor (1964) által ismertté tett szelekciós megszorítások a való világban értelmetlen konstrukciók kizárására készültek, például ezek nem engedték létrejönni a Lajos hegedűt iszik, vagy A szekrény átszólt a szomszédba és a jelentéstani szempontból hasonlóan abszurd szerkezeteket. Itt a jegyek tehát egyfajta szelekciót jelentettek, hogy az addig oszthatatlanként kezelt szintaktikai kategóriák szerkezetét finomítsák. Az első jegyek az élő–élettelen, az ember–nem ember, a férfi–nő és hasonló egyszerű megkülönböztetések megtételére szolgáltak, hiszen ezek a nyelvtani szerkezet szintjén is sokszor releváns kategóriák. A generatív nyelvelmélet szófaji kategóriáiról az is kiderült időközben, hogy nemcsak hogy nem oszthatatlanok, hanem valamilyen értelemben nem is diszjunktak: egyfajta kontinuumot alkotnak. Maga Chomsky (1965) is épített a szófaji kategóriák jegyek segítségével történő alosztályozására, aztán az évtized

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

vége felé Fillmore (1968) munkái bizonyították, hogy a mélyszerkezet leírásához is a jegyek a leglogikusabban használható segédeszközök. Megjelent tehát az összes szótári egység (a szavak és szerkezetek) jegyekkel való osztályozásának igénye, és a hatvanas évek végére kialakult lexikon már egy részben szemantikus jegyekkel jellemezhető nyelvi ismerettár. A modern nyelvészeti gondolkodással egy időben, ám attól teljesen függetlenül, a hatvanas években a mesterséges intelligencia kutatása is nagy lendülettel elindult. Az első elképzelések valóban az emberi intelligenciának a lehetőségekhez képest teljes modellálását tűzték ki célul. Az csak több évtized után vált világossá, hogy bár ezekből az elképzelésekből egy nagyon szofisztikált programozási módszertan és mindenféle erre épülő technológia fejlődött, a tényleges modellálás messze elmaradt a várakozásoktól. A szekvenciális – de a korábbiakhoz képest elképzelhetetlenül gyors – számítógép mára már inkább csak az újságírók hasonlataiban „elektronikus agy”. Az agymodelleket, az emberi gondolkodás, de még a nyelvfeldolgozás alapvető modelljeit sem elsősorban csak a mesterséges intelligenciának nevezett informatikai tudományterülettől várjuk. Ez azonban a hatvanas években még nem volt ennyire világos. Így történhetett, hogy a mesterségesintelligencia-kutatás területén akkortájt született számítógépes nyelvi modelleknek egyes kutatók igen hamar igyekeztek pszichológiai realitást adni, azaz az emberi információfeldolgozás egyfajta modelljeként tekinteni rájuk. Az első népszerű irány a mentális reprezentációk modelljeinek gondolt szemantikus hálók világa volt. Először Quillian (1968) mutatta be, hogy a világ legtöbb fogalma közötti kapcsolatokat le lehet írni egy egyszerű is-a hierarchiában, amely többé-kevésbé a könyvtári osztályzásból is ismert „alárendelt– fölérendelt” megfeleltetés. Hamarosan további relációk jelentek meg: a part-of („rész–egész” reláció) és has-a („van neki” reláció) kapcsolatok segítségével a világnak elsősorban a nominális részét lefedő szemantikus reprezentációk készíthetők. Ezek a modellek szintén a nyelv szavai közötti kapcsolatrendszert szándékoztak leírni, de mivel kialakulásuk a mesterséges intelligencia és a pszicholingvisztika határmezsgyéjén történt, kevésbé befolyásolta őket a generatív nyelvelmélet szótáraiban megjelenő és egy kicsit ugyancsak a szemantika felé tartó osztályzási tendencia. Az elméleti nyelvészet a szemantikus hálók világára több okból sem reagált. Egyrészt a számítógépesek modelljei nem követték az akkori modern nyelvészetben még egyeduralkodónak számító chomskyánus felfogást, másrészt a szemantika meglehetősen pontatlanul volt definiálva ezekben a modellekben: a nyelvi jelentés és a világismeret keveredett benne, és mint ilyen, nem számíthatott a „komoly” nyelvészek érdeklődésére. Más irányból való közelítések is megjelentek a világismeret és a nyelv közös működtetésének problémájával kapcsolatban: Schank (1975) mentális repre-



Prószéky Gábor – Miháltz Márton – Kuti Judit

zentációja például meglehetősen eltávolodott a hagyományos nyelvi modellektől, amikor a(z angol) nyelv igéit tizenegynéhány alapvető osztályba sorolta, mondván, hogy ezek az általánosított igék konkrét argumentumaikkal együtt jól meghatározzák, hogy pontosan melyik nyelvbéli igéről is van szó. A fogalmi függőségnek nevezett elmélet tehát nem szójelentésekkel, hanem komplex fogalmakkal, pontosabban a nyelvi szerkezetek konceptualizációjával, „fogalmasításával” dolgozott. A fogalom megjelenése fontos mozzanat, mert az elméleti nyelvészet reprezentációi mind a szavak szintjét célozták meg, és ezért a szövegek megértésén fáradozó számítógépes nyelvészek és pszicholingvisták számára nem adtak elegendő háttérismeretet. Nyilván egy ige ábrázolásában sem a „fogalmasított” cselekvés, sem az ennek argumentumaiként szereplő fogalmak nem lesznek egyedileg jellemzők az igére, ám az összekombinált szerkezet már igen. Schank modelljében például a megiszik és az injekciót kap „metaigéje” az, amelyik lehetővé teszi a bejutást, méghozzá folyadék bejutását egy élő szervezetbe, és az a konkrét testrész jelenti a szignifikáns különbséget, amin keresztül a bejutás történik, tehát a száj, vagy a bőrfelület. Ennek megfelelően az ábrázolás ezeket a világismeretből vett elemeket mind tartalmazta, lehetővé téve olyan típusú következtetések gépi véghez vitelét, amelyekhez hasonlót pusztán nyelvészeti alapon egyáltalán nem lehetett megcsinálni. Így az egyszerű lexikális reprezentáció mögött megjelent egy komplex leírás, amely sokszor olyan fogalmi viszonyokat is képes volt ábrázolni, amelyek nem a közvetlen nyelvi bemenetből származtak, ám amelyeknek az elemeit használjuk a nyelvi megértési folyamatban. Mivel a fogalmasítás lehetővé tette, hogy az implicit viszonyokra is úgy hivatkozzunk, mintha azok az adott szövegkörnyezetben szerepeltek volna, a sztereotip eseteket is lehet így ábrázolni. Ezt az illető fogalom mögött meghúzódó forgatókönyvnek nevezte Schank, amelyben megadta az adott fogalommal kapcsolatos szituációban előforduló szokásos tárgyakat, és a fogalom tipikus előfordulásakor elvárható események sorrendjét. Természetesen egy ilyen mélységű leírás nem egykönnyen készíthető el egy elméleti vagy egy gépi nyelvi rendszer minden szavához teljes mélységben, ezért nehezen működtethető, így az elképzelés elsősorban laboratóriumi szinten maradt, és ma már látjuk, hogy a pszicholingvisztikára nagyobb hatással volt, mint a számítógépes nyelvészetre. A mesterséges intelligencia egyik atyja, Minsky korai kutatásainak középpontjában sem az egyes szavak, hanem az ún. keretek álltak. A keretek tulajdonképpen speciális adatszerkezetek, és alapvetően sztereotipikus dolgok és szituációk reprezentálására szolgáltak. Ez a gondolat már korábban is megjelent, de Minsky érdeme elsősorban a formális megfogalmazás (Minsky 1975), amely sok hasonlóságot mutat a fogalmi függőség elméletéből kinőtt forgatókönyvekkel. Minsky ezeket a fogalmi kereteket eredetileg a vizuálisan felfogható jelensé-

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

gek leírására szánta, de mivel a felidézés sokszor nem látás, hanem például egy kimondott mondat útján jön létre, hamar felmerült az igény a keretek nyelvfeldolgozásban való alkalmazására. Ennek folytatásaként Charniak Minsky ötletét továbbfejlesztve, kimondottan nyelvfeldolgozási célra létrehozott egy olyan keretelméletet, amelyben a mindennapi gondolkodás következtetési lépései döntő szerepet játszottak (Charniak 1976). Egy másik korai lexikális szemantikai elképzelés Wilks (1972) preferenciális szemantikája volt, amelynek legfontosabb jellemzője, hogy a szövegrészletek lehetséges interpretációi közül a mért szemantikai sűrűségnek megfelelően kell kiválasztani a preferált interpretációt. A szemantikai sűrűség azt méri, hogy a szöveg egy eleme mennyire elégíti ki szomszédjai „elvárásait”. A preferenciák használata tehát egy olyan lexikont feltételez, amelyben a szavakról, azok preferált funkcióiról, az igék és a főnévosztályok közötti feltételezett eset- és jelentésviszonyairól szóló nagyszámú ismeret tárolva van. Az elképzelés minden szó mellett felsorolja ezeket, például azt, hogy a varr ige eszközhatározós esete leírja a tűt. Ugyanakkor a tű formulája azt mondja el, hogy a tűt általában varrásra használják. Nyilván a tű a legmegfelelőbb eszköz a varráshoz, de ha egy tűhöz hasonló tárgyat vennénk (pl. egy végén lyukas halcsontot), a formulák akkor is illeszkedni fognak egymáshoz, azaz a szemantikus sűrűség akkor is elég nagy lesz, bár nyilván kisebb, mint a tű esetében. A varr ugyan a tű lexikális egységet preferálja eszközként, de elfogadható lesz számára a halcsont is. A felsorolt lexikális reprezentációk közös vonása az volt, hogy megpróbáltak háttértudást adni a feldolgozandó szövegekben előforduló nyelvi egységek helyes feldolgozásához. A bemutatott első elképzeléseknek egyik komoly hibája az volt, hogy nem voltak megfelelően formalizálva, így nem igazán keltették fel a nyelvi jelentés kezelésében még meglehetősen bizonytalan kortárs elméleti nyelvészek érdeklődését. A generatív nyelvészet a hatvanas évek végére ugyanis a szemantika kezelését egyértelműen a logikai rendszerek bevonásával szándékozott megoldani. A predikátumkalkulusról hamar kiderült, hogy nem alkalmas a természetes nyelvi jelentések ábrázolására. Ezért a kutatások egyrészt egy „természetes logika” megalkotását tűzték ki célul, míg mások az időközben megjelent szintén logikai (de magasabb rendű, intenzionális logikával operáló) Montague-leírást dolgozták tovább, és ehhez építettek speciális lexikonokat (Partee 1973). Gyakorlatilag a hetvenes évek végére a modern nyelvészetben megszületett egy olyan formális szemantika, amely meglehetősen sok nyelvi ténnyel tudott már számolni. A számítógépes nyelvi rendszerekben való gyakorlati használatot viszont meglehetősen befolyásolta, hogy a logikai felfogás nem foglalkozott az olyan, fontosnak tűnő megfigyelésekkel, hogy a predikátumok denotátumai hogyan helyezkednek el a „szemantikai térben”. A logikai rendszerek ugyanis nem adnak számot például a formailag igen hasonló, azonos argumentumszámú



Prószéky Gábor – Miháltz Márton – Kuti Judit

predikátumok jelentős nyelvi különbségéről (pl. kutya(x), zöld(x) és fut(x)). Ezt a problémát viszont a szemantikus hálók világa jól tudja kezelni, ám az ő közelítéseik nemigen értek össze a logikai elméletekkel. Ezért volt értékes a későbbiekben Sowa (1984) kísérlete, amelyben a szemantikus hálókat közelebb hozta a logikai jelentésreprezentációkhoz. Sowa fogalmi gráfjai egyfajta kapcsolatot jelentettek a korábbi mesterségesintelligenciai–pszicholingvisztikai reprezentációk és a számítógépesen is jól kezelhető logika között. Kísérletei, sok más kísérlethez hasonlóan, egy-egy komolyabb kutatóintézményen belül1 sikeresen működtek, ám az egész nyelvfeldolgozási szakterület közvetlenül nem részesedett a nagy nemzetközi cégeken belül folyó reprezentációkutatás eredményeiből. Így volt ez később a Microsoft MindNet rendszere esetében is: csak részleges információk kerültek ki, a rendszer egészét a „külvilág” egészében nemigen ismerhette meg (Dolan et al. 1998). A szavak és kifejezések átfogó és egységes szemantikus leírására egy erre specializálódott nagyméretű vállalkozás is indult 1984-ben: a CyC (Matuszek et al. 2006). Ez a nyelvi egységek közötti relációkat a korábbi szemantikus hálókhoz hasonlóan, de azoknál lényegesen kidolgozottabb módon szándékozott kezelni. Mivel a hosszú évekig készített teljes rendszert csak komoly anyagi ellenszolgáltatásért lehetett igénybe venni, aprólékos kidolgozottsága, valamint az adatbázis egy részének egy idő után nyílt forráskódú közreadása ellenére sem vált a mindennapok számítógépes nyelvészetének lexikális kiindulópontjává. A nyolcvanas években azonban áttörés történt a lexikális szemantika területén: a mentális szótárak elméleti kutatásai és a gyakorlatban is használható méretű szemantikus hálók építése találkozási pontjánál kialakult egy formalizmus, amely azóta is töretlen népszerűséggel bír a nyelvi tudásreprezentációk – illetve egyre terjedő szakzsargonnal: a számítógépes ontológiák2 – területén. A modern nyelvészet kezdetén alapműnek tekintett Chomsky–Miller (1963) egyik szerzője, George Miller, a nemrégiben elhunyt világhírű pszichológus új oldaláról mutatkozott be a nyolcvanas években: a Princeton Egyetem Kognitív Tudományi Laboratóriumában egy olyan lexikális adatbázis kialakítását vette célba munkatársaival, amely – eltérően a korábbi szemantikus hálóktól – a(z angol) nyelv szavainak és a fogalmaknak egy igen ügyes megkülönböztetésére épült (Miller et al. 1990a;b; Fellbaum 1998b).

1 Az ő esetében ez az IBM volt. 2 A szemantikus hálóknak manapság sokszor a lexikális tudásbázis nevet adják, de az utóbbi időben az informatikában az ontológia (sőt, többes számban is: ontológiák) kifejezés egyre inkább tért hódít, ami az eredeti jelentés, a „lét tudománya” helyett sokkal inkább egy formálisan ábrázolt tudáshalmaz számítógéppel is használható fogalmi leírására utal.

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

. A Princeton WordNet Miller figyelme eredetileg a szójelentések számítógépes ábrázolásának dekompozíciós megközelítésére irányult, amelynek alapján a szójelentések visszavezethetők lennének fogalmi primitívekre (fogalmi atomokra) és a közöttük értelmezett kompozícionális műveletekre (Miller–Johnson-Laird 1976). A kezdeti lelkesedést azonban lehűtötte az a tény, hogy sehogy sem sikerült a fogalmi atomok kimerítő, a számítógépes ábrázolás számára megfelelő listáját előállítani. Így Millerék érdeklődése az 1985 körüli időszakban egyre nagyobb teret nyerő relációs lexikai szemantikai elméletek felé fordult, amelyek a szójelentéseket hálózatokban, szemantikai relációkkal strukturálva ábrázolták.3 Eredeti céljuk az egyetemükön folyó pszicholingvisztikai kutatások támogatása volt gépi eszközökkel, és ehhez kellett egy ilyen egységes, korábban sokak által ígért, de senki által létre nem hozott lexikális adatbázis. Így jött létre a Princeton Egyetemen – az USA haditengerészetétől és más forrásokból támogatva – a WordNet projekt. Célja tehát a korai időszakban még csak annak tesztelése volt, hogy a relációs lexikálisszemantika-elméletek kiterjeszthetők-e a „játék” illusztrációs modellek szókincsének nagyságrendjén túlra. Ahogy kezdett kiderülni, hogy az elmélet felskálázható lehet, kezdett megmutatkozni a projekt eredményeinek járulékos haszna is. Ahogy nőtt a WordNet lefedettsége, létrehozói és más kutatók egyre több alkalmazásban használták, ami következésképpen egyre újabb és jobb rendszer fejlesztését ösztönözte. Az elképzelés sikeresebb lett, mint maguk a kutatók gondolták. A WordNet fejlődését nemcsak a jól kijelölt kiindulás, hanem a számítástechnikának, és főként a számítógépes hálózatoknak a fejlődése nagyon meggyorsította. Gyors elterjedését az informatikában a Linux operációs rendszeréhez lehet csak hasonlítani, amelynek a sikerében szintén az volt az egyik összetevő, hogy szabadon hozzáférhetővé tették a szerzők, azaz a növekvő kutatói hálózat minden tagjának lehetett „beleszólása” a rendszer fejlődésébe. Persze ez nagyon szabályozott módon történt, tehát míg a korábbi operációs rendszerek, illetve szemantikus hálók szigorúan egy-egy intézményen belül jöttek létre, pénzért kerültek forgalomba, és változtatásukat csak a létrehozó vállalkozás megfelelően kvalifikált kutatói végezhették el, a Linux operációs rendszerhez, illetve a WordNet lexikális adatbázishoz bárki ingyen hozzáférhetett, és a megfelelő kvalifikáció felmutatása mellett 3 Noha a WordNet nem bontja a szójelentéseket további, értelmes összetevőkre, bizonyos szempontból rokon a dekompozíciós megközelítésekkel, így például a cause (okoz) igei reláció Jackendoff (1983) elemzéseiben a lexikai fogalmi struktúrákat összekötő szemantikai primitívként szerepel.



Prószéky Gábor – Miháltz Márton – Kuti Judit

hozzájárulhatott annak további fejlesztéséhez. Innentől kezdve a WordNet kiemelkedett a gépi nyelvészet és a pszicholingvisztika lexikális adatbázisainak világából, és fejlődése önálló útra lépett. A WordNet körüli figyelem fokozódásában szerepet játszhatott az a tény is, hogy az 1990-es évekre a nyelvészek és pszicholingvisták érdeklődésében újra hangsúlyt kapott a lexikon. Ahogy Christiane Fellbaum, a WordNet másik alapítója fogalmaz (Fellbaum 1998a), a lexikont nem csupán perifériális, rendhagyó és nem elegáns tények szemétdombjaként, hanem a nyelvtan központi komponenseként kezelő szemlélet térnyerése mögött olyan felfedezések állnak, amelyek a lexikont, mint szabályok és elvek jól szervezett tárházát, a korábban csak a szintaxisra jellemző figyelem státuszára emelik. Ismereteink alapján a szavakhoz kapcsolódó szemantikai információkon túl a lexikon azok szintaktikai viselkedését is részben meghatározó információkat is tartalmaz. Miller és csapata 1985-ben, az induló WordNet projekt kezdetén három előfeltevéssel élt (Miller 1998): 1. A különválaszthatóság hipotézise szerint egy nyelv lexikai komponense izolálható és önmagában vizsgálható. A lexikon természetesen nem független a többi nyelvi modultól, de bizonyos jelenségek arra utalnak, hogy elválasztható tőlük. Míg egy nyelv fonológiai és grammatikai komponensét elég egyszer s mindenkorra elsajátítanunk a nyelvtanulás egy korai fázisában, mentális szótárunk (intellektuálisan aktív) életünk végéig folyamatosan növekszik – valószínűleg eltérő kognitív folyamatok állnak a háttérben. 2. A mintázathasználat hipotézise szerint nem lennénk képesek birtokolni és könnyedén mozgósítani a természetes nyelvek használatához szükséges összes lexikai tudásunkat, ha nem állnának rendelkezésünkre a szavakkal kifejezhető jelentések között szisztematikus mintázatok és kapcsolatok. Mentális mintázatok ilyen rendszere legalább Platón óta vizsgálódások tárgya, de a modern nyelvészeti (és pszicholingvisztikai) kutatások segítségével kísérletek irányulhatnak ezek azonosítására a természetes nyelvek szemantikai struktúráiban. 3. A teljesség hipotézise: az előbbiekben említett munkák jó része – a WordNet előtti időkig, ahogy korábban is említettük – elvérzett a nagyságrend problémáján: egy-egy új szemantikai megközelítés megelégedett azzal, hogy elmélete illusztrációjául bemutatott 20–50 példát, a maradék (több-) százezer szó megoldását az olvasóra bízva. A számítógépes nyelvészeknek azonban, ha abban bíznak, hogy az emberével valaha is összemérhető

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

nyelvfeldolgozó rendszert lesznek képesek készíteni, szükségük lesz arra, hogy az emberi nyelvhasználókéhoz hasonló teljes lexikai tudás gépi reprezentációja álljon rendelkezésükre. Az 1980-as évekre nyilvánvalóvá vált, hogy egyes mesterségesintelligencia-kutatók által használt, körülhatárolt témakörök szókincsét kezelni képes szakértői rendszerek (Schank–Abelson 1977) felskálázhatóságával problémák lehetnek. Szükség mutatkozott egy olyan, minél teljesebb lexikális adatbázisra, amely számítógéppel jól kezelhető rendszerbe foglalja a szavakat és a szójelentéseket. A WordNet valójában egy szinkrón nyelvi tudást reprezentáló speciális szemantikai hálózat. Maga a wordnet szó is köznevesedett, jelezvén ennek a kialakult formalizmusnak egyre általánosabb használhatóságát. A wordnetek építőelemei, a szemantikai hálózat csomópontjai a – valamilyen szövegkörnyezetben – azonos értelmű szavakból, szinonimákból alkotott halmazok. Az eredeti Miller-féle terminológiában ennek a szinonimahalmaznak a neve synset. A wordnetekben minden synsethez tartozik egy rövid szöveges definíció is. Természetesen ez elsősorban nem a gépi feldolgozás, hanem az emberi felhasználó számára fontos, az adott jelentés könnyebb azonosításához. A wordnetekben – mint a legtöbb szemantikus hálóban – a synsetek közötti élek a közöttük fennálló szemantikai relációkat jelentik. Egy ilyen hálózat elsősorban a főnevek, igék, melléknevek és határozószók jelentéseit és a közöttük fennálló kapcsolatokat reprezentálja. A különböző szemantikai relációk fennállása az anyanyelvi beszélők számára nyelvi tesztek segítségével ellenőrizhető. Ezek legtöbbje egyszerű behelyettesítéses teszt, amelyekben a tesztelő egy adott szerkezetű tesztmondatba behelyettesítve a kérdéses elemeket a mondat szemantikai jólformáltságának (olykor természetesen szubjektív) megítélésével dönthet a reláció fennállásáról. A legfontosabb, a synsetek összetételét meghatározó szemantikai reláció a szinonímia, amely azonban – a többi relációval ellentétben – nem a synsetek között, hanem a synseteken belül, az ott szereplő szavak között áll fenn. A szinonimitás (vagy ahogy Miller hívja: szemantikai hasonlóság) definíciója a WordNetben: két kifejezés egymással szinonim egy C nyelvi környezetben, ha a C-ben az egyiket a másikkal felcserélve a mondat igazságértéke nem változik (Miller et al. 1990a). A későbbiekben Vossen (1999) ezt a meghatározást kiegészítette azzal, hogy két szemantikailag hasonló szó az entitások ugyanazon tartományát denotálja, függetlenül a regiszterbeli, stílusbeli, dialektusbeli különbségektől és a szavak pragmatikai használatától. Az előbbi hom*ogenitási feltételből következően két szinonim szó között nem állhat fent másféle szemantikai reláció. Emiatt például az alábbi szavak egyetlen synsetet alkotnak: rendőr, zsaru, yard, fakabát. Ugyanakkor a rendőrség szó nem lehet ennek a synsetnek a tagja, mivel van egy másik reláció (az ún. holonímia),



Prószéky Gábor – Miháltz Márton – Kuti Judit

ami a rendőr és a rendőrség fogalmak között fennáll, noha a hétköznapi (metonimikus) nyelvhasználatban gyakran egymással felcserélhetők: pl. kijött a rendőr/ rendőrség. A WordNetben tehát kézzelfoghatóan elkülönül a konceptuális/szemantikai és a lexikális szint: a hálózat alapegységei a nyelvi fogalmak, szójelentések, amelyeket egymással szinonim szavak és többszavas kifejezések halmazai reprezentálnak. Külön, ún. szemantikai relációk értelmezettek a fogalmak és külön, ún. lexikai relációk vannak az egyes szavak között. Ennek azért van jelentősége, mert bizonyíték van rá (Miller 1998), hogy a beszélők a melléknevekhez nem fogalmi, hanem szóalapon társítják az ellentétpárjukat (antonimájukat). Másfelől kísérleti adatok megmutatták, hogy a beszélők asszociációinak jelentős része szóingerekre szintagmatikus, ami további bizonyíték a szóspecifikus mentális kapcsolatok létezése mellett (Fellbaum 1998a). A Princeton WordNet szóanyagát először a különböző szófajú szavak gyakoriságát is ábrázoló Brown Corpus nyomán kezdték el összeállítani. Ehhez kapcsolódtak később a Charles Osgood szemantikusdifferenciál-módszeréhez kidolgozott melléknévpárok (Osgood et al. 1957). A szinonimák összegyűjtéséhez és rendszerezéséhez felhasználták sok nyomtatott tezaurusz anyagát is. A lefedettség növelésére több, akkor létező számítógépes lexikon anyagát, így a COMLEX szótárét is felhasználták (Macleod et al. 1994).

. Többnyelvű wordnetek A Princeton WordNet elvei alapján hamar megindult más nyelvek lexikális szemantikájának a kidolgozása. A később készült wordnetek számára a PWN szolgált mintául. 1996 és 1999 között létrejött egy olyan többnyelvű lexikális adatbázis – az EuroWordNet (EWN) –, amelyben a különböző nyelvek közötti jelentéskapcsolatok is megjelentek. Ez az adatbázis már releváns módosításokat is tartalmazott a PWN-hez képest. Az EuroWordNet adatbázis nyolc európai nyelvre kifejlesztett wordneteket takar, amelyek az angol WordNeten keresztül egymással is összeköttetésben vannak. A nyelvek közötti átjárhatóságot a Princeton WordNet synsetei alapján létrehozott nyelvközi index (ún. InterLingual Index, röviden: ILI) biztosítja. Az ILI-n keresztül felvett nyelvközi relációk alapján láthatóvá válnak például lexikális hiányok az egyes nyelvek közötti összehasonlításban. Az ILI-fogalmak listája azonban rendezetlen, közöttük nincsenek kapcsolatok; egyegy ILI-rekord a synsetből, a definícióból, a szófaj-címkéből és az eredetre utaló hivatkozásból áll.

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

Az EWN-ben az alapfogalmakat a wordnetek felső ontológiája, a felső szintű ontológia (top ontology, TO) rendszerezi. Ez magas szintű, nyelvfüggetlen fogalmak hierarchiája, amelynek minden csomópontja egy ún. magas szintű fogalom (top concept, TC). Ezeket a fogalmakat olyan meghatározó szemantikaelméletek alapján alakították ki, mint pl. az ún. qualiák elmélete (Pustejovsky 1995), vagy az Aktionsart igeosztályozás (Comrie 1976). A párhuzamos adatbázis a szókincs központi elemeiként meghatározott synsetek köré épül, és tetszőlegesen bővíthető. Ezzel olyan értékes többnyelvű lexikális erőforrás jött létre, amely segítségül szolgálhat mind fordítóprogramok, mind információkinyerő rendszerek működéséhez. Az eredeti Princeton WordNetben kezdetektől ismert volt az ún. teniszprobléma: hiányoznak az olyan fogalmi kapcsolatok, amelyek nem fogalmi hasonlóságokon vagy ellentéteken, hanem egy adott diskurzus topikjához (doménhez) közösen tartozáson alapulnak. Így például nincs olyan kapcsolat az ütő, labda, háló fogalmak között, amely megmutatná, hogy ezek mind a tenisz fogalmi körébe tartoznak (Fellbaum 1998b). Ezért az EuroWordNettel kapcsolatban említésre méltó változtatás még a Princeton WordNethez képest az új, több enciklopédikus információt hordozó role relációk bevezetése. Az ez alatt a név alatt bevezetett többfajta reláció eseményszerűségek4 tipikus szereplőit hozza kapcsolatba az eseményszerűséget leíró igével. A role reláció típusait a legáltalánosabban elfogadott tematikus szerepeknek megfelelően választották ki. A következő fogalmak pl. különféle role relációkkal vannak összekapcsolva: tanítani – tanár – diák – iskola. Az EuroWordNetet a role relációk a FrameNet projekt (Fillmore et al. 2002) keretében fejlesztés alatt álló adatbázishoz teszik hasonlóvá. A 2001 és 2004 között zajló BalkaNet projekt követte az EuroWordNet példáját, így további öt európai nyelvre készült el egy, az angol nyelven keresztül összeköttetésben lévő többnyelvű adatbázis (Tufiş 2004). Az EuroWordNet projektben alakalmazott módszertől eltérő módon a BalkaNet projektben még a PWN struktúráját is megtartották nyelvközi indexként, valamint kibővítették a projekt keretén belül elkészített wordnetek közös fogalmi csomópontjainak számát kb. 8500 fogalomra (ún. BalkaNet Concept Set, röviden: BCS). A PWN hierarchiáján kívül a BalkaNet ILI kapott még egy magasabb szintű szemantikai struktúrát, amelyet a Suggested Upper Merged Ontology (SUMO) ontológiából (Niles–Pease 2001) importáltak. A SUMO általános fogalmakat definiáló felsőszintű ontológia, amely különböző publikus ontológiai tartalmak egyesítésével született. A SUMO választása mellett szólt, hogy a PWN synsetjei és a SUMO kategóriái között már létezett megfeleltetés, valamint hogy 4 Az eseményszerűség terminust Bach (1986)-ra támaszkodva használjuk.



Prószéky Gábor – Miháltz Márton – Kuti Judit

a SUMO ötvözte több különböző terület erőforrásait és szabadon hozzáférhető volt. A két említett projekt eljárásai alapján általában két wordnet-építési módszert különböztet meg a WordNet-közösség: az összevonásos és a kiterjesztéses módszert. Az összevonásos módszerben (Merge Model) a lokális alapfogalmakat valamilyen saját erőforrásból kiindulva választják ki, belőlük a synseteket és a köztük lévő relációkat önállóan fejlesztik ki, majd ekvivalencia-relációkkal leképezik őket a PWN synseteire. A kiterjesztéses módszer (Expand Model) szerint a lokális alapfogalmakat a PWN-ből választják ki, és a kiválasztott synseteket (kétnyelvű szótárak segítségével) lefordítják az ekvivalens saját synsetekre. Ebben a megközelítésben a belső relációkat a PWN-ből örökli az új wordnet, és a továbbiakban, amennyire lehet, egynyelvű erőforrások segítségével ellenőrzik őket. Mindkét fejlesztői megközelítés alkalmazásában fontos szempont az automatizálható, különféle heurisztikus algoritmusokkal közelítő megoldást adó módszerek és a csak emberi, kézi munkával elvégezhető munka aránya. Számos, Princeton WordNetet követő, egyéb nyelvi wordnet megvalósításában felhasználtak automatikus módszereket (Atserias et al. 1997; Farreres et al. 1998; Barbu– Barbu Mititelu 2005). A Magyar WordNet fejlesztése során ehhez hasonlóan fontos szempont volt, hogy a költséges emberi munkamennyiség „kárára” minél több erőfeszítést lehessen automatizálni. A projektben olyan gépi információszerző és -kivonatoló eszközöket fejlesztettünk, amelyek létező (elektronikusan feldolgozható) forrásokból – kétnyelvű szótárak fordítási párjai, egynyelvű (értelmező) szótárak definíciói és egyéb szótári jelzetei, tezauruszok fogalmi csoportjai, morfológiai elemzőkkel azonosított morfoszemantikai viszonyok stb. – merítve javaslatokat tettek a készülő Magyar WordNet synseteinek anyagára (Prószéky–Miháltz 2008; Miháltz 2010). A kézi erővel elvégzett munka ezután ezek ellenőrzését és szerkesztését (jóváhagyás, javítás, törlés, kiegészítés) érintette. A szemantikai relációkat a Magyar WordNet automatikusan a PWN-ből örökölte (a két wordnet fogalmai között teljes megfeleltetés van). Az angol fogalmi viszonyok ellenőrzése, a hierarchiáknak a magyar nyelv szemantikai paradigmájához adaptációja már teljes mértékben kézi erőfeszítéssel történt. A választ arra a kérdésre, hogy hol húzódik a határ az automatizálható és a csak emberi szakértői intuíció bevonásával megválaszolható kérdésekre a wordnetek fejlesztésében, valószínűleg mind a nyelvtechnológiában jelenleg elérhető legjobb módszerek, mind a humán nyelvi és világismereti tudás jelenlegi gépi ábrázolhatósága, a mesterséges intelligencia jelenlegi erőforrásainak minősége meghatározza. Az első aspektus vizsgálatára irányuló mérések megmutatták, hogy az alkalmazott gépi módszerek a kész, emberi munkával ellenőrzött Magyar

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

WordNet synsetjeinek 52-ában tettek automatikus javaslatot lexikai elemekre, és az összes synset 39-a tartalmaz legalább egy, automatikusan ajánlott szinonimát (Miháltz 2010).

. A Magyar WordNet és újításai A Magyar WordNet (HuWN) mintegy 42 000 fogalmi csomópontot tartalmaz. A szófajok közötti arányok (főnév, ige, melléknév, határozószó) a Magyar Nemzeti Szövegtár szófaji megoszlását követik. A HuWN minden csomópontja nyelvközi relációval utal a jelentésben neki megfeleltethető vagy a hozzá legközelebb álló Princeton WordNet synsetre. A felvett szókincs teljes egészében lefedi a BalkaNet projektben kiválasztott mintegy 8500 ún. „BCS” synsetet. A nemzetközileg sztenderdizált szókincsen túl a Magyar WordNetben megtalálhatók az egyes szófajok leggyakoribb, a magyar nyelvre jellemzőnek ítélt fogalmai is. A főnevek és melléknevek esetében a Magyar Nemzeti Szövegtár (MNSZ) lemmagyakorisági listáit, illetve az Értelmező Kéziszótár (ÉKsz.) elektronikus változatában a definíciók szemantikai elemzéseit felhasználva kerültek kiválasztásra a relevánsnak ítélt fogalmak (Hatvani et al. 2006; Prószéky–Miháltz 2008). Az igék esetében az MNSZ-ben azonosított leggyakoribb igei vonzatkeretek biztosították a leggyakoribb, relevánsnak ítélt jelentések kiválasztását. A Magyar WordNet alapvető célja tehát az általános szókincs lefedése, de struktrúrájából adódóan tetszőlegesen bővíthető szaknyelvek irányába. A HuWN a gazdasági-üzleti szaknyelv irányába tartalmaz bővítést. A szaknyelvi fogalmak száma meghaladja a kétezret. Bár a Magyar WordNet belső felépítését tekintve nagyban követi a PWN-t, bizonyos módosításokat, újításokat tartalmaz a mintául szolgáló WordNethez képest. Ezeknek egy része módszertani meggondolásokra vezethető vissza, mások szófaj-, illetve nyelvspecifikusak. A Magyar WordNetben a Princeton WordNethez képest bevezetett újítások többsége szintén ilyen jellegű. Ezek nagyrészt az igei, kisebb részben a melléknévi WordNetet érintik. A melléknévi WordNet meghatározó struktúrája a kétpólusú klaszter (ennek alapját az antonimarelációra épülő szembeállítás és a két pólus körüli hasonlósági relációk képezik). A Princeton WordNetből átvett klaszteres struktúrát a HuWN-ben két új relációval egészítettük ki. Bár ezek száma szinte elenyésző az antonima- és hasonlósági relációkéhoz képest, elméleti jelentőségük van. Azokra az esetekre, amikor két ellentétes melléknév között – kvázi „félúton” – egy olyan melléknév helyezkedhetik el, amely jelentésével a két „szélső” melléknév által meghatározott skála középpontját adja meg, bevezettük a middle relációt. Például az {amfoter} synset middle relációban van a {savas} és a {lúgos}



Prószéky Gábor – Miháltz Márton – Kuti Judit

synsetekkel, ahogy pl. a {semleges} synset is middle relációban van a {pozitív} és {negatív} synsetekkel. A HuWN-ben ez a „középső” melléknév nem áll antonimarelációban a két „szélső” melléknévvel, bár a PWN ezt a relációtípust terjesztette ki az ilyen esetekre is, azaz három melléknévi synset között körkörösen vett föl antonimarelációt. Szintén az ilyen három (vagy még több) synsetre vonatkozó antonimarelációt szüntettük meg a partitions reláció bevezetésével. Ez a reláció olyan melléknévi synsetetket kapcsol főnévi synsetekhez, ahol a melléknév hatóköre korlátozott; csak egy adott szemantikai típusú főnévre vonatkozhat. Például az {egynyári}, a {kétnyári}, és az {évelő} melléknévi synsetek partitions relációban állnak a {növény} synsettel, ahogy a {működő, aktív}, {kialudt} és {alvó, inaktív} synsetek is partitions relációban állnak a {vulkán} synsettel. Mindkét relációtípus bevezetésével pontosabbá tettük a szemantikai kapcsolatok ábrázolását a WordNetben. Az igei WordNetet érintő újítások szinte kivétel nélkül azért kerültek bevezetésre, mert az angol igék szemantikai viszonyait reprezentáló háló nem mindig tűnt ideálisnak a magyar igék szemantikai viszonyainak ábrázolására. Például az angol nyelvvel ellentétben a magyarban az ige eseményszerkezetére vonatkozó információ – aspektus, akcióminőség – gyakran morfológiailag is megjelenik, azaz lexikális szinten fejeződik ki az, amit az angolban a szintaxis fejez ki (vö.: Az udvaron száradtak az ingek./The shirts were drying in the yard. és Az udvaron megszáradtak az ingek./The shirts have dried in the yard.) Mivel egy ige eseményszerkezete meghatározza, hogy milyen következtetésekben vehet részt, s a wordnetekben a relációk alapját logikai következtetéseken alapuló nyelvi tesztek alkotják, az igei szemantikai háló kialakításakor az eseményszerkezetet figyelembe akartuk venni. Célunk az volt, hogy egyrészt az igék belső eseményszerkezetével kapcsolatos információt tegyünk hozzáférhetővé a WordNetben, másrészt, hogy bizonyos, eseményszemantikai (és világismereti) szempontból összetartozó igék, illetve melléknevek összetartozását egyértelművé tegyük. Az igei WordNetet érintő újítások tehát kognitív tudományi vonatkozásúak, hiszen főleg a temporalitással, illetve az eseményszemantikával függenek össze. A WordNetben implementált újítások mögött meghúzódik az az alapvető – és így sokszor ki sem mondott – kognitív tudományi feltevés, hogy szavaink bizonyos, az agyban mentális reprezentációval rendelkező fogalmak lexikalizált megjelenései. Ez a feltevés bizonyos, összetartozónak ítélt igék hármas egységben való ábrázolásakor játszik fontos szerepet. Az említett ábrázolásmódot Moens és Steedman (1988) munkájára támaszkodva dolgoztuk ki. Az ún. nukleusz-struktúra implementálásának részletes leírása Kuti et al. (2006)-ban található.

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

Moens és Steedman az eseményszerűségeknek Vendler (1957) által készített felosztásán alapuló, de annál finomabb rendszerét vezeti be, amelynek központi fogalma az (esemény)nukleusz. Egy idealizált eseményszerűség maximálisan három összetartozó komponensből áll: előkészítő folyamat, telosz/sikerpont és utóállapot.5 Az eseménynukleusz ábrázolható rendezett hármasként: ⟨a, b, c⟩, ahol a = elkészít folyamat, b = telosz, c = utóállapot. Egy lexikalizált kifejezés mögötti konceptuális komponens meglétét aspektuális jellemzőkre érzékeny nyelvi tesztekkel lehet kimutatni. Egy adott eseményszerűséget leíró igéről aspektuális szempontból tehát az mond el valamit, hogy ezen „fölöttes” eseménykomponensek közül melyeket tölti ki konceptuálisan. Mivel a nyelvi tesztek az angol nyelvre lettek kitalálva, először egy angol példán, a walk out of the building igei frázis példáján szemléltetjük őket. Az eseménynukleusz első komponensének konceptualizáltságát tesztelhetjük a következő mondattal: ()

John was walking out of the building when I met him.

Mivel a fenti kifejezés elfogadható, ki van töltve az eseménynukleusz első komponense, azaz az előkészítő folyamat. A harmadik komponens meglétének tesztje a perfektiválhatóság (Present Perfect Simple): ()

By the time Sue arrived, John has walked out of the building.

A kifejezés elfogadható Present Perfect Simple-be téve is, azaz megállapítható, hogy a walk out of the building frázis által megnevezett eseményszerűség mindhárom nukleuszkomponenst konceptualizálja: ()

⟨walk towards the door, step over the doorstep, being out of the building⟩

Az az információ, hogy egy ige egy idealizált komplex eseményegységhez képest hány elemet konceptualizál, nem más, mint az eseményszerűség telikusságára, ill. atelikusságára vonatkozó információ. Amennyiben egy ige által leírt eseménynukleusz harmadik komponense ki van töltve, telikus eseményszerűségről, amennyiben nincs, atelikus eseményszerűségről beszélünk. 5 A három nukleusz-eseménykomponens egységként való kezelésének létjogosultságára a következő magyarázat adható: Lévén, hogy aspektológiai szempontból vizsgáljuk az eseményszerűségeket, releváns információnak kell tekintenünk, hogy ha egy-egy tetszőleges lexikalizálódott nyelvi kifejezést aspektológiai jellemzőkre érzékeny nyelvi tesztekkel (a magyarban a progresszív és a perfektív aspektus tesztjeivel) vizsgálunk, legfeljebb a fent leírt három komponens együttes megléte mutatható ki.



Prószéky Gábor – Miháltz Márton – Kuti Judit

Mivel eddig igékről, s nem igei frázisokról volt szó, fontos megjegyezni, hogy valójában egy igéről akkor tudjuk megmondani, hogy az általa lexikalizált nukleusz utóállapota vagy előkészítő folyamata ki van-e töltve, ha minimális propozícióvá alakítjuk. A run ige például, bár önmagában folyamat, azaz nincs utóállapota, a By the time the sun has set, John has run 4 kms mondat arról tanúskodik, hogy a run 4 kms frázisnak van. Ezért, amikor igékről beszélünk, valójában mindig egy adott vonzatkerettel minimális propozícióvá alakított igei frázisról kell beszélnünk. A nukleusz eseménykomponenseinek összetartozása több, mint puszta időbeli egymásutániság; az okozáshoz és a lehetővé tételhez hasonlatos, de velük nem megegyező viszony. A három nukleuszkomponens kölcsönös dependenciája miatt egyiket sem lehet saját jogán előkészítő folyamatnak, sikerpontnak vagy utóállapotnak tekinteni. Az olyan eseménytípusokat, amelyek mintha a három komponens egyikét konceptualizálnák csupán, értelemszerűen folyamatnak, pontszerű eseménynek, illetve állapotnak tekintjük attól függően, hogy melyik ez a komponens. A Magyar WordNet egyik jelentős kiegészítése az ismert wordnetekhez képest, hogy a synseteken belül, a literálok, azaz az egyes igék szintjén jelöltük az igék aspektuális tulajdonságait, a fenti, rendezett hármasként való jelöléssel. Ahogy fentebb említettük, ehhez szükséges volt, hogy a WordNet synsetjeiben előforduló jelentések/igék minimális propozíciókká alakíthatók legyenek. Ezt az biztosítja, hogy egy-egy igéhez hozzárendeltük az adott jelentésben előforduló összes vonzatkeretét. Sokszor egy-egy vonzatkeret-bejegyzés több összevont vonzatkeretet takar, opcionális argumentumokkal. Ilyenkor az igéket a minimálisan kötelező argumentumszámukkal értelmezzük. Pl. az opcionális tárggyal felvett eszik vonzatkerete esetében a tárgy nélkül képzett minimális predikátumról mondhatjuk ki atelikus voltát. Fontos megemlíteni, hogy az angol nyelvre kipróbált nyelvi tesztek magyarra való átültetése problematikusnak bizonyult. A magyarban, az angollal ellentétben, nincsenek egyértelműen használható, az igei frázisok, illetve mondatok aspektuális jellemzőire érzékeny nyelvi tesztek. Ennek megfelelően mindenképp valamilyen kompromisszumos megoldához kellett folyamodnunk, amikor az angolra kidolgozott teszteket a magyar nyelvre próbáltuk adaptálni (Kuti et al. 2006). A megoldás – bár elméleti szempontból vethet fel kérdéseket – a gyakorlati cél érdekében igen hasznosnak bizonyult. Ennek tudatában, amikor az igék aspektuális tulajdonságainak a tesztjére került sor, az adott helyzetben az angolon keresztül vezető (kerülő)utat választottuk. Az igei WordNet készítői mindannyian közel anyanyelvi szinten beszéltek angolul, és ismerték az angol nyelv aspektuális jellemzőit. Így a kutatás a készítőknek arra a hallgatólagos tudásá-

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

_s te ta

ph as e y_

nucleus_telos

nt

e qu

pr ep ar at or

e ns co

nu cle us _

_ us

cle

NYELVI SZINT

a BEFELHŐSÖDIK NUKLEUSZ nu

METANYELVI SZINT

ra támaszkodott, amelyet tesztelni akartunk. Egy magyar mondatról, azt Present Perfect Simple vagy Past Continuous igeidőbe áttéve, csakis aspektuális szempontból kellett megállapítani elfogadhatóságát, függetlenül a fordítás milyenségétől. Ezt biztosította a kialakított angol nyelvi intuíció. Azonban az angol fordítás ellenére a magyar anyanyelvi intuíció elég erős befolyásoló tényező ahhoz, hogy paradox módon az angol nyelvi mondatot is a magyar igével kifejezett jelentéssel lehessen értelmezni. Így, bár angol nyelvű teszttel, de végülis a magyar igékről nyertünk információt.6 Moens és Steedman eseménynukleusz-fogalma a HuWN-ben tehát egyrészt egyes igék aspektuális jellemzőinek jelölésében bizonyult produktívnak. Másrészt azonban bizonyos lexikalizált jelentések egymáshoz való, aspektuálisan motivált viszonyának modelljeként is szolgált. Az eseménynukleusz komponensei rávetíthetők a nyelvileg lexikalizálódott kifejezések szintjére, és a WordNet relációs struktúráját kihasználva megjeleníthetővé válnak bizonyos, a magyarra jellemző igei viszonyok. A Moens és Steedman-féle eseménynukleusz konceptuális szintjének megfeleltethetünk nyelvi elemeket – amennyiben ezek lexikalizálódtak –, s amelyeket a WordNetben synsetek jelölnek, az 1. ábrán látható módon.

{felhősödik}

{befelhősödik}

{felhős}

lexikalizálódo! előkészítő folyamat

lexikalizálódo! telosz / sikerpont

lexikalizálódo! utóállapot

1. ábra: Egy eseménynukleusz szintjei

A lexikalizált nukleuszkomponenseket egy metanyelvi szinten elhelyezett mesterséges csomópont fogja össze. Az ebből kiinduló „nukleuszrelációk” (az ábrán 6 Ez a módszertani fogás természetesen igényelné a másodiknyelv-tanulás terén folytatott kutatási eredmények támogatását, de magyar nyelvi tesztek hiányában, kellő odafigyeléssel alkalmazva hasznos és megbízható eszközt adott a kezünkbe.



Prószéky Gábor – Miháltz Márton – Kuti Judit

szaggatott vonal jelöli a relációkat az angol nucleus_preparatory_phase, nucleus_telos és nucleus_consequent_state címkékkel ellátva) az egyes synsetek közötti szemantikai viszonyokat az igék aspektuális jellemzőinek figyelembe vételével ábrázolják. A lexikalizálódott előkészítő folyamat per definitionem eseményszemantikailag folyamat, az utóállapot pedig, amennyiben nem melléknév fejezi ki, hanem ige, mindig állapotige (például az elalszik/alszik esetében). A nukleuszstruktúrában való ábrázolás előnye továbbá, hogy az egyébként a szófajok külön kezelése miatt egymáshoz nem kapcsolódó – gyakran melléknévként lexikalizálódott – utóállapotokat és az őket potenciálisan előidéző igéket közvetlen kapcsolatba hozza egymással.

. A HuWN-nel kapcsolatos további kutatások .. Az igei Magyar WordNet mint jelentésegyértelműsítő jelentéstár A wordnetek készítése mögött álló, fentebb említett két előfeltevés igazolhatósága kognitív tudományi szempontból is érdekes. Egyrészt, hogy mennyire igazolható az, hogy szavaink különböző jelentései elkülöníthetők; másrészt, hogy meg lehet-e állapítani, hogy egy adott szövegben előforduló szó melyik jelentésével szerepel (amennyiben poliszém). A nyelvtechnológiában (gépi) jelentésegyértelműsítésnek nevezett feldolgozó lépés arra az eljárásra utal, amelynek során egy tetszőleges szöveg szavaihoz valamilyen algoritmus alapján hozzárendeljük egy adott jelentéstárban felsorolt jelentések egyikét, azaz meghatározzuk, hogy az adott szövegkörnyezetben milyen jelentéssel fordul elő a szó. A jelentéstár lehet egynyelvű szótár, de inkább tipikusan wordnet, hiszen egy ilyen adatbázis nem szóalakokból indul ki, hanem magukat a jelentéseket tartalmazza szinonim csoportokban. A gépi jelentésegyértelműsítés a nyelvtechnológiának jelenleg az egyik legnagyobb kihívást jelentő feladata; nem tekinthető megoldottnak egyetlen nyelvre sem. Ennek egyik nyilvánvaló oka, hogy, bár egynyelvű szótárak léteznek, maguknak a jelentéseknek az elkülönítése sem megoldott. Ezek legtöbbször ún. enumeratív lexikonok, amelyek belső szabályszerűségeket követve, következetes módon, ám mégiscsak a lexikográfusok intuíciója alapján készülnek. Véronis (2003) az intuitív jelentésfogalom problematikus voltát, illetve az enumeratív lexikonok jelentésegyértelműsítés céljára való alkalmatlanságát próbálta meg megmutatni. Egy kísérletében rámutatott, hogy egy emberi annotátorok által jelentésekkel beannotált szöveg esetében az annotátorok közti egyetértés a jelentések tekintetében olyan alacsony, hogy nem képezhet megfelelő viszonyítási alapot gépi jelentésegyértelműsítő algoritmusok számára.

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

Héja et al. (2009) és Kuti et al. (2010) leírnak egy Véronis (2003) alapján megtervezett jelentésannotációs kísérletet, amelyben magyar igék esetében vizsgálták – három különböző jelentéstár alapján – az annotátorok közötti egyetértést. A vizsgált adatbázisok az introspektív, illetve disztribúciós alapon készülő jelentéstárak közötti spektrumot voltak hivatottak képviselni. A kísérletben 15 ige 30 előfordulását annotálta 5-5 kísérleti személy a Magyar Értelmező Kéziszótár (ÉKSz) és a Magyar WordNet (HuWN) jelentéseivel, illetve az Igei szerkezetek gyakorisági szótára (ISZGYSZ, Sass–Pajzs 2009) adatbázis igei szerkezeteivel. A kísérleti személyek az adatbázisokban megadott kategóriacimkék választásán kívül „nincs” és „nem tudom” választ is adhattak. Az ÉKSz-t reményeink szerint nem kell bemutatni az olvasónak. Az Igei szerkezetek gyakorisági szótára automatikusan gyűjtött7 gyakori, különböző specifikusságú ige + főnévi csoport szerkezeteket tartalmaz, a vonzatkeretektől a komplex igéken át a szólásokig (ige + esetragok/névutó + leggyakoribb lemmák). Az ISZGYSZ definíciókat nem tartalmaz, viszont minden szerkezethez ad korpuszból gyűjtött példákat, amelyek a szerkezet jelentését világítják meg. Lévén, hogy a magyar igei WordNet készítésekor már vonzatkeretekre vonatkozó, automatikusan kinyert információkat is figyelembe vettünk, a HuWN-beli jelentésmegkülönböztetések nem pusztán introspekción alapulnak. A HuWN ily módon módszertanilag az introspektív jelentésmegkülönböztetéseken alapuló ÉKSz. és a pusztán disztribúciós alapokon nyugvó ISZGYSZ között helyezkedik el. A kísérletben az annotátorok közötti egyetértés a HuWN alapján lett a legnagyobb,8 azt az ÉKSz. szerinti értékelést kivéve, amelyikben csak az ÉKSz. fő jelentéscsoportjait vettük figyelembe, az ezek alatt meghatározott aljelentéseket (az adatbázis legfinomabb jelentésmegkülönböztetéseit) nem. Az annotátorok közti egyetértés nagyságrendje azonban összevethető volt Véronis kísérletének eredményeivel, minden adatbázis esetében. Ez azt is jelenti, hogy egyik adatbázis alapján végrehajtott emberi jelentés-egyértelműsítés sem eredményezett olyan 7 Az adatbázist előállító algoritmus szigorúan disztribúciós alapon gyűjt, és a bővítményi szavak eloszlásából képes megállapítani, hogy egy adott bővítmény kötött vagy szabad. 8 Az annotátorok közötti egyetértést Fleiss-féle multi π érték szerint számoltuk, Artstein– Poesio (2008, 563–564) alapján. A Fleiss-féle multi π az összes annotátor adataiból becsült átlageloszlásból számolja a várható egyetértés mértékét, és azt mutatja meg, hogy a tapasztalt egyetértés hol helyezkedik el a véletlenszerűen várható egyetértés () és a teljes egyetértés () által meghatározott skálán. A mérték negatív értéket is felvehet, ha az egyetértés kisebb a véletlenszerűen elvártnál. Minél közelebb van tehát a kapott érték az -hez, annál nagyobb a valószínűsége, hogy az annotátorok közti egyetértés nem véletlen. Az átlagolt Fleiss-féle multi π érték az ÉKSz. esetében 0,3, a HuWN esetében 0,483, az ISZGSZ esetében 0,34 volt, míg abban az esetben, amikor az ÉKSz-nek csak a főjelentéseit vehették figyelembe az annotátorok, 0,517 volt.



Prószéky Gábor – Miháltz Márton – Kuti Judit

magas annotátorok közti egyetértést, amelynek alapján gépi jelentés-egyértelműsítő algoritmus számára megbízható referenciakorpusz készíthető volna, illetve amely a wordnetek, illetve a jelentés-egyértelműsítő feladat mögötti előfeltevések helyességére utalna. Véronis (2003), illetve a fenti kísérlet tehát rámutat, hogy a rendelkezésünkre álló jelentéstárak alapján még emberek között is nehéz egységes álláspontra jutni egy szöveg szavainak jelentés-egyértelműsítése tekintetében. Ennek oka lehet 1. egyrészt, hogy a jelentéstárak minősége nem megfelelő, ám a mögöttes előfeltevések helyénvalók, 2. illetve, hogy a wordnetek mögött feltételezett jelentésfogalom nem megfelelő, mert például fogalmaink között nem éles a határvonal, hanem „elmosódott”, ahogy azt például a fuzzy logikából (l. Zadeh 1965; 1968) eredeztethető szemantikai irányzatok feltételezik), 3. vagy az, hogy bár elkülöníthetők a szavak különböző jelentései, az adott szövegkörnyezetben a szavak egyszerűen nem pontosan ezekkel fordulnak elő, hanem például a relevanciaelmélet keretén belül értelmezett, ezen jelentések alapján ad hoc, a megértési folyamat során megalkotott szójelentésekkel (Wilson–Sperber 2012).

.. Kísérlet a Magyar WordNet automatikus kiegészítésére ige–vonzatosztály kapcsolatokkal Noha a WordNetben főnevek és igék között van néhány morfológiai alapú reláció (pl. lép–lépés), az olyan kapcsolatok, amelyek világosan mutatnák az igék és jellemző argumentumaik közötti szemantikai viszonyokat, hiányoznak – morfológiai családjuktól függetlenül, pl. iszik: folyadék, orvos: gyógyít stb. Ezek a relációk függvényei az egyes igék vonzatkereteinek: különböző igei vonzatkeretek különböző morfoszintaktikai pozícióihoz különböző névszói fogalmak tartozhatnak (pl. figyel valamire, elkezdődik valami, odaéget valamit). Másfelől ez a kötődés széles spektrumot mutathat: az egyik véglet az olyan idiomatikus, nem-kompozicionális ige–igei módosító kapcsolatoké, mint pl. hangot ad (valaminek), issza a szavát, napvilágra hoz, tenyerén hordoz stb. A másik végletet az olyan vonzatok képviselik, amelyek megfeleltethetők – egy vagy több – olyan szemantikai osztállyal, amelyek produktívan képesek az adott pozícióban elfogadható fogalmakat megjósolni (szelekciós megkötések): eszik vala-

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

mit {étel, ennivaló}, ír valamit {írás, írásmű}, kiönt valamit {víz, víztömeg} stb. Gyakran egy adott ige adott vonzatához több szemantikai kategória is tartozik a különböző jelentések/jelentésárnyalatok vagy egyéb szemantikai kapcsolatok függvényében (2. ábra.) Ezek a kapcsolatok a vonatkozó jelentések gyakoriságának függvényében eltérő mértékű asszociációt fejezhetnek ki az ige és a főnévi fogalomosztály között. Munkánkban ezeket a viszonyokat megkíséreljük korpuszstatisztikai módszerekkel kiszámított valószínűségi értékekkel közelíteni.

2. ábra: Három, az iszik ige tárgyesetű vonzataként megjelenő lehetséges főnévi osztály

elhelyezkedése a HuWN hipernima-hierarchiájában, néhány korpuszból származó példával, ahol a folytonos nyilak a hipernima-relációkat, a szaggatottak az új (hipotetikus) javasolt ige–vonzatosztály relációkat jelölik

Az ebben a fejezetben bemutatott, jelenleg is folyamatban lévő kísérlet fő célja (Resnik 1998-hoz hasonlóan) a Magyar WordNet kiterjesztése új relációkkal, amelyek igei synseteket tipikus (főnévi) argumentumosztályaikkal fognak összekötni. Minden ilyen relációhoz két attribútum is tartozni fog: az adott igei argumentumpozíciót azonosító esetrag vagy névutó kódja (case), valamint a kapcsolathoz rendelt, korpusztsatisztikai módszerekkel számolt valószínűség (p). Például az {iszik} − [case = acc; p = .87] → {folyadék} jelöléssel ábrázolt kapcsolat jelentése: az iszik ige tárgyesetű vonzatai a referenciakorpuszban 87-os valószínűséggel a folyadék fogalommal reprezentált szemantikai osztály tagjai (1. táb-



Prószéky Gábor – Miháltz Márton – Kuti Judit

lázat). A relációban szereplő főnévi synset tehát azt a fogalmi osztályt jelképezi, amelybe a belőle kiinduló hiponimaalgráf csomópontjai tartoznak. 1. táblázat: Az iszik igével accusativusi szerepben (tárgyesetben) együtt előforduló 50

leggyakoribb névszó a Mazsola adatbázisában Rang 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25.

Szó sör bor víz kávé sok tea mi korty valami több tej pálinka egy kevés lé annyi konyak maga alkohol az ital rum pezsg! vodka ami

Gyakoriság 583 581 459 318 311 238 217 206 204 196 161 138 105 97 96 95 94 89 86 83 77 65 61 57 56

Rang 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50.

Szó whisky vér fröccs kóla jó szó vörösbor ez ásványvíz fekete folyadék semmi elég mennyi narancslé kakaó üdít! szesz pertu nagy áldomás ennyi gyümölcslé gyógytea sor

Gyakoriság 54 53 51 46 46 46 46 42 42 40 37 36 35 34 26 24 24 23 23 22 20 17 17 16 16

Az eljárásban létrejövő új kapcsolatok – a Magyar WordNetben megjelenő új információkon, eddig hiányzó relációtípusok pótlásán felül – hasznosak lehetnek például magyar nyelvű szintaktikai elemzők statisztikai tanításában és alkalmazásában is.9 A kisérlethez a Magyar Nemzeti Szövegtár (Váradi 2002) 187 millió szövegszavas anyagából készült „Mazsola” igei bővítmény-adatbázis anyagát (Sass 2009) használtuk fel. A Mazsola projektben egy egyszerű szabályalapú parserrel azonosították a korpusz minden mondatában a tagmondatokat és a bennük szereplő finit igéket, valamint névszókat (NP-k fejeit) a hozzájuk tartozó morfoszintaktikai jellemzőkkel (esetrag vagy névutó). Ebből kiindulva készítettünk egy olyan gyakorisági adatbázist, amely minden feldolgozott igéhez társította a vele 9 Egy erre is irányuló, részben pszicholingvisztikai indíttatású nyelvtechnológiai kutatás folyik jelenleg is az MTA–PPKE Magyar Nyelvtechnológiai Kutatócsoportjában (Prószéky 2013).

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán 

együtt előforduló – vagyis feltehetően igevonzat vagy -módosító szerepet betöltő – főneveket, esetrag vagy névutó szerint külön-külön gyakorisági listákban. A kísérlet egyik célja egy olyan algoritmus kifejlesztése, amelynek bemenete egy adott igéhez egy bizonyos morfoszintaktikai pozícióban tartozó főnévi vonzatok gyakorisági listája, kimenete pedig főnévi synsetek súlyozott listája, amelyek a bemeneti lista elemeinek szemantikus osztályait, általánosításait fejezik ki. A szemantikus osztályokat reprezentáló output synseteknek az alábbi feltételeket kell teljesíteniük: 1. A korpuszból minél több szót fedjenek le: a synset maga, vagy hiponima-reláció szerinti alárendeltjei tartalmazzanak minél több input szót. 2. Az output synsetekből kiinduló hipernima-algráfok olyan „sűrűek” legyenek, amennyire csak lehet: a korpusz szavain kívül minél kevesebb egyéb szót tartalmazzanak. 3. Az algráfokkal kifejezett fogalmi osztályok az adott vonzatról minél erőteljesebb szemantikai általánosítást fejezzenek ki, de ne legyenek semmitmondóan túl általánosak (pl. {entitás}). 4. Automatikus jelentés-egyértelműsítés: ha egy korpuszbeli, igével asszociált szó többértelmű, az outputban szereplő synsetek csak a releváns, az igei vonzatpozíciónak megfelelő jelentéseihez kapcsolódjanak. 5. Amennyiben lehetséges, igyekszünk az idiomatikus vonzatoknak megfelelő synseteket is megtalálni, pl. {iszik} − [case = ACC; p = . . . ] → {szó}, {fény}, {áldomás}. Az algoritmus az input szavaknak megfeleltethető különböző synsetekből a HuWN hipernima-hierarchiájában a gyökércsomópontig vezető utak csomópontjait kezeli jelöltekként (lehetséges kimeneti kategóriákként). Két egyszerű feltétellel történő szűrés után (egy jelölt valódi részhalmaza egy másiknak, vagy nem fejez ki általánosítást) pontozza őket két tényező figyelembe vételével: a jelöltből kiinduló részgráf lefedése az input szavakra nézve, illetve „sűrűsége” (a lefedett input szavak aránya a részgráf teljes méretéhez képest). Végül az algoritmus a pontértékek szerint rangsorolt jelöltek közül az N legjobbat adja vissza. Az algoritmus implementációját a Mazsola adatbázis 20,24 millió tagmondatából kinyert 530 ezer különböző ige–vonzatpozíció gyakorisági listán futtattuk. Jelenleg az eredmények automatizált, humán ítéletekből alkotott sztenderdhez képest történő kiértékelésének módszertanán dolgozunk. Kísérletet teszünk



Prószéky Gábor – Miháltz Márton – Kuti Judit

arra is, hogy felhasználjuk a MetaMorpho magyar–angol fordítóprogram szintaktikai elemzőjében (Prószéky et al. 2004) használt igei vonzatkeret-leíró adatbázis anyagát is. Az adatbázis több mint 18 ezer igéhez 33 ezer vonzatkeret-leírást tartalmaz, amelyek megadják az adott jelentésben szereplő lehetséges vonzatpozíciókat és az azokra érvényes, attribútumokkal kifejezett lexikai, morfológiai, szintaktikai és szemantikai megkötéseket. Ezt a tudást felhasználhatjuk egyfelől annak eldöntésére, hogy milyen vonzatok milyen morfoszintaktikai konfigurációi számítanak egy-egy ige vonzatkereteinek. Másfelől, az új ige–főnév relációk létrehozásakor az igei synsetek kijelölésében segítséget jelent az a tény, hogy a vonzatkeret-adatbázis egy részét hozzákapcsolták a Magyar WordNethez annak fejlesztése során. Jelenleg 2805 igei synsethez összesen 7096 vonzatkeretazonosító tartozik. Természetesen annak meghatározása, hogy a Mazsola 20,24 millió mondatában a vonzatkeret-adatbázis mely vonzatkeretei jelennek meg, teljeskörű gépi szintaktikai elemzés alkalmazását jelentené a MetaMorpho rendszer mondatelemzőjének alkalmazásával. Ennek hiányában néhány egyszerű heurisztika segítségével, a vonzatkereteket leíró jegyek közül csupán a lexikai alakok és az esetek/névutók figyelembevételével, 25,5 ezer vonzatkerettel összesen 32 ezer különböző ige–vonzatpozícióból álló gyakorisági listát sikerült előállítani bemenetként az algoritmus számára. A következőkben bemutatjuk az iszik ige korpuszban található tárgyesetű vonzataiból generált lehetséges szemantikai osztályok közül az első ötöt, az algoritmus által kiszámított pontérték szerint csökkenő sorrendben. A synsetek után felsoroltuk az általuk reprezentált osztályba sorolt, korpuszból származó főneveket is (zárójelben a korpuszbeli gyakoriságaikkal): 1. s=9,1 {folyadék:2} (Folyékony anyag.) 26 szó: alkohol (86), bor (581), fehérbor (6), fekete (40), feketekávé (14), folyadék (37), gabonapálinka (6), gin (6), gyümölcslé (17), ital (77), kakaó (24), koktél (7), kávé (318), narancslé (26), pálinka (138), rum (65), ser (13), szesz (23), sör (583), tea (238), tej (161), viszki (7), vodka (57), víz (459), vörösbor (46), whisky (54) 2. s=8,7963 {ital:1, italféle:1, italféleség:1} (Ivóvíz, illetve ivásra haszn. egyéb folyadék.) 25 szó: alkohol (86), bor (581), fehérbor (6), fekete (40), feketekávé (14), gabonapálinka (6), gin (6), gyümölcslé (17), ital (77), kakaó (24), koktél (7), kávé (318), narancslé (26), pálinka (138), rum (65), ser (13), szesz (23), sör (583), tea (238), tej (161), viszki (7), vodka (57), víz (459), vörösbor (46), whisky (54)

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán  3. s=4,88889 {szeszes ital:1, szesz:1, ital:2, alkohol:1} (Színtelen, égető ízű folyadék, a szeszes italok hatóanyaga; etil-alkohol.) 16 szó: alkohol (86), bor (581), fehérbor (6), gabonapálinka (6), gin (6), ital (77), koktél (7), pálinka (138), rum (65), ser (13), szesz (23), sör (583), viszki (7), vodka (57), vörösbor (46), whisky (54) 4. s=4,375 {rövidital:1, tömény ital:1, tömény szesz:1, tömény:1} (Inkább lepárlással (mint erjesztéssel) készült italféleség.) 7 szó: gabonapálinka (6), gin (6), pálinka (138), rum (65), viszki (7), vodka (57), whisky (54) 5. s=3.75926 {táplálék:1, tápanyag:1} (A szervezetben feldolgozva az élőlényeket életben tartó, fejlesztő anyag.) 28 szó: alkohol (86), bor (581), ecet (7), fehérbor (6), fekete (40), feketekávé (14), gabonapálinka (6), gin (6), gyümölcslé (17), ital (77), kakaó (24), koktél (7), kávé (318), lé (96), narancslé (26), pálinka (138), rum (65), ser (13), szesz (23), szörp (14), sör (583), tea (238), tea (238), tej (161), viszki (7), vodka (57), víz (459), vörösbor (46), whisky (54)

Ha megvizsgáljuk az első három fogalom (folyadék, ital, szeszes ital) elhelyezkedését a főnévi hipernimagráfban, kiderül, hogy a folyadék fogalom a legáltalánosabb, alá tartozik az ital, utóbbi alá pedig az alkohol (3. ábra).

3. ábra: Az első három legyakoribb vonzatosztály (félkövér kiemeléssel) viszonya a hie-

rarchiában

Ezen a ponton felmerül a kérdés, hogy mit (miket) tekintsünk megfelelő eredménynek. Ha például a HuWN ontológiája szerint legáltalánosabb (a legtöbb tárgyesetű vonzatot lefedő) fogalmi kategóriát keressük, akkor a folyadék-ot kell



Prószéky Gábor – Miháltz Márton – Kuti Judit

választanunk. Logikailag azonban korrektebb lehet az ital kategória, hiszen nem minden folyadék alkalmas emberi fogyasztásra. Bizonyos alkalmazásokban viszont releváns információ lehet az is, hogy a korpuszadatok tanúsága szerint az alkohol és fajtái is szignifikáns szerepet tölenet be ebben a pozícióban. Jelenleg a fentiekhez hasonló ontológiai alapkérdések tisztázása, valamint a kiértékelő módszertan kidolgozása mellett a jelölteket súlyozó formula továbbfejlesztésén dolgozunk: többek között felhasználható információk az input szavak korpuszgyakoriságai, a jelölt csoport mélysége a HuWN hiponimagráfjában és az input szavakat tartalmazó synsetek átlagos távolsága (a hiponima-reláció szerint) a jelölt csoportot reprezentáló synsettől is. További szempont még a kompozicionális, szemantikailag tartalmas vonzatosztályok és az idiomatikus lexémákat tartalmazó fogalmi csomópontok (pl. szó: vki issza a szavát vkinek) megkülönböztetése is. Reményeink szerint a formula megfelelő hangolásával a szignifikáns, de csak egy elemet tartalmazó jelöltek nagy valószínűséggel az idiomatikus főnévi igemódosítók lesznek. Ebben a pontban bemutattunk egy kísérletet, amelynek célja egy reprezentatív, írott nyelvű korpusz (Magyar Nemzeti Szövegtár) ige–bővítmény gyakorisági adatainak rávetítése a Magyar WordNet ontológia főnévi hierarchiájára. Az eredmények egyrészt hasznos erőforrást jelenthetnek nyelvtechnológiai alkalmazásokhoz, másrészt betekintést nyújthatnak a mentális lexikon szófajközi viszonyaiba pszicholingvisztikai kutatások számára. Utóbbiakban releváns lehet az igék és főnévi vonzataik közötti asszociációk valós nyelvi adatokból származó súlyozása, illetve minél kimerítőbb felsorolása.

. Összefoglalás Cikkünkben röviden bemutattuk és történeti kontextusba helyeztük a wordneteket, mint a hazai és nemzetközi nyelvtechnológia egyik központi adatbázistípusát, s megmutattuk, hogy miként tettek szert népszerűségre mint több tudományág találkozásánál keletkező adatbázisok. Bemutattuk továbbá a Magyar WordNetet, több – kognitív tudományi szempontból releváns – innovációjával. Végül bepillantást engedtünk a Magyar WordNet kapcsán zajló friss nyelvtechnológiai kutatásokba, amelyek a jelentésegyértelműsítés, illetve az igék vonzatosztályainak automatikus jelölése területén zajlanak.

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán  Irodalom Alexin, Zoltán – Dóra Csendes (szerk.) 2006. A IV. Magyar Számítógépes Nyelvészeti Konferencia előadásai. Szeged: Szegedi Tudományegyetem. Artstein, Ron – Massimo Poesio 2008. Inter-coder agreement for computational linguistics. Computational Linguistics 34: 555–596. Atserias, Jordi – Salvador Climent – Xavier Farreres – German Rigau – Horacio Rodríguez 1997. Combining multiple methods for the automatic construction of multilingual WordNets. In: Nicolas Nicolov – Ruslan Mitkov (szerk.): Proceedings of the Second International Conference on Recent Advances in Natural Language Processing. Tsigov Chark: RANLP. 143–149. Bach, Emmnon 1986. The algebra of events. Linguistics and Philosophy 9: 5–16. Barbu, Eduard – Verginica Barbu Mititelu 2005. Automatic building of Wordnets. In: Nicolas Nicolov – Kalina Bontcheva – Galia Angelova – Ruslan Mitkov (szerk.): Proceedings of the Fourth International Conference on Recent Advances in Natural Language Processing. Amsterdam & Philadelphia: John Benjamins. 217–225. Charniak, Eugene 1976. A framed painting: The representation of a common sense knowledge fragment (ISSCO Working Papers 28). Geneva: Fondaziona Dalle Molle. Chomsky, Noam 1965. Aspects of the theory of syntax. Cambridge MA: MIT Press. Chomsky, Noam – George A. Miller 1963. Introduction to the formal analysis of natural languages. In: R. Duncan Luce – Robert R. Bush – Eugene Galanter (szerk.): Handbook of mathematical psychology, vol. 2. New York: Wiley. 269–321. Comrie, Bernard 1976. Aspect. An introduction to the study of verbal aspect and related problems. Cambridge: Cambridge University Press. Dolan, William B. – Stephen D. Richardson – Lucy Vanderwende 1998. Mindnet: Acquiring and structuring semantic information from text (MSR-TR-98-23). Redmond: Microsoft. Farreres, Xavier – German Rigau – Horacio Rodriguez 1998. Using WordNet for building Wordnets. In: Sandra Harabagiu (szerk.): Proceedings of COLING/ACL Workshop on Usage of WordNet in Natural Language Processing Systems. Montreal: ACL. 65–72. Fellbaum, Christiane 1998a. Introduction. In: Fellbaum (1998b, 1–19). Fellbaum, Christiane (szerk.) 1998b. WordNet: An electronic lexical database. Cambridge MA: MIT Press. Fillmore, Charles J. 1968. The case for case. In: Emmon Bach – Robert T. Harms (szerk.): Universals in linguistic theory. New York: Holt, Rinehart and Winston. 1–88. Fillmore, Charles J. – Collin F. Baker – Hiroaki Sato 2002. The FrameNet database and software tools. In: Manuel Gonzàlez Rodríguez – Carmen Paz Suarez Arauj (szerk.): Proceedings of the Third International Conference on Language Resources and Evaluation. Las Palmas: LREC. 1157–1160. Hatvani Csaba – Kocsor András – Miháltz Márton – Szarvas György – Szécsi Katalin 2006. Főnevek a Magyar WordNetben. In: Alexin – Csendes (2006, 109–116). Héja Enikő – Kuti Judit – Sass Bálint 2009. Jelentésegyértelműsítés – egyértelmű jelentésítés? In: Tanács Attila – Szauter Dóra – Vincze Veronika (szerk.): A VI. Magyar Számítógépes Nyelvészeti Konferencia előadásai. Szeged: Szegedi Tudományegyetem. 348–352. Jackendoff, Ray 1983. Semantics and cognition. Cambridge MA: MIT Press.



Prószéky Gábor – Miháltz Márton – Kuti Judit

Katz, Jerry J. – Jerry A. Fodor (szerk.) 1964. The structure of semantic theory. New Jersey: Prentice Hall. Kuti, Judit – Enikő Héja – Bálint Sass 2010. Sense disambiguation – “ambiguous sensation”? Evaluating sense inventories for verbal WSD in Hungarian. In: Stelios Piperidis – Milena Slavcheva – Cristina Vertan (szerk.): Proceedings of LREC 2010 Workshop on Exploitation of Multilingual Resources and Tools for Central and (South-)Eastern European Languages. La Valletta: ELRA. 23–30. Kuti Judit – Varasdi Károly – Cziczelszki Judit – Gyarmati Ágnes – Nagy Anikó – Tóth Marianna – Vajda Péter 2006. Igei wordnet és igei eseményszerkezet ábrázolása. In: Alexin – Csendes (2006, 97–108). Macleod, Catherine – Ralph Grishman – Adam Meyers 1994. The Comlex syntax project: The first year. In: Madelaine Bates (szerk.): Proceedings of the ARPA Human Language Technology Workshop. San Francisco: Morgan Kaufmann. 8–12. Matuszek, Cynthia – John Cabral – Michael J. Witbrock – John De Oliveira 2006. An introduction to the syntax and content of CyC. In: Timothy Bickmore – Nancy Green (szerk.): Proceedings of the 2006 AAAI Spring Symposium on Formalizing and Compiling Background Knowledge and Its Applications to Knowledge Representation and Question Answering, Vol. 3864, Issue 1447. Boston: AAAI Press. 44–49. Miháltz, Márton 2010. Semantic resources and their applications in Hungarian natural language processing. Doktori értekezés, Pázmány Péter Katolikus Egyetem, Budapest. Miller, George A. 1998. Foreword. In: Fellbaum (1998b, xv–xxii). Miller, George A. – Richard Beckwith – Christiane Fellbaum – Derek Gross – Katherine J. Miller 1990a. Five papers on WordNet (CSL Report 43). Princeton University: Princeton. Miller, George A. – Richard Beckwith – Christiane Fellbaum – Derek Gross – Katherine J. Miller 1990b. Introduction to WordNet: An on-line lexical database. International Journal of Lexicography 3: 235–244. Miller, George A. – Philip N. Johnson-Laird 1976. Language and perception. Cambridge MA: Belknap Press of Harvard University Press. Minsky, Marvin 1975. A framework for representing knowledge. In: Patrick H. Winston (szerk.): The psychology of computer vision. New York: McGraw Hill. 211–277. Moens, Marc – Mark Steedman 1988. Temporal ontology and temporal reference. Computational Linguistics 14: 15–29. Niles, Ian – Adam Pease 2001. Towards a standard upper ontology. In: Chris Welty – Barry Smith (szerk.): Proceedings of the 2nd International Conference on Formal Ontology in Information Systems. New York: ACM. 2–9. Osgood, Charles E. – George J. Suci – Percy H. Tannenbaum 1957. The measurement of meaning. Urbana, IL: University of Illinois Press. Partee, Barbara H. 1973. Some transformational extension of Montague Grammar. Journal of Philosophical Logic 2: 509–534. Prószéky Gábor 2013. Kutatások egy pszicholingvisztikai indíttatású számítógépes nyelvfeldolgozás irányában. Kézirat. Prószéky Gábor – Miháltz Márton 2008. Magyar WordNet: az első magyar lexikális szemantikai adatbázis. Magyar Terminológia 1: 43–57.

Lexikális szemantika: a számítógépes nyelvészet és a pszicholingvisztika határán  Prószéky, Gábor – László Tihanyi – Gábor Ugray 2004. Moose: A robust high-performance parser and generator. In: John Hutchins – Michael Rosner (szerk.): Proceedings of the 9th Workshop of the European Association for Machine Translation. La Valletta, Malta: Foundation for International Studies. 138–142. Pustejovsky, James 1995. The generative lexicon. Cambridge MA: MIT Press. Quillian, M. Ross 1968. Semantic memory. In: Marvin Minsky (szerk.): Semantic information processing. Cambridge MA: MIT Press. 227–270. Resnik, Philip 1998. WordNet and class-based probabilities. In: Fellbaum (1998b, 239–264). Sass Bálint 2009. ,,Mazsola” – eszköz a magyar igék bővítményszerkezetének vizsgálatára. In: Váradi Tamás (szerk.): Válogatás az I. Alkalmazott Nyelvészeti Doktorandusz Konferencia előadásaiból. Budapest: MTA Nyelvtudományi Intézet. 117–129. Sass, Bálint – Júlia Pajzs 2009. FDVC – creating a corpus-driven frequency dictionary of verb phrase constructions for Hungarian. In: Sylviane Granger – Magali Paquote (szerk.): Lexicography in the 21st century: New challenges, new applications. Louvain-la-Neuve: Universitaire de Louvain. 263–272. Schank, Roger C. (szerk.) 1975. Conceptual information processing. Amsterdam: North-Holland. Schank, Roger C. – Robert Abelson 1977. Scripts, plans, goals, and understanding. Hillsdale, NJ: Lawrence Erlbaum. Sowa, John F. 1984. Conceptual structures: Information processing in mind and machine. Reading: Addison-Wesley. Tufiş, Dan 2004. Balkanet: Aims, methods, results and perspectives. Romanian Journal of Information Science and Technology 7: 1–35. Váradi, Tamás 2002. The Hungarian National Corpus. In: Mark T. Maybury (szerk.): Proceedings of the Third International Conference on Language Resources and Evaluation. Las Palmas: European Language Resource Association. 385–389. Vendler, Zeno 1957. Verbs and times. Philosophical Review 66: 143–160. Véronis, Jean 2003. Sense tagging: Does it make sense? In: Andrew Wilson – Paul Rayson – Tony McEnery (szerk.): Corpus linguistics by the Lune: A Festschrift for Geoffrey Leech. Frankfurt: Peter Lang. 273–290. Vossen, Piek 1999. EuroWordNet general document. Amsterdam: University of Amsterdam. Wilks, Yorick 1972. Grammar, meaning, and the machine analysis of language. London: Routledge. Wilson, Deirdre – Dan Sperber 2012. Meaning and relevance. Cambridge: Cambridge University Press. Zadeh, Lotfi A. 1965. Fuzzy sets. Information and Control 8: 338–353. Zadeh, Lotfi A. 1968. Fuzzy algorithms. Information and Control 12: 94–102.



Prószéky Gábor – Miháltz Márton – Kuti Judit

Lexical semantics: at the border of computational linguistics and psycholinguistics Abstract: Our paper presents WordNet, a key database-type in current national and international language technology research, with a cognitive scientific focus. First we take a look at the birth of this database-type in a historical context and show that the popularity of wordnets owes a lot to having been born at the crossroads of linguistics, psycholinguistics and artificial intelligence research. We then present the Hungarian WordNet and some of its characteristics that are of interest from a cognitive scientific point of view. Finally we sketch two pieces of research connected to the Hungarian WordNet: one focuses on its use in word sense disambiguation, the other on automatically extending the Hungarian WordNet with information on the semantic constraints of verbs. Keywords: lexical semantics, computational linguistics, ontologies, wordnet, word-sense disambiguation

Kutya, ember, csimpánz: kognitív szempontok a fajok kommunikációs eltéréseinek értelmezésében* Kis Anna ELTE Etológia Tanszék és MTA Természettudományi Kutatóközpont, Kognitív Idegtudományi és Pszichológiai Intézet [emailprotected]

Miklósi Ádám ELTE Etológia Tanszék [emailprotected]

Topál József MTA Természettudományi Kutatóközpont, Kognitív Idegtudományi és Pszichológiai Intézet [emailprotected]

Kivonat: Az emberré válás evolúciós folyamatának egyik kulcsfontosságú tényezője, hogy a változó környezeti feltételek között fellépő alkalmazkodási kényszerek a hominidák szociális és kognitív képességeit olyan speciális fejlődési pályára állították (Csányi 2003), amelynek egyenes következménye volt egy szociális, fejlett kommunikációra és nyelvhasználatra képes faj, a hom*o sapiens megjelenése (Szathmáry–Számadó 2008; Topál 2010). Annak érdekében, hogy megtudjuk, kommunikációs rendszerünk és egyéb kognitív képességeink mely aspektusai azok, amelyek specifikusan az emberi evolúció folyamán jelentek meg, elengedhetetlen az összehasonlító megközelítés, amely filogenetikai rokonainkat, a csimpánzokat (és más főemlősöket) vizsgálja. Továbbá fontos egy, az emberi környezetben élő és ahhoz evolúciós léptékben alkalmazkodott faj, amilyen a kutya, vizsgálata is, amely rávilágít, hogy ökológiai környezetünk és az ezzel járó szelekciós hatások milyen képességek megjelenéséhez vezetnek. Kulcsszavak: komparatív, kommunikáció, kutya (Canis familiaris), főemlős

. Mi a kommunikáció? Definíciók és értelmezési keretek Az emberi faj egyedei életüket jellemzően szociális környezetben, más emberekkel körülvéve töltik. Kétségtelen, hogy a kommunikáció központi helyet foglal el az emberi tevékenységek sorában, hiszen egyaránt nélkülözhetetlen tényezője a kultúrát létrehozó és fenntartó tudásátadási folyamtoknak, illetve az emberi * A szerzők kutatásait az OTKA K valamint az MTA   támogatja.



Kis Anna – Miklósi Ádám – Topál József

csoport összehangolt tevékenységéhez szükséges szinkronizációnak. Azonban, mint ahogy az a legtöbb a kognitív működéssel kapcsolatba hozható jelenséggel kapcsolatban elmondható, a kommunikáció esetében is nagyrészt az alkalmazott meghatározáson múlik, hogy mennyire tekinthetjük egy adott élőlénycsoport specifikus sajátosságának, esetleg kizárólag az emberre jellemzőnek. A kommunikáció jelenségére különösen igaz, hogy rendkívül sokféle módon definiálható. Ha a kommunikációt a maga közkeletű és széles körben használt „egyszerűsített” módján definiáljuk (kommunikáció = információcsere), akkor nyilvánvaló, hogy az emberen kívül számos más organizmusra is jellemző, hogy fajtársaival vagy más fajok egyedeivel kommunikál. A jelenség nem korlátozódik az emlősökre vagy a fejlettebb gerincesekre, egyre több érv szól a mellett, hogy az információcsere valamilyen formában az élővilágra általánosan jellemző. A növényi neurobiológiának nevezett, újonnan formálódó tudományterület például egyre részletesebb képet nyújt arról, hogy a növények miként dolgozzák fel a környezetükből származó információkat, és hogy ez az információ hogyan terjed az adott növényen belül, illetve az egyedek között (l. Brenner et al. 2006 összefoglaló munkáját). Az efféle információátadás mechanizmusa meglepő módon sok tekintetben hasonlít az embernél ismertre: növényeknél is elektromos aktivitás, illetve neurotranszmitterek és azok receptor-hom*ológjai figyelhetők meg. Sőt a növényeknél jóval egyszerűbb prokarióta organizmusok is képesek egy baktériumkolónián belül koordinálni a viselkedésüket speciális biokémiai mechanizmusok segítségével (Camilli–Bassler 2006). Számos elterjedt definíció van azonban, amely a fentieknél komplexebben írja le a kommunikációt. A klasszikus ún. hatos modell szerint például a kommunikációhoz: szükséges egy adó (1), aki kiválaszt (vagy sajátos statisztikai korlátozásoknak megfelelően kódol) egy üzenetet (2) egy adott kódkészletből (3). Az üzenet dekódolásához az adó és a vevő (4) kódrendszerének legalább részben közösnek kell lennie, és az üzenet mindig feltételez egy olyan kontextust (5), amelyet a vevő érzékelni tud, valamint egy jelátviteli csatornát (6), amelyen keresztül a résztvevők meg tudják teremteni, és fenn tudják tartani a kapcsolatot (Jakobson 1969). Jól látható, hogy az egyedek közötti információcserének ebben a definícióban is központi szerepe van, bár az számos más elemmel kiegészült. További részletekkel gazdagítja a képet a viselkedéstudományok által széles körben elfogadott és leginkább általános meghatározás, amely szerint a kommunikáció az a folyamat, amelyben a jeladó egyed valamely viselkedési akciója (jelzés) révén a vevő információhoz juthat annak belső állapotáról (emócióiról, szándékairól), bekövetkező viselkedéséről vagy a külső környezet egyes elemeiről. A jelzést érzékelő egyed akkor tekinthető a kommunikációs interakcióban

Kutya, ember, csimpánz



részt vevő befogadónak, ha benne a jel hatására olyan specifikus kognitív, illetve élettani-viselkedési változás jön létre, amely az interakciók nagy számát figyelembe véve mindkét fél, vagy legalább az jeladó számára előnyös (Miklósi 2009). A rátermettség növelésének fontossága mellett az evolúciós megközelítés feltételezi azt is, hogy a kommunikáció céljára használt viselkedési jelek speciális eredettörténettel rendelkeznek és szelekciós hatások alatt állnak. Ez azonban nem zárja ki, hogy a tényleges kommunikációs interakció tanult viselkedéselemeket is tartalmazzon. A szakirodalomban, bár nem mindig jól elkülöníthető módon, egyaránt tetten érhető a kommunikáció funkcionális sajátosságaira, illetve lehetséges mechanizmusaira fókuszáló megközelítés. Míg az előbbi azt vizsgálja, hogy egy adott kommunikációs rendszerben megfigyelhető jelkészlet hogyan szolgálja az egyed vagy a populáció túlélését, illetve hogy milyen kommunikációs stratégiák létezhetnek, addig a mechanizmus kutatói elsősorban arra kíváncsiak, hogy milyen belső, kognitív folyamatok állnak a jel adás-vétel hátterében. Összességében, akármelyik definíciót, illetve megközelítésmódot is alkalmazzuk, a kommunikáció olyan szabályozó mechanizmusnak felel meg, amely úgy növeli az egyedek rátermettségét, hogy bizonyos mértékig összehangolja a viselkedésüket.

. Az összehasonlító módszer: mivel járulhat hozzá az állati kommunikáció kutatása saját fajunk megértéséhez? Az állati kogníció kutatásának egyik sokak által hangoztatott célja, hogy megtudjuk, amelyek azok a tulajdonságok, amelyek csak és kizárólag az emberre jellemzőek. Az eszközhasználat, a szociális tanulás képessége és még számos egyéb tulajdonság mellett a kommunikációs készségek speciális megnyilvánulását, a nyelvi kommunikációt is általában az emberspecifikus jellemzők közé sorolják (Szathmáry–Számadó 2008). Kétségtelen, hogy a különféle kommunikációs rendszereket figyelembe véve az emberi nyelv, legalábbis bizonyos vonatkozásaiban, egyedülállónak tekinthető. Nincs bizonyíték rá, hogy az emberen kívül más élőlény is el tudná sajátítani a beszédészlelés olyan alapvető elveit, mint a mondat szintaktikai szerkezetének megértését, vagy azt a képességet, hogy közölje bármely absztrakt vagy konkrét szó teljes szemantikai terjedelmét. Azonban egyes nem-humán fajok képesek lehetnek a beszédészelés más alapvető sajátosságainak elsajátítására. Ami a hangsorminták elemzését illeti, pl. a gyapjasfejű tamarinok (Saffran et al. 2008), valamint egyes énekesmadár-fajok (Comins–Gentner 2010) meglepően jó eredményekkel dicsekedhetnek.



Kis Anna – Miklósi Ádám – Topál József

Önmagában véve azonban nem rendkívüli, hogy az ember e vonatkozásban fajspecifikus tulajdonságokkal rendelkezik, hiszen évtizedek óta széles körben elfogadott, hogy a legtöbb faj rendelkezik olyan anatómiai, viselkedési, illetve kognitív működésbeli jellemzőkkel, amelyek specifikusan elkülönítik őket más fajoktól (Lenneberg 1974). A kognitív működésben megnyilvánuló fajspecifikus eltérések és az ezzel kapcsolatba hozható viselkedési jelenségek kutatásában különösen nagy jelentősége van az értelmi működés evolúciós és funkcionális szempontok alapján történő rendszerezésének. Az elmúlt évtizedekben ígéretes kutatás bontakozott ki egy olyan felfogás mentén (Wasserman 1993), amely megkülönbözteti a kognitív képességeket aszerint, hogy az információ megszerzése, feldolgozása, reprezentálása a környezet élő vagy élettelen aspektusára vonatkozik. Ennek megfelelően meg szokták különböztetni a kogníció fizikai (ökológiai) és szociális (lásd még „machiavelliánus intelligencia”) formáját. Az ennek nyomán indult szisztematikus összehasonlító vizsgálatok kézzelfogható közelségbe hozták annak lehetőségét, hogy az emberi és az emberszabású, illetve a nem emberszabású elme működési sajátosságai közötti eltérések megismerésével mélyebb betekintést nyerjünk abba, hogyan formálódott az ember sajátos képességkészlete. Összességében ma az összehasonlító elmekutatás az állati és emberi elme megnyilvánulásainak széles skáláját próbálja elemezni és értelmezni, a nyelvi kommunikáció és az ahhoz szükséges kognitív eszközkészlet vizsgálatát is beleértve. Az összehasonlító módszer egyik nagyon hatékony formája az egyed- és a törzsfejlődési megközelítés kombinálása. Ha evolúciós perspektívába helyezzük egy vizsgált faj viselkedés- és elmeképességének egyedfejlődését, akkor a fajspecifikus jellegek egyedfejlődése mellett lehetőség nyílik arra is, hogy megismerjük, miként oszlik meg ez a képességkészlet a különböző törzsfejlődési múlttal és adaptációs előtörténettel rendelkező más fajok között. Ebben nyújt segítséget a viszonylag közeli közös leszármazással jellemezhető, de eltérő környezetekhez adaptálódott fajok hom*ológián alapuló vizsgálata, valamint a törzsfejlődésileg távoli, de a vizsgálandó készség szempontjából hasonló környezeti feltételekhez adaptálódott fajok analógián (konvergencián) alapuló összehasonlítása. Számos faj egyazon kísérleti paradigmában történő összehasonlító megfigyelése rámutathat arra, hogy egy-egy tulajdonság (1) általánosan jellemző-e a törzsfejlődésileg rokon fajok egy adott csoportjára, (2) valamilyen környezeti tényező nyomán jelent-e meg az adott ökológiai viszonyokhoz alkalmazkodott fajokban, vagy esetleg (3) valamilyen speciális evolúciós szelekció nyomán alakult ki, és csak egy-egy fajra jellemző. A nyelvvel kapcsolatban például az egyik legismertebb tény, hogy az emberi agyban bal féltekei lateralizáció figyelhető meg a jobbkezes populáció mintegy 95

Kutya, ember, csimpánz



és a balkezes populáció közel 75 százalékában. A közelmúlt összehasonlító vizsgálatai (Ocklenburg–Güntürkün 2012) megmutatták, hogy a fajtársakkal való kommunikáció más fajok (emberszabásúak és főemlősök, sőt más emlősök, például a kutya vagy az egér és egyes békafajok) esetében is bal féltekei dominanciát mutat. Ennek alapján úgy tűnik, hogy az emberi nyelv esetében tapasztalt bal agyféltekei dominancia filogenetikai értelemben korán megjelent, és a kommunikációs rendszereket tekintve általánosan elterjedt sajátosság. A kommunikációs készségeket tekintve azonban sok esetben nem áll rendelkezésünkre összehasonlító adat a törzsfejlődés egyes stádiumait megjelenítő különböző fajokról. A fentebb részletezett összehasonlító paradigmának megfelelően az emberi kommunikáció (illetve tetszőleges egyéb kognitív képesség) vizsgálata szempontjából két megközelítés kapott különösen nagy szerepet. Az első az emberhez filogenetikailag közel álló fajok (emberszabásúak és egyéb főemlősök, pl. a csimpánz) összehasonlító vizsgálata; az ilyen megfigyelések közvetett módon arra adnak választ, hogy emberré válás során milyen változások történtek az emberszabásúakkal közös evolúciós őshöz képest. A második megközelítés az emberrel azonos környezetben élő háziasított állatok (legnagyobbrészt a kutya) viselkedését vizsgálja, és a vadon élő rokonokéval (pl. a kutya esetében a farkassal) összehasonlítva arra keresi a választ, hogy az emberi szociális környezet milyen evolúciós hatást jelenthetett, és ez milyen viselkedésbeli változásokhoz vezetett.

.. „Beszélő” állatok: a nyelvtanítási kísérletek tanulságai Az emberi nyelv összehasonlító vizsgálatának talán legalapvetőbb kérdése, hogy egyes fajok képesek-e az emberi nyelvet elsajátítani, és annak különböző (beszélt, írott, jelelt) formáit megérteni, illetve létrehozni, és ha igen, miként. Az első ilyen jellegű vizsgálatok alanyai az ember filogenetikai rokonai, a csimpánzok és más emberszabásúak voltak. A korai kutatások arra irányultak, hogy csimpánzokat megtanítsanak beszélni (Hayes–Nissen 1971). Az 1930-as évek elején a Kellogg házaspár egy Gua nevű nőstény csimpánzt nevelt fel saját fiúgyermekével együtt. Gua 16 hónapos korában megértett körülbelül 100 szót, de sohasem próbált meg Kelloggékhoz beszélni (Ward 1983). A negyvenes években Keith és Cathy Hayes neveltek otthonukban egy Viki nevű csimpánzt. Viki is rengeteg szót tanult meg, sőt némi nehézséggel ki tudta ejteni a mama, papa és a bögre szavakat (Ward 1983). Mindkét esetben közös, hogy bár az alanyok értették a szavakat, képtelenek voltak azokat kiejteni. Ma már tudjuk,



Kis Anna – Miklósi Ádám – Topál József

hogy ennek a kudarcnak egyebek mellett az volt az oka, hogy a csimpánzok hangképző rendszere alapvetően különbözik az emberétől. Ezt követően kutatók beszéd helyett különböző jelnyelveket próbáltak alanyaiknak tanítani. A Gardner házaspár Washoe nevű csimpánzának az amerikai siketnéma-ábécé jeleit tanította meg (Gardner–Gardner 1969). Washoe öt év alatt mintegy 150 jel használatát tanulta meg. E „szavakat” képes volt 2–3 tagú jelsorozatokba fűzni, amelyek elsősorban a szükségletei kielégítésével álltak kapcsolatban, és nagyon gyakran a gondozóhoz intézett kérésekre vonatkoztak. A jelek nagy része azonban olyan kézmozdulatokból és gesztusokból tevődött össze, amelyek nem tekinthetők absztrakt és önkényes szimbólumoknak, hiszen a tárgyra vonatkozó közvetlen rámutatásból álltak. E probléma kiküszöbölésére 1966-tól a Kaliforniai Egyetem kutatatói különböző alakú és színű műanyag lapok (ún. lexigramok) segítségével tanítottak kommunikálni egy Sarah nevű csimpánzt (Premarck–Premack 1974). Sarah szókészlete mintegy 130 jelből állt, ezeket 75–80 százalékos megbízhatósággal használta. Továbbá képes volt 3–5 szóból álló kéréseket létrehozni, sőt arra is meg tudták tanítani, hogy hasonló hosszúságú kérdő mondatokra röviden feleljen, illetve utasításokat teljesítsen. A következő kérdés az volt, hogy Sarah valóban érti-e a szimbólumok jelentését, illetve az összekapcsolásukra vonatkozó szabályokat, hiszen a fentebb ismertetett eredmények alapján nem zárható ki, hogy fejlett kognitív képességeinek és memóriájának köszönhetően azt tanulta meg, milyen szituációban milyen választ kell ahhoz adnia, hogy jutalomhoz (táplálékhoz) jusson. Erre a kérdésre úgy adható válasz, ha bebizonyosodik, hogy az alany létre tudja hozni egy tárgy mentális reprezentációját e tárgy jelenléte nélkül, azaz ha a megtanult szimbólumokat egy új helyzetben is alkalmazni tudja. Sarah ezekben a feladatokban is jól teljesített, képes volt például színek neveit (lexigramjait) a megfelelő színű tárgyak nevével párosítani, ami arra utal, hogy a szimbólumokat az általuk jelölt dolgok alapján – nem pedig a műanyag lapok formája és színe szerint – osztályozta. A nyelvtani szabályok elsajátítása azonban, úgy tűnik, komoly akadályt jelent az emberszabásúak számára. Sarah ugyan képes volt az alany–állítmány– tárgy sorrend következetes és szinte hiba nélküli használatára négy–öt szavas jelsorozatokban („mondatokban”), azonban elképzelhető, hogy nem a szórendet értette meg, hanem lépésenként megtanulta a szavaknak azt a sorrendjét, amelyet a kísérletvezetők jutalommal erősítettek meg. Savage-Rumbaugh (1991) bonobója, Kanzi szolgáltatja az egyetlen elfogadható bizonyítékot arra, hogy az emberszabásúak elemi szinten képesek lehetnek a szintaktikai szabályokat megérteni és alkalmazni. Kanzi ugyan nem kapott olyan intenzív nyelvi „kiképzést”, mint a korábbi kísérletek alanyai, elsősorban utánzás

Kutya, ember, csimpánz



útján tanult, mégis meglepő jártasságra tett szert az emberrel való kommunikáció terén. Gondozói, akiknek szabad volt beszélt nyelvet használniuk, leginkább egy mágnestáblán elhelyezett szimbólumkészlet segítségével kommunikáltak vele. Kanzi számtalan, új jelentésű kombinációt hozott létre, amelyben szimbólumok, gesztusok és hangok egyaránt szerepeltek. Szimbólumhasználata spontánnak és szándékosnak bizonyult; senki sem tanította neki az egyes jelkombinációkat, noha, miután létrehozta őket, általában megerősítették a használatukat. Az esetek többségében két szimbólumot (lexigramot) tudott összekapcsolni, és képes volt egyfajta elemi nyelvtan megértésére. Rájött, hogy a cselekvés megelőzi a tárgyat, ami olyan szabály, amelyet a gondozók használtak ugyan, de külön sohasem tanítottak. Kanzi tanulása ugyanakkor rendkívül hosszú időt (7–8 évet) vett igénybe, mialatt mindössze egy 150 szavas szótárt sajátított el. Megrekedt a kétszavas jelkombinációk szintjén, amelyek ráadásul szinte kizárólag kéréseket tartalmaztak. A beszéd és a jelnyelv értése, illetve produkciója mellett viszonylag kevés figyelmet kapott az összehasonlító kutatók körében az írott nyelv. Ennek legvalószínűbb oka, hogy az írott nyelv olyan speciális kulturális produktum, amely alig néhány ezer éve jelent meg az emberiség történelme során. Evolúciós szemszögből nézve ezen rövid időszak alatt kicsi valamilyen specifikus szelekció valószínűsége, így az olvasás képessége egy már meglévő biológiai-neurális rendszerre alapozva jöhetett létre (Dehaene–Cohen 2007). Az egyes hangokat reprezentáló írott jelek elkülönítése nagy valószínűség szerint nem igényel különösebben fejlett kognitív képességeket; számos állatfaj (emlősök, madarak) képes az emberhez hasonlóan egyes betűket másoktól megkülönböztetni (Blough 1982). Egy páviánokon végzett vizsgálat (Grainger et al. 2012) azonban arra is rávilágított, hogy ennél bonyolultabb olvasási feladatokat is képes lehet egy nem-emberi faj végrehajtani. A vizsgálathoz összesen hat páviánt tanítottak meg egy érintőképernyős készülék segítségével, hogy négy betűből álló angol szavakat megkülönböztessenek négy betűből álló értelmetlen kombinációktól, azaz álszavaktól. Az értelmes szavak és az álszavak különböztek a szótaggyakoriság tekintetében, így lehetséges volt statisztikai alapon megkülönböztetni őket. Az alanyoknak a képernyő megérintésével kellett válaszolniuk, és a helyes választ jutalom követte. Másfél hónapnyi tréninget követően a vizsgálatban részt vevő páviánok képesek voltak mintegy 75-os pontossággal megkülönböztetni a valós szavakat az álszavaktól. A részletes elemzés azt is megmutatta, hogy ez a megkülönböztetés a szótaggyakoriságon alapult. Az eredményekből egyrészt az következik, hogy a statisztikai tanulás fontos szerepet játszhat nyelvi ingerek feldolgozásában, másfelől az is kiderült, hogy az olvasáshoz szükséges bizonyos alapvető kognitív készségek nemhumán fajokban is megjelenhetnek.



Kis Anna – Miklósi Ádám – Topál József

A nyelvi kommunikáció előzményeit feltáró emberszabású-vizsgálatokhoz képest jóval később indult meg annak kutatása, hogy az emberi verbális környezet mint specifikus adaptációs kényszer milyen képességeket „hívhatott elő” az embertől filogenetikusan távol eső, de az emberi környezetbe evolúciós léptékben is számottevő ideje beilleszkedett fajban, a kutyában. Az első ilyen tanulmány (Kaminski et al. 2004) egy Rico nevű border collie szótanulási képességeit mutatta be. Rico több mint 200 tárgy – többnyire játékok – nevét ismerte, és képes volt kizárásos alapon ismeretlen szavakhoz egy új tárgyat társítani. Korábbi vizsgálatokban (pl. Young 1991) szereplő kutyáknak csak viszonylag kevés tárgy közül kellett visszahozni a megfelelőt, így nem derült fény arra, hogy mekkora szókincset képesek elsajátítani. Ricónak először tíz hónapos korában tanított a gazdája szavakat olyan módon, hogy három különböző tárgyat rakott le valahol a lakásban, és kérte, hogy hozza oda az egyiket. Amennyiben a kért tárgyat hozta, akkor jutalomfalattal vagy játékkal jutalmazta. Új tárgyak neveit úgy tanulta meg, hogy gazdája bemutatta neki a tárgyat, és két-háromszor elmondta a nevét, majd szabadon játszhatott az új tárggyal, ami azt követően bekerült azok közé, amelyekből választania kellett, ha kérték, hogy hozzon oda valamit. Rico 200 szavas szókincse hozzávetőlegesen megegyezik a főemlősöknél elérhető szókinccsel, és lényegesen nagyobb annál a 3–5 szónál, amelyek elsajátítását korábbi kutatások igazolták. Érdemes azonban megjegyeznünk, hogy a kutya esetében az ily módon kísérletesen is igazolt „szókincs” csak a főnevekre (tárgyak neveire) vonatkozik, és nincs adat arról, hogy hányféle cselekvésre felszólító verbális utasítást (igét) képes elkülöníteni. Pedig egy átlagos kutya „beszédértő” teljesítménye jórészt cselekvések szóbeli megnevezéséhez kapcsolódik, így Rico repertoárja is valószínűleg tartalmazott igéket. Egy következő tesztben a már ismert tárgyak közé egy új tárgyat helyeztek el kutatók. Az első próbában Ricónak egy ismert tárgyat kellett visszahoznia, majd ezt követően a gazda az új tárgyat kérte, miközben egy Rico számára ismeretlen nevet használt. Rico itt is jól teljesített, és sikeresen kiválasztotta az új tárgyat az ismeretlen név hallatán. Mi több, Rico ezekre az újonnan tanult nevekre négy hét elteltével is emlékezett, és képes volt ezeket a tárgyakat több ismerős és ismeretlen tárgy közül helyesen kiválasztani. A szerzők úgy érvelnek, hogy ez az első ránézésre meglehetősen komplex képesség, amelyet Rico elsajátított, egyszerű mechanizmusokon is alapulhat, és meglehet, hogy a gyerekek és a kutyák más-más módon tanulják meg, hogy a tárgyakhoz egy-egy szó tartozik. Egy néhány évvel későbbi vizsgálat (Pilley–Reid 2010) egy másik border collie, Chaser szótanulási képességeit mutatta be, aki még Rico teljesítményét is

Kutya, ember, csimpánz



felülmúlta, hiszen összesen 1022 tárgy–szó párt tanult meg, és ezekre még három év elteltével is emlékezett. Míg Rico feladata pusztán az volt, hogy a gazdájához vigye a kívánt tárgyat (bár a szerzők megjegyzik, hogy a gazda elmondása alapján Rico képes volt a tárgyat különböző személyekhez odavinni, vagy egy dobozba belerakni), addig Chaser további tesztekben bizonyította, hogy képes különböző parancsokat – odahoz, illetve lábbal vagy orral megérint – végrehajtani a megtanult tárgyakkal kapcsolatban. Az eredmények azt bizonyítják, hogy a tárgyak neve Chaser elméjében valóban a tárgyra vonatkozó reprezentációs szereppel bírt. Chaser – Ricóhoz hasonlóan – képes volt kizárásos alapon a még nem ismert szavakhoz új tárgyakat társítani; és ezen tanulmány szerzői kizárták azt az alternatív hipotézist (ami a Rico kísérletekkel szemben kritikaként merült fel), hogy a jelenség újdonságpreferencia alapján magyarázható lenne: Chasert olyan próbákban is tesztelték, amelyekben a kutyának új tárgyak közül kellett egy már ismert nevű tárgyat kiválasztania. A legfrissebb ilyen irányú vizsgálatban egy Bailey nevű yorkshire terrier vett részt (Griebel–Oller 2012). A szerzők nemcsak bebizonyították, hogy a kutyák közül nem csak a border collie fajta képes nagyszámú tárgy nevét megtanulni, hanem számos korábban megválaszolatlan kérdésre is igyekeztek választ adni. Bailey összesen 117 tárgy nevét ismerte, és ezeket kérésre a gazdájához vitte. A tesztek során kiderült, hogy Bailey nem csak a gazdája utasításainak engedelmeskedett, de két kísérletvezető (nő és férfi, német és amerikai kiejtésű) kérésére is sikeresen odavitte a kívánt tárgyat, bizonyítva, hogy képes a némiképp különböző hangsorokból is általánosítani. Bailey azonban nem volt képes kizárásos alapon új tárgyakat odavinni, amikor egy számára ismeretlen nevet használtak a vezényszóban. Bár a videofelvételek utólagos visszanézésével megállapítható volt, hogy sokszor az új tárgyat vette először a szájába, és néha el is indult vele a gazdája felé – miközben jóval több időt töltött a tárgyak manipulálásával, mint azokban a próbákban, amelyekben egy ismert név hangzott el a parancsszóban – végül általában inkább egy már ismerős tárgyat vitt magával. A szótanulás mellett a nyelvi kompetencia alapvető kérdése a szintaxis, amely a jelek sorrendjétől függő jelentésre vonatkozik. Ramos és Ades (2012) egy Sofia nevű keverékkutyán vizsgálták a jelsorrend hatását. A kutya két hónapos korától rendszeres tréningeken vett részt, és két éves korára megtanulta négy tárgy (labda, kulcs, üveg, bot) és két akció (mutat, hoz) nevét. Ezt követően az volt a cél, hogy Sofia megértse, a főnevek és az igék eltérő fogalmi tartalmúak, és egy tárgy neve nem egy bizonyos tárgyra, hanem hasonló tárgyak elvont halmazára vonatkozik. Ezért nemcsak a tárgy–akció párosok összeállítását változtatták véletlenszerűen, hanem a két szófaj sorrendjét is, tehát az utasításokban hol a



Kis Anna – Miklósi Ádám – Topál József

főnév, hol az ige szerepelt első helyen. Emellett nem csak egy bizonyos labdát, kulcsot stb. használtak, hanem eltérő színű, anyagú, formájú labdákat, kulcsokat. Sofia ezen tesztek során is jól szerepelt (szignifikánsan a véletlen szint felett teljesített, bár soha nem érte el a 100-ot). A fenti vizsgálatok, amelyek bizonyos szempontból az emberszabásúakéval összemérhető nyelvi kommunikációs képességeket igazoltak kutyáknál, nem adnak egyértelmű választ arra a kérdésre, hogy az efféle, kísérleti helyzetekben megfigyelt teljesítmények mennyiben köszönhetőek annak, hogy az emberi nyelvi környezet is specifikus alkalmazkodási kényszert jelenthetett a domesztikáció során. Farkasokkal való összehasonlítás hiányában egyelőre nem világos, hogy a kutya „beszédértése” milyen értelemben köszönhető az emberi környezetben lezajlott szelekciónak. Alternatív magyarázat lehet, hogy a megfigyelt jelenségek mögött általánosabb elmemechanizmusok állnak. Számos további vizsgálat szükséges annak eldöntésére, hogy vajon a kutya „beszédértése” milyen értelemben feleltethető meg (funkcionális analógia) egy preverbális csecsemő idevágó képességeinek. Idevágó fontos ismeret, hogy a főemlősök és a kutyák mellett számos más fajoktól (palackorrú delfin (Tursiops truncatus): pl. Herman et al. 1984; afrikai szürkepapagáj (Psittacus erithacus): pl. Pepperberg 2002) esetében is sikerült kimutatni egyes alapvető nyelvi képességek meglétét. A nyelvi képességek kutatása szempontjából az egyik legismertebb alany Alex, a szürkepapagáj (Pepperberg 2002), aki több, mint 50 tárgy nevét ismerte, valamint 7 színt, 5 formát, a számokat 6-ig, 3 kategóriát (szín, forma, anyag) és olyan kifejezéseket, mint Gyere ide! vagy Nem!. Ezeket a szavakat nem csak értette, de adott kontextusban ő maga is releváns módon használta. Az efféle kísérletek nyomán sikerült eloszlatni azt a korábban elterjedt elképzelést, hogy a nyelvi képességre alapozott összefüggő komplex problémák megoldására kizárólag a főemlősök elméje képes. Úgy tűnik ugyanis, hogy specifikus és részleteiben mindmáig nem ismert evolúciós és ökológiai folyamatok (alkalmazkodási kényszerek) számos más állat elméjét tehetik alkalmassá arra, hogy képes legyen alapvető nyelvi képességek megjelenítésére.

.. Mely kognitív képességek elengedhetetlenek az emberi nyelv kialakulásáshoz? A fent bemutatott összehasonlító vizsgálatok arra keresték a választ, hogy milyen mértékben lehetnek különböző fajok képesek az emberi nyelv specifikus aspektusainak megértésére, produkciójára. Az alábbiakban három olyan elmeképességet mutatunk be részletesebben, amelyek az emberi nyelvhasználathoz nélkülözhe-

Kutya, ember, csimpánz



tetlenek, és amelyeket éppen emiatt sokáig emberspecifikusnak tartottak: a kategorikus percepciót, a referencialitást és a vokális imitációt (l. még: Hauser et al. 2002).

... Kategorikus percepció Az ember élete során alapvető, hogy az őt érő legkülönbözőbb ingereket (színeket, hangokat stb.) kategóriákba sorolja, akkor is, ha egy kontinuum mentén helyezkednek el. Kategorikus percepción azt értjük, ha ezek a kategóriák egy folytonos fizikai paraméter diszkrét egységekben történő észlelése során alakulnak ki. A hangok kategorikus percepciója alapvető a beszédértéshez, ugyanakkor meglepőnek tűnhet, hogy ezzel a képességgel nem csak az ember rendelkezik. Kísérleti körülmények között csincsillák is képesek voltak megtanulni a da és ta szótag közötti különbséget (Kuhl–Miller 1975), és e tudásukat a tréninget követően általánosítottak mesterségesen szintetizált da és ta szótagokra is. Ezt követően a kutatók a mesterségesen szintetizált da és a ta szótagok között egy folytonos átmenetet hoztak létre, és az alanyoknak az volt a feladata, hogy ezeket a hangingereket az eredeti két kategóriába sorolják. Az eredmények azt mutatták, hogy a csincsillák az angol anyanyelvű felnőtt emberekhez hasonló helyen húzzák meg a határt a kétféle szótag között. A tanulmány szerzői maguk is megjegyzik, hogy ez nem bizonyítja, hogy a csincsillák és az emberek ugyanúgy dolgozzák fel és kategorizálják a hangokat, de rávilágít arra, hogy a kategorikus percepció egyéb nyelvi képességek hiányában is megjelenik. A kategorikus percepció mellett azonban egyéb kategorizációs képességek is fontos szerepet töltenek be a nyelvészlelésben. Már az újszülött ember is képes megkülönböztetni két eltérő nyelven (pl. hollandul, illetve japánul) elhangzó beszédet (Ramus 2002), többek között a fonotaktikai ritmus alapján. Azonban ez a képesség is kimutatható más állatfajokban. Tamarinok (Ramus 2002) és patkányok (Toro et al. 2003) is különbséget tesznek japánul és hollandul elhangzó mondatok között, ami arra utal, hogy a különböző ritmusú vokalizációk megkülönböztetése szintén egy evolúciós értelemben ősi képesség. A csimpánzokról sokáig úgy tartották, hogy nem képesek tárgy- és fogalmi kategorizációra (fa*got et al. 2006), mert képtelennek bizonyultak színeket az emberi koncepcióknak megfelelő kategóriákba csoportosítani. Ugyanakkor egy habituációs-diszhabituációs paradigmát alkalmazó vizsgálatban (Murai et al. 2005) azt találták, hogy a csimpánzok képesek tárgyakat absztrakt kategóriákba sorolni (pl. ’emlős’, ’bútor’, ’jármű’). Kutyák kategorizációs képességét nem-nyelvi ingerek segítségével vizsgálták (Range et al. 2008). Egy érintőképernyős készülék alkalmazásával sikerült



Kis Anna – Miklósi Ádám – Topál József

kimutatni, hogy négy egyed sikeresen alakított ki általános kategóriákat (pl. ’kutya’, ’tájkép’). A szótanulásos kísérletek is számos bizonyítékot adtak a kutyák kategorizációs képességére. A már korábban említett Chaser nevű border collie (Pilley–Reid 2010) képes volt kategórianeveket – játék, labda, frizbi – megtanulni, és a teszt során sikeresen általánosított olyan tárgyakra, amelyek megnevezésére korábban még nem használták az adott kategórianevet.

... Referencialitás Az állatvilágban előforduló kommunikációs jelzések legnagyobb része a jeladó belső állapotáról, motivációjáról hordoz információt (pl. félelmet vagy éppen agressziót fejez ki), szemben az emberekre tipikusan jellemző ún. referenciális jelzésekkel, amelyek a külvilágról hordoznak információt. Ennek következtében felmerülhet, hogy a referencialitás is olyan nyelvi sajátosság, amely kizárólagosan az emberre jellemző. Régóta ismert, hogy a cerkófmajmok különböző vészjelekkel jelzik az egyes ragadozók közeledtét (Seyfarth et al. 1980), illetve makákók (Hauser–Marler 1993) különböző szituációkban eltérő hangjelzést hallatnak élelem láttán. Ezek a megfigyelések arra utalnak, hogy az állatok is képesek a külső környezetről kommunikálni. Az ilyen kommunikációt tehát funkcionális értelemben referenciálisank tekinthetjük, hiszen a külső környezet befolyásolja, hogy milyen jelzést (hangot) ad az állat. Azonban nem zárható ki, hogy az eltérő külső környezet következtében más-más belső állapotban van a jeladó, és a különböző vokalizációk pusztán a környezetnek megfelelő belső állapotot tükrözik. Funkcionális értelemben referenciálisnak tekinthetjük a kommunikációt, amennyiben 1. a jel egyedülálló módon és specifikusan csak adott körülmények között – az adott referencia meglétekor – jelenik meg (produkciós kritérium); 2. a jel a kiváltó inger vagy más, egyébként rendelkezésre álló kulcs hiányában is elégséges a megfelelő válaszreakció kiváltásához (percepciós kritérium); 3. a jeladást befolyásolja a társak jelenléte vagy hiánya, vagyis az egyed például nem jelez, ha egyedül van, illetve figyelembe veszi a társai reakcióit és figyelmi állapotát (közönség hatása); 4. a jeladó, felismerve a jelvevő ismerethiányos állapotát, azzal a céllal jelez, hogy társa ezen állapotán változtasson (szándék kritériuma) (Evans 1997).

Kutya, ember, csimpánz



Egyes elképzelések szerint (Marler et al. 1992) a kommunikációs jeleket egy többdimenziós modell keretében lenne érdemes vizsgálni, amely a motivációs és a referenciális tulajdonságokat egyaránt figyelembe veszi. Egyes szignálok (pl. sok fészekhagyó madár elégedettséget/félelmet kifejező hangja vagy a csecsemők sírása) döntően a belső állapot megváltozásához köthetők, míg mások (pl. az emberi beszéd) képesek szinte kizárólag referenciális karakterű tartalmat is kifejezni. Az ilyesfajta szélsőséges jelzések, amelyek csak motivációs vagy csak referenciális komponensekkel rendelkeznek, azonban viszonylag ritkák, és a jelentéstartalmat általában mind a belső állapot, mind a külső körülmények befolyásolják. Az emberszabásúak szociális interakcióit kísérő hangjai (morgás, agonisztikus visítások) nagyrészt motivációs alapúak (Rowell–Hinde 1962), ugyanakkor referenciális információkat is közvetíthetnek a csapatban elfoglalt pozícióról (Cheney–Seyfarth 1982; Gouzoules et al. 1984). A kommunikáció funkcionálisan referenciális voltát főemlősök mellett főként madarakon vizsgálták, és ebben a csoportban is több faj esetén bebizonyosodott ennek a képességnek a megléte. Egy hollókon (Corvus corax) végzett terepi vizsgálat (Bugnyar et al. 2001) során például az alanyok három különböző táplálékforrás egyikével találkoztak. A kutatók arra voltak kíváncsiak, hogy miként változtatják a fajtársakat magukhoz hívó hangjelzéseiket. Az elsőként megfigyelt rövid „hú” jeleket a hollók jellemzően az élelemforrás megközelítése közben hallatták, és megjelenése nem függött a kísérleti helyzettől. Eszerint ezt a jelet az alany motivációs állapotának változása következtében hallatja, és annak belső állapotát tükrözi. A táplálék jelenlétére az alanyok mindig egy adott hosszú „haa” jelzéssel is reagáltak. Ennek gyakorisága eltérő volt a különböző fajtájú élelemforrások esetében, így azt mondhatjuk, hogy ez a jelzés az élelem minőségéről hordozott funkcionálisan referenciális információt. Kutyafélék esetében sokáig nem volt ismert, hogy képesek-e funkcionális értelemben referenciális jelzések alkalmazására. Faragó et al. (2010) különböző helyzetekben (a kutya őrzi a csontját egy másik kutyától, a kutyát megközelíti egy fenyegető idegen, a kutya rongyozós játékot játszik a gazdájával) rögzített morgásokat játszott vissza az alanyoknak. A kísérleti helyiségben egy letakart kutyaketrec elé egy csontot helyeztek, és a tesztben részt vevő kutyáknak a ketrecben elrejtett hangszórókból játszották vissza a különböző szituációkból származó morgásokat, abban a pillanatban, amikor megközelítették a csontot. A kutyák eltérően viselkedtek a különböző helyzetekben felvett morgások esetében. A helyzethez illeszkedő csontőrző morgás hallatán nagyobb latenciával közelítették meg ismét a csontot, és sokkal hamarabb otthagyták, mint azok a kutyák, akik a helyzethez nem illeszkedő, játékos vagy fenyegető ember által kiváltott morgást hallották.



Kis Anna – Miklósi Ádám – Topál József

A csontőrző és a fenyegető morgás megkülönböztetése arra utal, hogy a kutyák morgása információt hordoz az adott helyzetről, amelyben elhangzik.

... Vokális imitáció Egyes énekesmadár-fajok fiókái a fajukra jellemző kommunikációs rendszert vokális imitáció révén sajátítják el, ami egy speciálisan érzékeny egyedfejlődési szakaszhoz köthető auditorosan vezérelt motoros tanulás, s ez részben szerepet játszik az emberi csecsemő nyelvelsajátítási folyamataiban is. A vokális imitáció a beszélt nyelv kialakulása szempontjából kiemelkedően fontos, és – bár más főemlősökre nem jellemző – számos párhuzam lelhető fel az énekesmadarak énektanulásával mind a viselkedés, mind a neurális és a genetikai háttérmechanizmusok szintjén (Bolhuis et al. 2010). Mindkét esetben a tanult és a veleszületett képességek interakciója figyelhető meg. A teljes izolációban nevelt énekesmadarak is énekelnek, anélkül, hogy hallanák a fajtársaikat, azonban ez az ének abnormális, bár tartalmaz fajspecifikus jellemzőket. Ha fiatal zebrapintyek egy ilyen izolációban nevelkedett egyed abnormális énekét hallják, akkor spontán módon azt fogják utánozni. Azonban több generációt figyelembe véve, az ének egyre inkább hasonlít a fajspecifikus változathoz (Fehér et al. 2009). A megfigyelések párhuzamba állíthatók az emberek nyelvi rendszereinek evolúciójával, és a nyelvek kulturális tanulás révén bekövetkező átalakulásával.

. Ember–állat interakció, mint a fajok közötti kommunikáció speciális esete Az emberi nyelv valamilyen formájának megértése, illetve az ehhez szükséges kognitív képességek vizsgálata mellett összehasonlító szempontból fontos szerepet kapott a nem-nyelvi kommunikáció kutatása is. Különösen az a kérdés kapott kiemelt figyelmet, hogy az egyes fajok miként képesek az emberrel kommunikálni, azaz milyen mértékben képesek értelmezni az ember jelzéseit, illetve milyen jelzéseket használnak az ember viselkedésének megváltoztatására, befolyásolására. Az összehasonlító kutatások során az egyik leggyakrabban alkalmazott kommunikációs helyzet az emberi mutató gesztus értésének a vizsgálata. A mutatás olyan fajspecifikus, öröklött háttérrel is rendelkező gesztus, amellyel az ember képes mások figyelmét a környezet egyes tárgyaira, illetve a környezetben történő eseményekre irányítani. Az emberi csecsemők már egy éves korukban spontán módon követik egy felnőtt mutatását (Behne et al. 2005). Ez a képesség fokozatosan alakul ki az egyedfejlődés során, 9 hónapos csecsemők már figyelemmel

Kutya, ember, csimpánz



kísérik, ha a felnőtt kinyújtott karral és mutatóujjal egy kb. 50 cm távolságban lévő tárgyra mutat. Egyévesnél idősebb csecsemők már képesek a mutatás irányát egy távolabb elhelyezkedő tárgyig követni, mintha képzeletbeli „vonalat” húznának az ujj vége és a tárgy között. 15 hónapos korukban pedig már az sem akadályozza őket a követésben, ha a kutatók egy közelebb lévő tárggyal próbálják megzavarni a figyelmüket (Morissette et al. 1995; Butterworth–Itakura 2000). A csimpánzok számára ez a kommunikációs helyzet számos nehézséget okoz, még az ember által felnevelt egyedek teljesítménye is lényeges mértékben különbözik az emberétől (Povinelli et al. 1997; 1999). Csimpánzok számára meglepően nehéznek bizonyul az emberi gesztusok értelmezése, és egyes vizsgálatokban még hosszas gyakorlás után sem képesek követni a mutatás irányát annak érdekében, hogy például élelmet találjanak egy rejtekhelyen (Tomasello et al. 1997). Ha azonban a kooperatív jellegű mutató gesztus helyett egy versengő kísérleti helyzetet teremtünk (az ember nem rámutat a rejtekhelyre, ahol a jutalom található, hanem csak felé nyúl, mintha nem érné el), akkor a csimpánzok sikeresen kiválasztják, hogy hol keressenek (Tomasello–Call 1994). A csimpánzokkal ellentétben a kutyák spontán módon, már korai életkorban is képesek az ember különböző mutató jelzéseit megfelelően értelmezni (Soproni et al. 2002), azaz a mutatás iránya alapján megtalálják az elrejtett élelmet. Ezzel szemben emberi környezetben nevelt fiatal farkasok (Miklósi et al. 2003) nem képesek erre, és csak felnőttkorukra tanulják meg az emberi mutató jelzéseket követni (Gácsi et al. 2009). Az a tény, hogy a kutyák bizonyos értelemben felülmúlják mutatásértésben vad rokonaikat, a farkasokat, és az emberhez filogenetikailag legközelebb álló csimpánzokat, arra enged következtetni, hogy az emberrel közös evolúciós múlt, illetve az emberrel való együttműködésre történt szelekció a kommunikációs rendszerre is hatással volt. Az ilyen referenciális gesztusokkal való kommunikációnak fontos feltétele, hogy az interakció során a jeladó és a jelvevő egymás figyelmi állapotát figyelembe vegye. A figyelmi állapot felismerésének első lépése annak a felismerése, hogy a másik tekintetének iránya milyen jelentősséggel bír (Emery et al. 1997; Emery 2000). Tekintetkövetésről akkor beszélhetünk, ha a jelvevő kövei a jeladó nézési irányát, függetlenül a konkrét céltárgytól. A közös figyelem akkor valósul meg, ha a jeladó és -vevő figyelme ugyanarra a dologra irányul a tekintetkövetés következtében. Kapcsolt figyelemről akkor beszélünk, ha a közös figyelmen túl, a két egyed kölcsönösen érzékeli a másik figyelmi állapotát is. A kapcsolt figyelem nagyon fontos szerepet tölt be a gyerekek nyelvtanulása során: a tárgyak, események neveit a gyerek azáltal tanulja meg, hogy az adott szó kimondásával párhuzamosan a felnőtt a megnevezett dologra néz vagy mutat. A gyerek pedig már 6,5 hónapos kora körül képes érzékelni, hogy mi a felnőtt figyelmének tárgya,



Kis Anna – Miklósi Ádám – Topál József

amennyiben megfelelő figyelemfelkeltő és kommunikációsszándék-kifejező jelzéseket alkalmazunk (Senju–Csibra 2008). A tekintetkövetés jelensége az állatfajok viszonylag széles körében megfigyelhető (pl. kecskéknél: Kaminski et al. 2005; hollóknál: Schloegl et al. 2007; teknősöknél: Wilkinson et al. 2010). A különböző főemlősfajok egyedei társaik tekintetirányának figyelésével szereznek információt a másik egyed szándékairól, emocionális állapotáról vagy a körülöttük zajló eseményekről. A csimpánzok képesek az ember tekintetének irányát követni, sőt megértik annak „célját” is (Tomasello et al. 1999) abban az értelemben, hogy amikor a kísérletvezető tekintetének irányában valamilyen, a tekintetet megakasztó nagyobb, átlátszatlan tárgy volt, akkor is követték az ember tekintetének irányát és a jutalmat az „akadály” mögött keresték. Fontos azonban megjegyezni, hogy a tekintetkövető viselkedés önmagában nem nyújt elegendő alapot arra, hogy feltételezzük: ezek az állatok értik a másik egyed figyelmi állapotának jelentőségét. Egy másik ehhez kapcsolódó kérdés, hogy vajon az egyed képes-e kiépíteni a másik kommunikatív szándékára utaló reprezentációt, azaz képes-e felfogni, hogy a másik jelzése az ő számára információt nyújt. Feltételezhetjük, hogy amennyiben egy ilyen reprezentáció létrejön, akkor az egyed képes lehet bármilyen, elvileg megkülönböztethető jelzést kommunikációs jelként értelmezni. A csimpánzokkal és orangutánokkal végzett vizsgálatok csak korlátozott mértékben utalnak ilyen reprezentáció meglétére (Tomasello–Call 1994). A kutya azonban érzékeny az ember tekintetirányának referenciális sajátosságaira (Soproni et al. 2002), illetve, ha egy kommunikatív interakciót a közlési szándékra utaló (osztenzív) jelzések vezetnek be (megszólítás, szemkontaktus), akkor az alanyok, a csecsemőkhöz hasonlóan, hajlamosabbak követni a demonstrátor tekintetét (Téglás et al. 2012). Mindezek alapján elmondható, hogy az együttműködést feltételező, kommunikációs interakciókban a kutya kifinomultabban értelmezi az emberi figyelmi állapot jelzéseit, mint az ember által felnevelt, fogságban élő csimpánzok. Összességében azt láthattuk, hogy a kommunikáció összehasonlító vizsgálata sok esetben rámutathat arra, hogy az emberi nyelv, illetve az ahhoz szükséges kognitív képességek (például a kategorikus percepció, a referencialitás) nem emberspecifikusak, hanem más fajokban is megjelennek. Egy adott képesség kimutatása az egyes nem-humán fajokban sok esetben a jelenség aktuális definícióján múlik. Az emberhez hasonló teljesítményt lehetővé tevő kommunikációs és egyéb kognitív képességek sok esetben visszavezethetők a közös evolúciós múltra vagy az azonos környezetre és az ezzel együtt járó hasonló szelekciós hatásokra. Az összehasonlító kutatás eredményei közelebb vezethetnek minket annak megértéséhez, hogy az emberi nyelv miben tér el az élővilágban megfigyelhető más kommunikációs rendszerektől.

Kutya, ember, csimpánz



Irodalom Behne, Tanya – Malinda Carpenter – Michael Tomasello 2005. One-year-olds comprehend the communicative intentions behind gestures in a hiding game. Developmental Science 8: 492– 499. Blough, Donald 1982. Pigeon perception of letters of the alphabet. Science 218: 397–398. Bolhuis, Johan – Kazuo Okanoya – Constance Scharff 2010. Twitter evolution: Converging mechanisms in birdsong and human speech. Nature Reviews. Neuroscience 11: 747–59. Brenner, Eric – Rainer Stahlberg – Stefano Mancuso – Jorge Vivanco – Frantisek Baluska – Elizabeth Van Volkenburgh 2006. Plant neurobiology: An integrated view of plant signaling. Trends in Plant Science 11: 413–419. Bugnyar, Thomas – Maartje Kijne – Kurt Kotrschal 2001. Food calling in ravens: Are yells referential signals. Animal Behaviour 61: 949–958. Butterworth, George – Shoji Itakura 2000. How the eyes, head and hand serve definite reference. British Journal of Developmental Psychology 18: 25–50. Camilli, Andrew – Bonnie Bassler 2006. Bacterial small-molecule signaling pathways. Science 311: 1113–1116. Cheney, Dorothy – Robert Seyfarth 1982. How vervet monkeys perceive their grunts: Field playback experiments. Animal Behaviour 30: 739–751. Comins, Jordan – Timothy Gentner 2010. Working memory for patterned sequences of auditory objects in a songbird. Cognition 117: 38–53. Csányi, Vilmos 2003. Reconstruction of the major factors in the evolution of human behavior. Praehistoria 4–5: 1–12. Dehaene, Stanislas – Laurent Cohen 2007. Cultural recycling of cortical maps. Neuron 56: 384–398. Emery, Nathan 2000. The eyes have it: The neuroethology, function and evolution of social gaze. Neuroscience and Biobehavioral Reviews 24: 581–604. Emery, Nathan – Erika Lorincz – David Perrett – Michael Oram – Christopher Baker 1997. Gaze following and joint attention in rhesus monkeys (Macaca mulatta). Journal of Comparative Psychology 111: 286–293. Evans, Christopher 1997. Referential signals. In: Donald Owings – Michael Beecher – Nicholas Thompson (szerk.): Perspectives in ethology. Vol. 12: Communication. New York: Plenum Press. 99–144. fa*got, Joël – Julie Goldstein – Jules Davidoff – Alan Pickering 2006. Cross-species differences in color categorization. Psychonomic Bulletin & Review 13: 275–280. Faragó, Tamás – Péter Pongrácz – Friederike Range – Zsófia Virányi – Ádám Miklósi 2010. “The bone is mine”: Affective and referential aspects of dog growls. Animal Behaviour 79: 917– 925. Fehér, Olga – Haibin Wang – Sigal Saar – Partha Mitra – Ofer Tchernichovski 2009. De novo establishment of wild-type song culture in the zebra finch. Nature 459: 564–568. Gácsi, Márta – Borbála Győri – Zsófia Virányi – Enikő Kubinyi – Friederike Range – Bea Belényi – Ádám Miklósi 2009. Explaining dog wolf differences in utilizing human pointing gestures: Selection for synergistic shifts in the development of some social skills. PLoS ONE 4: e6584. Gardner, Allen – Beatrice Gardner 1969. Teaching sign language to a chimpanzee. Science 165: 664–672.



Kis Anna – Miklósi Ádám – Topál József

Gouzoules, Sarah – Harold Gouzoules – Peter Marler 1984. Rhesus monkey (Macaca mulatta) screams: Representational signalling in the recruitment of agonistic aid. Animal Behaviour 32: 182–193. Grainger, Jonathan – Stéphane Dufau – Marie Montant – Johannes Ziegler – Joël fa*got 2012. Orthographic processing in baboons (Papio papio). Science 336: 245–248. Griebel, Ulrike – Kimbrough Oller 2012. Vocabulary learning in a Yorkshire terrier: Slow mapping of spoken words. PLoS ONE 7: e30182. Hauser, Marc D. – Noam Chomsky – W. Tec*mseh Fitch 2002. The faculty of language: What is it, who has it, and how did it evolve? Science 298: 1569–1579. Hauser, Marc D. – Peter Marler 1993. Food-associated calls in rhesus macaques (Macaca mulatta): I. Socioecological factors. Behavioral Ecology 4: 194–205. Hayes, Keith – Catherine Nissen 1971. Higher mental functions of a home-raised chimpanzee. In: Alan Martin Schrier – Fred Stollnitz (szerk.): Behavior of nonhuman primates: Modern research trends. New York: Academic Press. 59–115. Herman, Louis – Douglas Richards – James Wolz 1984. Comprehension of sentences by bottlenosed dolphins. Cognition 16: 129–219. Jakobson, Roman 1969. Hang – jel – vers. Válogatott tanulmányok, szerk.: Szépe Gy.–Fónagy I. Budapest: Gondolat. Kaminski, Juliane – Joseph Call – Julia Fischer 2004. Word learning in a domestic dog: Evidence for “fast mapping”. Science 304: 1682–1683. Kaminski, Juliane – Julia Riedel – Joseph Call – Michael Tomasello 2005. Domestic goats, Capra hircus, follow gaze direction and use social cues in an object choice task. Animal Behaviour 69: 11–18. Kuhl, Patricia – James Miller 1975. Speech perception by the chinchilla: Voiced–voiceless distinction in alveolar plosive consonants. Science 190: 69–72. Lenneberg, Eric 1974. A nyelv – biológiai szempontból. In: Pap (1974, 310–330). Marler, Peter – Christopher Evans – Marc D. Hauser 1992. Animal signals: Motivational, referential, or both? In: Hanuš Papoucek – Uwe Jürgens – Mechthild Papoucek (szerk.): Nonverbal vocal communication: Comparative and developmental approache. Cambridge: Cambridge University Press. 66–86. Miklósi, Ádám 2009. Evolutionary approach to communication between humans and dogs. Veterinary Research Communications 33: 53–9. Miklósi, Ádám – Enikő Kubinyi – József Topál – Márta Gácsi – Zsófia Virányi – Vilmos Csányi 2003. A simple reason for a big difference: Wolves do not look back at humans, but dogs do. Current Biology 13: 763–766. Morissette, Paul – Marcelle Ricard – Thérèse Décarie 1995. Joint visual attention and pointing in infancy: A longitudinal study of comprehension. British Journal of Developmental Psychology 13: 163–175. Murai, Chizuko – Daisuke Kosugi – Masaki Tomonaga – Masayuki Tanaka – Tetsuro Matsuzawa – Shoji Itakura 2005. Can chimpanzee infants (Pan troglodytes) form categorical representations in the same manner as human infants (hom*o sapiens)? Developmental Science 8: 240–254. Ocklenburg, Sebastian – Onur Güntürkün 2012. Hemispheric asymmetries: The comparative view. Frontiers in Psychology 3: 1–9.

Kutya, ember, csimpánz



Pap Mária (szerk.) 1974. A nyelv keletkezése. Budapest: Kossuth. Pepperberg, Irene 2002. In search of king solomon’s ring: Cognitive and communicative studies of grey parrots (Psittacus erithacus). Brain, Behavior and Evolution 59: 54–67. Pilley, John – Alliston Reid 2010. Border collie comprehends object names as verbal referents. Behavioural Processes 86: 184–195. Povinelli, Daniel – Donna Bierschwale – Claude Cech 1999. Differences between chimpanzees (Pan troglodytes) and humans (hom*o sapiens) in the resting state of the index finger: Implications of pointing. British Journal of Developmental Psychology 17: 37–60. Povinelli, Daniel – James Reaux – Donna Bierschwale – Ashley Allain – Bridgett Simon 1997. Exploitation of pointing as a referential gesture in young children, but not adolescent chimpanzees. Cognitive Development 12: 423 461. Premarck, Ann James – David Premack 1974. Hogyan lehet nyelvet tanítani egy majomnak? In: Pap (1974, 213–230). Ramos, Daniela – Cesar Ades 2012. Two-item sentence comprehension by a dog (Canis familiaris). PLoS ONE 7: e29689. Ramus, Franck 2002. Language discrimination by newborns: Teasing apart phonotactic, rhythmic, and intonational cues. Annual Review of Language Acquisition 2: 85–115. Range, Friederike – Ulrike Aust – Michael Steurer – Ludwig Huber 2008. Visual categorization of natural stimuli by domestic dogs. Animal Cognition 11: 339–347. Rowell, Thelma – Robert Hinde 1962. Vocal communication by the rhesus monkey (Macaca mulatta). Proceedings of the Zoological Society of London 138: 279–294. Saffran, Jenny R. – Marc D. Hauser – Rebecca Seibel – Joshua Kapfhamer – Fritz Tsao – Fiery Cushman 2008. Grammatical pattern learning by infants and cotton-top tamarin monkeys. Cognition 107: 479–500. Savage-Rumbaugh, Sue 1991. Language learning in the bonobo: How and why they learn. In: N. Krasnegor – D. Rumbaugh – R. Schiefelbush – M. Studdert-Kennedy (szerk.): Biological and behavioral determinants of language development. New Jersey: Lawrence Erlbaum. 209– 234. Schloegl, Christian – Kurt Kotrschal – Thomas Bugnyar 2007. Gaze following in common ravens, Corvus corax: Ontogeny and habituation. Animal Behaviour 74: 769–778. Senju, Atsushi – Gergely Csibra 2008. Gaze following in human infants depends on communicative signals. Current Biology 18: 668–671. Seyfarth, Robert – Dorothy Cheney – Peter Marler 1980. Monkey responses to three different alarm calls: Evidence of predator classification and semantic communication. Science 210: 801– 803. Soproni, Krisztina – Ádám Miklósi – József Topál – Vilmos Csányi 2002. Dogs’ (Canis familiaris) responsiveness to human pointing gestures. Journal of Comparative Psychology 116: 27–34. Szathmáry, Eörs – Szabolcs Számadó 2008. Language: A social history of words. Nature 456: 40–41. Téglás, Ernő – Anna Gergely – Krisztina Kupán – Ádám Miklósi – József Topál 2012. Dogs’ gaze following is tuned to human communicative signals. Current Biology 22: 209–212. Tomasello, Michael – Joseph Call 1994. The social cognition of monkeys and apes. Yearbook of Physical Anthropology 37: 273–305.



Kis Anna – Miklósi Ádám – Topál József

Tomasello, Michael – Joseph Call – Andrea Gluckman 1997. Comprehension of novel communicative signs by apes and human children. Child Development 68: 1067–1080. Tomasello, Michael – Brian Hare – Bryan Agnetta 1999. Chimpanzees, Pan troglodytes, follow gaze direction geometrically. Animal Behaviour 58: 769–777. Topál József 2010. Összehasonlító viselkedéskutatás: a darwini gondolat szerepe a pszichológiában egykor és ma. Magyar Pszichológiai Szemle 65: 49–63. Toro, Juan – Josep Trobalon – Núria Sebastián-Gallés 2003. The use of prosodic cues in language discrimination tasks by rats. Animal Cognition 6: 131–136. Ward, Eric 1983. Teaching sign language to a chimpanzee: Some historical references. Journal of the Experimental Analysis of Behaviour 40: 341–342. Wasserman, Edward 1993. Comparative cognition: Toward a general understanding of cognition in behavior. Psychological Science 4: 156–161. Wilkinson, Anna – Isabella Mandl – Thomas Bugnyar – Ludwig Huber 2010. Gaze following in the red-footed tortoise (Geochelone carbonaria). Animal Cognition 13: 765–769. Young, Ann 1991. Verbal commands as discriminative stimuli in domestic dogs (Canis familiaris). Applied Animal Behaviour Science 32: 75–89.

Dog, human, chimpanzee: Cognitive aspects in the analysis of communication in different species Abstract: The variable environmental conditions during early human evolution represented an adaptational pressure that played a key role in putting the social and cognitive capacities of hominids on a special evolutionary track (Csányi 2003). As a consequence, a species capable of highly developed communication and language use emerged (Szathmáry–Számadó 2008; Topál 2010). In order to reveal what aspects of our communicative system and cognitive capacities are the result of this specific evolutionary process a comparative approach investigating our closest phylogenetical relatives, the primates, is indispensable. Furthermore it is also important to study a species that, similarly to us, has adapted to the human niche, such as the domestic dog. This latter approach will shed light on how our ecological environment and concomitant selection pressures led to the emergence of certain social competences. Keywords: comparative, communication, dog (Canis familiaris), primate

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban Gervain Judit CNRS és Université Paris Descartes, Sorbonne Paris Cité [emailprotected]

Kivonat: Egészséges felnőtteknél a nyelvért felelős agyi hálózat általában a bal alsó homloki lebenyt és a kétoldali halántéki lebenyeket foglalja magában. Ezeket a területeket két idegpálya (ventrális és dorzális) kapcsolja össze. A nyelv és a beszédészlelés korai fejlődésének vizsgálata betekintést nyújt ezen agyi specializáció kialakulásának folyamatába, és lehetővé teszi a veleszületett tényezők és a tapasztalat, valamint a kettő interakciójának elkülönítését. Az eredmények azt mutatják, hogy már születéskor jelen van egy általános és tág specializáció a beszéd és a nyelv feldolgozására, így az újszülöttek olyan nyelvi ingereket és kontrasztokat is meg tudnak különböztetni, amelyek nincsenek jelen a (későbbi) anyanyelvükben. Ugyanakkor születéskor a magzati korban, azaz az anyaméhben szerzett nyelvi tapasztalatok hatása is már megfigyelhető. Az első életévek során azután az általános és tág specializáció jórészt leszűkül az anyanyelvben található hangmintázatokra. E ráhangolódási folyamatot idegi szinten is egyre fokozottabb specializáció és a nyelvfeldolgozás egyre erősebb bal féltekei lateralizációja kíséri. Az első életévben az anyanyelv fonológiájának fejlődésével párhuzamosan a szókincs és a nyelvtan elsajátítása is megindul. Az első lexikai és morfoszintaktikai ismeretekre már 6–8 hónapos korban van bizonyíték. Kulcsszavak: beszédészlelés, nyelvelsajátítás, beszéd- és nyelvfeldolgozás agyi specializációja, lateralizáció, perceptuális ráhangolódás

. Brocától a mágneses rezonanciáig: nyelvi feldolgozás a felnőtt agyban Pierre Paul Broca 1861-ben a francia Anatómiai Társaság folyóiratában arról számolt be, hogy beszédzavarral küzdő betegek agyának boncolása alapján a nyelv székhelyét a baloldali homloklebenyben, az azóta róla Broca-területnek nevezett alsó tekervényben találta meg. Az utóbbi évtizedekben az agyi képalkotó eljárások elterjedésével ugrásszerűen megnőtt a tudásunk arról, hogy a felnőtt anyanyelvi beszélők agya hogyan észleli, dolgozza fel, állítja elő és tárolja a nyelvi ingereket. Bár a nyelvi hálózat és annak pontos funkciói teljes egészükben még nem ismertek, a ma rendelkezésre álló adatok alapján a következő kép bontakozik ki (Friederici 2012; Giraud–Poeppel 2012a). A nyelvi feldolgozásért a frontális (homlok-) lebeny alsó tekervénye, valamint a temporális (halántéki) lebeny területei felelősek – bal féltekei dominanciával (a jobbkezeseknél és a balkezes



Gervain Judit

populáció egy jelentős részénél). E területek között két út, azaz idegpályákból álló összeköttetés biztosít kapcsolatot. A ventrális (alsó) út a temporális területek által feldolgozott hangingereket kapcsolja össze a nekik megfelelő szintaktikai szerkezettel és jelentéssel a frontális lebeny alsó tekervényében (így a Broca-területen és a szomszédos területeken). A dorzális út két részre oszlik. Az egyik (néha dorzodorzálisnak is nevezett) rész a temporális területeket a parietális (fali) lebeny alsó részein át a premotoros területekkel köti össze – ez az út a hangok és a motoros reprezentációk közötti összeköttetésekért felel. A másik (dorzo-ventrális) rész a temporális területeket a Broca-területtel köti össze, és a komplex szintaktikai feldolgozásban vesz részt. A felnőttekkel végzett vizsgálatok szükségszerűen nyitva hagynak egy kérdést: mi a nyelv agyi specializációjának eredete? Az emberi agy genetikusan meghatározott módon fel van-e készülve, elő van-e huzalozva a nyelv feldolgozására, vagy a specializáció fokozatosan, a nyelvi tapasztalatok és a nyelvtanulás eredményeképpen jön létre? Erre a kérdésre a nyelvi és agyi fejlődés vizsgálatával kaphatunk választ. E fejezet ezen belül is főként a nyelvtani és szerkezeti szabályosságok fejlődésével foglalkozik, a nyelv egyéb szintjeinek, egységeinek (fonémák, szavak stb.) elsajátítását csak röviden érinti.

. Az agy nyelvi specializációja születéskor: előhuzalozás és prenatális tanulás .. Nyelvpercepció a születés előtt Az elme és az agy nyelvi specializációjának kutatásában az egyik legizgalmasabb kérdés a kezdeti állapot leírása. Bár e kérdés elméleti szempontból igen nagy jelentőségű, a ma rendelkezésre álló vizsgálati módszerekkel nem lehet rá egyszerűen válaszolni. A hallás ugyanis már a terhesség 24–28. hetétől működik, így a magzat már az anyaméhben tapasztalatot szerez anyanyelvéről. Ez két gyakorlati problémát is felvet. Egyrészt az anyaméhben a beszéd másként hangzik, mint normális körülmények között a levegőben. Azt tudjuk, hogy az anya szövetei alacsony frekvenciákat áteresztő szűrőként működnek, így a magzat leginkább a beszéd általános dallamát, prozódiáját érzékeli, az egyes szavakat, hangokat nem vagy csak kevésbé (Lecanuet–Granier-Deferre 1993). Mindezzel együtt az anyaméhben tapasztalt beszéd akusztikai tulajdonságai pontosan nem ismertek, így nem teljesen egyértelmű, amilyen információ áll a magzat rendelkezésére anyanyelvével kapcsolatban a születése előtt. Másrészt a magzat percepciós képességei sem jól ismertek. Bár viselkedéses (DeCasper et al. 1994; Kisilevsky et al. 2009;

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



Lecanuet et al. 1992) és újabban képalkotó (Huotilainen et al. 2005) eljárások is léteznek a magzatok észlelési képességeinek vizsgálatára, ezek alkalmazása érthető praktikus okoknál fogva egyelőre viszonylag korlátozott. Annyi bizonyos, hogy a magzatok képesek a beszéd és más hangingerek bizonyos aspektusait megkülönböztetni, illetve azokat felismerni, megtanulni (DeCasper et al. 1994; Kisilevsky et al. 2003; 2009; Lecanuet et al. 1992).

.. Az újszülöttek nyelvpercepciós képességei: általános fogékonyság a nyelvre Mindezen technikai nehézségek ellenére az újszülöttek képességeit vizsgálva is közelebb juthatunk a kezdeti állapot leírásához, ha nem tévesztjük szem elől a születés előtti nyelvi tapasztalatokat. E tapasztalatok jelentőségét mutatja és a magzati tanulást igazolja, hogy az újszülöttek felismerik és szívesebben hallgatják édesanyjuk hangját, mint más női hangokat (DeCasper–Fifer 1980). Ugyanígy felimerik és preferálják anyanyelvüket/anyanyelveiket: az(oka)t a nyelv(ek)et, amely(ek)et az anya a terhesség alatt beszélt (Byers-Heinlein et al. 2010; Mehler et al. 1988; Moon et al. 1993). Úgy tűnik ugyanakkor, hogy nyelvpercepciós képességeik túlmennek a születés előtti tapasztalatokon. Az újszülöttek képesek például ritmusuk alapján olyan nyelveket is megkülönböztetni egymástól, amelyeket sohasem hallottak (Nazzi et al. 1998; Ramus et al. 1999; 2000). Így francia újszülöttek sikeresen különítenek el egymástól orosz és japán mondatokat, jóllehet egyik nyelvet sem ismerik. Érdekes megjegyezni, hogy a nyelvek ritmusát számszerűen, pontos akusztikai mérésekkel is meghatátozták (Ramus et al. 1999; 2000), mégpedig a magánhangóknak a beszédben való időbeli arányaként (jele V). A hagyományosan szóhangsúly alapú ritmussal jellemzett nyelvekben (angol, lengyel stb.) ez az arány viszonylag alacsony (az angolban pl. 39 százalék körül mozog), a szótag alapú nyelvekben (francia, olasz, tagalog) közepesen magas (az olaszban 45), míg a mora alapú nyelvekben (japán, tamil) inkább magas (japán: 53). A magyar a 48-os magánhangzóaránnyal ritmusát tekintve a szótag alapú nyelvek közé tartozik (Mehler et al. 2004). Azzal kapcsolatban azonban nem végeztek kutatásokat, hogy a magyart az újszülöttek meg tudják-e különböztetni tőle ritmikailag eltérő nyelvektől. Az újszülöttek ezenkívül szívesebben hallgatják a beszédet, mint akusztikus szempontból hasonlóan bonyolult nem nyelvi ingereket, de csak akkor, ha a beszéd és az ingerek nem voltak alacsony frekvenciákat áteresztő szűrőn filtrálva, azaz ha eltérnek az anyaméhben tapasztalt redukált formától (Vouloumanos–Werker 2007). Úgy tűnik tehát, hogy a nyelvi képességek



Gervain Judit

kezdeti állapota nem pusztán a magzati korban tanultakra szorítkozik, hanem általános, genetikailag adott prediszpozíciót mutat a beszéd feldolgozására. A legújabb eredmények tanulságai alapján ez a prediszpozíció nagyon általános lehet, és az emberi beszéden kívül magába foglalhatja a más főemlősök által adott hangokra való fogékonyságot is. Az újszülöttek ugyanis az emberi beszédet és a rhesus makákók kiáltásait ugyanolyan szívesen hallgatják, és mindkettőt preferálják nem nyelvi ingerekhez képest (Vouloumanos et al. 2010). A preferencia csak 3 hónapos korra billen az emberi beszéd javára. E viselkedésesen megfigyelt nyelvi specializáció agyi szinten is felelhető, bár mértékét és okait jelenleg is aktívan kutatják. Két megközelítés különíthető el. Az egyik irány azt vizsgálja, hogy az újszülöttek agya milyen választ mutat különböző nyelvekre az anyanyelvtől a babák számára ismeretlen beszélt nyelveken át a más hordozóval kifejezett (pl. fütyült) nyelvekig. A legkorábbi vizsgálatok bal féltekei dominanciát és azon belül is a temporális és prefrontális területek aktivációját mutatták újszülötteknél infravörös spektroszkópiával (near-infrared spectroscopy: NIRS; Pena et al. 2003, anyanyelv: olasz) és 3 hónapos csecsemőknél mágneses rezonanciával (magnetic resonance imaging: MRI; Dehaene-Lambertz et al. 2002, anyanyelv: francia) az anyanyelv hallgatásakor. A későbbi NIRS vizsgálatok az anyanyelvre adott válasz mellett más, a csecsemők által nem ismert, anyanyelvüktől ritmikailag külöböző nyelvekre adott választ is mérték. E kutatások egy része a korábbiakkal összhangban az anyanyelvre bal féltekei specializációt, míg az ismeretlen nyelvre kétoldali választ talált (Sato et al. 2012, ebben a kísérletben az anyanyelv a japán, az idegen nyelv az angol volt). Más kísérletek azonban az anyanyelvre éppúgy kétoldali aktivációt figyeltek meg, mint az ismeretlen nyelvekre, mind alul áteresztő szűrővel filtrált (May et al. 2011a, anyanyelv: angol, ismeretlen nyelv: tagalog), mind normális, filtrálatlan (May et al. 2011b, anyanyelv: angol, ismeretlen nyelv: spanyol) ingerek esetén. Ezekben a vizsgálatokban az anyanyelv előnye az aktiváció nagyobb mértékében, nem pedig annak helyében nyilvánult meg. Ezzel együtt megjegyzendő, hogy ebben a kísérletben – éppúgy, mint a fentebb említettekben is – a felnőtt nyelvi hálózathoz hasonlóan a temporális és temporo-parietális területek aktiválódtak. Tehát születéskor az anyanyelv és a nem ismert nyelvek esetén egyaránt megfigyelhető agyi specializáció. Az eredmények között leginkább csak a féltekei lateralizáció meglétében vagy hiányában van eltérés. Az tehát nem világos egyelőre, hogy a felnőtteknél megfigyelhető bal féltekei specializáció, legalábbis az anyanyelv esetén, jelen van-e születéskor vagy nem. Az azonban bizonyos, hogy az anyanyelvre adott válasz mindenképpen eltér az ismeretlen nyelvekre adott választól már az újszülöttek esetében is – azt bizonyítva, hogy a méhen belüli nyelvi tapasztalatok lenyomatot hagynak az agyban is. További kutatást igényel, hogy a bal féltekei

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



specializáció megléte vagy hiánya vajon a vizsgált nyelvek (olasz, francia, japán, angol) akusztikai/fonológiai tulajdonságainak különbségeivel magyarázható-e, vagy más, esetleg módszertani eltérésekkel. Ezzel kapcsolatban megjegyzendő, hogy a magyarral ilyen nyelvpercepciós kutatásokat egyelőre még nem végeztek. Az agy nyelvi előhuzalozottságának specificitását vizsgálandó, a fenti kísérletek egyike (May et al. 2011b) arra is kíváncsi volt, hogyan reagálnak az újszülöttek egy általuk nem ismert, fütyült, azaz nem beszélt nyelvre. E füttynyelv a Kanáriszigetek egyikén, a Gomera-szigeten használt silbo, amely a spanyol nyelv hangjait alakítja át füttyjelekké némi egyszerűsítéssel, több különböző hangot azonos füttyjelre képezve le. Ezen átalakítás során olyan nyelvet kapunk tehát, amely a beszélt nyelvekhez hasonló szerkezetű a nyelvi leírás minden szintjén (bár fonológiája némileg egyszerűbb), de amely nem beszédet, hanem más jelet használ hordozóként. MRI vizsgálatok felnőttekkel azt találták, hogy a füttyjelet használók a silbót is a nyelvi agyterületekkel dolgozzák fel, míg az azt nem ismerők nem (Carreiras et al. 2005). Nem meglepő, hogy az egész életükben csak beszélt nyelvet halló és használó felnőttek agya nem reagál megkülönböztetett módon a füttyre. De mivel a világon több mint 70 füttynyelv létezik, azaz az emberi agy könnyen használja ezt a hordozót nyelvi kommunikációra, felmerül a kérdés, hogy kezdeti állapotában vajon nyelviként dolgozza-e azt fel. May et al. (2011b) NIRS-kísérlete alapján az újszülöttek agya nem mutat bal oldali specializációt a silbó hallgatásakor – bár megjegyzendő, hogy ebben a kísérletben sem az anyanyelvre (angol), sem az újszülöttek által nem ismert más beszélt nyelvre (spanyol) nem volt bal oldali válasz. Ezzel együtt a silbóra összességében sokkal kisebb volt a válasz, mint az angolra és a silbó alapjául szolgáló spanyolra. Úgy tűnik tehát, hogy bár a nyelvre való előhuzalozottság a kezdeti állapotban elég általános és nyitott – nem ismert beszélt nyelvek is aktiválják a nyelvi területeknek legalább egy részét –, de annyira nem, hogy a fütty mint a nyelv hordozója beleférjen. A másik kutatási irány, amely az agy kezdeti specializációjának mértékét és okait vizsgálja, arra kíváncsi, hogy a nyelvnek mint akusztikus-fizikai ingernek mely tuljadonságai azok, amelyek az agyi specializációt kiváltják. Korábban láttuk, hogy a felnőtteknél a nyelvi ingerek időbeli és spektrális modulációja játszik szerepet (pl. Giraud–Poeppel 2012b; Hickok–Poeppel 2007; Zatorre–Belin 2001). Az erre vonatkozó elméleteket nemrég csecsemőkön is tesztelték. Szimultán végzett elektrofiziológiai és NIRS mérések azt mutatták, hogy újszülöttek (Telkemeyer et al. 2009), valamint 6 hónapos csecsemők (Telkemeyer et al. 2011) agya az időben gyorsan változó (12 msec és 25 msec) ingerekre a két oldali temporális és temporo-parietális területek aktivációjával válaszol, míg lassan változó ingerek (160 msec és 300 msec) esetén mindkét életkorban a jobb oldali frontális és temporo-parietális régiók reagáltak. Úgy tűnik tehát, hogy e két életkorban a



Gervain Judit

babák agya a felnőttekéhez (Hickok–Poeppel 2007) hasonló specializációt mutat, és a gyors, a fonémákra jellemző időbeli modulációra kétoldali, a lassan, szótagoknak és nagyobb egységeknek megfelelő modulációra jobb oldali aktivitást produkál. Megjegyzendő azonban, hogy az utóbbi kísérletben (Telkemeyer et al. 2011) 3 hónapos csecsemőket is teszteltek, akiknél nem találták meg e mintázatot. Ezt a szerzők nem életkori változással vagy az agy fejlődésével, hanem a kísérletből, illetve a módszerből eredő zavaró tényezők hatásával magyarázzák. Egy másik kísérlet, amely szintén újszülötteket vizsgált NIRS-szel, az időbeli moduláció mellett a beszédre jellemző spektrális tulajdonságok kiváltotta agyi reakciókat is mérte (Minagawa-Kawai et al. 2011b). Az eredmények itt is megerősítették, hogy az időben gyorsan (21 msec) változó ingerek a kétoldali frontális, temporális és temporo-parietális területeken dolgozódnak fel (a lassabb ingerekre azonban nem volt jobb oldali válasz), de a spektrum-modulált ingerek a várttal ellentétben nem váltottak ki szignifikáns reakciót egyik féltekében sem. Összességében úgy tűnik tehát, hogy a nyelvi ingerek fizikai tulajdonságainak feldolgozását vizsgáló kísérletek időben gyorsan változó ingerek esetén kétoldali aktivitást mutatnak, amely megfelel a felnőtteknél újabban mért mintázatnak, de a lassan változó és a spektrálisan modulált ingerek esetén nem egyértelműek az eredmények. Érdekes megjegyezni, hogy ezek a kísérletek nem adnak választ a nyelv felnőtteknél megfigyelt bal oldali lateralizációjának okára, illetve hogy még a felnőttkísérletek esetén is egyre gyakoribb a kétoldali, azaz nem egyértelműen lateralizált mintázat megjelenése. Egyelőre nem világos, hogy ennek az-e az oka, hogy a nyelvi lateralizáció nagyobb változatosságot mutat, mint azt korábban hinni lehetett, így nehezebb kimutatni, vagy módszertani tényezők (pl. az ingerek természete, minősége stb.) a felelősek a kétoldali aktivációért, avagy esetleg a lateralizáció a fejlődés során (akár többször is) változik. Míg a teljes komplexitásukban bemutatott nyelvi ingerek lateralizációjának oka, mértéke és fejlődése vitatott, bizonyos nyelvi jegyek/egységek (pl. magánhangzók, mássalhangzók, hangmagasság stb.) feldolgozásának agyi korrelátumai némileg egyértelműbb képet mutatnak (erről részletes összefoglalást ad Minagawa-Kawai et al. 2011a). Kezdetben sokuk nem nyelvi, hanem pusztán akusztikus feldolgozást vált ki, amely mindkét féltekét igénybe veszi. Ez később az anyanyelv növekvő ismeretének hatására azután nyelvi természetű, absztrakt feldolgozássá alakul át, amely lateralizált (a prozódia esetén a jobb, más vizsgált jegyek esetén a bal féltekében, pl. Minagawa-Kawai et al. 2007; Sato et al. 2012).

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



.. Az újszülöttek nyelvpercepciós képességei: az egyes nyelvi szintek és egységek feldolgozása Az újszülötteknek nemcsak a beszéd felismerésére és a nyelvek megkülönböztetésére vannak igen kifinomult képességeik, hanem a nyelv kisebb egységeinek, így a mondatoknak, szavaknak és a fonémáknak az észlelésére is (Gervain–Mehler 2010). Születéskor képesek a világ nyelveinek majdnem összes hangját megkülönböztetni egymástól, s akárcsak a felnőttek, az újszülöttek és a csecsemők is jobbak két eltérő fonéma megkülönböztetésében, mint egy adott fonéma két különböző változatának elkülönítésében, még akkor is, ha a hangpárok között mindkét esetben ugyanakkora a fizikai-akusztikus különbség (Dehaene-Lambertz– Dehaene 1994; Eimas et al. 1971; Werker–Lalonde 1988). Emellett felismerik a szóhatárokat jelző akusztikus jegyeket, így meg tudnak különböztetni egymástól két, a fonémák szintjén azonos hangsort (pl. mati), ha az egyik egy szó belsejéből (pl. mathématicien ’matematikus’ franciául), a másik két szó határáról (panorama typique ’jellegzetes látkép’ franciául) van kivágva. Ez nagyban hozzásegítheti az újszülötteket ahhoz, hogy a folyamatos hangzó beszédet kisebb egységekre, szavakra tudják tagolni. Hasonlóan fontos képesség a szóhangsúly percepciója – ez is a beszéd tagolásában, szegmentálásában játszhat nagy szerepet már a kezdetekkor. Az újszülöttek erre is képesek (Sansavini et al. 1997): meg tudnak különböztetni egymástól olyan szólistákat, amelyekben a szavak a hangsúly helyében különböznek, függetlenül a szavak szótagszámától és fonémaösszetételétől. (A magyarban a szóhangsúly mindig állandó helyen, a szó első szótagján van, így a magyarban nincs ilyen különbség a szavak között. De a fenti kísérletben használt olasz nyelvben a hangsúly helye szavanként változik, és olykor még jelentésmegkülönböztető szerepe is lehet: pl. papà ’apa, apu’ vs. papa ’pápa’). Az újszülöttek a szavak hangalakját arra is fel tudják használni, hogy elkülönítsék egymástól a tartalmas szavakat (főnevek, igék, melléknevek stb.), amelyek fonológiailag testesek, és a funkciószavakat (névelők, névutók, névmások, igekötők stb.), amelyek fonológiailag minimálisak (Shi et al. 1999) – ez azt teszi lehetővé számukra, hogy a későbbiekben a hallott nyelvi ingereket a nyelvtan szempontjából releváns egységekre tudják bontani, és a mondatok szerkezetét fel tudják fedezni. A fentiek alapján egyértelmű tehát, hogy a kezdeti állapotban az elme és az agy elő van huzalozva a nyelv feldolgozására. Ez a specializáció nyitott és igen általános, lehetővé téve bármilyen nyelv és más, a beszélt nyelvhez hasonló ingerek elsajátítását. Az elsajátítási folyamat pedig rögtön a hallás működésének beindulásával, tehát már születés előtt megkezdődik. E specializáció és a korai tanulás együttesen teszik lehetővé, hogy a csecsemők hatékonyan és gyorsan, mindössze nehány év alatt megtanulják az anyanyelvüket.



Gervain Judit

. Az első életévek: ráhangolódás az anyanyelvre A bármely nyelv elsajátítására való általános felkészültség az első egy-két életév alatt az egyre növekvő anyanyelvi tapasztalatok hatására fokozatosan szűkül: a csecsemők egyre járatosabbak lesznek az anyanyelvükben megtalálható distinkciók, nyelvi jegyek észlelésében, s ezzel párhuzamosan egyre gyengébbek a nem anyanyelvi jegyek megkülönböztetésében. E ráhangolódási folyamat (attunement) nemcsak a nyelvre, hanem a percepció más területeire is jellemző (Haan et al. 2002; Pascalis et al. 2002). Így például a csecsemők egyre ügyesebben tudják megkülönböztetni egymástól a saját rasszukhoz tartozó arco*kat (tehát pl. ázsiai csecsemők az ázsiai arco*kat), de egyre kevésbé a más rasszba tartozó arco*kat (pl. ázsiai csecsemők a fehér, „kaukázusi” arco*kat). A környezetben tapasztalt ingerekre való fokozott ráhangolódást, és ezzel együtt a nem tapasztalt ingerekre való érzékenység elvesztését a tanulás kritikus periódusaival és az agyi plaszticitás fokozatos csökkenésével hozzák összefüggésbe (Bavelier et al. 2010; Berardi et al. 2000; Hensch 2005; Kolb 1989). A nyelv esetén e ráhangolódás legkönnyebben a fonémapercepcióban érhető tetten. Minden nyelvtanuló tapasztalhatta, milyen nehéz egy idegen nyelv bizonyos hangjait felnőttként egymástól megkülönböztetni vagy kiejteni. Ahogyan korábban említettük, az újszülöttek még a világ nyelveinek legtöbb fonémáját meg tudják különböztetni egymástól – olyanokat is, amelyek nem találhatók jövendőbeli anyanyelvükben, és amelyeket sem magzati korban, sem a születés után soha nem hallhattak. A magánhangzók esetében az első 4–6, a mássalhangzók esetében az első 6–8 hónap után e képesség fokozatosan elveszik. A 6–8 hónapos angol anyanyelvű babák még éppúgy meg tudják különböztetni egymástól a hindi nyelv dentális és retroflex „d” hangjait, mint a hindi csecsemők vagy a hindi felnőttek, de releváns tapasztalat hiányában (mivel az angolban ez a kontraszt nem létezik) a 10 hónapos angol babák, akár csak az angol anyanyelvű felnőttek, erre már nem képesek, míg a hindi csecsemőknél megmarad a distinkció. Újabb kutatások alapján ugyanez tapasztalható a tonális nyelvek esetén az anyanyelvben meglévő és meg nem lévő tónusok esetében is (pl. Mattock et al. 2008). Az első életév második felében a csecsemők az egyes hangok mellett az anyanyelvük más jellemzőit is egyre jobban ismerni kezdik. Felismerik például, hogy melyek anyanyelvükben a gyakran és melyek a ritkán vagy soha elő nem forduló hangkapcsolatok. E növekvő fonotaktikai tudásukat azután felhasználják arra, hogy ritmikailag hasonló nyelveket megkülönböztessenek egymástól, ami igen lényeges olyan kétnyelvűek esetén, akiknek az anyanyelvei ritmusukban hasonlóak (pl. spanyol és katalán, Bosch–Sebastián-Gallés 1997), vagy arra, hogy a folyamatos beszédet szavakra tagolják, abból potenciális szóalakokat szűrjenek

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



ki (Mattys–Jusczyk 2001; Mattys et al. 1999; Saffran–Thiessen 2003). Ugyancsak hasznos információt nyújt a szegmentáláshoz a nyelv tipikus hangsúlymintázatainak ismerete (Höhle et al. 2009). Ezt a csecsemők 6 hónapos koruktól képesek szegmentációs feladatokban felhasználni (Jusczyk 1999; Jusczyk et al. 1993). Az anyanyelv tipikus fonológiájának (fonotaktikájának, prozódiájának stb.) növekvő ismerete hozzájárul tehát ahhoz, hogy a csecsemők elkezdjék anyanyelvük szavait elsajátítani. Ennek első jeleit 6 és 9 hónapos koruk között mutatják (Swingley 2009): képesek korábban hallott szavakat folyamatos szövegekben felismerni (Jusczyk–Aslin 1995), és a legújabb eredmények szerint e korai szóalakokat már ismert tárgyakhoz és cselekvésekhez (azaz egyfajta jelentéshez) kapcsolják (Bergelson–Swingley 2012). Ahogyan említettük, e ráhangolódással párhuzamosan az agyban is egyre specifikusabbá válik az anyanyelv feldolgozása. Az anyanyelvi beszéd általában és egyes nyelvi jegyek önmagukban is egyre inkább a bal féltekében dolgozódnak fel (Minagawa-Kawai et al. 2011a). A japánban jelentésmegkülönböztető erővel bíró kétféle (ereszkedő, illetve emelkedő) szóhangsúlyt például a japán csecsemők mind 4, mind 10 hónapos korukban meg tudják egymástól különböztetni viselkedéses tesztekben, de míg a 4 hónapos csecsemők agya kétoldali aktivációt mutat e hangingerek hallatán, addig a nagyobb babáké csak bal féltekei aktivációt (Sato et al. 2010), ami azt sugallja, hogy a kezdeti akusztikai alapon történő megkülönböztetés nyelvivé vált. Ehhez hasonlóan 5 hónapos párizsi babák a párizsi francia hallatán fokális aktivitást mutatnak a bal temporális területeken, míg az általuk nem ismert, bár párizsi felnőttek számára jól érthető québeci francia dialektus hallatán mindkét oldalon mutattak aktivitást, és az sokkal kiterjedtebb területeket érintett (Egorova et al. 2010).

. Az első életévek: a szintaxis előzményei, az absztrakt szabálytanulás A nyelvelsajátítás egyik legnagyobb kihívásának a nyelvtani szabályok felismerését és megtanulását szokták tekinteni (Chomsky 1959), mivel a nyelvi inputban közvetlenül nem figyelhetők meg azok az absztrakt szabályok, amelyek alapján a beszélők a nyelvi ingereket, azaz a mondatokat megalkotják. E klasszikus indukciós probléma, amelynek a nyelvtanulásra való alkalmazása a mai megismeréstudományokban Chomsky nevéhez köthető, annak feltételezését teszi szükségessé, hogy a tanulást veleszületett elvek irányítják. A generativista/innátista elképzelés szerint ezek az elvek nemcsak veleszületettek, hanem nyelvspecifikusak is, azaz nem általános, a kogníció más területén is alkalmazható mechanizmusok, hanem



Gervain Judit

kifejezetten csak a nyelvi tartalomra vonatkoztathatóak. Az ezzel szemben álló nézetek (pl. Elman et al. 1996; Tomasello 2000) vitatják a tanulási mechanizmusok veleszületettségét, nyelvspecifikusságát vagy mindkettőt. Éppen ezért fontos kérdés, hogy az újszülöttek és a fiatal csecsemők képesek-e absztrakt szabályok elsajátítására, és ha igen, milyen típusú ingerek alapján. Az elvont szabálytanulás egyik fontos paradigmája (Marcus et al. 1999) azt vizsgálja, hogy a csecsemők képesek-e azonosságon (mint a legegyszerűbb absztrakt reláción) alapuló szabályokat megtanulni. Képesek-e megkülönböztetni egymástól olyan mesterséges nyelvtanokat, amelyek csak az azonossági reláció avagy ismétlés helyében és jellegében térnek el egymástól, pl. ABB: mubaba vs. ABA: bamuba vs. AAB: babamu stb. NIRS vizsgálatok (Gervain et al. 2008; 2012) tanúsága szerint az újszülöttek képesek az egyszerű, azonnali ismétlődést tartalmazó nyelvtanokat (ABB és AAB) megtanulni, azokat véletlenszerű kontroll (ABC: mubage) nyelvtanoktól, valamint egymástól megkülönböztetni. Ez utóbbi különösen fontos, mert azt jelzi, hogy az újszülöttek nemcsak az ismétlődést ismerik fel, hanem annak helyét is kódolják, és a két típusú információt, azaz az azonossági relációt és a szekvenciális helyet egy elvontabb reprezentációban jelenítik meg. Fontos megjegyzeni, hogy e nyelvtanok megtanulásakor kisebb mértékben a jobb, nagyobb mértékben a bal temporális, illetve a bal frontális területek aktiválódnak – tehát azok a klasszikus nyelvi területek, amelyek a felnőtteknél is felelősek a nyelvfeldolgozásért, beleértve a Broca-területet is. Érdekes módon azonban az újszülöttek szabálytanulási képessége a nem azonnali ismétlődésre, azaz az ABA mintázatra nem terjed ki – ezt a szerkezetet az újszülöttek agya nem dolgozza fel másként, mint az azonosságot nem tartalmazó ABC mintázatot (Gervain et al. 2008). Néhány hónap múlva azonban már ez a szerkezet sem okoz gondot a kisbabáknak. A téma kutatását megalapozó viselkedéses kísérlet (Marcus et al. 1999) azt mutatta meg, hogy 7 hónapos csecsemők nyelvi ingerek használatakor képesek megkülönböztetni egymástól ABB és AAB, illetve ABB és ABA szerkezetű nyelvtanokat – mégpedig úgy, hogy a familiarizációhoz képest a tesztben új, korábban nem hallott szavak jelentek meg (pl. ABB familiarizáció: ga ti ti, teszt: wo fe fe). Így tehát a babáknak valóban a mögöttes absztrakt szerkezetet kellett megtanulniuk, nem volt elég egyes szavakat, szósorokat memorizálniuk. Ebben a kísérletben az ABA szerkezet közvetlenül az ABB szerkezettel volt összehasonlítva, így felmerül annak a lehetősége, hogy a csecsemők valójában csak az azonnali ismétlődést tartalmazó ABB szerkezetet tanulták meg, a nem azonnali ismétlődést tartalmazó ABA szerkezetet nem – azt csak kizárásos alapon tudták a megtanult ABB szekvenciától megkülönböztetni. E hipotézis valószínűségét növeli, hogy felnőttekkel végzett mesterségesnyelvtan-tanulási kísérletek (Endress et al.

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



2005; 2007; 2009) szerint az azonnali ismétlődés, illetve a sorozatok első és utolsó pozíciója perceptuális és emlékezeti szempontból kiemelt szerepet játszanak, feldolgozásuk automatikus és alacsony szintű. Így lehetséges tehát, hogy a csecsemők e kísérletekben mégsem elvont szerkezeteket tanulnak, csak a szekvenciák kiemelt jegyeire, így például az azonnali ismétlődésre reagálnak. Egy, az előzőhöz nagyon hasonló kísérlet tehát azt vizsgálta, hogy 7 hónapos kisbabák meg tudják-e az ABB és ABA szerkezeteket különböztetni a véletlenszerű ABC sorozatoktól, illetve ha igen, van-e különbség a két szerkezet feldolgozásában (Gervain–Werker 2012). Az eredmények azt mutatták, hogy ebben az életkorban a babák mindkét nyelvtant sikeresen megkülönböztetik a véletlenszerű sorozattól, és sem a familiarizáció, sem a tesztfázis során nem mutatnak eltérő viselkedést az ABB és az ABA nyelvtanra. Továbbá familiarizáció nélkül nem mutatnak spontán preferenciát egyik nyelvtan iránt sem (ahogy a véletlen ABC mintára sem), azaz az azonnali ismétlődés nem vált ki automatikus tanulást vagy preferenciát. E szerkezetek idegi feldolgozásának hátterét vizsgálta egy újabb NIRS tanulmány (Wagner et al. 2011), amely a korábbi újszülött-paradigmát (Gervain et al. 2008) alkalmazta 7, illetve 9 hónapos babáknál. Az eredmények tanúsága szerint a 7 hónaposok, akárcsak az újszülöttek, a temporális és frontális területeken nagyobb agyi aktivitást mutatnak az ismétlődést tartalmazó ABB szerkezetekre, mint a kontroll ABC-re. Ezzel szemben a 9 hónaposoknál ugyenezen területeken már ez utóbbi szerkezetre nagyobb az agyi válasz. Ezt a szerzők azzal a viselkedéses kísérleteknél is megfigyelt életkori változással hozzák összefüggésbe, amely szerint a kisebb csecsemők hajlamosabbak az ismert, egyszerűbb, kiszámíthatóbb ingereket preferálni, míg az idősebbek az új, nagyobb változatosságot mutató, nehezebben feldolgozható stimulusokra figyelnek jobban. Számottevő lateralizációs különbség nem volt megfigyelhető egyik életkorban sem. A kutatások arra is kíváncsiak voltak, hogy e szabályszerűségek elsajátítása nyelvspecifikus-e. A hangingerek terén a nyelvnek, úgy tűnik, kiemelt szerepe van. Egy viselkedéses vizsgálatban (Marcus et al. 2007) a csecsemők csak akkor tudták a nem nyelvi hangokkal (állathangok, zenei hangok, különböző hangszerek stb.) megvalósított ABB és ABA nyelvtanokat (pl. ABB: kacsahápogás kutyaugatás kutyaugatás vs. ABA: kacsahápogás kutyaugatás kacsahápogás) megkülönböztetni egymástól, ha előtte ugyanezen szerkezeteket beszéddel megvalósítva is hallották. A vizuális modalitásban 11 hónapos csecsemők csak az ABB, azaz az azonnali ismétlődést tartalmazó nyelvtan elsajátítására képesek, az ABAéra nem, ha az ingerek geometrikus figurák, amelyek szekvenciálisan, egymás után jelennek meg a képernyőn (Johnson et al. 2009). Ezzel szemben már 7 hónapos csecsemők is sikerrel végzik el mindkét nyelvtan megkülönböztetésének feladatát, ha a sorozatok elemeit egyszerre láthatják, és az ingerek természetes



Gervain Judit

kategóriák (pl. kutyafajták, Saffran et al. 2007). Ha a stimulusok egyszerre több modalitásban is megjelennek, például vizuális ingerek és beszéd kombinációjaként, akkor már az 5 hónapos babák is képesek a nyelvtanokat megtanulni (Frank et al. 2009). E kísérletek azt igazolják, hogy 5–9 hónapos kor körül a csecsemők már képesek az azonnali mellett távoli ismétlődésen alapuló mesterséges nyelvtanokat is megtanulni. Úgy tűnik azonban, hogy a távoli relációk elsajátítása nehezebb, ha nem azonosságon, ismétlődésen, hanem pusztán együttjáráson alapulnak. Így például egyéves gyermekek még nem tudnak olyan mesterséges nyelvi szabályosságokat megtanulni, amelyek együtt előforduló, de távoli szóosztályok között állnak fenn, pl. AXC: pel wadim jic, pel loga jic (Gómez–Maye 2005). Ebben az életkorban erre csak akkor képesek, ha előtte ugyanezen szóosztályok között egy közeli relációt már megtanultak (Lany–Gómez 2008). Enélkül csak 15 hónapos korban sajátítják el a távoli szabályszerűséget (Gómez–Maye 2005). A természetes nyelvben még később jelenik meg a távoli szabályszerűségek ismerete. Angol anyanyelvű gyerekek 18 hónapos korban képesek a grammatikus is . . . -ing (a folyamatos jelenidő képzése az angolban: is reading ’éppen olvas’, is eating ’éppen eszik’) szerkezetet az angolban agrammatikus can . . . -ing szerkezettől megkülönböztetni, 15 hónapos korban még nem. Hasonló eredményekre jutottak a hollandban is: a gyerekek 2 éves korban felismerik a névelő és a kicsinyítő képző közötti távoli viszonyt, de 17 hónapos korban még nem (Heugten–Johnson 2010).

. Az első életévek: az anyanyelv grammatikájának kezdetei, a szórend korai elsajátítása A fent idézett kísérletek arra mutatnak rá, hogy az absztrakt szabálytanulás képessége nagyon korán, részben már születéskor jelen van. Vajon mikor kezdik el a csecsemők e képességüket arra használni, hogy anyanyelvük nyelvtanát elsajátítsák? Az elmúlt 10–15 év kutatásai szerint a nyelvtan elsajátítása, akárcsak a szótanulás, már nagyon korán, jóval hamarabb elkezdődik a korábban feltételezettnél (Morgan–Demuth 1996). Korábbi elképzelések szerint a csecsemőknek először jó néhány szót el kell sajátítaniuk ahhoz, hogy nagyobb szerkezeti egységeket, azaz szintagmákat, mondatokat tudjanak elsajátítani. Újabb eredmények alapján azonban úgy tűnik, hogy a szintaxis megtanulása nem függ a szavak ismeretétől, és már 7–8 hónapos korban megkezdődik. A prozódiai és a szógyakorisági csizmahúzási modellek (Bernard–Gervain 2012; Mazuka 1996; Morgan–

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



Demuth 1996; Shukla–Nespor 2010; Weissenborn et al. 1998) szerint1 erre azért van lehetőség, mert a nyelvi inputban vannak olyan felszíni, igen fiatal csecsemők által is észlelhető jegyek, például a prozódia és a szógyakoriság, amelyek korrelálnak a szintaxis bizonyos aspektusaival, és amelyek így információt szolgáltathatnak róluk. A szógyakorisági csizmahúzás azon a megfigyelésen alapszik, hogy a természetes nyelvekben két nagy szóosztály különíthető el, a tartalmas szavak (igék, főnevek stb.), valamint a funkciószavak (névelők, névmások, névutók stb.) osztálya (Abney 1987; f*ckui 1986). Az előbbiek lexikai jelentést hordoznak, míg az utóbbiak a mondatszerkezet vázát adják. E definiáló jellegű és absztrakt funkcionális különbségen kívül más, perceptuálisan is érzékelhető különbségek is vannak a két osztály között. A tartalmas szavak hangalakja testesebb (tipikusan többszótagú, hangsúlyos stb.), a funkciószavaké minimális vagy redukált (gyakran egyszótagú, hangsúlykerülő stb.) – ahogyan korábban láttuk, ezekre a különbségekre már az újszülöttek is érzékenyek. Emellett az egyes funkciószavak gyakoribbak, mint a tartalmas szavak. Korpuszvizsgálatok alapján a nyelvek 30–50 leggyakoribb szava funkciószó (Gervain et al. 2008; Kucera–Francis 1967). A funkciószavak ezenkívül gyakran töltenek be kiemelt helyet a mondatokban: gyakran fordulnak elő a mondat legelején vagy legvégén, márpedig ezekre a hozzájuk kapcsolódó jól észlelhető fonetikai-fonológiai jegyek miatt (megemelt hangmagasság és hangerő a mondat elején, nyújtás a mondat végén) a csecsemők már igen fiatal korban érzékenyek (Aslin et al. 1996). Fontos, hogy e mondatbeli hely szisztematikus változatosságot mutat a nyelvekben, és korrelál a szórenddel. Egyes nyelvekben, például a törökben, baszkban, japánban stb., a funkciószavak inkább a szintaktikai egységek és mondatok végén találhatók, más nyelvekben, így az angolban, olaszban, franciában stb., inkább azok elején. Lényeges, hogy a funkciószóval kezdődő és végződő nyelvek szórendjük más aspektusaiban is ugyanilyen különbségeket mutatnak (Dryer 1992; Greenberg 1978): az első csoportba tartozó nyelvekben az ige megelőzi a tárgyat (így ezeket VO, azaz Verb–Object nyelveknek is nevezik) és az alárendelt mellékmondatokat, a prepozíciók megelőzik a főneveket stb., míg az utóbbi nyelvekben ennek épp ellenkezőjét tapasztalhatjuk (tárgy–ige, azaz OV, tárgy–alárendelt mondat, főnév–posztpozíció stb.). Mindezek alapján ha a csecsemők képesek néhány nagyon gyakori szót és azok mondatbeli helyét felismerni, akkor tudást szerezhetnek anyanyelvük alapszórendjéről. Kísérletek alapján úgy tűnik, erre már 8 hónapos csecsemők is képesek (Gervain et al. 2008). Japán 1 Megjegyzendő azonban, hogy más csizmahúzási modellek is léteznek, például a szintaktikai (Fisher et al. 1991; Gillette et al. 1999) és a szemantikai (Pinker 1984) csizmahúzási elméletek. Ezek a fentiekkel ellentétben feltételeznek némi lexikai ismeretet.



Gervain Judit

(funkciószóra végződő) és olasz (funkciószóval kezdődő) anyanyelvű csecsemők olyan mesterséges nyelvi inger hallatán, melyben gyakori és nem gyakori szavak váltakoztak egymással (. . . gefofibugedefikoge. . . ), ellentétes szórendi preferenciát mutattak. A tesztben a japán babák a gyakori szóval végződő (pl. kafipage), az olasz babák a gyakori szóval kezdődő (pl. fifogebi) szósorokat preferálták, azaz az anyanyelvüknek megfelelő szórendet választották. A szógyakoriságon kívül a szintagmák prozódiája is korrelál az alapszórenddel (Nespor et al. 2008; Shukla–Nespor 2010), ugyanis a hangsúly a tartalmas szóra esik (japán: Tokyo ni ’Tokióba’ vs. angol: to Rome ’Rómába’). A szintagma elejére, illetve végére eső hangsúlynak más és más az akusztikai megvalósulása: a kezdeti hangsúlyt általában a hangmagasság és a hangerő megemelkedése jelzi (pl. ∧ Tokyo ni), míg a véghangsúlyt nyújtás (to Ro:me). Mérések igazolják, hogy a funkciószóval kezdő nyelvekben valóban a nyújtásé, a funkciószóval végződő nyelvekben a hangmagasságé és a hangerőé a főszerep a prozódiai frázishangsúly jelzésekor (Gervain–Werker 2013; Nespor et al. 2008). E fizikai–akusztikai különbség tehát jól hallható, a babák számára is észlelhető jele a hangsúlynak, a hangsúly helyének és így a szórendnek. Több új eredmény is azt igazolja, hogy a csecsemők fogékonyak a szórend e prozódiai jelzésére. Olyan 8 hónapos csecsemők, akik egy funkciószóval kezdődő és egy funkciószóval végződő szórendű nyelvet tanulnak (pl. angol és japán), a gyakori elemmel kezdődő szórendet preferálják, ha a fent említett, gyakori és nem gyakori szavakat váltakoztató mesterséges nyelvet nyújtással kiegészített prozódiával hallják, de preferenciájuk a gyakori elemmel végződő szórendre vált, ha a hallott prozódia hangmagassági kontrasztot használ (Gervain–Werker 2013). Ugyanebben az életkorban a csecsemők a két tulajdonságot, tehát a szógyakoriságot és a prozódiát össze is kapcsolják. Nyolc hónapos francia (funkciószóval kezdődő szórendű) anyanyelvű csecsemők csak akkor mutatták a franciára jellemző preferenciát a gyakori elemmel kezdődő szórend iránt, ha a mesterséges nyelvben a gyakori elemek hangsúlytalanok (azaz rövidebbek) voltak, ahogyan az a franciában és más természetes nyelvekben előfordul, de akkor nem, ha a gyakori elemek hangsúlyosak (megnyújtottak) voltak (Bernard–Gervain 2012). A szógyakoriság és a prozódia hasznos információt nyújtanak tehát az anyanyelv alapszórendjéről, amelyet a csecsemők már igen korán ki tudnak aknázni, hogy a funkciószavak helye alapján a szórendről egy egyszerű, de már absztrakt reprezentációt hozzanak létre. E reprezentációt később tovább gazdagíthatják növekvő lexikai ismereteik alapján, hogy az anyanyelv szórendjének más aspektusait, így például az ige és a tárgy egymáshoz viszonyított helyét megtanulják (Hochmann et al. 2010).

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



A magyar nyelv elsajátításával kapcsolatban ilyen korai vizsgálatokat nem végeztek. Léteznek azonban érdekes kutatási eredmények a magyarra jellemző sajátos nyelvfejlődésről 2–3 éves kortól kisiskolás korig (pl. az igekötők leválasztásának és helyének komplex szabályairól, illetve a magyar morfológia sajátos és igen összetett szabályainak elsajátításáról; Pléh 1980; Pléh–Juhász 2001; Pléh–Lukács 2001; Pléh et al. 2002). Érdekes ezenkívül az atipikus nyelvfejlődés vizsgálata a magyarban, pl. Williams-szindrómás gyermekeknél (Lukács et al. 2001; 2004; Pléh et al. 2003).

. Összegzés Az újszülöttekkel és fiatal csecsemőkkel végzett vizsgálatok arra engednek következtetni, hogy az emberi elme és agy már a kezdetektől fel van készülve a nyelv elsajátítására, és a tanulás valóban az első lehetséges pillanatban, már a születés előtt meg is indul. E kezdeti felkészültség igen tág és általános, lehetővé téve bármely nyelv, akár egyszerre több, egymástól nagyon különböző nyelv elsajátítását is. A nyelvi tapasztalatok hatására azután az első néhány év alatt leszűkül az anyanyelvre, elősegítve annak minél hatékonyabb feldolgozását. E növekvő hatékonyság ára a nem anyanyelvi ingerekre való érzékenység csökkenése.

Irodalom Abney, Steven Paul 1987. English NP in its sentential aspect. Doctoral dissertation, MIT. Aslin, Richard N. – Julide Z. Woodward – Nicholas P. LaMendola – Thomas G. Bever 1996. Models of word segmentation in fluent maternal speech to infants. In: Morgan – Demuth (1996, 117–134). Bavelier, Daphne – Dennis M. Levi – Roger W. Li – Yang Dan – Takao K. Hensch 2010. Removing brakes on adult brain plasticity: From molecular to behavioral interventions. The Journal of Neuroscience 30: 14964–14971. Berardi, Nicoletta – Tommasso Pizzorusso – Lamberto Maffei 2000. Critical periods during sensory development. Current Opinions in Neurobiology 10: 138–145. Bergelson, Elike – Daniel Swingley 2012. At 6–9 months, human infants know the meanings of many common nouns. Proceedings of the National Academy of Sciences 109: 3253–3258. Bernard, Carline – Judit Gervain 2012. Prosodic cues to word order: What level of representation? Frontiers in Language Sciences 3: 451. Bosch, Laura T. – Nuria Sebastián-Gallés 1997. Native-language recognition abilities in four-monthold infants from monolingual and bilingual environments. Cognition 65: 33–69. Byers-Heinlein, Krista – Tracey C. Burns – Janet F. Werker 2010. The roots of bilingualism in newborns. Psychological Science 21: 343–348.



Gervain Judit

Carreiras, Manuel – Jorge Lopez – Francisco Rivero – David Corina 2005. Linguistic perception: Neural processing of a whistled language. Nature 433: 31–32. Chomsky, Noam 1959. A review of B. F. Skinner’s Verbal behavior. Language 35: 26–58. DeCasper, Anthony J. – William P. Fifer 1980. Of human bonding: Newborns prefer their mothers’ voices. Science 208: 1174–1176. DeCasper, Anthony J. – Jean-Pierre Lecanuet – Marie-Claire Busnel – Carolyn Granier-Deferre 1994. Fetal reactions to recurrent maternal speech. Infant Behavior and Development 17: 159–164. Dehaene-Lambertz, Ghislaine – Stanislas Dehaene 1994. Speed and cerebral correlates of syllable discrimination in infants. Nature 370: 292–295. Dehaene-Lambertz, Ghislaine – Stanislas Dehaene – Lucie Hertz-Pannier 2002. Functional neuroimaging of speech perception in infants. Science 298: 2013–2015. Dryer, Matthew S. 1992. The Greenbergian word order correlations. Language 68: 81–138. Egorova, Natalia – Alejandrina Cristià – Inga Vendelin – Luca Filippin – Bria Long – Judit Gervain – Yasuyo Minagawa-Kawai – Emmanuel Dupoux 2010. Neural correlates of dialect perception in early infancy. Journal of the Acoustical Society of America 128: 2351–2351. Eimas, Peter D. – Einar R. Siqueland – Peter W. Jusczyk – James Vigorito 1971. Speech perception in infants. Science 171: 303–306. Elman, Jeff – Elizabeth Bates – Mark Johnson – Annette Karmiloff-Smith – Domenico Parisi – Kim Plunkett 1996. Rethinking innateness: A connectionist perspective on development. Cambridge MA: MIT Press. Endress, Ansgar D. – Ghislaine Dehaene-Lambertz – Jacques Mehler 2007. Perceptual constraints and the learnability of simple grammars. Cognition 105: 577–614. Endress, Ansgar D. – Marina Nespor – Jacques Mehler 2009. Perceptual and memory constraints on language acquisition. Trends in Cognitive Sciences 13: 348–353. Endress, Ansgar D. – Brian J. Scholl – Jacques Mehler 2005. The role of salience in the extraction of algebraic rules. Journal of Eexperimental Psychology 134: 406–419. Fisher, Cynthia – Henry Gleitman – Lila R. Gleitman 1991. On the semantic content of subcategorization frames. Cognitive psychology 23: 331–392. Frank, Michael C. – Jonathan A. Slemmer – Gary F. Marcus – Scott P. Johnson 2009. Information from multiple modalities helps five-month-olds learn abstract rules. Developmental Science 12: 504–509. Friederici, Angela D. 2012. The cortical language circuit: From auditory perception to sentence comprehension. Trends in Cognitive Sciences 16: 262–268. f*ckui, Naoki 1986. A theory of category projection and its applications. Doctoral dissertation, MIT. Gervain, Judit – Iris Berent – Janet F. Werker 2012. Binding at birth: The newborn brain detects identity relations and sequential position in speech. Journal of Cognitive Neuroscience 24: 564–574. Gervain, Judit – Francesco Macagno – Silvia Cogoi – Marcela Pena – Jacques Mehler 2008. The neonate brain detects speech structure. Proceedings of the National Academy of Sciences of the United States of America 105: 14222–14227. Gervain, Judit – Jacques Mehler 2010. Speech perception and language acquisition in the first year of life. Annual Review of Psychology 61: 191–218.

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



Gervain, Judit – Janet F. Werker 2012. Learning non-adjacent regularities at age 0;7. Journal of Child Language FirstView: 1–13. Gervain, Judit – Janet F. Werker 2013. Prosody cues word order in 7-month-old bilingual infants. Nature Communications 4: 1490. Gillette, Jane – Henry Gleitman – Lila R. Gleitman – Anne Lederer 1999. Human simulations of vocabulary learning. Cognition 73: 135–176. Giraud, Anne-Lise – David Poeppel 2012a. Cortical oscillations and speech processing: Emerging computational principles and operations. Nature Neuroscience 15: 511–517. Giraud, Anne-Lise – David Poeppel 2012b. Speech perception from a neurophysiological perspective. In: David Poeppel – Tobias Overath – Arthur N. Popper – Richard F. Fay (szerk.): The human auditory cortex. New York: Springer. 225–260. Gómez, Rebecca – Jessica Maye 2005. The developmental trajectory of nonadjacent dependency learning. Infancy 7: 183–206. Greenberg, Joseph H. (szerk.) 1978. Universals of human language. Stanford CA: Stanford University Press. Haan, Michelle de – Olivier Pascalis – Mark H. Johnson 2002. Specialization of neural mechanisms underlying face recognition in human infants. Journal of Cognitive Neuroscience 14: 199–209. Hensch, Takao K. 2005. Critical period plasticity in local cortical circuits. Nature Reviews Neuroscience 6: 877–888. Heugten, Marieke van – Elisabeth K. Johnson 2010. Linking infants’ distributional learning abilities to natural language acquisition. Journal of Memory and Language 63: 197–209. Hickok, Gregory – David Poeppel 2007. The cortical organization of speech processing. Nature Reviews Neuroscience 8: 393–402. Hochmann, Jean-Remy – Ansgar D. Endress – Jacques Mehler 2010. Word frequency as a cue for identifying function words in infancy. Cognition 115: 444–457. Höhle, Barbara – Ranka Bijeljac-Babic – Birgit Herold – Jürgen Weissenborn – Thierry Nazzi 2009. Language specific prosodic preferences during the first half year of life: Evidence from German and French infants. Infant Behavior and Development 32: 262–274. Huotilainen, Minna – Anu Kujala – Merja Hotakainen – Lauri Parkkonen – Samu Taulu – Juha Simola – Jukka Nenonen – Matti Karjalainen – Risto Näätänen 2005. Short-term memory functions of the human fetus recorded with magnetoencephalography. NeuroReport 16: 81–84. Johnson, Scott P. – Keith J. Fernandes – Michael C. Frank – Natasha Kirkham – Gary Marcus – Hugh Rabagliati – Jonathan A. Slemmer 2009. Abstract rule learning for visual sequences in 8-and 11-month-olds. Infancy 14: 2–18. Jusczyk, Peter W. 1999. How infants begin to extract words from speech. Trends in Cognitive Sciences 9: 323–328. Jusczyk, Peter W. – Richard N. Aslin 1995. Infants’ detection of the sound patterns of words in fluent speech. Cognitive Psychology 29: 1–23. Jusczyk, Peter W. – Anne Cutler – Nancy J. Redanz 1993. Infants’ preference for the predominant stress patterns of English words. Child Development 64: 675–687.



Gervain Judit

Kisilevsky, Barbara S. – Sylvia M. J. Hains – C. Ann Brown – Charlotte T. Lee – B. Cowperthwaite – S. S. Stutzman – M. L. Swansburg – et al 2009. Fetal sensitivity to properties of maternal speech and language. Infant Behavior and Development 32: 59–71. Kisilevsky, Barbara S. – Sylvia M. J. Hains – Kang Lee – Xing Xie – Hefeng Huang – Hai Hui Ye – Ke Zhang – Zengping Wang 2003. Effects of experience on fetal voice recognition. Psychological Science 14: 220 –224. Kolb, Bryan 1989. Brain development, plasticity, and behavior. American Psychologist 44: 1203–1212. Kucera, Henry – W. Nelson Francis 1967. Computational analysis of present-day American English. Providence: Brown University Press. Lany, Jill – Rebecca L. Gómez 2008. Twelve-month-old infants benefit from prior experience in statistical learning. Psychological Science 19: 1247. Lecanuet, Jean-Pierre – Carolyn Granier-Deferre 1993. Speech stimuli in the fetal environment. In: Bénédeicte de Boysson-Bardies (szerk.): Developmental neurocognition: Speech and face processing in the first year of life. Dordrecht: Kluwer. 237–248. Lecanuet, Jean-Pierre – Carolyn Granier-Deferre – Anne-Yvonne Jacquet 1992. Decelerative cardiac responsiveness to acoustical stimulation in the near term fetus. The Quarterly Journal of Eexperimental Psychology 44b: 279–303. Lukács, Ágnes – Csaba Pléh – Mihály Racsmány 2004. Language in Hungarian Williams syndrome children. In: Susanne Niedeggen-Bartke – Julia Siegmüller (szerk.): Linguistic development and competence in Williams syndrome. Amsterdam & Philadelphia: John Benjamins. 187– 220. Lukács, Ágnes – Mihály Racsmány – Csaba Pléh 2001. Vocabulary and morphological patterns in Hungarian children with Williams syndrome: A preliminary report. Acta Linguistica Hungarica 48: 243–269. Marcus, Gary F. – Keith J. Fernandes – Scott P. Johnson 2007. Infant rule learning facilitated by speech. Psychological Science 18: 387. Marcus, Gary F. – Sujith Vijayan – Shoba Bandi Rao – Peter M. Vishton 1999. Rule learning by seven-month-old infants. Science 283: 77–80. Mattock, Karen – Monika Molnar – Linda Polka – Denis Burnham 2008. The developmental course of lexical tone perception in the first year of life. Cognition 106: 1367–1381. Mattys, Sven L. – Peter W. Jusczyk 2001. Phonotactic cues for segmentation of fluent speech by infants. Cognition 78: 91–121. Mattys, Sven L. – Peter W. Jusczyk – Paul A. Luce – James L. Morgan 1999. Phonotactic and prosodic effects on word segmentation in infants. Cognitive Psychology 38: 465–494. May, Lilian – Krista Byers-Heinlein – Judit Gervain – Janet F. Werker 2011a. Language and the newborn brain: Does prenatal language experience shape the neonate neural response to speech? Frontiers in Language Sciences 2: 222. May, Lilian – Judit Gervain – Manuel Carreiras – Janet F. Werker 2011b. Neural specialization for speech at birth: Comparing native and non-native language. Paper at the Neurobiology of Language Conference, Annapolis, MD. Mazuka, Reiko 1996. Can a grammatical parameter be set before the first word? Prosodic contributions to early setting of a grammatical parameter. In: Morgan – Demuth (1996, 313–330).

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



Mehler, Jacques – Peter W. Jusczyk – Ghislaine Lambertz – Nilofar Halsted – Josiane Bertoncini – Claudine Amiel-Tison 1988. A precursor of language-acquisition in young infants. Cognition 29: 143–178. Mehler, Jacques – Nuria Sebastian-Galles – Marina Nespor 2004. Biological foundations of language: Language acquisition, cues for parameter setting and the bilingual infant. In: Michael S. Gazzaniga (szerk.): The new cognitive neurosciences (3rd ed.). Cambridge MA: MIT Press. 825–836. Minagawa-Kawai, Yasuyo – Alejandrina Cristià – Emmanuel Dupoux 2011a. Cerebral lateralization and early speech acquisition: A developmental scenario. Developmental Cognitive Neuroscience 1: 217–232. Minagawa-Kawai, Yasuyo – Alejandrina Cristià – Inga Vendelin – Dominique Cabrol – Emmanuel Dupoux 2011b. Assessing signal-driven mechanisms in neonates: Brain responses to temporally and spectrally different sounds. Frontiers in Language Sciences 2: 135. Minagawa-Kawai, Yasuyo – Koichi Mori – Nozomi Naoi – Shozo Kojima 2007. Neural attunement processes in infants during the acquisition of a language-specific phonemic contrast. Journal of Neuroscience 27: 315–321. Moon, Christine – Robin P. Cooper – William P. Fifer 1993. Two-day-olds prefer their native language. Infant Behavior and Development 16: 495–500. Morgan, James L. – Katherine Demuth (szerk.) 1996. Signal to syntax: Bootstrapping from speech to grammar in early acquisition. Mahwah, NJ: Erlbaum. Nazzi, Thierry – Josiane Bertoncini – Jacques Mehler 1998. Language discrimination by newborns: Toward an understanding of the role of rhythm. Journal of Experimental Psychology, Human Perception and Performance 24: 756–766. Nespor, Marina – Mohinish Shukla – Ruben van de Vijver – Cinzia Avesani – Hanna Schraudolf – Caterina Donati 2008. Different phrasal prominence realization in VO and OV languages. Lingue e Linguaggio 7: 1–28. Pascalis, Olivier – Michelle de Haan – Charles A. Nelson 2002. Is face processing speciesspecific during the first year of life? Science 296: 1321–1323. Pena, Marcela – Atsushi Maki – Damir Kovacic – Ghislaine Dehaene-Lambertz – Hideaki Koizumi – Furio Bouquet – Jacques Mehler 2003. Sounds and silence: An optical topography study of language recognition at birth. PNAS 100: 11702–11705. Pinker, Stephen 1984. Language learnability and language development. Cambridge MA: Harvard University Press. Pléh Csaba 1980. A pszicholingvisztika horizontja. Budapest: Akadémiai Kiadó. Pléh Csaba – Juhász Levente Zsolt 2001. Az igekötők pszicholingvisztikájáról. In: Bakró-Nagy Marianne – Bánréti Zoltán – É. Kiss Katalin (szerk.): Újabb tanulmányok a strukturális magyar nyelvtan és nyelvtörténet köréből. Kiefer Ferenc tiszteletére barátai és tanítványai. Budapest: Osiris Kiadó. 199–211. Pléh Csaba – Lukács Ágnes (szerk.) 2001. A magyar morfológia pszicholingvisztikája. Budapest: Osiris Kiadó. Pléh, Csaba – Ágnes Lukács – Mihály Racsmány 2003. Morphological patterns in Hungarian children with Williams syndrome and the rule debates. Brain and Language 86: 377–383. Pléh Csaba – Palotás Gábor – Lőrik József 2002. Nyelvfejlődési szűrővizsgálat (PPL). Budapest: Akadémiai Kiadó.



Gervain Judit

Ramus, Franck – Marina Nespor – Jacques Mehler 1999. Correlates of linguistic rhythm in the speech signal. Cognition 73: 265–292. Ramus, Frank – Marc D. Hauser – Cory Miller – Dylan Morris – Jacques Mehler 2000. Language discrimination by human newborns and cotton-top tamarin monkeys. Science 288: 349–351. Saffran, Jenny R. – Rebecca L. Seibel – Seth D. Pollak – Anna Shkolnik 2007. Dog is a dog is a dog. Infant rule learning is not specific to language. Cognition 105: 669–680. Saffran, Jenny R. – Erik D. Thiessen 2003. Pattern induction by infant language learners. Developmental Psychology 39: 484–494. Sansavini, Alessandra – Josiane Bertoncini – Giuliana Giovanelli 1997. Newborns discriminate the rhythm of multisyllabic stressed words. Developmental Psychology 33: 3–11. Sato, Hiroki – Yukiko Hirabayashi – Hifumi Tsubokura – Makoto Kanai – Takashi Ashida – Ikuo Konishi – Mariko Uchida-Ota – Yukuo Konishi – Atsushi Maki 2012. Cerebral hemodynamics in newborn infants exposed to speech sounds: A whole-head optical topography study. Human Brain Mapping 33: 2092–2103. Sato, Yutaka – Yuko Sogabe – Reiko Mazuka 2010. Development of hemispheric specialization for lexical pitch-accent in Japanese infants. Journal of Cognitive Neuroscience 22: 2503–2513. Shi, Rushen – Janet F. Werker – James L. Morgan 1999. Newborn infants’ sensitivity to perceptual cues to lexical and grammatical words. Cognition 72: B11–B21. Shukla, Mohinish – Marina Nespor 2010. Rhythmic patterns cue word order. In: Naomi EreschikShir – Lisa Rochman (szerk.): The sound patterns of syntax. Oxford: Oxford University Press. 174–188. Swingley, Daniel 2009. Contributions of infant word learning to language development. Philosophical Transactions of the Royal Society B: Biological Sciences 364: 3617–3632. Telkemeyer, Silke – Sonja Rossi – Stefan P. Koch – Till Nierhaus – Jens Steinbrink – David Poeppel – Hellmuth Obrig – Isabell Wartenburger 2009. Sensitivity of newborn auditory cortex to the temporal structure of sounds. Journal of Neuroscience 29: 14726–14733. Telkemeyer, Silke – Sonja Rossi – Till Nierhaus – Jens Steinbrink – Hellmuth Obrig – Isabell Wartenburger 2011. Acoustic processing of temporally modulated sounds in infants: Evidence from a combined near-infrared spectroscopy and EEG study. Frontiers in Language Sciences 1: 62. Tomasello, Michael 2000. Do young children have adult syntactic competence? Cognition 74: 209–253. Vouloumanos, Athena – Marc D. Hauser – Janet F. Werker – Alia Martin 2010. The tuning of human neonates’ preference for speech. Child Development 81: 517–527. Vouloumanos, Athena – Janet F. Werker 2007. Listening to language at birth: Evidence for a bias for speech in neonates. Developmental Science 10: 159–164. Wagner, Jennifer B. – Sharon E. Fox – Helen Tager-Flusberg – Charles A. Nelson 2011. Neural processing of repetition and non-repetition grammars in 7- and 9-month-old infants. Frontiers in Psychology 2. Weissenborn, Jürgen – Barbara Höhle – Dorothen Kiefer – Damir Cavar 1998. Children’s sensitivity to word-order violations in German: Evidence for very early parameter-setting. In: Annabel Greenhill (szerk.): Proceedings of the 22nd Annual Boston University Conference on Language Development. Boston: Cascadilla Press. 756–767.

Szerkezet és agy a nyelvfejlődés legkorábbi szakaszaiban



Werker, Janet F. – Chris E. Lalonde 1988. Cross-language speech perception: Initial capabilities and developmental change. Developmental psychology 24: 672–683. Zatorre, Robert J. – Pascal Belin 2001. Spectral and temporal processing in human auditory cortex. Cerebral Cortex 11: 946.

Structure and the brain in early language development Abstract: In the majority of the adult population, the language network typically involves the left inferior frontal and the temporal areas, with two neural pathways (ventral and dorsal) connecting them. The investigation of early speech perception and language development provides a unique window into the origins of this brain specialization, allowing us to tease apart the contributions of our genetic endowment and experience, and their interactions. The existing findings suggest that humans are born with an initial broad-based specialization for speech and language, allowing neonates to perceive sound patterns and contrasts not found in their future native language. At the same time, the effects of prenatal language experience are already observable at birth. The initial broad specialization narrows down to native sound patterns during the first year of life. This perceptual attunement is accompanied by increasing specialization and lateralization at the level of neural processing. The vocabulary and the grammar of the native language proceed in parallel with phonological development, with the first lexical and morphosyntactic acquisitions evident as early as 6–8 months. Keywords: speech perception, language acquisition, brain specialization for speech and language, lateralization, perceptual attunement

Korai kétnyelvűség és tudatelmélet: A kétnyelvűség előnyei a versengő mentális reprezentációk kezelésében Kovács Ágnes Melinda Közép-európai Egyetem (CEU) [emailprotected]

Kivonat: A társas megismerés legelterjedtebb nézete szerint a gyerekek 4 éves kor után kezdenek el mások mentális reprezentációiról gondolkodni. Más kutatók szerint azonban a tudatelméleti képesség veleszületett, a megfigyelt különbségek pedig a tudatelmélettel kapcsolatos feladatok megoldásához szükséges más képességeknek (például végrehajtó funkcióknak) tulajdoníthatók. A tanulmány kétnyelvű környezetben felnövő kisgyerekekkel végzett kísérletekkel vizsgálta ezeket a feltevéseket. Az eredmények szerint különböző nyelvek feldolgozása már 7 hónapos korban, a beszédprodukció megjelenése előtt fejlesztheti a végrehajtó funkciókat. Továbbá, óvodáskorban a fejlettebb végrehajtó funkciók lehetővé teszik, hogy a kétnyelvűek jobban teljesítsenek a tudatelméleti feladatokban, amelyekhez fejlett végrehajtó funkciókra van szükség, mivel fontos részük a két mentális reprezentáció közti konfliktus feloldása. A születéstől kezdődő kétnyelvűség a nyelv területén túlmutató változásokat idézhet elő és felgyorsíthatja a társas megismerés fejlődését. Kulcsszavak: korai kétnyelvűség, kétnyelvűség kognitív hatásai, végrehajtó funkciók, tudatelmélet

. Bevezetés A fejlődéspszichológia egyik meghatározó kérdése az, hogy mikor fejlődik ki az a képesség, hogy „leolvassuk” embertársaink tudattartalmait, vagyis „mentalizáljunk”. Két domináns elmélet ismeretes. Az egyik értelmében a gyerekek csak 4 éves kor után kezdenek el a felnőttekhez hasonlóan gondolkodni a embertársaik mentális reprezentációiról. Ebben a keretben a kutatók jól leírható fejlődési pályát tulajdonítanak ennek a képességnek (Wellman et al. 2001), más kutatók szerint azonban a tudatelmélet az ember veleszületett adottsága, a fejlődés során megfigyelt különbségek pedig az egyéb tudatelmélettel kapcsolatos feladatok megoldásához szükséges képességek (például végrehajtó funkciók) fejlődéséből adódnak (Leslie et al. 2005). A végrehajtó funkciókra a tudatelméleti feladatokban megjelenő versengő reprezentációk (mint az igaz és hamis vélekedések) kezeléséhez van szükség. A kísérleti eredmények azt mutatják, hogy a kétnyelvű környezet már korai csecsemőkortól fejleszti a végrehajtó funkciókat, valamint kétnyelvű óvodáskorú gyerekeknél is végrehajtó funkcióbeli előnyöket találtak



Kovács Ágnes Melinda

egynyelvű kortársaikkal szemben (Bialystok 1999). Így a kétnyelvűek jobb teljesítménye a tudatelméleti feladatokban a fejlettebb végrehajtó funkciókból származhat. A jelen tanulmány a két nyelv egyidejű elsajátításában részt vevő kognitív folyamatokra és a kétnyelvűségnek a szociokognitív fejlődésre gyakorolt lehetséges hatásaira koncentrál. A korai kétnyelvű hatások változásokat eredményezhetnek bizonyos területspecifikus (például a nyelvvel kapcsolatos) és területfüggetlen (például a versengő ingerek kezelésével kapcsolatos) folyamatokban. Ezek a változások pedig hatással lehetnek a kétnyelvűek nyelvelsajátítására, valamint a kognitív fejlődés egyéb területeire is. Két nyelv párhuzamos elsajátítása akkor lehet megfelelőképpen hatékony, ha a nyelvet tanulók sikeresen szét tudják választani és külön tudják kezelni ezeket a nyelveket. Tulajdonképpen elképzelhető, hogy a kétnyelvűek speciális folyamatokat használnak a két nyelvből származó ingerek hatékony kezelésére. Megvizsgáljuk majd azt a hipotézist, amely szerint a kétnyelvű ingerek feldolgozása már a beszéd kezdete előtt befolyásolja az olyan kognitív képességek fejlődését, amelyek szerepet játszanak a két nyelvből származó ingerek sikeres szétválasztásában és megtanulásában. Korábbi kutatások alapján elképzelhető, hogy a kétnyelvűek erősebb kognitív kontrollal rendelkeznek, a kontroll olyan helyzetekben történő széles körű használatának köszönhetően, amikor az egyik nyelven beszélve a másikat le kell gátolniuk (Bialystok et al. 2004). Újabb kutatások felvetették a kérdést, hogy két nyelv feldolgozása a beszéd előtti szakaszban, a produkció hiányában is fokozza-e a végrehajtó funkciók fejlődését (Kovács–Mehler 2009a). Lehetséges, hogy a kétnyelvű gyerekek már jóval a beszéd kezdete előtt aktívan monitorozzák a két nyelvnek megfelelő reprezentációs készleteket és képesek figyelmüket is ennek megfelelően egyik nyelvről a másikra irányítani. Ez egyrészt a két nyelv hatékony elsajátítását szolgálja, másrészt gyorsulást is eredményez a végrehajtó funkciók fejlődésében. A fejlett végrehajtó funkciók pedig előnyt jelenthetnek az ellentétes nyelvi és nem-nyelvi reprezentációk kezelésében (Kovács 2009; Kovács–Mehler 2009b). A következőkben két olyan kísérletsorozatot mutatunk be, amelyek közül az első azt vizsgálja, hogy a csecsemőkori kétnyelvű környezet a végrehajtó funkciók fejlődéséhez vezet-e, a másik pedig azt, hogy ez az előny jobb teljesítményhez vezet-e az olyan feladatokban, ahol a gyerekeknek figyelembe kell venniük mások mentális állapotait. Számos kutató szerint amikor a gyerekeknek mások mentális állapotairól kell következtetéseket levonniuk, hatékony végrehajtó kontrollra is szükségük van, hogy a száliens, a gyermek saját mentális állapotán alapuló választ figyelmen kívül tudják hagyni. Így, ha a kétnyelvűek jobb végrehajtó kontrollt fejlesztenek ki a két nyelv feldolgozása miatt, akkor hatékonyabbak le-

Korai kétnyelvűség és tudatelmélet



hetnek az ellentétes reprezentációk (mint a gyerek saját vélekedése és másoknak tulajdonított vélekedések) kezelésében a tudatelméleti feladatokban is. A fejezet első részében olyan vizsgálatokról lesz szó, amelyek szerint azok a gyerekek és csecsemők, akik születésüktől kezdve két nyelv hatásainak voltak kitéve, végrehajtó funkcióbeli előnyökkel rendelkeznek (Bialystok 1999; Kovács– Mehler 2009a). Továbbá, olyan eredményeket fogunk bemutatni, hogy a 12 hónapos kétnyelvűek hatékonyabbak két nyelvi ingerbe ágyazott szabály megtanulásában egynyelvű társaiknál (Kovács–Mehler 2009b). Amíg ezen vizsgálatok szerint a kétnyelvű gyerekek az olyan végrehajtó funkciós feladatoknál rendelkeznek előnnyel, ahol le kell gátolniuk egy előzőleg megtanult választ vagy szabályt, a fejezet második részében azt fogjuk tárgyalni, hogy ezek az előnyök a társas megismerés területén is érvényesülnek-e, amikor mások mentális reprezentációinak figyelembe vételére is szükség van.

. A tudatelmélet fejlődése: kompetencia és performancia alapú leírások Az emberi viselkedés komplexitásának megértéséhez figyelembe kell vennünk, hogy az embereket célok, érzelmek és vélekedések irányítják. Míg az emberi társadalom nehezen lenne elképzelhető mások mentális állapotairól való gondolkodás nélkül, az ehhez kapcsolódó számítások problémája elképesztően összetettnek tűnik. Az aktuális fizikai kontextus megfigyelése gyakran nem szolgáltat elég információt ahhoz, hogy megfelelő következtetéseket vonjunk le más ágensek mentális tartalmairól és így viselkedésükről. A komplex társas interakciókhoz szükség van arra a felismerésre, hogy az embereket olyan nem megfigyelhető mentális állapotok irányítják, mint célok, tervek vagy hiedelmek. Amennyiben sikerül figyelembe venni mások hiedelmeit és vágyait, amelyek különbözhetnek a sajátjainktól, képesek leszünk megérteni olyan helyzeteket is, amelyek másképp nehezen lennének megmagyarázhatók. Azt a képességet, hogy vélekedéseket, vágyakat és szándékokat tulajdonítunk másoknak és saját magunknak, valamint hogy ezen mentális állapotok alapján meg tudjuk jósolni mások viselkedését, tudatelméleti képességnek nevezik. A tudatelméleti képesség a társas kompetencia fejlődéséhez kötődik és fejletlensége az autizmus fontos jellemzője lehet (Baron-Cohen et al. 1985). Míg a felnőttek meglepő könnyedséggel, feltehetőleg automatikusan képesek a mások mentális állapotait figyelembe venni (Friedman–Leslie 2004; Kovács et al. 2010; de l. Apperly et al. 2006), úgy tűnik, hogy a gyerekeknek 4 éves korukig nehézséget jelent a komplex mentális állapotok megértése (Wellman et al. 2001). Bár már



Kovács Ágnes Melinda

a csecsemők is érzékenyek az olyan nem megfigyelhető mentális tartalmakra, mint a célok és a szándékok (Gergely et al. 1995), az ágenseknek való céltulajdonítás nem minden esetben elegendő ahhoz, hogy helyesen előre tudjuk jelezni mások viselkedését. Az emberi viselkedés kimenetelét vélekedések, vagyis a külső világról alkotott szubjektív reprezentációk szabályozzák, amelyek nem minden esetben esnek egybe a valósággal. Így a kihívás annak megértésében rejlik, hogy a gyerekek mikor és hogyan lesznek képesek következtetni mások mentális reprezentációira, amelyek konfliktusban állhatnak a saját, valóságról alkotott reprezentációikkal. A terület fő vitás kérdése jelenleg az, hogy milyenek a mások mentális állapotairól való gondolkodást lehetővé tevő mechanizmusok és hogyan jelennek meg a fejlődés során (Wellman et al. 2001; Scholl–Leslie 2001). Két fő elméleti javaslat terjedt el a tudatelmélet eredetével kapcsolatban. Az egyik szerint ahhoz, hogy reprezentációkat tudjunk formálni mások mentális állapotairól, bonyolult következtetési folyamatokra van szükségünk és a tudatelméleti képesség a fejlődés késői szakaszában jelenik meg (Perner 1991; Apperly et al. 2006), a másik javaslat szerint ezek a képességek olyan területspecifikus folyamatokra támaszkodnak, amelyek automatikusak és valószínűleg velünk születettek (Scholl–Leslie 2001; Friedman–Leslie 2004; Sperber–Wilson 2002; Kovács et al. 2010). Így vannak olyan kutatók, akik a tudatelméleti képességeknek lassú és fokozatos fejlődési mintázatot tulajdonítanak, és úgy vélik, hogy mások belső állapotainak és mentális reprezentációinak figyelembevétele még a felnőttek számára is megerőltető feladat (Wellman et al. 2001; Apperly et al. 2006). Az elmúlt 25 évből származó eredmények valóban arra mutatnak, hogy az úgynevezett hamisvélekedés-feladatok eredményei alapján a 3–4 éves gyerekeknek nehézséget okoz a mások mentális állapotairól való gondolkodás (Baron-Cohen et al. 1985; Wimmer–Perner 1983). A standard hamisvélekedés-feladatban, amit a tudatelmélet mérésére dolgoztak ki, az egyik szereplő elrejt egy tárgyat az A helyen. A távollétében a második szereplő áthelyezi a tárgyat az A helyről a B helyre. A tesztfázisban a gyerekeknek azt kell kikövetkeztetniük, hogy az első szereplő ott fogja keresni a tárgyat, ahol az ő hamis vélekedése szerint az található (az A helyen). Ezekben a feladatokban a gyerekek csak 4 éves kor után jutnak helyes következtetésekre, a kisebb gyerekek saját igaz vélekedéseik alapján, nagyrészt hibásan válaszolnak. Ezen eredmények alapján a kutatók arra jutottak, hogy a gyerekek konceptuális kompetenciája fontos változáson mehet keresztül az iskoláskor előtti években, és a komplex vélekedések kezelését lehetővé tevő képesség is ekkor jelenik meg (Wellman et al. 2001; Wimmer–Perner 1983). A 3 éves gyerekek azért hibáznak a tudatelméleti feladatokban, mert még nem képesek következtetése-

Korai kétnyelvűség és tudatelmélet



ket levonni összetett mentális állapotokkal, például vélekedésekkel kapcsolatosan (Perner 1991). Ebben az esetben a tudatelméleti feladatokban elért siker annak lehet az eredménye, hogy megjelenik a mások (és önmaguk) mentális tartalmak tükrében való megértése. Felnőtt résztvevőkkel végzett vizsgálatok azonban arra mutatnak, hogy nemcsak a gyerekek számára problémás a hamis vélekedések kezelése, hanem még a felnőttek számára is megerőltető folyamat lehet, annak ellenére, hogy ők már feltételezhetően teljes mértékben fejlett tudatelméleti képességekkel rendelkeznek. Például Apperly és munkatársai (2006) a mentális állapotokra való következtetés automatikussága ellen érvelve kimutatták, hogy a felnőtt résztvevők lassabban válaszolnak olyan kérdésekre, amelyek egy másik személynek egy tárgy helyére vonatkozó (hamis) vélekedéséhez kapcsolódtak, mint a tárgy valódi helyét érintő kérdésekre. A szerzők szerint ezek az eredmények arra mutatnak, hogy mások vélekedéseinek feldolgozása megterhelőbb saját vélekedéseink kezelésénél. Ezek az eredmények úgy születtek, hogy a résztvevőket nem kérték arra, hogy kísérjék figyelemmel a másik személy vélekedéseit. Nem volt különbség azonban a hamis vélekedésekkel és a valósággal kapcsolatos válaszok között, amennyiben a résztvevőket előre felszólították a másik személy vélekedéseinek követésére, s így a feladat kezdetétől fogva akaratlagosan rá tudták irányítani a figyelmüket erre a folyamatra. Bár a való életbeli szituációknál nem lehet tudni, hogy mások vélekedéseinek követése később hasznosnak bizonyul-e majd, mégis úgy tűnik, hogy a felnőttek jelentős sikerrel és könnyedséggel használják a mások mentális állapotairól való következtetéseiket. Például nem jelent nekik problémát az irónia megértése, és az olyan látszat/valóság kettősségén alapuló konfliktusokat, mint amelyek például Shakespeare Tévedések vígjátékában jelennek meg, mulatságosnak találják. Így az előző felfogással szemben, amely megerőltető tudatelméleti következtetéseket feltételez, ezen alternatíva támogatói úgy vélik, hogy a felnőttek automatikusan képesek következtetéseket levonni mások mentális állapotaival kapcsolatban és ezek a képességek már nagyon korán jelen vannak és egyedülálló módon csak az emberre jellemzőek (Friedman–Leslie 2004; Kaminski et al. 2008; Sperber–Wilson 2002). Az utóbbi évek eredményei is ezt a felfogást támasztják alá. Számos kutatás szerint a 13 és 18 hónapos kor közötti csecsemők azt várják el a nonverbális tudatelméleti feladatokban, hogy a szereplő saját vélekedése alapján fogja keresni az adott tárgyat (Buttelmann et al. 2009; Onishi–Baillargeon 2005; Song et al. 2008; Baillargeon et al. 2010; Scott–Baillargeon 2009; Southgate et al. 2007; Surian et al. 2007). Továbbá, szemmozgás-követéses vizsgálatok során kimutatták, hogy kétévesek meg tudják jósolni mások viselkedését hamis vélekedéseik alap-



Kovács Ágnes Melinda

ján (Southgate et al. 2007). Újabb keletű vizsgálatok szerint feltételezhető, hogy mind a csecsemők, mind a felnőttek automatikusan kiszámítják mások vélekedéseit implicit tudatelméleti feladatokban, és úgy tűnik, hogy másoknak tulajdonított reprezentációik hasonlóképpen befolyásolják viselkedésüket, mint a saját valóságreprezentációik (Kovács et al. 2010). Ezen nézet alapján a hamisvélekedés-feladat megoldásánál előtérbe kerülő fejlődésbeli változások inkább bizonyos teljesítménybeli tényezőkből adódnak, mint konceptuális váltásból (Bloom–German 2000; Fodor 1992; Kovács et al. 2010; Leslie et al. 2005; Scholl–Leslie 2001). Így elképzelhető, hogy a gyermekek már 4 éves kor előtt rendelkeznek alapvető tudatelméleti képességekkel, de a standard explicit hamisvélekedés-feladatok megoldásához szükség van más képességek, például a problémamegoldás (Fodor 1992) vagy a végrehajtó funkciók (például a gátlás) fejlődésére is (Carlson et al. 1998; Leslie et al. 2005).

.. A végrehajtó funkciók szerepe tudatelméleti feladatok megoldásában Számos tanulmány kapcsolatot feltételez a tudatelmélet és a kontrollfolyamatok, vagyis a végrehajtó funkciók fejlődése között (Carlson–Moses 2001; Leslie–Polizzi 1998). A tudatelmélet és a végrehajtó funkciók közti kapcsolatra utaló bizonyítékok változatos területekről származnak. Az autista gyerekek tudatelméleti és végrehajtó funkciókat érintő gyenge teljesítménye kapcsolatban áll egymással (Ozonoff et al. 1991), továbbá a tipikus fejlődésű gyerekeknél jelentős teljesítményjavulás a végrehajtó funkciókban szintén 4 éves kor körül figyelhető meg, akarcsak a tudatelméleti feladatokban (Gerstadt et al. 1994). Ugyanakkor úgy tűnik, az egyéni tudatelméleti teljesítmény is korrelál a végrehajtó funkciót érintő feladatokban elért teljesítménnyel (Carlson–Moses 2001). Leslie és munkatársai kétszintes modellben mutatják be, hogy a különböző képességek hogyan járulnak hozzá a tudatelméleti feladatok megoldásához (Leslie–Polizzi 1998; Leslie et al. 2005). Modelljükben az első szinten a tudatelméleti mechanizmus lehetővé teszi a vélekedések és vágyak reprezentációját. Elképzelhető, hogy ez automatikus folyamat, amelynek erős velünk született alapjai vannak. A tudatelméleti mechanizmus azonban önmagában még nem elegendő a hamis vélekedések kezeléséhez, mivel a hamis vélekedést tartalmazó feladatokban le kell gátolni azt az alapvető feltevést, amely szerint a vélekedések általában igazak. Így a feldolgozás második szintjén egy területfüggetlen komponens lép be a folyamatba, a szelekciós processzor, amely a végrehajtó funkciók része. Felmerült, hogy a szelekciós processzor fokozatosan fejlődik és ez felelős a tudatel-

Korai kétnyelvűség és tudatelmélet



méleti feladatokban megjelenő gátlásigény kielégítéséért. Amennyiben a gátlási követelmények emelkednek, még azok a gyerekek is nehézségekkel küzdenek a tudatelméleti feladatoknál, akik a standard feladatot sikeresen megoldották (Leslie et al. 2005). Egy másik hasonló irányú megközelítés szerint mind a gyerekeket, mind pedig a felnőtteket befolyásolja a „tudás átka” elnevezésű jelenség (Birch–Bloom 2003; 2007). Míg a felnőttek természetesen képesek kiszámítani mások mentális reprezentációit, hajlamosak az elfogultságra, amely abból származik, hogy nehezen képesek figyelmen kívül hagyni (legátolni) a saját tudásukat. Például egy ezt a jelenséget megcélzó kísérletben a résztvevőknek nehézséget jelentett eltekinteni egy tárgy helyére vonatkozó saját tudásuktól amikor mások viselkedését kellett előrejelezniük a hamis vélekedéseik alapján, egy olyan helyzettel szemben, amikor nem volt tudomásuk a tárgy valódi helyéről (Birch–Bloom 2007). Egyre több bizonyíték szól a mellett, hogy egyrészt már a csecsemők is képesek a tudatelméleti feladatok megoldására, másrészt pedig a standard tudatelméleti feladatokban más, a tudatelméleti feladatokhoz szorosan nem kapcsolódó mechanizmusok (pl. gátlás) is részt vesznek. Így elképzelhetőek olyan speciális körülmények, amelyek segítenek a kisgyerekeknek a mentális állapotokról való gondolkodásban vagy két versengő reprezentáció (igaz és hamis vélekedés) közti konfliktus feloldásában. Olyan vizsgálatokat fogunk bemutatni, amelyek azt elemezték, hogy egy ilyen körülmény, mégpedig a kétnyelvű környezetben való nevelkedés, hogyan hat a tudatelméleti képesség fejlődésére azáltal, hogy már a korai gyermekkortól fogva elősegíti a végrehajtó funkciók fejlődését (Kovács 2007a;b; 2009). Az elsőként tárgyalt vizsgálatok feltételezései szerint a kétnyelvű környezet már csecsemőkorban is pozitív hatással lehet a végrehajtó funkciókra és megkönnyíti az egymással ellentétes szabályszerűségek kezelését. A továbbiakban pedig azzal foglalkozunk majd, hogy a kétnyelvűség hogyan lehet hatással a tudatelméleti képességekre.

. A kétnyelvűség hatása a végrehajtó funkciókra .. A beszélt nyelvek közötti gyakori váltás erősíti a végrehajtó kontrollt gyermek- és felnőttkorban A nyelvek közötti mindennapos váltás jellegzetes változásokat idézhet elő a kognitív rendszerben. Bialystok (1999) eredményei azt mutatják, hogy az egyik nyelv folyamatos gátlása már óvodás gyerekeknél előnyökhöz vezet az olyan feladatokban, amelyekhez a gátló funkciókra van szükség. A felnőttekkel végzett vizsgálatok is hasonló előnyöket írtak le kétnyelvűeknél (Bialystok et al. 2005). Ezen



Kovács Ágnes Melinda

vizsgálatokat az az ötlet motiválta, hogy a kétnyelvűek ugyanazokat a mechanizmusokat vehetik igénybe a nyelvek közötti váltáskor, amelyeket a különböző végrehajtófunkció-feladatoknál használnak. Ahhoz, hogy hatékonyan kommunikálhassanak, a kétnyelvűeknek kontrollálniuk kell, hogy éppen melyik nyelvüket használják, és valószínűleg le kell gátolniuk az egyik nyelv elemeit, amikor a másikra váltanak (Green 1998). A két nyelv váltogatásában szerzett gyakorlottság hatékonyabb végrehajtó funkciókhoz vezethet. A kétnyelvű felnőttek valóban jobban teljesítenek a végrehajtó funkciókat mérő különböző feladatokban az egynyelvűeknél, például alacsonyabb interferenciahatás jelenik meg náluk a Simon-feladatban (Bialystok et al. 2005) és hatékonyabb figyelmi kontroll, valamint kevesebb a feladatok közti váltásból adódó költség figyelhető meg a figyelmiháló-feladatnál (Attentional Network Task, Costa et al. 2008). A kétnyelvűek előnye a végrehajtó funkciót érintő feladatokban fiatal felnőttkortól egészen időskorig jelen van (Bialystok et al. 2005). A lexikális hozzáférést mérő vizsgálatokból származó adatok arra mutatnak, hogy a nyelvek közötti váltásban és kontrollban szerzett gyakorlat jobb teljesítményhez vezet még egy harmadik nyelvre való váltás esetében is (Costa– Santesteban 2004). Érdekes hatásai figyelhetőek meg annak is, hogy valaki kora gyermekkorban vagy csak később vált kétnyelvűvé. Úgy tűnik, hogy az olyan kettős feladatot magukban foglaló szituációk, ahol a kétnyelvűeknek egyszerre kell nyelvek közötti és figyelmi váltást végrehajtaniuk, csak a késői kétnyelvűeknek jelentenek nehézséget, a korai kétnyelvűenek nem, arra utalva, hogy a korai kétnyelvűek jobb végrehajtó funkciókkal rendelkezhetnek (Kovács–Téglás 1998; 2005). További eredmények arra mutatnak, hogy a kétnyelvűség gyermekkorban is befolyásolja a végrehajtó funkciók fejlődését. Például a kétnyelvű 4-éves gyerekek jobban teljesítenek egynyelvű társaiknál az olyan feladatokban, ahol egy előzőleg tanult szabály legátlására van szükség (Bialystok 1999) vagy amelyek motoros konfliktust foglalnak magukban (Bialystok 2005; Bialystok–Martin 2004). A végrehajtó funkciók fejlődésének felmérésére gyerekeknél gyakran használt eszközök egyike a dimenzionális váltásos kártyaszortízozási feladat (DCCS/ Dimensional Change Card Sorting Task – Frye et al. 1995). Ebben a feladatban a gyerekeknek két szabály közül az egyik alapján (pl. szín vagy forma) kell osztályozniuk a kártyákat. Először a gyerekeknek az egyik szabály alapján kell válogatniuk (pl. szín), majd a szabály megváltozik, és a másik szabály (pl. forma) alapján kell osztályozniuk. Általában a 4 évesnél kisebb gyerekeknek problémát jelent a második szabály alapján osztályozni, mivel nehezükre esik legátolni az első szabályt, illetve még nem képesek hatékonyan kezelni két egymással ellentétes szabályt (Diamond

Korai kétnyelvűség és tudatelmélet



2002; Frye et al. 1995). Egy- és kétnyelvűeket összehasonlítva Bialystok (1999) azt vizsgálta, hogy a 3 és 5 év közötti kétnyelvűek rendelkeznek-e valamilyen előnnyel egy ilyen kártyaszortírozási feladatban. Az eredmények alapján a kétnyelvű gyerekek jobban teljesítettek az egynyelvűeknél, így feltételezhető, hogy a kétnyelvűség pozitív hatással van a végrehajtó funkciók fejlődésére, feltehetőleg a két nyelv közötti folyamatos váltások miatt. További, a Simon-próbát használó vizsgálatból származó eredmények szólnak amellett, hogy a kétnyelvű gyerekek hatékonyabb gátló mechanizmusokkal rendelkeznek (Bialystok et al. 2005). A Simon-próba egy nonverbális téri feladat, amely az inger–válasz kompatibilitáson alapszik és kongruens és inkongruens próbákból áll. A résztvevőknek egy bizonyos ingerre az egyik, egy másik ingerre pedig a másik kezükkel kell választ adniuk, az inger elhelyezkedésétől (jobb/bal oldal) függetlenül. Az inkongruens próbákban az ingernek a válasz szempontjából ellentétes elhelyezkedése (pl.: bal oldal) interferál a jobb kéz által adandó motoros válasszal, így lassítva a reakcióidőt. A kongruens próbákban ezzel ellentétben nincs interferencia, mert az inger a jobb oldalon jelenik meg, és a választ is jobb kézzel kell adni. A három korcsoportba tartozó kétnyelvűek (5 évesek, valamint középkorú és idősebb felnőttek) gyorsabb reakcióidőket mutatnak egynyelvű, korban illesztett társaiknál az inkngruens próbákban. Érdekes módon a kétnyelvűek jobban teljesítettek a kongruens próbákon is, amelyekhez azonban nem volt szükség gátlásra. Bialystok és munkatársai (2005) szerint ez a hatás annak köszönhető, hogy ahhoz, hogy a figyelmünket az egyik próbáról a másikra irányítsuk, bizonyos mértékben mind a kongruens, mind az inkongruens próbáknál szükség van a végrehajtó funkciókra. Így lehetséges, hogy a jobb gátlási képességek általános teljesítményelőnyben jelentek meg, ami kiterjedt mind a kongruens, mind az inkongruens próbákra. Ezek az eredmények illeszkednek ahhoz az elmélethez, amely szerint a beszédprodukció folyamán történő nyelvek közötti váltás magyarázza a kétnyelvűek végrehajtó funkciókbeli előnyét, ugyanis a kétnyelvű gyerekek 4 éves kor előtt már képesek hatékonyan váltani a nyelvek között (Genesee et al. 1995). Míg ezek a gyerekekkel és felnőttekkel végzett vizsgálatok alátámasztják azt az elméletet, amely szerint a különböző nyelveken történő aktív beszédprodukció fejlettebb végrehajtó funkciókat eredményez, keveset tudunk arról, hogy vajon hasonló előnyök származnak-e abból, ha két különböző nyelven hallunk kijelentéseket még a beszédprodukció megjelenése előtt. A két különböző nyelvhez tartozó beszéd feldolgozása is elegendő lehet ezen képességek erősítéséhez. Így a végrehajtó funkcióbeli előnyök megfigyelhetők lehetnek olyan kétnyelvű csecsemőknél is, akik még nem képesek szavakat produkálni. Míg számos adat támasztja alá, hogy a két nyelven történő beszéd-



Kovács Ágnes Melinda

produkció erősíti a végrehajtó funkciókat (Bialystok 1999; Costa et al. 2008), csak a közelmúltban kezdtek el bizonyos vizsgálatok azzal foglalkozni, hogy a beszéd kezdete előtt is megjelennek-e ezek a végrehajtó funkcióbeli előnyök csecsemőknél (Kovács–Mehler 2009a;b).

.. A kétnyelvű környezet elősegíti a végrehajtó funkciók fejlődését csecsemőkorban A kétnyelvű gyerekeknek két különböző nyelvet kell felépíteniük egy olyan kevert nyelvi inputból, amely fonológiájában, szókészletében és mondattanában is heterogén. Ehhez első sorban arra van szükség, hogy a gyermekek meg tudják különböztetni a két nyelvet egymástól. Az eddigi kutatások arra mutatnak, hogy a csecsemők már jóval azelőtt fel tudják dolgozni a nyelvi ingerek számos sajátosságát, mielőtt első szavaikat kiejtenék. Úgy tűnik, a csecsemők már születésükkor olyan képességekkel rendelkeznek, amelyek lehetővé teszik a nyelvek megkülönböztetését, és képesek szétválasztani az egyes nyelveket azok ritmikai jellemzői alapján (Nazzi et al. 1998; Ramus et al. 2000). 4 hónapos korukra mind az egy-, mind a kétnyelvű gyerekek meg tudnak egymástól különböztetni két hasonló ritmikai sajátosságokkal rendelkező nyelvet is (pl. katalánt és spanyolt, Bosch– Sebastián-Gallés 1997; 2001). A kétnyelvű gyerekek egyértelműen rendelkeznek a megfelelő kognitív apparátussal ahhoz, hogy sikeresen figyelemmel kísérjék a környezetükben hallott két nyelvet, így gyakorlatra tesznek szert a két nyelv közti figyelmi váltásokban, amely a végrehajtó funkciók hatékonyabb fejlődéséhez vezethet. Ezt a feltevést végrehajtó funkciókat igénybevevő feladatok segítségével vizsgáltuk egy- és kétnyelvű babáknál szemmozgáskövető berendezés használatával (Kovács–Mehler 2009a). Amennyiben a kétnyelvű ingerek monitorozása már nagyon fiatal kortól kezdve erősíti a végrehajtó funkciókat, a kétnyelvű csecsemők teljesítményének jobbnak kell lennie az egynyelvűekénél. Összekapcsoltuk ezt a vizsgálatot azzal a kérdéssel is, hogy vajon mennyire általános ez az előny. Mivel a kétnyelvű csecsemőknek az egymással versengő nyelvi ingerekkel kapcsolatban vannak tapasztalataik, a születéskor kezdődő kétnyelvűség kezdetben kizárólag a nyelvi ingerek terén eredményezhet fejlett kontrollfolyamatokat. Az is elképzelhető azonban, hogy a születéskor kezdődő kétnyelvűség a modalitástól független, területáltalános végrehajtó funkcióbeli előnyhöz vezet. Az egyik vizsgálat során (Kovács–Mehler 2009a) egy- és kétnyelvű 7 hónapos csecsemőket vizsgáltunk egy figyelmi váltást magában foglaló feladatban, ahol egy előzőleg érvényes és többször megismételt választ (szemmozgás az A

Korai kétnyelvűség és tudatelmélet



helyre egy bizonyos inger megjelenéséhez kötődően) kellett legátolniuk, hogy egy új választ (szemmozgás a B helyre) tanuljanak meg. Elvárásaink szerint amennyiben a kétnyelvű csecsemők jobb végrehajtó funkciókkal rendelkeznek, ebben a váltást tartalmazó vizsgálatban jobb teljesítményt kell nyújtaniuk egynyelvű társaiknál. Bár mindkét csoportnak egyforma hatékonysággal kellene megtanulnia az első választ, mivel ebben a részben még nincs szükség a kontrollképességekre, a kétnyelvűeknél jobb figyelemváltási eredményeket várunk a második válasznál. Az összes alább tárgyalt vizsgálatban az egy- és kétnyelvű csecsemők illesztve voltak életkor, nem, valamint a szüleik szocioökonómiai helyzete alapján. A csecsemőket akkor tekintettük kétnyelvűnek, ha a két szülő anyanyelve különböző volt és következetesen ezen a nyelven beszéltek a csecsemőkhöz, illetve a csecsemők mindkét nyelvet napi rendszerességgel hallották. A vizsgálat egy tanulási (váltás nélküli) részből és egy figyelemváltási részből állt. A váltás előtti fázisban a csecsemőknek 9 próbát mutattunk, ahol egy három szótagú nyelvi ingert egy, a képernyőnek mindig ugyanazon az oldalán megjelenő érdekes tárgy követett. Így a csecsemők megtanulhatták, hogy a szavak a tárgy bizonyos helyen való megjelenését jelzik előre. A figyelemváltásos részben további 9 próbát mutattunk be, ezekben a szavak azt jelezték, hogy a tárgy a képernyő másik felén fog megjelenni. Hogy megkönnyítsük annak a megtanulását, hogy először az egyik, majd a másik oldalra kell nézni, az egyik vizsgálatban különböző nyelvi szabályszerűségeket tartalmazó anyagot használtunk a váltás előtti és utáni részekben. Például a váltás előtti részben szótagismétlést használtunk a szavak elején (így AAB szerkezetűek voltak, ahol az A és B betűk szótagokat jelölnek, pl. lelemo). Ezzel ellentétben a váltás utáni szakaszban az ingerek végén használtunk szótagismétlést (így ABB szerkezetűek voltak, mint a lemomo). Bár tudjuk, hogy a 7 hónaposok képesek megkülönböztetni hasonló szabályszerűségeket (Marcus et al. 1999), a jelenlegi vizsgálathoz nem feltétlenül szükséges, hogy meg is tanulják őket. Ebben a vizsgálatban túl kellett lépniük egy előzőleg megtanult válaszon, ezt pedig megkönnyíthette a válaszoknak a különféle struktúrákkal való összekapcsolása. A tanulás mértékét úgy térképeztük fel, hogy szemmozgás-követéses módszerrel rögzítettük a csecsemőknek a tárgy megjelenését megelőző szemmozgásait. Ha a baba megtanulta, hogy a jelzőinger után a tárgy egy bizonyos helyen fog megjelenni, már azelőtt arra a helyre nézhet, mielőtt a tárgy megjelenne (anticipációs szemmozgások). Egy következő vizsgálatban vizuális ingersorozatokat használtunk nyelvi ingerek helyett. Ezek a sorozatok ugyanazokat a szabályszerűségeket követték (azonos formák a sorozat elején: AAB, vagy a végén: ABB). Korábbi vizsgálatok kimutatták, hogy a hét hónapos csecsemők mind vizuális, mind hangingerek



Kovács Ágnes Melinda

1. ábra: Egy előzőleg megtanult válasz gátlása 7 hónapos egy- és kétnyelvű csecsemők-

nél. A: A próbák szerkezete Kovács és Mehler vizsgálatában (2009a). Az egyik vizsgálatban nyelvi, míg a másiban vizuális ingerek szerepeltek. A váltás előtti fázisban (9 próba) a tárgy mindig a képernyő azonos oldalán jelent meg, a váltás utáni szakaszban (9 próba) pedig a másik oldalon. B–C: Kovács és Mehler (2009a) 2.1 és 3. vizsgálatának eredményei. A helyes anticipációs szemmozgást produkáló csecsemők aránya. Mindkét vizsgálat váltás előtti szakaszában (a, I. fázis) mindkét csoportnál növekedett a helyes oldalra mutató szemmozgások aránya. Azonban mindkét vizsgálat váltás utáni szakaszában (b, II. fázis) csak a kétnyelvűek mutattak növekedést a helyes anticipációs szemmozgások arányában a próbák során.

esetében képesek észlelni és általánosítani az ilyen a szabályszerűségeket (Saffran et al. 2007). Ezen vizsgálat célja annak kimutatása volt, hogy a kétnyelvű csecsemőknél megfigyelhető lehetséges végrehajtó funkcióbeli előny az auditoros modalitásra korlátozódik-e, vagyis csak abban a modalitásban érvényesül-e, amelyben a végrehajtó funkciókat a nyelvelsajátítás során használhatják. Kérdés, hogy megjelenhetnek-e ilyen előnyök akkor is, ha a vizsgálat modalitása nem egyezik meg a tanulás modalitásával. Ezen kérdés tanulmányozásának érdekében azt vizsgáltuk, hogy a kétnyelvűeknél megfigyelhető végrehajtó funkcióbeli előny csak akkor van-e jelen, ha beszédhez kapcsolódó ingerekre válaszolnak, vagy a vizuális modalitáshoz tartozó ingereknél is megfigyelhető. Az B,C ábrán látható az anticipációs szemmozgások aránya arra az oldalra, ahol a tárgy később megjelent a vizsgálatok váltás előtti (I. fázis) és váltás utáni részében (II. fázis). Mindkét vizsgálatban mind az egy- mind a kétnyelvűeknél gyors tanulást (helyes anticipációs szemmozgások növekedését) találtunk a váltás előtti fázisban. Azonban csak a kétnyelvűeknél volt megfigyelhető növekedés a helyes anticipációs szemmozgásokban a váltás utáni szakaszban. 1 A kutatás 1. vizsgálatának eredményei hasonlóak a másik kettőéhez, a részleteket l. Kovács– Mehler (2009a).

Korai kétnyelvűség és tudatelmélet



Ezek az eredmények azt mutatják, hogy az egynyelvűeknek nehézséget jelent a már megtanult válaszok figyelmen kívül hagyása. Ez a jelenség jól illeszkedik azokhoz a korábbi adatokhoz, amelyek szerint a 7 hónaposoknak a fejletlen végrehajtó funkcióik miatt problémát jelent a korábban megtanult válaszreakciók legátlása (Diamond–Goldman-Rakic 1989). A mi vizsgálatainkban azonban a váltás után a kétnyelvűek előzőleg begyakorolt, de már nem érvényes válaszai csökkentek, míg az új helyre mutató anticipációs szemmozgásaik gyakoribbá váltak. Ezek alapján úgy tűnik, hogy a kétnyelvű környezet már a beszéd megkezdése előtt is fejleszti a végrehajtó funkciókat a csecsemőknél. Bár mind az egy-, mind a kétnyelvű gyerekek egyforma hatékonysággal tanulták meg a vizsgálatok váltás előtti részében, hogy a nyelvi vagy vizuális inger egy érdekes tárgyat jelez előre, lényeges viselkedésbeli különbséget figyeltünk meg a két csoport között a váltás utáni fázisokban. Míg a kétnyelvűek könnyedén legátolták az előzőleg megtanult választ és adaptálták előrejelzéseiket a feladat által támasztott változó körülményeknek megfelelően, addig az egynyelvűek nem tanulták meg az új választ a váltás utáni próbák során. A kétnyelvűek jobb teljesítménye nem tudható be egy általános információfeldolgozási különbségnek, mivel a két csoport teljesítménye hasonló volt a váltás előtti fázisban. E vizsgálatok eredményei alapján a két nyelvből származó megnyilatkozások észlelése és feldolgozása a születés utáni hónapokban már jóval a beszéd kezdete előtt a végrehajtó funkciók területfüggetlen komponenseinek fejlődéséhez vezet. Bár az egyik nyelv gátlása a másik nyelv aktív használata közben jól dokumentált folyamat, a beszédprodukció nem feltétlenül szükséges a végrehajtó funkciók fejlődéséhez. Tulajdonképpen már a két nyelv feldolgozása és a reprezentációik kezelése is elég a végrehajtó funkciók gyorsabb fejlődéséhez. Továbbá, a jól fejlett végrehajtó funkciós képesség segíthet a kétnyelvűeknek, hogy sikeresen monitorozzák és szétválasszák a két nyelv reprezentációit, ezáltal lehetővé téve a nyelvek hatékony elsajátítását.

.. A kétnyelvűség rugalmasságot eredményez két strukturális szabály tanulásakor csecsemőkorban Még mindig tisztázatlan, hogy a kisgyerekek hogyan tudják elkülöníteni a lényeges szabályszerűségeket a környezetükben hallott rengeteg nyelvi jelből. Ez a probléma különösen szembetűnő a kétnyelvű családokba született csecsemők esetében. Az egynyelvűekhez hasonlóan fel kell dolgozniuk a nyelvi adatokat ahhoz, hogy elsajátítsak a nyelvet, azonban számukra a nyelvi input két különböző forrásból érkezik. Érdekes módon a kétnyelvű gyerekek körülbelül ugyanakkor



Kovács Ágnes Melinda

érik el a különböző nyelvelsajátítási stádiumokat mindkét nyelvükben, amikor az egynyelvűek, habár nekik sokkal bonyolultabb jelrendszerrel kell szembenézniük (Pearson et al. 1993; Petitto et al. 2001). Annak ellenére, hogy a kétnyelvűség a világ minden részén jelen van, ritkán tanulmányozzák azokat a folyamatokat, amelyek lehetővé teszik két nyelv szabályrendszerének együttes elsajátítását. Az előzőekben bemutattuk, hogy a kétnyelvű csecsemők hatékonyabb végrehajtó funkciókat fejlesztenek ki, feltehetőleg a két nyelvhez tartozó különböző reprezentációk megfigyelése és szétválasztása miatt. Lehetséges viszont, hogy ezek a képességek segítik őket abban is, hogy hatékonyan tudják kezelni a két nyelv sokféle szabályszerűségeit. Kovács és Mehler kutatásának (2009b) célja annak feltérképezése volt, hogy az egy- és kétnyelvű csecsemők hogyan tanulnak meg a nyelvi inputban fellelhető ismétlésalapú szabályokat, amikor egy időben kétféle struktúrával találkoznak. Ez a fajta szimultán tanulás erősen igénybe veheti a végrehajtó funkciós és figyelmi képességeket, mivel a csecsemőknek folyamatosan figyelemmel kell kísérniük és megkonstruálniuk a két szabályszerűséghez tartozó reprezentációkat. Így ha a kétnyelvű csecsemők jobb végrehajtó funkciókkal rendelkeznek, jobb teljesítményt fognak nyújtani ebben a feladatban is. A vizsgálatokban egy tipikus próba a következőképpen zajlik: elhangzik egy bizonyos struktúrájú álszó (pl.: AAB, zo-zo-mo), amit egy bizonyos helyen (például baloldalt) megjelenő érdekes tárgy követ. A következő próbában pedig egy másik, eltérő struktúrájú álszó hangzik el (pl.: ABA, zo-mo-zo), amit egy érdekes tárgy követ a másik oldalon (jobbra). Így a próbák többszöri ismétlése során a csecsemők megtanulhatják, hogy a szó felépítése megjósolja a tárgy helyét, és így elvárásokat alakíthatnak ki a már ismert struktúrák új példányaival szemben is (szabályáltalánosítás). Az általunk feltett kérdés az volt, hogy a kétnyelvűek sikeresebbek lesznek-e egynyelvű társaiknál két ismétlésen alapuló szabályszerűség szimultán tanulásakor. A tanulás mértékét a csecsemők az új nyelvi inger utáni első szemmozgásának iránya alapján mértük. Amennyiben elsajátították a struktúrákat, először ott kell keresniük a tárgyat, ahol az adott struktúra után meg szokott jelenni. Másrészt azt is mértük, hogy a csecsemők összességében milyen gyakran néztek a megfelelő oldalra. Így egy próbát akkor kódoltunk helyesnek, ha a csecsemő először a helyes oldalra nézett, illetve többet nézte a helyes oldalt az új inger elhangzása után (amit viszont nem követett tárgy). Az eredmények a 2. ábrán láthatók. A kétnyelvű 12 hónapos csecsemők a teszt fázisban mindkét struktúránál gyakrabban néztek a helyes oldalra, az első tekintet (C ábra, bal oldal) és a teljes nézési idő átlag (C ábra jobb oldal) alapján

Korai kétnyelvűség és tudatelmélet



2. ábra: A: Kovács és Mehler vizsgálatának (2009b) familiarizációs fázisa. A csecsemők

3 szótagos nyelvi ingereket hallottak, amelyekben vagy az első két szótag egyezett meg (AAB szerkezet, mint a lo-lo-vu-ban) vagy az első és az utolsó szótag (mint az ABA szerkezetű lo-vu-lo-ban). A nyelvi ingerek után egy érdekes tárgy jelent meg a képernyő két oldalán folyamatosan látható fehér négyzetek valamelyikében. A hallott inger szerkezete előre jelezte a tárgy megjelenésének helyét (például bal oldali négyzet AAB, jobb oldali négyzet ABA esetén). B: Az 1. kísérlet tesztfázisa. A csecsemők új AAB és ABA ingereket hallottak, de nem jelent meg tárgy az ingerek elhangzása után. Szemmozgáskövető berendezéssel vizsgáltuk, hogy a csecsemő melyik oldalon várta a tárgy megjelenését. A jobb oldalon egy csecsemő két próba során megfigyelt szemmozgása látható. C: A tanulás mértéke a két szerkezet alapján. Bal oldalon a helyes első nézések aránya [(helyes nézések száma − hibás nézések száma)/(helyes nézések száma + hibás nézések száma)] a  véletlenszinthez képest az AAB és ABA szerkezet esetén (1. vizsgálat: kétnyelvűek, N = 22, egynyelvűek, N = 22), valamint férfi és női hang esetén (2. vizsgálat egynyelvűek, N = 20). Jobb oldalon: nézési idő átlagarányok egy- és kétnyelvűeknél az 1., és egynyelvűeknél a 2. vizsgálatban. Kovács–Mehler (2009b) alapján.

is. Az egynyelvűek ezzel ellentétben gyakrabban néztek a helyes oldalra, amikor a nyelvi ingerek szerkezete AAB volt, ABA szerkezet esetén azonban nem. Hogy kizárják azt a lehetőséget, hogy a kétnyelvűek előnye a hangok és helyek közti viszony hatékonyabb megtanulásából adódik, és nem a többféle struk-



Kovács Ágnes Melinda

turális sajátosság egyidejű elsajátításából, Kovács és Mehler (2009b) végzett egy vizsgálatot csak egynyelvűek részvételével. Ebben a második vizsgálatban egy új 12 hónapos egynyelvű csoport olyan hangingereket hallott, amelyek nemcsak szerkezetükben, hanem hangmagasságban is különböztek (pl.: női hang ABA, férfi hang AAB szerkezetnél). A csecsemők sikeresen megtanulták a tárgy helyének előrejelzését a hangingerek alapján, ahogy az első nézés (C ábra, bal oldal) és a nézési idő elemzésben is látszik (C ábra, jobb oldal). Ezek az eredmények összességében az jelzik, hogy a kétnyelvűekkel ellentétben az egynyelvű csecsemők nem tudnak két különböző struktúrát egyidejűleg megtanulni, de képesek két különböző beszélőt két különböző helyszínhez kötni. Az adatok alapján arra lehet következtetni, hogy a preverbális 12 hónapos kétnyelvű csecsemők hatékonyabbak egynyelvű társaiknál két szabályszerűség egyidejű megtanulásában. Egy olyan helyzetben, ahol a csecsemőknek lehetőségük volt két egymással nem összeegyeztethető szabályszerűséget megtanulni, a kétnyelvűek mindkettőt megtanulták, míg az egynyelvűek csak az egyiket sajátították el. Ez az előny kapcsolódhat a kontroll- és szelekciós képességek előzőleg tárgyalt korai fejlődéséhez (Kovács–Mehler 2009a), amely megfigyelhető kétnyelvű felnőtteknél és óvodásoknál is (Bialystok et al. 2005). Ezek a képességek lehetővé tehetik a kétnyelvűek számára, hogy hatékonyabban tudjanak a nyelv területén kezelni két ellentétes reprezentációt (például két szerkezetbeli szabályszerűséget). A továbbiakban azt a kérdést fogjuk tárgyalni, hogy ez az előny megfigyelhető-e a társas megismerés területén is, ahol a gyerekeknek két ellentétes (például igaz és hamis) vélekedést kell kezelniük.

. A tudatelméleti feladatok megoldását megkönnyítő körülmények Vajon a kétnyelvűek végrehajtó funkcióbeli fejlettsége megjelenik-e más területeken is? Kimutatható-e például olyan feladatokban, amelyek a mások mentális állapotáról való gondolkodást vizsgálják gyermekeknél? Ahogy korábban említettük, az irányadó vélemény szerint a gyerekek csak 4 éves koruk után képesek a mentális reprezentációkat a felnőttekhez hasonlóan kezelni. Ennek alapján a kutatók úgy vélik, hogy ehhez a képességhez egy jól körülírható fejlődési pálya kapcsolható (Wellman et al. 2001). Mások azt feltételezik, hogy a mentális reprezentációk kezelése velünk született, humánspecifikus képesség és a megfigyelt fejlődésbeli különbségek más, a tudatelméleti feladatok megoldásához szükséges képességek (mint például végrehajtó funkciók) fejlődéséből adódnak (Leslie et al. 2005). A végrehajtó funkciók szükségesek a tudatel-

Korai kétnyelvűség és tudatelmélet



méleti feladatokban megjelenő ellentétes reprezentációk (igaz és hamis vélekedések) kezeléséhez. Mivel egyre több kutatás szerint a kétnyelvű környezet már nagyon korán, akár csecsemőkortól fejleszti a végrehajtó funkciókat, lehetséges, hogy a kétnyelvűség a megerősödött végrehajtó funkciókon keresztül vezet sikerhez a tudatelméleti feladatokban. Úgy is lehet azonban érvelni, hogy a kétnyelvű gyerekek egy tudatelméleti kompetenciaváltás miatt teljesítenek jól ezekben a feladatokban, nem pedig a fejlettebb végrehajtó funkcióik miatt. Vagyis elképzelhető, hogy a kétnyelvűek egynyelvű társaiknál hamarabb tulajdonítanak mentális állapotokat másoknak. Például az egynyelvű gyerekek esetében a tudatelméleti kompetencia változását okozhatja a bizonyos következtetésekhez köthető tapasztalatok felhalmozódása. 4 éves korukra a gyerekek már számos olyan helyzettel találkozhattak, ahol végrehajtottak egy cselekedetet, de nem sikerült ezzel elérniük a céljukat (például egy olyan dobozban kerestek egy labdát, ahol korábban elrejtették, de később nem találják már ott). Ezeket a sikertelen cselekedeteket megpróbálhatják úgy magyarázni, hogy kritikus különbségekre következtetnek saját mentális reprezentációik (azt gondolták, hogy a labda a dobozban van) és a valóság (a labda nincs ott) között. Az ilyen helyzetekből származó tapasztalatok segíthetnek nekik abban, hogy megértsék, hogy a mentális állapotok (például az igaz és hamis vélekedések) hogyan irányítják a viselkedést, ez a folyamat pedig végül a tudatelmélet kialakulásához vezethet (Brown et al. 1996; Sabbagh et al. 2006). Ehhez hasonlóan a nyelvváltásos szituációkban megjelenő különböző mentális reprezentációkkal kapcsolatos tapasztalatok segíthetik a kétnyelvű gyerekeket, hogy hamarabb kialakítsák tudatelméleti kompetenciájukat. Ezek a körülmények tudatosíthatják a kétnyelvűekben, hogy a társalgásban részt vevők nem feltétlenül ismerik mindkét nyelvüket. Azonban ahogy korábban említettük, az is elképzelhető, hogy a több nyelv kezeléséből származó gyakorlottság erősíti a végrehajtó funkciók fejlődését. Ez pedig lehetővé teszi, hogy jobban teljesítsenek az ezeket a képességeket igénybe vevő tudatelméleti feladatokban. A következő vizsgálatokban a kompetencia- és performanciaváltozás elméleteiből származó hipotéziseket szándékoztunk tesztelni. Azt vizsgáltuk, hogy hogyan befolyásolja a tudatelméleti feladatokban nyújtott teljesítményt a születéstől kezdve kétnyelvű környezet („bölcsői kétnyelvűség”). Az első hipotézist a tapasztalatalapú kompetenciaváltozás elmélete inspirálta, amely szerint a 4 évesnél kisebb gyerekeknek eleinte nehézséget jelent a mentális állapotok reprezentálása, de ahogy idősebbek lesznek, számos olyan tapasztalatot szerezhetnek, amelyek lehetővé teszik, hogy a saját és mások mentális állapotai és a valóság közötti különbségeket észleljék. Ez pedig segít nekik a



Kovács Ágnes Melinda

tudatelméleti képesség kialakításában (Brown et al. 1996; Sabbagh et al. 2006). Úgy tűnik, hogy még egy rövid, laboratóriumi körülmények között folyó – mentális állapotokról való gondolkodást magában foglaló – tréning (amely visszajelzést ad a standard feladatban) is javíthatja a tudatelméleti feladatokban nyújtott teljesítményt (Melot–Angeard 2003). Természetesen a laboratóriumon kívül a tudatelméleti kompetenciában beállhat változás a tapasztalatoktól függetlenül (például fejlődési tényezőknek köszönhetően) is. Azonban mivel nem állnak rendelkezésünkre adatok ezen tényezők közti különbségekről egy- és kétnyelvűeknél, helyénvalónak tűnt a tapasztalatalapú, konceptuális változás nézetet tesztelni. A következőkben egy 3 és 4 éves, egy- és kétnyelvű gyerekeket összehasonlító, a standard és a módosított hamisvélekedés-feladatot használó vizsgálatsort ismertetünk.

. A korai kétnyelvűség elősegíti az egymással versengő mentális reprezentációk kezelését A kétnyelvű környezetben élő gyerekek gyakran találkoznak olyan helyzetekkel, amelyekben tapasztalatokat szerezhetnek az egymásnak ellentmondó mentális reprezentációkkal kapcsolatban. Amikor egy kétnyelvű gyerek olyan nyelven szólít meg egy egynyelvűt, amelyen az nem beszél, a kommunikáció sikertelenségét nem feltétlenül ugyanúgy dolgozza fel a két fél, mert csak a kétnyelvűek tudják feloldani a konfliktust a nyelvek közötti aktív váltás segítségével. Az ilyen helyzetek miatt a kétnyelvűek tudatában lehetnek az egynyelvűek és saját mentális tartalmaik (vagyis az általuk ismert nyelvek) közti különbségekkel. Meggyőző bizonyítékok vannak arra nézve, hogy a kétnyelvűek tisztában vannak vele, hogy beszélgetőpartnereik nem feltétlenül beszélik mindkét nyelvüket, mivel már 3 éves kor előtt a megfelelő nyelven szólítják meg őket (Genesee et al. 1995; Petitto et al. 2001). Az előbb bemutatott kompetenciaváltozási elmélet, amely szerint az egymással ellentétes mentális állapotok észlelése segítheti a gyerekeket a tudatelmélet kialakításában, azt vetíti előre, hogy mivel a kétnyelvűek több tapasztalattal rendelkeznek a nyelvváltással kapcsolatos különböző mentális tartalmakkal kapcsolatban, hatékonyabban fogják megoldani a tudatelméleti problémákat. Elképzelhető, hogy a nyelvek közötti hatékony váltás érdekében a születésük óta kétnyelvű gyerekek kifejlesztenek egyfajta megértést mások elméjének bizonyos tulajdonságairól. Amennyiben ez így van, a kétnyelvűek szelektív előnnyel rendelkezhetnek a nyelvváltással kapcsolatos hamisvélekedés-problémák megoldásában.

Korai kétnyelvűség és tudatelmélet



A kétnyelvűek azonban a performanciaváltozási elmélet szerint is jobban teljesíthetnek a tudatelméleti feladatokban. A születésüktől fogva kétnyelvű gyerekek azért lehetnek sikeresebbek a tudatelméleti feladatokban, mert korábban fejlődnek ki a gátló és szelekciós folyamataik, amelyek fontosak lehetnek a hamis vélekedések kezeléséhez is. Egyre több bizonyíték szól amellett, hogy a kétnyelvű óvodás korú gyerekek (Bialystok 1999) és felnőttek (Bialystok et al. 2004; Costa et al. 2008) gátló mechanizmusai hatékonyabbak. Így elképzelhető, hogy a kétnyelvűek fejlettebb gátló képességei annak köszönhetőek, hogy széleskörű gyakorlatuk van az egyik nyelv kiválasztásában és a másik legátlásában. A gátlást igénylő feladatokon való gyakorlás valóban javítja a gyerekek tudatelméleti feladatokban nyújtott teljesítményét (Kloo–Perner 2003). Így a kétnyelvűek nyelvszelekciós gyakorlata hatással lehet a gátlást igénylő tudatelméleti feladatokra, és jobb teljesítményhez is vezethet. Ezen két hipotézis vizsgálatához Kovács (2009) 3 éves magyar–román kétnyelvűeket és román egynyelvűeket hasonlított össze a standard és a módosított tudatelméleti feladat, valamint egy fizikai érvelést tartalmazó kontrollfeladat segítségével. A módosított tudatelméleti feladat egy olyan nyelvváltásos szituációt jelenített meg, amellyel a kétnyelvűek gyakran találkozhatnak, és amely befolyásolhatja a tudatelméleti képességüket. Ha ez a típusú tapasztalat hozzájárul a tudatelmélet korai konszolidációjához kétnyelvűeknél, akkor kiemelkedően jó teljesítményt fognak nyújtani ebben a feladatban. Ezzel ellentétben, ha a kétnyelvűek előnye a tudatelméleti feladatokhoz szükséges végrehajtó gátló képességek hatékonyabb működésének köszönhető, mindkét tudatelméleti feladatban jobb teljesítményt kell nyújtaniuk a kétnyelvűeknek, mivel azonos mértékben igényelnek gátlást. Mind a kompetencia- mind a performanciaelmélet azt jelzi előre, hogy a kétnyelvű gyerekek jobban fognak teljesíteni az egynyelvűeknél a nyelvváltásos tudatelméleti feladatban, míg a kontrollfeladatban nem. A standard tudatelméleti feladattal kapcsolatban azonban különböznek az előrejelzéseik. A tapasztalat alapú kompetenciaváltozási elmélet szerint a nyelvváltásos helyzetekben szerzett tapasztalat készíti elő a kétnyelvű gyerekeket a tudatelmélet gyorsabb kialakítására. Így felkészültebbnek kell lenniük az ezzel kapcsolatos hamisvélekedés-problémák megoldására. Korábbi vizsgálatok szerint a 3 éves gyerekek teljesítménye a különböző tudatelméleti feladatokban nem feltétlenül „minden vagy semmi” típusú, elképzelhető, hogy egy gyerek sikeres lesz az egyik feladatban, de egy másikban már nem (Wellman–Bartsch 1988). Kis módosításokkal, például egy előző reprezentáció hangsúlyozásával, egy másik tárgy bevezetésével vagy a tesztkérdés megváltoztatásával jobban átláthatóvá és ezáltal könnyebbé tehető a feladat (Freeman–Lacohee 1995; Wellman–Bartsch 1988). Így ez a mi esetünkben a



Kovács Ágnes Melinda

kétnyelvűeknél jobb teljesítményt jelez előre a módosított tudatelméleti feladatban, amelyik egy nyelvváltási helyzetet jelenít meg. A performanciaváltozási elmélet ezzel szemben mást jósol. Amennyiben a kétnyelvűek az általános gátlási folyamatokban megfigyelhető előnyeik miatt sikeresebbek a tudatelméleti feladatokban, mind a standard mind a módosított tudtaelméleti feladatban jobban teljesítenek majd egynyelvű társaiknál, mivel a feladatok szerkezetileg hasonlóak és azonos végrehajtófunkció-igényekkel bírnak.2 A kétnyelvűség kritériumai vizsgálatunkban a következőek voltak: két különböző anyanyelvű szülővel rendelkező gyermek, akinek szülei anyanyelvükön beszélnek gyerekükhöz és mindketten mindennapi kapcsolatban vannak vele. A szülök kitöltöttek egy kérdőívet a gyermek nyelvhasználatáról és nyelvi körülményeiről. A csoportok illesztve voltak szocioökonómiai helyzet és intelligencia alapján. A két csoportot két olyan romániai (erdélyi) város azonos óvodájából gyűjtöttük össze, ahol mindkét nyelvet beszélik. A standard tudatelméleti feladatban (Wimmer–Perner 1983) a gyerekek egy történetet hallanak egy fiúról, aki egy szekrénybe teszi a csokoládéját, majd távollétében az anyukája átteszi a csokit egy másik szekrénybe. A feladat végén a gyerekeknek meg kell jósolniuk, hogy a fiú hol fogja keresni a csokoládét, amikor visszatér a szobába. A módosított tudatelméleti feladat (3. ábra) szerkezetileg a standard feladatoz hasonló a tudatelméleti gondolkodás tekintetében, emellett pedig egy nyelvváltási helyzetet jelenít meg. Ebben a feladatban a gyerekeknek egy hamis vélekedésre kellett következtetniük mások különböző nyelvekkel kapcsolatos ismereteinek figyelembe vétele mellett. A forgatókönyv a következő volt: a két szereplő, egy egy- és egy kétnyelvű bábu, fa*gylaltot akar venni. Két bódét látnak, az egyik fa*gylaltot, a másik szendvicseket árul. Ahogy a bábuk közelednek, a fa*gylaltárus bejelenti az egynyelvű bábu által nem beszélt nyelven, hogy nála elfogyott a fa*gylalt, de a szendvicsárusnál még van. Ez a mondat le volt fordítva és kiemelték, hogy az egynyelvű bábu nem értette, amit az árus mondott. A feladat végén a gyerekeknek meg kellett jósolniuk, hogy az egynyelvű bábu hova

2 Egy harmadik elmélet szerint a tudatelméleti feladatok megoldása kétnyelvű kontextusban valójában nehezebb lehet a két-, mint az egynyelvűek számára. Mivel a kétnyelvűek mindkét nyelvet beszélik, nem feltétlenül fogják fel, hogy miért nem érti meg a beszélőt egy egynyelvű. Csakhogy ez az álláspont összeegyeztethetetlennek tűnik azzal, hogy a kétnyelvű gyerekek már 3 éves koruk előtt a megfelelő nyelven szólítják meg a környezetükben lévőket (Genesee et al. 1995). Amennyiben problémát jelent számukra elfogadni, hogy a beszélők nem feltétlenül értik meg mindkét nyelvüket, nehéz megmagyarázni, hogy miért váltanak nyelvet beszélgetőtársukat figyelembe véve.

Korai kétnyelvűség és tudatelmélet



fog majd menni fa*gylaltot venni. Az általános információfeldolgozási különbségek kiszűrésére a Zaitchik (1990) által kifejlesztett gizmo-feladatot használtuk.

3. ábra: A módosított tudatelméleti feladat sematikus illusztrációja (Kovács 2009 alap-

ján)

Ahogy a 4. ábrán látató, Kovács (2009) eredményei szerint kétszer annyi kétnyelvű gyerek oldotta meg helyesen a standard és a módosított tudatelméleti feladatot, mint ahány egynyelvű, de a gyerekek hasonlóan teljesítettek a kontrollfeladatban. A kétnyelvűek eredménye mind a két tudatelméleti feladatban jobb volt, és nem jelent meg náluk teljesítménybeli különbség a standard és a módosított tudatelméleti feladatban. A gyerekek teljesítménye a két tudatelméleti feladatban szignifikánsan korrelált egymással. A résztvevők összességében jobban teljesítettek a kontrollfeladatban, mint a tudatelméleti feladatokban és a kétnyelvűek teljesítménye döntően jobb volt mindkét tudatelméleti feladatban az egynyelvűekénél, azonban ez a kontrollfeladatra nem volt jellemző. Összességében az eredmények azt mutatják, hogy a kétnyelvű gyerekek a tudatelméleti feladatok megoldásában jelentkező speciális előnyökkel rendelkeznek egynyelvű társaikkal szemben. A kétnyelvűség hatása nem magyarázható az általános információfeldolgozó képességek különbségeivel, mivel ez a hatás nem volt kimutatható a kontrollfeladatban. Más olyan faktorok sem okozhatták a különbségeket, mint a szocioökonómiai helyzet, esetleg intelligenciabeli különbség, mivel ezeket a tényezőket is kontrolláltuk a vizsgálatban. Azt a lehetőséget



Kovács Ágnes Melinda

4. ábra: Azon gyerekek százalékos aránya, akik sikeresek voltak a standard tudatelméleti

feladatban (balra), a módosított tudatelméleti feladatban (középen) és a kontrollfeladatban (jobbra) (Kovács 2009 alapján)

is kizárhatjuk, hogy a két tudatelméleti feladat nem volt azonos bonyolultságú, mivel az egynyelvűek hasonló teljesítményt nyújtottak mindkét feladatnál. Ezt vehetjük alapul a kétnyelvűek teljesítményének vizsgálatakor. A kétnyelvű gyerekek jobb teljesítménye a két tudatelméleti feladatban valószínűleg az ilyen feladatokhoz szükséges hatékonyabb gátló képességeiknek köszönhető. Ez a forgatókönyv a csoport főhatását jelezte előre, hasonló mértékű kétnyelvű előnnyel mindkét feladatnál. Az eredményeink pontosan ezt a hatást mutatják. Így megfelelnek annak az elméletnek, amely szerint a kétnyelvűek előnye a gátláshoz kapcsolódik. Azonban az adatok nem támasztják alá a specifikus tapasztalatokból származó kompetenciaváltási elméletet, amely szerint a nyelvváltásos helyzetek vezetnek a tudatelmélet korai kialakulásához kétnyelvűeknél. Ez az elmélet azt vetíti előre, hogy a kétnyelvűek előnye különösen a módosított feladatban fog érvényesülni, mivel ez mutat be olyan helyzetet, amely feltehetőleg a kétnyelvűek tudatelméleti képességének korai kialakulásához vezethetett. Ezzel szemben a kétnyelvűeknél általánosan jobb teljesítmény volt megfigyelhető, amely mind a standard, mind a módosított tudatelméleti feladatban megjelent. Így ezek az eredmények összhangban vannak a tudatelmélet fejlődésének performanciaváltozási elméletével. Ennek ellenére elképzelhetőek olyan más forgatókönyvek, amelyek a konceptuális változásokat helyezik előtérbe. Például a kétnyelvű gyerekek észrevehetik, hogy egy bizonyos fogalom két különböző nyelvben két egyenrangú megnevezéssel rendelkezik. Ez segítségükre lehet az alternatív mentális reprezentációk fenntartásában, amely a hamisvélekedés-fel-

Korai kétnyelvűség és tudatelmélet



adatokhoz is szükséges. Míg az egynyelvű gyerekek csak 4 éves kor körül képesek egy tárgy két megnevezése (két szinonima) között flexibilisen váltani (Perner et al. 2002), a kétnyelvűeknek már sokkal hamarabb meg kell tanulniuk ezt a hatékony kommunikáció érdekében. Az is elképzelhető továbbá, hogy a kétnyelvűek jobb reprezentációs készséggel rendelkeznek, a fejlettebb nyelvi képességeiknek köszönhetően. Kovács (2007a) egy további kísérletsorozatban azt vizsgálta, hogy a kétnyelvűek a fejlettebb gátló funkcióik vagy egyéb tényezők miatt teljesítenek-e jobban a standard tudatelméleti feladatban. Ezekben a vizsgálatokban 3 és 4 éves egyés kétnyelvű gyerekeket hasonlított össze magas és alacsony gátlásigényű tudatelméleti feladatokban. Ha a kétnyelvűek előnye az erősebb gátló képességeiknek köszönhető, akkor csak a magas gátlásigényű feladatoknál fognak jobb teljesítményt nyújtani az egynyelvűeknél. Ezzel ellentétben a konceptuális váltás elmélete szerint a kétnyelvűek mindkét tudatelméleti feladatban jobb teljesítményt nyújtanak majd, a gátlásigénytől függetlenül. Az a kérdés is felmerült a vizsgálatban, hogy a kétnyelvűek az előző vizsgálatban megfigyelt jobb teljesítménye lehet-e a fejlettebb nyelvi képességek eredménye. Villiers és Pyers (2002) felvetette, hogy bizonyos szintaktikai komplementumok (pl. a mentális állapotot jelentő igék alá tartozó argumentumok: nem tudja, hogy itt vagyok) szolgálhatnak reprezentációs alappal a hamis vélekedések kódolásához. Más vizsgálatok szerint az általános nyelvi képességek hozhatók kapcsolatba a tudatelmélettel (Astington– Jenkins 1999; Tardiff et al. 2007). Így Kovács (2007b)három tudatelméleti feladatban, egy kontrollfeladatban és egy szintaktikai komplementumok megértésének vizsgálatára tervezett feladatban hasonlította össze az egy- és kétnyelvűeket. Az ebből a vizsgálatból származó adatok azt mutatják, hogy kétszer annyi kétnyelvű, mint egynyelvű gyerek ment át a standard tudatelméleti feladaton, de mindkét csoport hasonlóan teljesített az alacsony gátlásigényű tudatelméleti feladatokban és a kontrollfeladatban. A nyelvi feladatban nem találtunk szignifikáns különbséget a csoportok között. Ezen adatok alapján a kétnyelvűek előnye a standard tudatelméleti feladatban nem a jobb nyelvtani képességüknek köszönhető, mivel nem volt különbség a két csoport között az igei komplementumok megértése tekintetében. A kétnyelvűek előnye a standard tudatelméleti feladatra korlátozódik, amely egy domináns válasz gátlását igényli. Így a gátlást előtérbe helyező elmélet tűnik a legvalószínűbb magyarázati keretnek a klasszikus tudatelméleti feladatban megjelenő kétnyelvű előnyre. A kétnyelvűek nagy gyakorlatra tesznek szert a különböző reprezentációs struktúrák monitorozásában és gátlásában, mivel folyamatosan váltaniuk kell a nyelvek között. Ez az extra gyakorlás előnyhöz juttatja őket az egymásnak ellentmondó mentális reprezentációkat tartalmazó feladatokban.



Kovács Ágnes Melinda

. Konklúzió és záró megjegyzések A másoktól és másokról, valamint a környezetükben előforduló eseményekről való tanulás hatalmas kihívást jelent a csecsemők számára, és ez a feladat a kétnyelvűeknek sem könnyebb. Úgy tűnik azonban, hogy a kisgyerekek nagyon hatékony tanulási képességekkel rendelkeznek, és meglepően könnyen képesek használni az absztrakt struktúrákról (mint a nyelv vagy mások mentális állapotai) való következtetés képességét. Az előzőekben azt a felvetést vizsgáltuk meg, hogy a kétnyelvűek nyelvtanulása azért aktiválja-e korán a végrehajtó mechanizmusokat, hogy kezelni tudja a két nyelv reprezentációit. Amennyiben ez így van, a kétnyelvűek már a beszéd kezdete előtt széleskörűen használhatják a végrehajtó funkcióikat, ez pedig ezen képességek gyorsabb fejlődéséhez vezethet. Azon kísérleti eredmények, melyek arra mutatnak, hogy már a 7 hónapos kétnyelvűek is jobban teljesítenek az egynyelvűeknél a végrehajtó funkciókkal kapcsolatos feladatokban, megerősítik ezt a feltevést. Így elképzelhető, hogy a különböző nyelvek észlelése és feldolgozása már a beszéd megkezdése előtt fejleszti a végrehajtó funkciókat. Ennek következtében a végrehajtó funkciók lehetővé teszik, hogy a kétnyelvűek jobb teljesítményt nyújtsanak a tudatelméleti feladatokban, amelyekhez jól fejlett végrehajtó funkciókra van szükség, mivel fontos részük a két mentális reprezentáció közti konfliktus feloldása. A fejezet második részében bemutatott eredmények alapján a kétnyelvűek jobban teljesítenek a tudatelméleti feladatokban, de csak a standard változatban, a csökkentett gátlást igénylő variációban nem. Úgy tűnik, hogy szignifikánsan több kétnyelvű sikeres a standard és a nyelvváltást megjelenítő tudatelméleti feladatban, azonban nem különböznek az egynyelvűektől az általános információfeldolgozó képességekben, intelligenciában vagy szocioökonómiai helyzetükben (Kovács 2009). Továbbá a kétnyelvűek előnye csak a magas gátlásigényű tudatelméleti feladatban mutatkozik meg, míg az alacsony gátlásigényű feladatokban az egynyelvűekhez hasonlóan teljesítenek. Ezek az eredmények további bizonyítékokkal szolgálnak arról, hogy a fejlődő végrehajtó funkciók hogyan járulnak hozzá a standard tudatelméleti problémák megoldásához, mivel rámutatnak, hogy a születéstől fogva kétnyelvű környezet segíti a végrehajtó funkciók fejlődését, így közvetetten elősegíti a tudatelméleti feladatokban nyújtott teljesítményt. Arra a következtetésre jutottunk, hogy a kétnyelvűek akár már a bölcsőben elkezdődő széleskörű gyakorlata a két nyelv figyelemmel kísérésében fejlettebb gátlási folyamatokhoz vezethet, ami pedig előnyhöz juttathatja őket a gátlást magában foglaló tudatelméleti feladatoknál. A korai kétnyelvű hatások kiemelt fontosságát további tanulmányok eredményei is alátámasztják. Egyrészt Kovács (2007b) ír egy vizsgálatról, ahol egynyelvű, valamint születésüktől fogva kétnyel-

Korai kétnyelvűség és tudatelmélet



vű gyerekeket vizsgáltak tudatelméleti és végrehajtó funkciókra épülő feladatokban. A kétnyelvűek jobban teljesítettek a standard tudatelméleti és a végrehajtó funkciókkal kapcsolatos feladatokban. Egy másik vizsgálat, amely 2 éves koruktól kétnyelvű iskolába járó gyerekeket hasonlított össze egynyelvűekkel, nem talált teljesítménybeli különbséget a standard hamisvélekedés-feladatban, de az első csoport valamivel jobban teljesített más tudatelmélethez kapcsolódó feladatokban (Goetz 2003). Ezek az eredmények arra mutatnak, hogy a születéstől kezdődő kétnyelvű hatások valóban kiemeltem fontos szerepet játszhatnak, ahogy Carlson és Melzoff (2008) is felvetette, amikor jobb végrehajtó funkciós feladatbeli teljesítményt talált a születésüktől fogva kétnyelvű gyerekeknél, mint azoknál, akik az óvodában kezdték meg második nyelvük elsajátítását. A fejlett végrehajtó funkcióik legalább két szinten segíthetik a kétnyelvűeket a tudatelméleti feladatok megoldásában. A hamis vélekedések kezelésekor a kétnyelvűek könnyebben figyelmen kívül hagyják a saját igaz vélekedésüket, így korábban képesek lehetnek mások mentális tartalmai függvényeben azok viselkedését előrejelezni még akkor is, ha azok sem saját vélekedéseiknek, sem a valóságnak nem felelnek meg (Leslie et al. 2005). A válaszadás szintjén pedig elképzelhető, hogy könnyebben le tudják gátolni a domináns, tárgyhoz kapcsolódó válaszokat a tudatelméleti feladatokban. Ezeket a domináns válaszokat vezérelheti a tárgyak valódi elhelyezkedése, még akkor is, ha a gyerekek tudják, hogy másoknak nincs birtokában ez az információ. Összességében azok az eredmények, amelyek szerint a 3 éves kétnyelvű gyerekek jobban teljesítenek az egynyelvűeknél a standard vagy nyelvváltásos kontextusú, magas gátlásigényű tudatelméleti feladatokban, új bizonyítékokat szolgáltatnak a tudatelméleti kompetencia–performancia vitához, mivel arra mutatnak, hogy az alapvető tudatelméleti képességek már 4 éves kor előtt jelen lehetnek. Nem valószínű azonban, hogy a kétnyelvűek itt megfigyelt előnyei a tudatelméleti kompetencia egy alapvető részének megváltozása miatt következnek be. Már a csecsemők is képesek lehetnek arra, hogy fajtársaikat magukhoz hasonlóként érzékeljék, vagyis olyan intencionális ágenseknek tekintsék őket, akiket nem megfigyelhető mentális állapotok jellemeznek (Onishi–Baillargeon 2005; Kovács et al. 2010). Valószínűbb, hogy a születéskor kezdődő kétnyelvű környezet a tipikus tudatelméleti feladat megoldásához szükséges kontrollképességek megerősödéséhez vezet. A bölcsői kétnyelvűség a nyelv területén jóval túlmutató változásokat idéz elő és felgyorsítja a társas megismerés fejlődését. Ezek az erőteljes, több területen átívelő előnyök jelennek meg a kétnyelvűek hamis vélekedéses szituációkban nyújtott jobb teljesítményében.



Kovács Ágnes Melinda

Irodalom Apperly, Ian A. – Kevin J. Riggs – Andrew Simpson – Claudia Chiavarino – Dana Samson 2006. Is belief reasoning automatic? Psychological Science 17: 841–844. Astington, Janet W. – Jennifer M. Jenkins 1999. A longitudinal study of the relation between language and theory-of-mind development. Developmental Psychology 35: 1311–1320. Baillargeon, Renee – Rose M. Scott – Zijing He 2010. False-belief understanding in infants. Trends in Cognitive Sciences 14: 110–118. Baron-Cohen, Simon – Allan M. Leslie – Uta Frith 1985. Does the autistic child have a ‘theory of mind’? Cognition 21: 37–46. Bialystok, Ellen 1999. Cognitive complexity and attentional control in the bilingual mind. Child Development 70: 636–644. Bialystok, Ellen – Fergus I. Craik – Cheryl Grady – Wilkin Chau – Ryouhei Ishii – Atsuko Gunji – Christo Pantev 2005. Effect of bilingualism on cognitive control in the Simon task, evidence from MEG. NeuroImage 24: 40–49. Bialystok, Ellen – Fergus I. Craik – Raymond Klein – Mythili Viswanathan 2004. Bilingualism, aging, and cognitive control: Evidence from the Simon task. Psychology and Aging 19: 290–303. Birch, Susan A. J. – Paul Bloom 2003. Children are cursed: An asymmetric bias in mental-state attribution. Psychological Science 14: 283–286. Birch, Susan A. J. – Paul Bloom 2007. The curse of knowledge in reasoning about false beliefs. Psychological Science 18: 382–386. Bloom, Paul – Tamsin P. German 2000. Two reasons to abandon the false belief task as a test of theory of mind. Cognition 77: B25–B31. Bosch, Laura – Nuria Sebastián-Gallés 2001. Evidence of early language discrimination abilities in infants from bilingual environments. Infancy 2: 29–49. Bosch, Laura T. – Nuria Sebastián-Gallés 1997. Native-language recognition abilities in four-monthold infants from monolingual and bilingual environments. Cognition 65: 33–69. Brown, Jane R. – Nancy Donelan-McCall – Judy Dunn 1996. Why talk about mental states? The significance of children’s conversations with friends, siblings and mothers. Child Development 67: 836–849. Buttelmann, David – Carpenter Malinda – Michael Tomasello 2009. Eighteen-month-old infants show false belief understanding in an active helping paradigm. Cognition 112: 337–342. Carlson, Stephanie M. – Andrew N. Meltzoff 2008. Bilingual experience and executive functioning in young children. Developmental Science 11: 279–295. Carlson, Stephanie M. – Louis J. Moses 2001. Individual differences in inhibitory control and children’s theory of mind. Child Development 72: 1032–1053. Carlson, Stephanie M. – Louis J. Moses – Hollie R. Hix 1998. The role of inhibitory control in young children’s difficulties with deception and false belief. Child Development 69: 672–691. Costa, Albert – Mireia Hernández – Nuria Sebastián-Gallés 2008. Bilingualism aids conflict resolution: Evidence from the ANT task. Cognition 106: 59–86. Costa, Albert – Mikel Santesteban 2004. Lexical access in bilingual speech production: Evidence from language switching in highly proficient bilinguals and L2 learners. Journal of Memory and Language 50: 491–511.

Korai kétnyelvűség és tudatelmélet



Diamond, Adele 2002. Normal development of prefrontal cortex from birth to young adulthood, cognitive functions, anatomy, biochemistry. In: D. T. Stuss – R. T. Knight (szerk.): Principles of frontal lobe function. Oxford: Oxford University Press. 466–503. Diamond, Adele – Patricia S. Goldman-Rakic 1989. Comparison of human infants and rhesus monkeys on Piaget’s A-not-B task. Evidence for dependence on dorsolateral prefrontal cortex. Experimental Brain Research 74: 24–40. Fodor, Jerry A. 1992. A theory of the child’s theory of mind. Cognition 44: 283–296. Freeman, Norman H. – Hazel Lacohee 1995. Making explicit 3-year-olds’ implicit competence with their own false beliefa. Cognition 56: 31–60. Friedman, Ori – Allan M. Leslie 2004. Mechanisms of belief-desire reasoning: Inhibition bias. Psychological Science 15: 547–552. Frye, Douglas – Philip D. Zelazo – Tibor Palfai 1995. Theory of mind and rule-based reasoning. Cognitive Development 10: 483–524. Genesee, Fred – Elene Nicoladis – Johanne Paradis 1995. Language differentiation in early bilingual development. Journal of Child Language 22: 611–631. Gergely, György – Zoltán Nádasdy – Gergely Csibra – Szilvia Bíró 1995. Taking the intentional stance at 12 months of age. Cognition 56: 165–193. Gerstadt, Cherie L. – Yoon J. Hong – Adele Diamond 1994. The relationship between cognition and action: Performance of children 3, 5–7 years old on Stroop-like day-night test. Cognition 53: 129–153. Goetz, Peggy J. 2003. The effects of bilingualism on theory of mind development. Bilingualism: Language and Cognition 6: 1–15. Green, David W. 1998. Mental control of the bilingual lexico-semantic system. Bilingualism: Language and Cognition 1: 67–81. Kaminski, Juliane – Joseph Call – Michael Tomasello 2008. Chimpanzees know what others know, but not what they believe. Cognition 109: 224–234. Kloo, Daniela – Josef Perner 2003. Training transfer between card sorting and false belief understanding: Helping children apply conflicting descriptions. Child Development 74: 1823–1839. Kovács, Ágnes Melinda 2007a. Beyond language: Childhood bilingualism enhances high-level cognitive functions. In: István Kecskés – Liliana Albertazzi (szerk.): Cognitive aspects of bilingualism. Dordrecht: Springer. 301–324. Kovács, Ágnes Melinda 2007b. Enhanced executive functions boost performance in theory of mind tasks: The case of bilinguals. Paper presented at the SRCD Biennial Meeting, Boston, 30 March, 2007. Kovács, Ágnes Melinda 2009. Early bilingualism enhances mechanisms of false-belief reasoning. Developmental Science 12: 48–54. Kovács, Ágnes Melinda – Jacques Mehler 2009a. Cognitive enhancements in 7-month-old bilingual infants. Proceedings of the National Academy of Sciences of the United States of America 106: 6556–6560. Kovács, Ágnes Melinda – Jacques Mehler 2009b. Flexible learning of multiple speech structures in bilingual infants. Science 325: 611–612. Kovács Ágnes Melinda – Téglás Ernő 1998. A mentális reprezentációk kettős kódolási elméletének vizsgálata többnyelvűeknél. Parallaxis 2: 42–56.



Kovács Ágnes Melinda

Kovács Ágnes Melinda – Téglás Ernő 2005. Az aszimmetria logikája: a központi feldolgozó és a nyelvváltás kapcsolata kétnyelvűeknél. In: Gervain Judit – Kovács Kristóf – Lukács Ágnes – Racsmány Mihály(szerk.): Az ezerarcú elme. Tanulmányok Pléh Csaba 60. születésnapjára. Budapest: Akadémiai Kiadó. 222–235. Kovács, Ágnes Melinda – Ernő Téglás – Ansgar Denis Endress 2010. The social sense: Susceptibility to others’ beliefs in human infants and adults. Science 330: 1830–1834. Leslie, Allan M. – Tamsin P. German – Pamela Polizzi 2005. Belief-desire reasoning as a process of selection. Cognitive Psychology 50: 45–85. Leslie, Allan M. – Pamela Polizzi 1998. Inhibitory processing in the false belief task: Two conjectures. Developmental Science 1: 247–253. Marcus, Gary F. – Sugumaran Vijayan – Shoba Bandi Rao – Peter M. Vishton 1999. Rule learning in seven-month-old infants. Science 283: 77–80. Melot, Anne-Marie – Nathalie Angeard 2003. Theory of mind: Is training contagious? Developmental Science 6: 178–184. Nazzi, Thierry – Josiane Bertoncini – Jacques Mehler 1998. Language discrimination by newborns, toward an understanding of the role of rhythm. Journal of Experimental Psychology, Human Perception and Performance 24: 756–766. Onishi, Kristine H. – Renee Baillargeon 2005. Do 15-month-old infants understand false beliefs? Science 308: 255–258. Ozonoff, Sally – Bruce F. Pennington – Sally J. Rogers 1991. Executive function deficits in high functioning autistic children: Relationship to theory of mind. Journal of Child Psychology 32: 1081–1105. Pearson, Barbara Z. – Sylvia C. Fernez – D. K. Oller 1993. Cross-language synonyms in the lexicons of bilingual infants, one language or two? Journal of Child Language 22: 345–365. Perner, Josef 1991. Understanding the representational mind. Cambridge MA: MIT Press. Perner, Josef – Sandra Stummer – Manuel Sprung – Martin Doherty 2002. Theory of mind finds its Piagetian perspective: Why alternative naming comes with understanding belief. Cognitive Development 17: 1451–1472. Petitto, Laura-Ann – Marina Katerelos – Bronna G. Levy – Kristine Gauna – Karine Tetreault – Vittoria Ferraro 2001. Bilingual signed and spoken language acquisition from birth: Implications for the mechanisms underlying early bilingual language acquisition. Journal of Child Language 28: 453–496. Ramus, Frank – Mark D. Hauser – Corry Miller – Morris Dylan – Jacques Mehler 2000. Language discrimination by human newborns and cotton-top tamarin monkeys. Science 288: 349–351. Sabbagh, Mark A. – Fei Xu – Stephanie M. Carlson – Louis J. Moses – Kang Lee 2006. The development of executive functioning and theory of mind. A comparison of chinese and U.S. preschoolers. Psychological Science 17: 74–81. Saffran, Jenny R. – Seth Seibel – Rebecca Pollak – Anna Shkolnik 2007. Dog is a dog is a dog. Infant rule learning is not specific to language. Cognition 105: 669–680. Scholl, Brian J. – Allan M. Leslie 2001. Minds, modules, and meta-analysis. Child Development 72: 696–701. Scott, Rose M. – Renee Baillargeon 2009. Which penguin is this? Attributing false beliefs about identity at 18 months. Child Development 80: 1172–1196.

Korai kétnyelvűség és tudatelmélet



Song, Hyun-joo – Kristine H. Onishi – Renee Baillargeon – Cynthia Fisher 2008. Can an agent’s false belief be corrected through an appropriate communication? Psychological reasoning in 18-month-old infants. Cognition 109: 295–315. Southgate, Victoria – Atsusi Senju – Gergely Csibra 2007. Action anticipation through attribution of false belief by two-year-olds. Psychological Science 18: 587–592. Sperber, Dan – Deirdre Wilson 2002. Pragmatics, modularity and mind-reading. Mind and Language 17: 3–23. Surian, Luca – Stefania Caldi – Dan Sperber 2007. Attribution of beliefs by 13-month-old infants. Psychological Science 18: 580–586. Tardiff, Twila – Catherine W. C. So – Niko Kociroti 2007. Language false belief: Evidence for general, not specific, effects in Cantonese-speaking preschoolers. Developmental Psychology 43: 318–340. Villiers, Jill de – Jennie E. Pyers 2002. Complements to cognition: A longitudinal study of the relationship between complex syntax and false-belief-understanding. Cognitive Development 17: 1037–1060. Wellman, Henry M. – Karen Bartsch 1988. Young children’s reasoning about beliefs. Cognition 30: 239–277. Wellman, Henry M. – David Cross – Julanne Watson 2001. Meta-analysis of theory-of-mind development: The truth about false belief. Child Development 72: 655–684. Wimmer, Heinz – Josef Perner 1983. Beliefs about beliefs: Representation and constraining function of wrong beliefs in young children’s understanding of deception. Cognition 13: 103–128. Zaitchik, Deborah 1990. When representations conflict with reality: The preschoolers’ problem with false beliefs and “false” photographs. Cognition 35: 41–68.

Early bilingualism and theory of mind Abstract: According to the main view of social cognition, children become able to reason about mental representations only after the age of four. However, other researchers have argued that such theory of mind abilities are innate, and that the observed differences are due to other processes (e.g., executive functions) involved in solving theory-of-mind problems. The present work investigated these assumptions through studies performed with bilingual children. According to the results, processing different languages enhances the development of executive functions already at 7 months of age, before the onset of speech. Furthermore, their more developed executive functions allow bilingual preschoolers to perform better on theory-of-mind tasks, where well-developed executive functions are necessary, as children have to resolve a conflict between two mental representations. Crib bilingualism results in changes that go beyond the domain of language and seems to enhance socio-cognitive development. Keywords: early bilingualism, cognitive effects of bilingualism, executive functions, theory of mind

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban* Bánréti Zoltán Magyar Tudományos Akadémia, Nyelvtudományi Intézet [emailprotected]

Szücs Márta Szegedi Tudományegyetem [emailprotected]

Mészáros Éva Országos Orvosi Rehabilitációs Intézet, Budapest [emailprotected]

Kivonat: A lexikai rekurzió műveletére vonatkozó képességeket vizsgáljuk olyan tesztekkel, amelyek összetett szavak rekurzív létrehozást kívánják meg. A tesztekben ép, afáziás és Alzheimer-kórral élő személyek vettek részt. Az afáziások két csoportot képeztek válaszmintázataik tekintetében. Az anómikus afáziások a lexikai rekurziót illetően súlyos korlátozottságot mutattak. Olyan javító stratégiával próbálkoztak, amely az összetett célszavak megépítése helyett a „szintaxisba kilépés” műveleteit tartalmazta, komplex összetett szavak előállítása helyett mondatokat vagy szószerkezeteket produkáltak. Ehhez társult a lexikai rekurzió súlyos deficitje. Az összetett szó produktív építésében a szintaxisba kilépés kompenzáló stratégiát követő, anómikus afáziásoknál a lexikai rekurzív műveletek sérültebbeknek mutatkoztak, mint a mondattani rekurzió. A másik afáziás csoportot a Broca- és a vezetéses afáziások adták. A lexikai rekurziót, az összetett szavak produktív és rekurzív építését kívánó feladatokra a lexikai keresés stratégiájával reagáltak: az összetett célszavak helyett azok egyszerű szinonimáját vagy a hiperonim jelentésű szót részesítették előnyben. Tehát deficitet mutatnak a lexikai rekurzív műveletek (az összetett szavak produktív építése) és korlátozottak a mondattani rekurzív műveletek. A produktívan alkalmazandó lexikai rekurzió deficitje erősen érzékeny volt a megépítendő összetett szó komplexitására. Egyúttal korlátozottak voltak a mondattani rekurzív műveletek. Az Alzheimer-kóros személyek az összetett szavak produktív és rekurzív építésében a szintaxisba kilépés stratégiáját preferálták. A lexikai rekurzív szabályok a 3 tagú összetett szavakig viszonylagosan épen maradtak, de a célszó komplexitásának növekedése a szintaxisba kilépés stratégiáját váltotta ki és nem a lexikai keresést. A három- és négytagú összetett szavakat leíró, rekurzívan épített mondatokkal helyettesítették. Ezek a vizsgálatok megmutatták, hogy az összetett szó rekurzív építésének deficitjéből nem következik a mondattani rekurzió deficitje, és fordítva: a mondattani rekurzió korlátozottsága nem eredményezi automatikusan az összetett szó rekurzív építésének deficitjét. A szóösszetételt eredményező rekurzió alapja egy produktív szemantikai konstrukció és nem a szintaktikai szabály. Ugyanakkor maga a lexikai rekurzió művelete egyfajta „saját” szintaxissal rendelkezik, éppen ezt mutatja produktivitása.

* A kutatást az OTKA támogatta: NK  sz. téma. Köszönettel tartozunk Hoffmann Ildikónak, Kotra Mónikának, Őrley Zitának, Rung Andrásnak és Zsitvai Mihálynak a tesztelések során végzett munkájukért.



Bánréti Zoltán – Szücs Márta – Mészáros Éva

Az említett tesztekben észlelt produkciós különbségeket az magyarázza, hogy nem egyetlen rekurzív művelet különféle nyelvi szinteken történő alkalmazása sérülhet vagy maradhat épen, hanem nyelvtani alrendszerekhez kötött rekurzív műveletekről van szó, amelyek szelektíven korlátozódhatnak. Kulcsszavak: rekurzió, szintaxis, lexikon, afázia, Alzheimer-kór

A tanulmányban bemutatott kutatásainkkal annak tisztázásához szeretnénk hozzájárulni, hogy a rekurzióra való emberi képességnek vajon mi a közelebbi a forrása: az (i) emberi nyelv szintaxisa, vagy (ii) a nyelv szemantikája és pragmatikája (annak rekurzív logikája), vagy (iii) a szociális megismerés műveletei, mint a rekurzív tudatelméleti következtetések, vagy (iv) az emberi elme általános kognitív képessége. Kutatásaink centrumában olyan empirikus vizsgálatok álltak, melyekben afáziás személyeket (agrammatikus, anómikus és Wernicke-afáziásokat), enyhe és középsúlyos Alzheimer-kóros személyeket és ép személyeket vizsgáltunk rekurzív műveleteket kívánó nyelvi tesztekben.

. Megjegyzések a rekurzióról .. Bar-Hillel (1953) értelmében a rekurzió az az eszköz, amely lehetővé teszi, hogy az emberek potenciálisan végtelen számú, különböző nyelvi szerkezetet hozzanak létre. Ám a rekurziót a nyelvészetben, a kognitív pszichológiában, a matematikában, vagy éppen a számítógép-tudományokban nem azonos módon definiálják, és a neurobiológiai kutatások is új szempontokat vetettek fel (pl. Brisco 2009; Tallerman et al. 2009; illetve: Bickerton–Szathmáry 2009). Amint Tomalin (2007), Hulst (2010a) és Koschmann (2010) összefoglalja, a nyelvészet keretein belül is többféleképpen definiálták a rekurziót, a neki tulajdonított szerep változásokon ment át az elmúlt ötvenhét évben. A következőkben az empirikus vizsgálataink során alkalmazott rekurziófogalmat szeretnénk jellemezni. Az általunk használt specifikus rekurziófogalom Chomsky (2007, 5–6) által ajánlott megközelítésen alapul. Eszerint a nyelv komputációs műveletei rekurzívan konstruálnak szintaktikai objektumokat a szelektált lexikai egységekből és a már megformált szintaktikai objektumokból. Például a Merge művelete számára kétféle nyelvi egység szolgálhat inputként: (i) lexikai egységek, és (ii) a Merge korábbi alkalmazásai által létrehozott frázisok. Mivel a Merge használhatja saját maga korábbi outputjait inputként, a szabály rekurzív. Egyúttal a szabály kategóriasemleges, tehát a minimalista elméleti keretben minden nagyobb frázison belül előforduló frázis mutatja a szabály rekurzivitását (bármely XP frázis önmaga részeként tartalmazza az X kategóriát, mint a szerke-

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



zet „fejét”: X0-t). A szintaktikai objektumok (nyelvi kifejezések) „kisebb” szintaktikai objektumok kombinációjaként definiálhatók. Az ilyen értelemben vett rekurzió megengedi a specifikus rekurzió fogalmát, amelyet mi is alkalmazunk: egy szintaktikai-szerkezeti összetevő ismételhető beágyazását azonos típusú szerkezeti összetevőbe, pl. vonatkozó mellékmondat-beágyazását vonatkozó mellékmondatba, főnévi szerkezet beágyazását főnévi szerkezetbe, vagy azt, hogy egy összetett szó önmaga komponenseként tartalmazhat egy vele azonos kategóriájú szót. A szerkezeti (formális) rekurzivitás a szavak, a frázisok és a mondatok szintjein tehát egyaránt megjelenhet. Így az összetett szó lehet rekurzív műveletek eredménye, mivel olyan szó, amely maga is szavakat tartalmaz, például: készít(ijeszt-madár) → madárijesztő-készítő. Rekurzív főnévi szerkezet: Vali barátnője öccse kutyájának a labdája, infinitívuszos szerkezet: Ő most akar elkezdeni énekelni tanulni. Rekurzív tagmondat-beágyazások: Vali tudja, hogy én észrevettem, hogy te mosolyogtál. Többféle szintaktikai szabály szervezi ezeket a műveleteket, ennek részleteire nem térünk ki. A nyelvekben vannak nem rekurzív szintaktikai részrendszerek is. Ilyenek az emotívok: Ó, az a mázlista! Neked Ica gazdag? Ödönt elnöknek?, vagy az ún. fényképmondatok: A kutya a macskával a kertben. Mari Rómában. Ezek nem tartalmaznak finit igét, és egymásba nem ágyazhatók, nem rekurzívok: *Ödön mint menedzser, hogy Ödönt elnöknek? Evans és Levinson (2009), Everett (2009) a nyelv szemantikáját és pragmatikáját tartják a rekurzivitás forrásának, mivel összetett propozíciók, beágyazott következetések egyetemesen kifejezhetők a nyelvekben, ekkor a nyelvi rekurzió alapját egyes kognitív képességek adhatják. Így egyszerű mondatok szekvenciáját tudjuk úgy interpretálni, hogy egy állítás tartalmaz egy másik állítást, ami szemantikai tekintetben vett rekurziót jelenthet: Mari bement a boltba. Egy porszívót vásárolt. Végre tisztaságot akart a lakásban. Folyton tüsszögött a portól. .. A természetes nyelv szintaxisának rekurzivitását Hauser et al. (2002), valamint Fitch et al. (2005) az emberi nyelv specifikumának tekinti. E híres cikkek legfontosabb állításai széles körben vitatottak. Hauser és munkatársai (2002) azt állítják, hogy a rekurzió a velünk született nyelvi képesség alapvető összetevője, és a szenzomotoros rendszerrel, valamint a konceptuális rendszerrel alkotott interfésszel együtt adja a szűkebb értelemben vett nyelvi képességet. Azt is állítják, hogy vannak olyan más mentális képességek, amelyek specifikusan szolgálják a nyelvet, és amelyek a rekurzióval együttesen képezik a széles értelemben vett nyelvi képességet. Ilyenek az állatvilágban is megfigyelhetők (pl. emlékezeti rendszerek, figyelem, motiváció, fejlett hangadási szisztéma stb.), de a rekurzió maga már nem, mivel az emberi specifikum. Pinker és Jackendoff (2005) ezt



Bánréti Zoltán – Szücs Márta – Mészáros Éva

megkérdőjelezi, mondván, hogy azok a rendszerek, amelyek specifikusan a nyelvet szolgálják, részei kell legyenek azon mentális képességeknek, amelyek „közös metszete” éppen a velünk született nyelvi képességhez vezet. Ez utóbbinak tehát többet és mást is kell tartalmaznia, mint a rekurzió képességét. A harmadik alapállítás az, hogy a rekurzió univerzális, minden emberi nyelvben jelen van. Ezt vitatják többek között Everett beszámolói a piraha nyelv rendszeréről, melyek szerint a pirahában nincsen szintaktikai-szerkezeti rekurzió (Everett 2009). Végül Hauser et al. (2002) azt is állítja, hogy a rekurzió az emberi elme egyedülálló vonása. Ezt is megkérdőjelezték, már a madarak tekintetében is. Gentner et al. (2006) kimutatta, hogy az európai seregélyek pontosan felismernek olyan akusztikus mintákat, amelyeket rekurziót tartalmazó, kontextusfüggetlen nyelvtan definiál. Felismerik az ilyen nyelvtan által definiált új mintákat és megkülönböztetik tőlük az „agrammatikus” hangmintázatokat. Más oldalról ezt vitatják (pl. Friederici 2009). De Chomsky (2007) és Hauserék is megengedik, hogy az állatok tájékozódási kapacitása rekurzív lehet. Ebből viszont az következik, hogy a rekurzió mégsem csak az emberi elmére korlátozódik. Kérdés az is, hogy az emberi nyelvben megjelenő rekurzió tükrözője-e az emberi elme általánosabb rekurzív műveleti képességének, vagy pedig léteznek csakis a természetes nyelv sajátjaként működő rekurzív műveletek. A nyelvi intonációs szerkezet mintázata például determinált lehet a rekurzív beágyazás, illetve a hierarchikus csoportosítás által (Hunyadi 2010; Wagner 2007). Amint Hunyadi (2010) bemutatja, a tagmondat-beágyazás által megszakított szerkezeteknek a megszakítás előtti és a megszakítás utáni elemei közti tonális kontinuitás (a beágyazott szakasz eltérő dallama mellett) emlékeztető-könyvjelző effektust mutat, mintegy megjelöli, hol „hagytuk abba” a mátrixszerkezetet, és honnan „folytatódik” a beágyazással korábban megszakított mátrixszerkezet építése. A rekurzív beágyazás kezdete alacsonyabb tónussal, a vége (a „kiágyazás”) magasabb tónussal jelölt, a beágyazás előtt rövidebb, a befejeződése után hosszabb szünet van, és ez többszörös beágyazásnál a hierarchikus szinteken ismétlődik. Hunyadi (2010) értelmében a könyvjelzőeffektus inkább tekinthető az általánosabb kognitív működés rekurzív művelete komponensének, mintsem specifikus nyelvtani szabálynak. Everett a piraháról szóló írásaiban felveti: lehetséges, hogy a morfológiai ismétlődés (egy madár (egy fa ágán (a hegy tetején))) és a nyelvi intonációs (tonális) jegyek használata konvencionalizáltan kifejezheti a konceptuális szerkezetek rekurzivitását (Everett 2009). Ha ezt elfogadjuk, akkor a szintaktikai-szerkezeti rekurzió csak az egyik, és nem az egyetlen kifejezője a konceptuális szerkezetek rekurzivitásának.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



.. Az a mechanizmus, amely az egyik nyelvi szerkezetet beágyazza a másikba, elvileg fontos lehet más kognitív rendszerek számára is, de nem világos, hogy a nyelv szolgáltat-e ilyet vagy sem. Hauser et al. (2002) szerint például a matematika területén rekurzív rendszer feltételezése szükséges ahhoz, hogy megértsük: tetszőleges nagyságú számot tudunk előállítani úgy, hogy valamely számhoz 1-et adva egy másik számot hozunk létre. A helyzetet bonyolítja, hogy funkcionális MRI-vizsgálatok szerint a nyelvi szintaktikai műveletekben és az algebrai szintaktikai műveletekben részt vevő agyi területek szétválnak, elkülönülnek egymástól. Monti et al. (2012) fMRI-kísérleteiben a nyelvi tesztfeladatok az ismert „nyelvi” agyi területek aktivitását mutatták, azonban a hierarchikus algebrai műveletek egészen más, kétoldali fali lebenyi területeket használtak. Az algebrai műveletek gyakran rekurzívak (gondoljunk például a többszörösen zárójelezett aritmetikai feladatokra). A neurológiai területek elkülönülése a melletti érv, hogy nem a nyelvi szintaxis szolgáltatja az algebrai szintaxis alapjait, hanem a két rendszer független egymástól, miközben mindkettő tartalmaz műveleti rekurziót. A vizuális kogníció területein is lehetnek a látványt, képet elemző műveletek rekurzív jellegűek (pl. a „kép a képben” jelenség: egy kép saját összetevőjeként ismétlődve tartalmazhatja önmagát (Parker 2006; Levine 2007). Számosan vélik úgy, hogy a zene komplex hierarchiában szerveződik és rekurzív szintaxissal bír (Hofstadter 1980; Parker 2006; Katz–Pesetsky 2009). A „szociális intelligencia” (Jackendoff–Pinker 2005), közelebbről a tudatelméleti képesség, amellyel specifikus mentális állapotokat tulajdonítunk másoknak, egy hiedelemnek egy másikba történő, rekurzív beágyazásán alapul. Ez a nyelvben szintaktikai-szerkezeti rekurzióval kódolható: mi úgy gondoljuk, hogy egy második személy úgy gondolja, hogy egy harmadik személy azt gondolja. . . Harminc év idevágó kutatásait elemezve Tomasello és Call (2008) azt állítja, hogy a tudatelméleti képességek egy megszorított változata kifejezetten emberi képességünk, amellyel saját hiedelmeink komponensévé tudjuk tenni mások hiedelmeit, vágyait, értékrendszerét és ehhez illeszkedő cselevéseit. Ez a képesség nagyon „erős” lesz a rekurziós modul elérésével. Látnunk kell, hogy a rekurzivitás jelen van a képesség mentális tartalmában és nyelvi, szintaktikai-szerkezeti kódolásában egyaránt.

. A kutatás előzményei .. Korábbi kutatásainkban és a most bemutatandókban egyaránt azt vizsgáltuk, hogy az afáziás nyelvi korlátozódás miképpen érinti a nyelvi-szerkezeti rekurziót és miképpen a rekurzív tudatelméleti képességeket. A két rendszer



Bánréti Zoltán – Szücs Márta – Mészáros Éva

lehetséges szétválásainak mintázatai alapján következtetési lehetőségeket keresünk arra, hogy feltételezhető-e esetleg számukra közös rekurziós modul, avagy két terület két „saját” rekurzív rendszeréről van szó. Bánréti és Mészáros (2011) a szintaktikai rekurzió afáziabeli korlátozódását és ennek következményeit mutatta be olyan esettanulmányok keretében, ahol rekurzív műveleteket kívánó nyelvi tesztekben afáziás személyek (agrammatikus, anómikus és Wernicke-afáziások) és ép személyek vettek részt. Olyan eredményeket kaptak, amelyek szerint az agrammatikus (Broca) afáziások a szintaktikai-szerkezeti rekurziót tartalmazó választ kikerülték, a mondattani rekurzió elvégzése erősen korlátozott volt számukra. Ehhez társult azonban az, hogy rekurzív tudatelméleti következtetéseik (egyszerű szituatív mondatokban történő kifejezései) épek maradtak. (A rekurzív tudatelméleti következtetéseken azt értettük, hogy a vizsgálati személyek, azon túl, hogy önmagukat mások mentális állapotára következtetni képesnek tartották, úgy tekintettek más személyekre, pl. képeken szereplőkre, hogy azok további (harmadik) személyek mentális állapotaira tudnak következtetni, ezáltal rekurzív konstrukcióhoz jutunk.) Például arra a kérdésre, hogy Mit gondolhat a képen a lány? nem adtak olyasfajta választ, hogy A lány azt gondolja, hogy a fiú megsértődőtt, hanem ehelyett ilyesfajta válaszokat adtak: Csak nem haragszol? (mintegy a képen látható személy nevében, első személyben megszólalva). Az ilyen válaszokat neveztük szituatív mondatoknak, amelyek tudatelméleti következtetéseket fejeznek ki. A szintaktikai-szerkezeti rekurzió és a tudatelméleti következtetések disszociációja a Wernicke- és az anómikus afáziában kevéssé tapasztalható, ami összhangban áll azokkal a megfigyelésekkel, amelyek a szintaktikai folyamatok korlátozódását elsősorban a Broca-afáziához kötik, míg a Wernicke-afázia, valamint az anómikus afázia grammatikai hibáit a lexikai folyamatok sérülése következményeinek tekintik. Rámutattunk arra, hogy az agrammatikus Broca-afáziások válaszaikban a rekurzív tudatelméleti következtetéseket (az azok tartalmát hordozó szituatív mondatokat) javító, kompenzáló stratégiaként alkalmazzák a szintaktikai-szerkezeti rekurzió elkerülésére. Ezt az eredményt alátámasztotta egy esettanulmány is, amely az egyik Broca-afáziás felépülési folyamatainak nyelvi oldalát vizsgálta. Az állapotjavulás során az afáziás számára fokozatosan elérhetővé vált az egyeztetés alapvető nyelvtani elvének alkalmazása. A vizsgálati személy válaszaiban megjelentek a rekurzív mondattani szerkezetek, és ezzel párhuzamosan csökkent a válaszokban a tudatelméleti tartalmakat kifejező szituatív mondatok aránya, majd ezek a folyamat végére eltűntek. .. A vázolt megfigyelés érvényességét támogathatja, hogy fordított disszociációt is lehet találni. Alzheimer-kóros személyeknél, ahol – az afáziától eltérő-

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



en – a nyelv csak fokozatosan válik érintetté a kór kiterjedése függvényében, azt vizsgáltuk, miképpen érintettek a nyelv szerkezet-beágyazó műveletei és a rekurzív tudatelméleti következtetések (Hoffmann et al. 2011). Azt az eredményt kaptuk, hogy – szemben az agrammatikus afáziával – az Alzheimer-kór enyhe és középsúlyos szakaszában a szintaktikai-szerkezeti rekurziót mutató tagmondatbeágyazások műveletei épek maradnak (tudniillik a mondattani szerkezetük). Másfelől a kór középső szakaszára a rekurzív tudatelméleti következtetések képessége korlátozódik. A középsúlyos Alzheimer-kóros személyek elkerülik a tudatelméleti következtetések tartalmait hordozó szituatív mondatokat, és a más személyeknek tulajdonított szándékokat illetően téves válaszokat adnak. Olykor közvetett módon, egyes szám harmadik személyben még képesek szándéktulajdonításra, de önmaguknak egy másik személy állapotába történő projekciója hiányzik. Ezt alátámasztják a másodrendű hamisvélekedés-tesztben mért eredmények is, ahol helytelen válaszokat adtak a hamis vélekedés kérdésére. A középsúlyos Alzheimer-kórban az ép szintaktikai-szerkezeti rekurzió és a korlátozott tudatelméleti következtetések, másfelől az agrammatikus Broca-afáziában a korlátozott szintaktikai-szerkezeti rekurzió és az ép tudatelméleti következtetések a kettős disszociáció mintázatát mutatják. Ez támogatja azokat az elméleteket, amelyek – a felnőttkor időszakában – a kettő egymástól való függetlenségét tételezik fel. Mivel a magyar nyelv esetében a rekurzió nemcsak a mondatok és frázisok, hanem az összetett szavak körében is megtalálható, megvizsgáltuk a lexikai rekurzió folyamatait is, azt, hogy ezek milyen viszonyban lehetnek a szintaktikai rekurzióval. Összetett szavak produktív és rekurzív konstruálását kívánó teszteket alkalmaztunk, amelyekben mind afáziás, mind pedig Alzheimer-kórral élő személyek részt vettek.

. Rekurzió az összetett szavakban .. Az összetett szavakat produktív módon létrehozó szabályrendszer sajátos státuszú. Alapvetően lexikai szabályokról lehet szó, ugyanis a frázisszerkezeteket építő szintaktikai szabályok számára az összetett szó áthatolhatatlan, „nem látnak” a belsejébe (vö. Kenesei 2008). Vannak olyan összetett szavak, melyek bináris konstrukciójúak, és ezen belül az egyes összetételi tagok maguk is bináris konstrukciót mutatnak, további szavakból állnak. Ezt rekurzív módon strukturált összetett szavaknak nevezik (pl. Dressler 2006). Az összetett szavak kapcsán tehát a lexikai rekurzió fogalmát alkalmazzuk. A rekurzió ilyen megközelítését Kiefer (2000) veti fel. A következőképpen definiálja az összetett szavakat: „olyan



Bánréti Zoltán – Szücs Márta – Mészáros Éva

több szóból álló morfológiai alakzat, amely szintaktikai értelemben maga is szó” (i.m., 521). Ebből adódik, hogy az összetett szó belső szerkezete (konstrukciója) a szószerkezeteket, mondatokat generáló szintaktikai műveletekkel nem változtatható meg. Az összetételek lehetnek endocentrikusak és exocentrikusak. Az endocentrikus szerkezetekben az alaptag – a magyarban a jobb szélső tag – az, amely megszabja az összetett szó morfológiai, szintaktikai és részben szemantikai tulajdonságait. Nemcsak a magyarban, hanem a németben és az angolban is az öszetett szó jobbszélső tagja az alaptag. Ha az összetett szót alkotó tagok azonos kategóriájúak (pl. két főnév: autókormány, vagy két melléknév: balliberális), akkor az alaptag ilyen pozicionális módon határozható meg. Amennyiben az összetett szót alkotó tagok nem azonos kategóriájúak, akkor a pozíció és a konstrukció felépítése alapján megállapítható, melyikük az alaptag: pl. a hidegfront főnévi alaptagú, a kőkemény melléknévi alaptagú. Az alaptag funkciója valamennyire hasonlít a szintaktikai szerkezetekben használt fej funkcióhoz, de nem azonos vele, például nincs jelen „látható” szintaktikai kötőelem. A következőkben ezért az összetett szavak „fej” tagját alaptagnak fogjuk nevezni. Exocentrikus összetételnek azokat tekintik, amelyekben szerkezeti jegyek alapján (szinkronikus rendszerben tekintve) nem jelölhető ki az alaptag. Ilyenek a „szervetlen” összetett szavak (hiszekegy, egyszeregy). Vannak továbbá mellérendelő típusú ismétlő összetételek (egyszer-egyszer), ikerítések (dirmeg-dörmög) és a tulajdonképpeni mellérendelő összetételek (üt-ver) (Kiefer 2000, 519–525). Mivel ezek kevésbé vagy egyáltalán nem produktívak, a következőkben csakis az endocentrikus összetételeknek azon típusára szorítkozunk, amely az alább bemutatandó tesztanyagunk szempontjából releváns. .. Tesztjeinkben olyan termékeny, endocentrikus összetételek szerepelnek, amelyeknek a második vagy a harmadik tagjuk, de mindenképpen a jobb szélső alaptagjuk: deverbális, -ó/-ő képzős tag. Látni fogjuk, hogy az ilyen tag támogatja az összetett szó rekurzív építését, és bővítményeként veszi fel a tőle balra álló szavakat. Például a vízvezetékszerelő-oktató összetett szó szerkezetében az oktató tárgyi bővítménye a vízvezetékszerelő, a szerelő tag tárgyi bővítménye a vízvezeték. Az ilyen összetett szavak szerkezete bináris jellegű: mindig kétfelé ágaznak, alkotásuk rekurzív, elvileg vég nélkül folytatható (1. ábra). A rekurzió lehetősége szempontjából döntő az -ó/-ő képzős elem jelenléte, mert ez teszi lehetővé az összetétel műveletének ismétlését azáltal, hogy bővítményeként tudja felvenni a korábbi részösszetételt. Amikor az endocentrikus összetétel kettőnél több tagból áll, akkor is mintegy „kettesével” illesztjük őket össze: (((víz+vezeték)+szerelő))+oktató))). Jelen vizsgálatban azok az összetett szavak

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



N N

N

N

N

N

N

V

víz

vezeték

szerel

V AF oktat

AF +ó

1. ábra: Összetett szó rekurzív szerkezete (AF = affixum, deverbális képző)

relevánsak számunkra, amelyeknek -ó/-ő képzős relatív, illetve abszolút alaptagja van. Az -ó/-ő képzős összetevő alaptagként mindig a bővítményétől jobbra van, az összetétel jobb szélén. Pl. csempevágó: a morfológiai, szemantikai és szintaktikai viselkedést determináló alaptag a vágó. Ha ugyanez a tag bal oldalon van, például vágókép, akkor a morfológiai, szemantikai és szintaktikai viselkedést determináló alaptag a kép. A bináris szerkezetű és rekurzív összetett szavakban lehetnek relatív és abszolút alaptagok, a szerkezet komplexitásától függően. A vízvezetékszerelő-oktató példánkban relatív alaptagok: (. . .) vezeték, ((. . .) szerelő)) és abszolút alaptag: (((. . .) oktató))). Közös bennük, hogy a tőlük balra álló szó vagy szavak alkotják a bővítményeiket. Az utóbbiak szemantikai sajátossága, hogy rendszerint generikus olvasatúak („általános” vonatkoztatásúak). Például a vízvezeték+szerelő összetételben generikus olvasatú a vízvezeték, szemben a vízvezetéknek a szerelője szószerkezettel, ahol a vízvezetéknek lehet határorozott vonatkoztatású. Az -ó/-ő képzős, deverbális alaptagú összetételek jelentése általában előrejelezhető, bár az -ó/-ő képzős tag nem őrzi meg teljes mértékben az alapige argumentumszerkezetét. A jelentés olvasataiban vannak kontextusfüggő vonások. Az alaptag jelenthet ágenst, helyet és eszközt is, függően az alapigétől és a kontextustól. Az előtag-bővítmény legtöbbször az alapige tárgyi (páciens) szerepű bővítménye. Néhány példa: – ágens alaptag + tárgyi előtag-bővítmény: autószerelő (vö.: autót szerel valaki), – preferáltan eszközt jelentő alaptag + tárgyi előtag-bővítmény: bolhairtó (vö. a szer, amivel irtják a bolhát), vagy falvéső (vö.: az eszköz, amivel vésik a falat), – preferáltan helyet jelentő alaptag + tárgyi előtag-bővítmény: csónaktároló (vö.: hely, ahol csónakot tárolnak).



Bánréti Zoltán – Szücs Márta – Mészáros Éva

Az interpretációknak egyik jellegzetes sajátossága, hogy a deverbális képzés alapját adó ige alanyi argumentumának a helye lekötött, nem lehet külön jelölni az összetett szón belül, hanem magához az -ó/-ő képzős alaptaghoz társul a cselekvő neve. Ez akkor is működik, amikor a tárgyi előtag mellett az alaptag jelölhet eszközt vagy helyet (vö.: vírusirtó, tudniillik: szoftver, amivel irtják a vírust), ekkor általános cselekvőről van szó, mint az eszköz használójáról. Mivel az alapige alanyi argumentumának helye lekötött, ezért nem lehet egyargumentumú, tárgyatlan alapigét alkalmazni ebben a konstrukcióban (vö.: *gyereksíró, de: gyereksírás). Az alapige alanyán kívüli, tárgyi vagy más, szabad argumentumot az előtag elégíti ki, ez tipikusan lehet páciens szerepű. Az interpretációk másik jellegzetes vonása az, hogy – kontextustól is függően – valamilyen fokú intézményesültséget jelölhetnek. Például a kutyafuttató jelölheti azt a helyet, ahol „intézményesítetten” futtatják a kutyákat, de azt a cselekvőt is, aki kutyát futtat. Kiefer (2000, 557) javaslata szerint az intézményesülés az összetett szó jelentésének lexikalizálódásával párhuzamos folyamat, így ez nem része a szóösszetételi szabályoknak. Nem meglepő módon, az intézményesültség tekintetében, éppen úgy, mint a lexikalizáltság tekintetében, fokozatokkal kell számolnunk. A fenti példákban közös, hogy a bővítmény tag mindig páciens funkciójú, bármilyen jelentéskategóriát tulajdonítunk is az alaptagnak. A lexikai rekurzió szempontjából releváns, hogy az -ó/-ő képzős alaptag örökli az „eredeti” igétől a páciens szerepű argumentumot, amelyet a bővítmény (pl. vízvezeték, autó, bolha, csónak, vírus stb.) elégít ki. De ezek a bővítmények már nem szintaktikai értelemben vett vonzatai az -ó/-ő képzős tagnak. Az alaptag és a bővítmény közötti kapcsolatot szemantikai argumentumok (thematikus szerepek) biztosítják. Ez a reláció grammatikai szempontból nem kötelező: az alaptagok (szerelő, irtó, tároló stb.) önmagukban nem rosszul formáltak, nem kötelező bővítményt felvenniük, pusztán jelentésük egyes vonásai nem specifikálódnak. Amikor alaptagok, akkor azt a szemantikai sémát követik, melyben az előzményszónak, azaz a páciensnek szemantikai (thematikus) viszonyban kell lennie az -ó/-ő képzős alaptaggal. Eszerint adódik az összetett szó jelentésének olvasata. A séma maga csak annyit mond, hogy vannak XY összetételek, amelyekben a fent leírt viszony áll fenn (X páciense Y-nak). A létrejött alakzatot, (XY)-t egységnek tekintve az (XY)+Z összetételben az (XY) és a Z között is hasonló lehet a viszony. Ily módon létrejöhet egy (XYZ) lexikai egység, amelyhez egy V elem csatlakozhat ((XYZ)+V) és így tovább. Az ilyen műveleteket tekintjük lexikai rekurziónak. .. Természetesen alapvető kérdés, hogy milyen módon tárolódnak az endocentrikus, -ó/-ő képzős alaptagú összetett szavak a lexikonban. Az egyik lehető-

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



ség a dekompozíció nélküli egészleges tárolás. A másik lehetőség, hogy lexikálismorfológiai szabályok alapján hozzuk létre, illetve értjük meg az összetett szavakat. Nem valószínű, hogy minden egyes összetett szó reprezentációja egészlegesen tárolódik, mivel ez túl nagy memóriakapacitást igényelne, így nem lenne gazdaságos. A szabályalapú elképzelés viszont nem magyarázza a nem transzparens alakok létrehozását. A harmadik lehetőség a kétutas hozzáférés feltételezése (Pinker 1999). Eszerint a produktív alakokat szabályok hozzák létre, a nem produktív, szemantikailag nem transzparens alakok viszont a lexikonban tárolódnak. De szabályos alakok is tárolódhatnak egészlegesen, ha gyakran használjuk őket (Mondini et al. 2004). Az alábbiakban ismertetendő tesztben a következőképpen kezeltük ezt a kérdést. A vizsgálati személyeknek élethelyzeteket ábrázoló képek kontextusában, verbális kérdésekre válaszul 2 tagú, 3 tagú, majd 4 tagú összetett szavakat kellett alkotniuk. Az összetett szavak rekurzív építésére vonatkozó képességeik felmérésekor a 2 tagú összetett szavaknál nyújtott teljesítményüket automatikusan úgy tekintettük, mint egészlegesen lexikalizált egységek aktivációjában elért eredményt. A 3 és a 4 tagú szóösszetételek alkotásában nyújtott teljesítményüket tekintettük relevánsnak a rekurzív képességeik szempontjából. Természetesen az egyes vizsgálati személyek mentális lexikonjai különböztek egymástól abban, hogy számukra mely 2 tagú összetétel lexikalizálódott és milyen jelentésben. A 3 és a 4 tagú összetételek esetében igyekeztünk olyan ingeranyagot adni, amely ténylegesen megkívánja az összetett szó rekurzív építését. A megcélzott összetett szó gyakoriságának jegyeit is figyelembe vettük az eredmények kiértékelésében.

. A tesztek .. A természetes nyelvi rekurzió működését vizsgáltuk a szintaxis területén afáziás beszélők, egészséges kontrollszemélyek, valamint Alzheimer-kóros betegek esetében. Bánréti (2009; 2010), Bánréti–Mészáros (2011) eredményei szerint az afázia egyes típusaiban a szintaktikai-szerkezeti rekurzió korlátozódik, míg a rekurzív tudatelméleti következtetések képessége szelektív módon épen marad. Ez Jackendoff–Pinker (2005) felfogása mellett szolgáltat érveket, amely szerint a rekurzió az emberi elme általános tulajdonsága, és a nyelv csupán közvetítője, illetve szerkezeti formákban kódolója a rekurzióra vonatkozó kognitív képességeknek. Hoffmann et al. (2011) Alzheimer-kóros betegekkel végzett vizsgálatai további érvekkel szolgálnak a szintaktikai rekurzió és a tudatelméleti következtetések disszociációja mellett, ugyanis míg a szerkezeti rekurzió épen működik az



Bánréti Zoltán – Szücs Márta – Mészáros Éva

Alzheimer-kór enyhe és középsúlyos szakaszában, addig a tudatelméleti következtetések műveletei a középsúlyos szakasztól kezdve korlátozódnak. Feltételeztük, hogy a nyelvi korlátozódás érintheti a lexikai szintű szerkezeti rekurzió működését afáziában, ill. az Alzheimer-kór enyhe és középsúlyos szakaszában. Továbbá, ahogy az afáziások esetében a szintaktikai-szerkezeti rekurzió kerülése következményeként megmutatkoztak az ép tudatelméleti következtetési képességek, úgy a szóösszetételek rekurzív építésében is megvizsgáljuk, vannak-e kompenzáló, javító stratégiák az egyes vizsgálati csoportok esetében.

.. A vizsgálati személyek ... Normál kontrollszemélyek 1. táblázat: Kontrollszemélyek

E.É. D.Gy. B.E. Sz.Zs. S.H. E.Zs. K.M. Sz.G. Z.É. T.D.

Kor

Iskola (év)

Nem

32 59 58 21 35 69 52 28 31 44

15 11 14 15 15 14 12 16 16 15

nő ffi nő nő nő nő nő ffi nő nő

... Afáziás személyek és klinikai-logopédiai diagnózisaik A CT-felvételek analizisének eredményei az alábbiak voltak: B.T.: Bal oldalon media területi mérsékelt térfoglaló jellegű állománydefectus, amely elsősorban ischaemiás infarctusnak tartható. B.L.: Posthaemorrhagias parenchyma laesio a bal tempo-frontalis területben. G.M.E.: Bal ACM területi ischaemia. T.J.: Krónikus vascularis laesiok az ACA területén. Bal oldali multiplex ischaemiás laesio.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



Az afáziás személyek nyelvi produkciós és megértési képességeit a WAB (Western Aphasia Battery) szűrőteszttel (magyarra adaptált változata: Osmanné Sági 1991) illetve a Token beszédértést vizsgáló teszttel (magyar adaptáció: Osmanné Sági 1994) mértük fel. A WAB teszt altesztekből áll, ezek a beszéd folyékonyságát, információtartalmát, a megértést, az ismétlést és a megnevezést értékelő, egytől tízig pontozó altesztek. Az altesztbeli pontok összegének kétszerese adja az afázia-együtthatónak (AQ) nevezett értéket. Ép nyelvhasználatról akkor beszélnek, ha az elért összpontszám: 93,8 vagy a feletti. A pontok értékeinek megoszlása mentén a szűrőteszt nyolcféle kategóriába sorolja a személyeket: globális, izolációs, Broca-, transzkortikális motoros, Wernicke-, transzkortikális szenzoros, vezetéses és anómikus afáziások. Hangsúlyozni kell, hogy ezek kifejezetten a nyelvi szűrőteszt kategóriái. Például a Broca-afázia kategóriát akkor adja a teszt, ha a fluencia a 0–4 közötti pontértékek, a megértés a 4–10, az ismétlés 8-nál alacsonyabb, a megnevezési teljesítmény pedig pedig a 0–8 értékek közé esik. A vezetéses és az anómikus afázia kategóriáját akkor adja a teszt, ha a fluencia pontértékek egyaránt 5–10 közötti, a megértés egyaránt 7–10 pontértékek közé esik, viszont a szóés mondatismétlési teljesítmény a vezetéses afáziánál a 0–6,9, míg az anómikus afáziánál a 7–10 pontértékek közé esik, a megnevezésnél pedig egyaránt 0–9 közötti pontértékek vannak. A Token komplex beszédmegértési tesztben pedig a maximális eredmény 36. 2. táblázat: Az afáziás személyek adatai Vsz B.T. B.L. G.M.E. T.J.

Életkor Nem Isk. Token    

N F N F

   

 ,  

WAB WAB auditív WAB WAB Diagnózis fluencia verbális megértés ismétlés megnevezés    

  , ,

, , , ,

 , , ,

Broca-afázia vezetéses afázia anómikus afázia anómikus afázia

... Alzheimer-kóros személyek Az Alzheimer-kóros (AK) személyeket a demencia súlyossági foka alapján kategorizáltuk enyhe és középsúlyos típusba a Módosított Mini Mental Teszt (MMMT) (Folstein et al. 1975; Tariska et al. 1990) és az ADAS-Cog (Rosen et al. 1984) szűrőtesztek alapján. Az AK vizsgálati személyek eleget tettek a DSM-IV (APA 2000) és a ICD-10 (WHO 1993) AK diagnosztizálási követelményeinek. A 30– 27 pontok közötti teljesítményt normálisnak tekintik, a 26–20 közti intervallum az enyhe demenciát, a 19–10 intervallum a közepesen súlyos demenciát, 9 alatti



Bánréti Zoltán – Szücs Márta – Mészáros Éva

intervallum pedig a súlyos demenciát jelzik. Ennek megfelelően az AK személyeket az alábbiak szerint kategorizáltuk a demencia súlyossági foka alapján: 3. táblázat: Az Alzheimer-kóros személyek adatai Vsz Zs.A. K.D.

Életkor

Nem

Iskolázottság (év)

MMMT

Diagnózis

 

N N

 

 

enyhe AK középsúlyos AK

Miért vontunk a vizsgálat körébe Alzheimer-kórral élő személyeket? Azért, mert korábban (vö. Hoffmann et al. 2011) a mondattani rekurzióra vonatkozó vizsgálatainkban olyan disszociáció mintázatát kaptuk, hogy Alzheimer-kórral élő személyeknél, ahol a nyelv csak fokozatosan válik érintetté a kór kiterjedése függvényében, ott – szemben az agrammatikus afáziával – a szintaktikai-szerkezeti rekurziót mutató tagmondat-beágyazások műveletei épek maradnak (tudniillik a mondattani szerkezetük). A következtetésünk az volt, hogy a középsúlyos Alzheimer-kórban ép szintaktikai-szerkezeti rekurziót és korlátozott tudatelméleti következtetéseket, míg az agrammatikus Broca-afáziában korlátozott szintaktikai-szerkezeti rekurziót és ép tudatelméleti következtetéseket találunk, tehát a kettős disszociáció mintázatát. Ezek után most arra vagyunk kíváncsiak, hogy a mondattani rekurzió kapcsán talált szétválások leképeződnek-e valamiképp a lexikai rekurzió tartományára vagy sem. Ennek első lépésenként két, Alzheimer-kórral élő személy rekurzív összetettszó-alkotási teljesítményét tartalmazó esettanulmány eredményeit fogjuk bemutatni.

.. A vizsgálat anyaga A vizsgálati anyag 63 képből állt. Mindegyik képhez társítottunk egy, a képen látható objektumra vonatkozó állítást. Miközben a vizsgálati személy nézte a képet, állításokat hallott a képről (pl. Ezen tartják a kottát. Ő lakkozza.). Majd minden állítás után elhangzott egy kérdés (Mi lehet a foglalkozása?). Az instrukciónak megfelelően a vizsgálati személyeknek összetett szóval kellett válaszolniuk a feltett kérdésre. A vizsgálat első részében tanuló jellegű próbateszt zajlott, amelynek célja az volt, hogy a vizsgálati személyek elsajátítsák a feladatot, az elvárt válasz minden esetben összetett szó volt. A feladatok nehézségi foka a kétszavas összetételtől a négy összetételi tagig nőtt, ezek a próbateszt után random sorrendben fordultak elő.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



A rekurzív szerkesztés vizsgálata szempontjából csak a három és négy összetételi tagú formákat vettük számításba, ugyanis a kéttagú összetételeket valamilyen fokon lexikalizáltnak tekinthetjük. A személyeknek a 3 és a 4 tagú összetett szavakat a teszt során kellett megalkotniuk a kép segítségével és az elhangzott állítások alapján. A 3 és 4 tagú, elvárt összetett szavak deverbális alaptagúak voltak. (A 2 tagúak nem szükségképpen.) Ez azt jelenti, hogy a vizsgálati személyeknek az alaptagot az állításban elhangzott igéből kellett -ó/-ő képzővel előállítani, majd helyes sorrendben összekapcsolni az előtaggal. Az előtag esetjelölő végződését egyidejűleg törölnie kellett. Előbb mindig 2 tagú összetett szót (többé-kevésbé lexikalizált jelentésűt) kellett építeni, majd ebből egy 3 tagú összetett szót, abból pedig 4 tagú összetett szót. Példák: 1. példa a tesztből: 1. kép

Az elhangzó állítás, utána a kérdés: Ez forralja a vizet. Mi ez? Várt válasz: vízforraló

2. kép

Az elhangzó állítás, utána a kérdés: Ez a szer tisztítja a vízforralót. Mi lehet a neve? Várt válasz: vízforraló-tisztító

3. kép

Az elhangzó állítás, utána a kérdés: Ezzel adagolják a vízforraló-tisztítót. Mi lehet a neve? Várt válasz: vízforralótisztító-adagoló

A 2. és 3. kép esetében elvárt válaszok rekurzív módon épített, 3 tagú, illetve 4 tagú összetett szavak. Az ilyen válaszokat értékeltük ki az összetett szavak rekurzív megépítésére vonatkozó képesség szempontjából. A lehetséges teljesítménymintázatok körülhatárolására voltak olyan kép + állítás + kérdés kombinációk, melyek csak 2 tagú vagy csak 3 tagú összetételekig mentek el. A 2 tagú összetételek esetében nyújtott teljesítményt az adott összetett szó aktivációjára vonatkozó képességként, nem pedig rekurzív szóépítésként mértük. A 2 tagúak esetében elvárt összetett szónak nem feltétlen kellett -ó/-ő képzős alaptagúnak lennie, ez a 3 és 4 tagú összetett szavaknál volt feltétel. A képről tett állítások predikátumainak helyes sorrendjét (a relatív vagy abszolút alaptag pozíciójába helyezését), a mondatbeli argumentumok esetragjainak törlését és a szavaknak az alaptaghoz való hozzárendezését kívánták a feladatok. Tekintsünk egy másik példát a nyelvi inger és az elvárt összetett szó relációira. A kiinduló, 2 tagból álló összetett szó nem -ó/-ő képzős alaptagú, de a 3 és 4 tagú összetett szó már igen.



Bánréti Zoltán – Szücs Márta – Mészáros Éva

2. példa a tesztből: 2. kép

1. kép

Az elhangzó állítás, utána a kérdés: Ő vezeti a mentőautót. Mi a foglalkozása? Várt válasz: mentőautó-vezető

Az elhangzó kérdés: Mi ez? Várt válasz: mentőautó

3. kép

Az elhangzó állítás, utána a kérdés: Ő oktatja a mentőautó-vezetőt. Mi lehet a foglalkozása? Várt válasz: mentőautóvezető-oktató

A kiinduló, 2 tagú összetett szó maga is lehet deverbális, ekkor -ó/-ő képzős taghoz kell hozzáépíteni: 3. példa a tesztből: 1. kép

2. kép

Az elhangzó állítás, utána a kérdés: Ez a szer írtja a kullancsot. Mi a neve? Várt válasz: kullancsirtó

Az elhangzó állítás, utána a kérdés: Ezzel fújják a kullancsirtót. Mi lehet a neve? Várt válasz: kullancsirtófújó

3. kép

Az elhangzó állítás, utána a kérdés: Ez (a gép) gyártja a kullancsirtófújót. Mi lehet a neve? Várt válasz: kullancsirtófújó-gyártó

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



. A válaszok mintázatai A kapott válaszokat a következő kategóriákba soroltuk: (i) A célszó sikeres produkciója (pl. kottatartó-lakkozó) (ii) Hiányos célszó: az elvárt összetett szó valamely eleme hiányzik (lakkozó a kottatartó-lakkozó helyett) (iii) Hiperonima/szinonima: az összetett szó helyett más (fölé- vagy mellérendelt) lexikai egység produkciója (látszerész a napszemüveg-tervező helyett) (iv) Szerkezet, ha az összetett szó helyett frázisszerkezetet (pl. birtokos szerkezetet) használ (a napszemüvegnek a tervezője a napszemüveg-tervező helyett) (v) Mondat, ha az összetett szó helyett mondattal válaszol (Takarítja a játszóteret és a hintát, a játszótér-takarító helyett)

.. A normál kontroll tejesítménye 4. táblázat: A helyes és a hibás válaszok -os megoszlása a normál kontrollcsoportban

 tagú összetétel (n = )  tagú összetétel (n = )  tagú összetétel (n = )

Helyes válaszok aránya ()

Hibás válaszok aránya ()

 , ,

 , ,

A normál kontrollszemélyek a 2 tagú összetételeknél nem adtak hibás választ. A 3 és 4 tagú összetételeknél a hibák nem agrammatikus szókonstrukciókból álltak, hanem valamelyik relatív alaptagot érintették, kihagyták vagy megváltoztatták. A 3 tagúaknál négy személy követett el hét ilyen hibát, a 4 tagú összetételek esetében csak két személy nem hibázott, öt személy egy-egy alkalommal, két személy két-két alkalommal, egy személy pedig négy alkalommal hibázott. Az abszolút alaptagot soha nem hagyták el. A válaszok megoszlását részletesebben az 5. táblázat mutatja. A kontrollszemélyek teljesítménye 83–100 között mozgott, kivéve T.D.-t, aki a 4 tagú összetételt tartalmazó tizenkét válaszból négy esetben hagyott ki relatív alaptagot.



Bánréti Zoltán – Szücs Márta – Mészáros Éva 5. táblázat: A normál kontroll válaszai. Az összes válaszon belül a helyes és a hibás vála-

szok -os megoszlása.  tagú összetétel (n = ):

É.E. D.Gy. B.E. Sz.Zs. S.H. E.Zs. K M. Sz.G. Z.É. T.D. összes:

Helyes válaszok aránya ()

Helytelen válaszok aránya ()

 ,   , ,    , ,

 ,   , ,    , ,

 tagú összetétel (n = ):

É.E. D.Gy. B.E. Sz.Zs. S.H. E.Zs. K.M. Sz.G. Z.É. T.D. összes:

Helyes válaszok aránya ()

Helytelen válaszok aránya ()

, ,   , , , , , , ,

, ,   , , , , , , ,

Néhány példa a normál kontroll hibás válaszaira: ()

gyertyatartó-készítő → gyertyakészítő szappanbuborék-fújó → buborékfújó lakókocsiparkoló-takarító → lakókocsipark-takarító játszótértakarító-felügyelő → játszótér-felügyelő kullancsirtófújó-gyártó → kullancsirtószer-gyártó vakvezetőkutya-képző → vakvezető-képző iskola vakvezetőkutya-képző → kutyakiképző iskola fafaragóműhely-takarító → műhely-takarító forgalomirányítólámpa-vezérlő → forgalomlámpa-irányító-vezérlő

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban

6. táblázat: Összetettszó-eredmények százalékos megoszlása afáziás személyeknél 3 és 4

összetételi tagnál. A / előtti szám mutatja, hogy az összetett szó hányadik tagja produkált, a/utáni szám: az összetett célszó tagjainak száma. Zárójelben: hányszor fordult elő. Pl. 1+3/3 (1) = az 1. és a 3. tag produkciója, a 3 tagú összetett célszónál, az előfordulás száma: 1.





Bánréti Zoltán – Szücs Márta – Mészáros Éva

.. Az afáziás személyek eredményeinek elemzése A 6. táblázat mutatja, hogy az összetett szó építésének deficitje már a háromtagú szerkezetnél jelen van, és a szerkezet bonyolultabbá válásával a deficit erősebben megmutatkozik. A sikeresen létrehozott összetett szavak aránya a három tagból álló célszavakhoz képest jelentősen csökken a négy tagból álló összetett célszavaknál. A nyelvi korlátozódás mindegyik személy esetében érinti az összetett szó rekurzív építését, de eltérő módon. B.T. és B.L. viszonylag magas arányban (38,5 és 59-ban) alkot meg helyesen szavakat 3 összetételi tagig, ugyanakkor 4 összetételi tag esetén B.T. egyáltalán nem, B.L. pedig mindössze 17-ban teljesít. G.M.E. esetében már 3 összetételi tagnál sem találunk sikeresen megalkotott összetett szót. T.J. teljesítménye is alacsony már a 3 tagú összetételnél. Ugyanakkor a vizsgálati személyek nem csak teljes vagy hiányos célszavakat produkáltak, hanem másfajta, a célszóval valamilyen relációban álló válaszokat is adtak. A „másfajta” válaszok egyik osztálya lexikai relációban volt a célszóval, ilyen volt a helyettesítő szinonimák produkciója, és voltak szintaktikai utak: a célszó jelentéséhez viszonyított mondatok vagy szószerkezetek produkciói. Ezeket az el nem ért célszavak helyett produkálták, ezért javító, kompenzáló stratégiák megjelenéseinek tekintjük őket. A kompenzációs stratégiák, amelyekkel a deficit ellenére is képesek értékelhető grammatikai teljesítményt nyújtani, tehát eltérőek. A személyek egyrészt leegyszerűsített lexikai rekurzív művelettel élnek, amikor csak az elvárt összetett szó egy részét szerkesztik meg (hiányos célszó), vagy elkerülik a rekurzív szerkesztést lexikai kereséssel (hiperonima/szinonima produkciója) vagy pedig valamilyen szintaktikai szerkezetet (birtokos szerkezetet, mondatot) építenek. A rekurzív szerkesztés zavarának mértékét, és a rekurzió elkerülési módozatait figyelembe véve a következő főbb stratégiákat követik az egyes személyek:

... Keresés a lexikonban Ennek tiszta esetét mutatja B.T. (Broca-afáziás), aki a 3 tagú összetételek építésénél rekurzív szóépítési műveletet igyekszik alkalmazni és ezzel megpróbálkozik 4 tagú összetételeknél is, ám az utóbbi esetben a létrehozott szavak mindegyike hiányos célszó. A hiányos célszavakban jellemzően a puszta deverbális alaptagig jut el (pl. mozgólépcsőszerelő-felügyelő helyett felügyelő), ami nagyobb szókonstruálási zavarra utal. A lexikai szintű rekurzív szerkesztés elkerülésekor nem „mozdul ki” a lexikonból, hanem a mentális lexikonjában már meglévő elemet hív elő. Ez a lexikai „átkeresés” bár asszociatív jellegű, irányát tekintve a mellé- vagy fölérendelt fogalom (szinonima/hiperonima) előhívását jelenti. Erre csak a 3 tagú összetételek esetében képes, a 4 tagúaknál már nem. Hasonló stratégiát mutat B.L.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



(vezetéses afáziás), ő is főként rekurzív összetett szóépítéssel próbálkozik még 4 összetételi tagnál is, és ebből 17 sikeres is. A hiányos célszavak egynél több tagból állnak és rekurzív módon konstruáltak, ez az összetettszó-építő képesség enyhébb korlátozottságára utal. Az így kapott összetett szavakban szinte kivétel nélkül az abszolút alaptag marad meg, és a relatív alaptag esik ki a szerkesztés során (pl. játszótértakarító-felügyelő helyett játszótér-felügyelő). Elkerülő stratégiaként B.L. is hiperonima/szinonima előhívást alkalmaz. Nála előfordul jelzős szerkezet is, ami szintén a lexikai „átkeresésből” fakad, ugyanis az összetett szó egyik eleme helyett jelzős szerkezetet alkalmaz (pl. a jelzőlámpairányító-tervező helyett jelzőlámpa műszaki tervező). Közös vonás tehát a két személy esetében az összetett szavak rekurzív építésének megpróbálása, ami a korlátozottság mértékétől függően részben vagy kevéssé sikeres. A korlátozottság megjelenésének mértéke az összetételi tagok számának növekedésével arányos. Kompenzáló stratégiaként jellemző a lexikai átkeresés, vagyis hiperonimák/szinonimák keresése a mentális lexikonban főként 3 összetételi tagnál. 4 összetételi tag esetében ezen elemek aránya csökken vagy stagnál, miközben a hiányos célszavak aránya növekszik.

... „Kilépés” a szintaxisba A szókonstrukció deficitjének legnagyobb mértékét G.M.E.-nél tapasztaljuk, már 3 összetételi tagnál sem találunk sikeresen megalkotott teljes célszót. Néhány alkalommal rekurzív módon épít hiányos célszót. De a 4 tagú összetételeknél csakis az abszolút alaptagot produkálja, mást nem (fafaragóműhely-takarító helyett takarító). Elkerülő stratégiája túlmutat a lexikonon belüli műveleteken. A lexikonban való keresés stratégiája itt is jelen van. A három tagú összetételnél még 62ban lexikai kereséssel az elvárt szó hiperonimáját/szinonimáját (pl. hólapáttároló helyett raktár) mondja, de négy összetételi tagnál csökken a hiperonim/szinonim kifejezések aránya (42). Ez összefügg azzal, hogy egyre nehezebb lehet már „készen” létező, ekvivalens lexikai egységet előhívni a speciális megnevezésekre (pl. mozgólépcsőszerelő-felügyelő). A lexikai „keresés” csökkenésével viszont megnő a produkált mondattani szerkezetek (frázisok) és mondatok (pl. Felügyel, ott felügyel) aránya. Jellemző, hogy ezek a szintaktikai szerkezetek már 3 összetételi tagnál megjelennek (23-ban), de arányuk az összetett célszó komplexitásával párhuzamosan növekszik, és a 4 tagúaknál már a válaszok 41-a mondat, illetve birtokos szerkezet. Ezek részesedése tehát már majdnem annyi, mint a hiperonim/szinonim kifejezéseké. Az így kapott mondatok a képhez, illetve a vizsgálatvezető instrukciójához tartalmilag kapcsolódnak, gyakran a hallott igei elem vagy szerkezet megismétlését tartalmazzák. Egy-egy esetben szintaktikai beágya-



Bánréti Zoltán – Szücs Márta – Mészáros Éva

zást is tartalmaznak (pl. Felügyeli, hogy jól végzi a munkáját.). Mivel a tesztfeladat rekurzív lexikai műveleteket kívánt, de a 4 tagú összetett célszavaknál, a hiányos célszavakon túl, a lexikai helyettesítéssel majdnem azonos arányban voltak jelen a szószerkezetek és mondatok, ezért ezt a válaszmegoszlást a szintaxisba való „kilépés” stratégiájának nevezzük.

... A lexikonban keresés és a szintaxisba „kilépés” kombinálása A kétféle stratégia együttesen van jelen T.J. teljesítményében. Lexikonon belül maradva összetett szót építő rekurzív műveletet is végez a 3 tagú célszóknál 18,5ban sikeresen, 37-ban pedig hiányos összetett szavakat alkot. Ugyancsak a lexikon belüli keresés eredményeként a 3 tagúaknál szinonim/hiperonim lexikai egységgel helyettesít 33,5-ban, ugyanakkor a válaszok 11-a mondat, amely nem tartalmazza a célszót. A 4 tagú összetett célszavaknál csökken a sikeresen létrehozott összetett szavak aránya (8), viszont a rekurzívan épített, de hiányos (4 tagnál kevesebbet tartalmazó) célszavak aránya 50-ra nő. A más lexikai egységgel történő helyettesítés 25-ra csökken. A 4 tagú célszavaknál adott válaszok 17 -a mondat, amely nem tartalmazza a célszót. Az elvárt összetett szó rekurzív komplexitásának 4 tagúra növekedésével egyrészt megnőtt a hiányos célszavak produkciója, csökkent a szinonim válaszok aránya, de megnőtt a mondatok aránya a válaszokban. Közülük az első jegy a lexikonon belüli keresést jellemezte (B.T. és B.L. válaszai) a második és a harmadik jegy pedig a szintaxisba kilépés stratégiáját (G.M.E. válaszaiban).

.. Alzheimer-kóros személyek eredményeinek elemzése Az Alzheimer-kóros személyek esetében a sikeresen létrehozott célszavak aránya 3 összetételnél magas (70 és 74), ami azt mutatja, hogy képesek összetett szavak rekurzív építésére, ugyanakkor a nagyobb memóriakapacitást igénylő esetekben, 4 összetételi tagnál jelentősen csökken a rekurzív összetett szavak aránya (7. táblázat). Az Alzheimer-kóros (AK) személyek válaszmintázatait alapvetően két sajátosság jellemezi. Az egyik a 3 tagú célszavaknál nyújtott, viszonylag jó teljesítmény már említett erős romlása 4 tagú célszavak produkciójában. A másik sajátosság a 3 tagú célszavaknál is jelenlevő mondattani szerkezetek részesedésének megugrása a 4 tagú célszavakra adott válaszokban. Ebben a tekintetben nem volt lényeges különbség az enyhe és a középsúlyos Alzheimer-kórral élők között. A lexikonban való keresés során az enyhe AK-val élő személy (Zs.A.) esetében a

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



7. táblázat: Összetettszó-eredmények százalékos megoszlása AK személyeknél 3 és 4

összetételi tagnál Név

3 tagú összetételnél Kategória

Zs.A. (enyhe AK)

Célszó Hiányos célszó

1+3/3 (1) 2+3/3 (1)

4 tagú összetételnél %

Kategória

74

Célszó

7,5

Hiányos célszó

% 17 3+4/4 (1)

25

1+3+4/4 (1) 1+2+4/4 (1)

K.D. (középsúlyos AK)

Birtokos szerkezet

18,5 Birtokos szerkezet

50

Konjunkció

Konjunkció

8

70

Célszó

8,5

19

Hiányos célszó

33

Célszó Hiányos célszó

2+3/3 (3) 1+3/3 (2)

Birtokos szerkezet

2+4/4 (1) 1+2+4/4(1) 2+3/4 (1) 1+4/4 (1) Birtokos szerkezet

Konjunkció

4

Konjunkció

Mondat, amely nem tartalmazza a célszót

7

Mondat, amely nem tartalmazza a célszót

50

8,5

szintaxisba „kilépő” stratégia részeként már 3 összetételi tagnál megjelenik a birtokos szerkezet használata (18,5), a fennmaradó válaszok nagy része azonban sikeresen épített 3 tagú célszó volt (74). A 4 tagú összetett célszók esetében az összetett szavak rekurzív építését elkerülő stratégiát a birtokos szerkezet használata adja (a válaszok 50-a). Ezek egy része nem tartalmazza az elvárt szó összes elemét (az úszószemüvegtok-tervező helyett úszószemüveg tervezője). Az első két tag rekurzív szerkesztésre utal, a középső elem memóriakorlátok miatt kiesik, és a következő műveleti lépést szószerkezeti szinten végzi, birtokos egyeztetést is végez (. . . tervezője). A válaszként adott birokos szerkezetek többsége azonban valamennyi releváns összetettszó-elemet tartalmazza, de úgy, hogy a 4 tagú célszó abszolút alaptagját már szószerkezeti szinten építi hozzá az előzményhez. Például a hegymászóirányító-oktató elvárt célszó helyén az utolsó tagot (oktatja → oktató), az abszolút fejet, „birtokként” jelöli (hegymászóirányító oktatója). Mellérendelő szerkezetek is előfordulnak (8). A lexikai szabályok helyett tehát frázisszerkezeti–szintaktikai szabályokat alkalmaz a 4 tagú célszavakra adott válaszok 58-ában. A középsúlyos Alzheimer-kórral élő K.D. esetében 3 tagú összetételnél a teljes célszó megszerkesztése csak kevéssel maradt el az enyhe állapotú személyhez képest (70), de növekszik a hiányos célszavak aránya (19). A mondatta-



Bánréti Zoltán – Szücs Márta – Mészáros Éva

ni szerkezetek helyettesítő stratégiaként megjelennek, ha szerény mértékben is (11). A 4 tagú összetételek esetében megváltozik a helyzet. A hiányosan produkált célszavak adják a válaszok 33-át, amelyek esetében jellemzően az első vagy a második tag marad ki a konstrukcióból, miközben az alaptag épen megmarad, de egyik esetben sem önmagában (pl. a mentőautóvezető-oktató helyett mentőautóoktató). A teljes célszók csekély arányú megjelenése (8) mellett radikálisan megnő a szintaktikai szerkezeteket tartalmazó válaszok aránya (58,5). K.D. így létrehozott mondatainak negyede tartalmaz rekurzív szintaktikai-szerkezeti beágyazást, a mondatok tartalmilag a képhez kapcsolódnak és tartalmazzák az instrukcióban hallott igét. A szintaktikai szerkezetek részesedése a középsúlyos Alzheimer-kóros személy válaszaiban nagyon közel áll az enyhe Alzheimer-kórral élő személy válaszmintázatához. Azt mondhatjuk, hogy az Alzheimer-kór súlyosságának mértéke a lexikonon belüli teljesítmény korlátaiban volt tetten érhető, de a szintaxisba „kilépés” stratégiáját nem érintette.

. Volt-e gyakorisági hatás? Valószínűleg igen, de erre pontos választ csak az individuális mentális szótárak vizsgálata adhatna. Természetesen egy gyakorisági adatbázis nyújthat kritériumokat, fogódzókat. Ezért megvizsgáltuk, hogy a vizsgálati személyek teljesítményére milyen lehetséges hatása volt annak a szógyakoriságnak, amit a Szószablya adatbázison kapunk (www.szoszablya.hu). A Szószablya adatbázisában azon kéttagú összetett szavak gyakoriságára kerestünk rá, amelyek alapjai, bemenetei a 3 tagú szavak alkotásának a tesztben. A gyakorisági mutatók és a vizsgálati személyek teljesítménye közötti viszonyokat vizsgáltuk. Azon 2 tagú elemek gyakorisági sorrendje, melyek a 3 tagú összetételek első elemei, a szóalak toldalékokkal együtt előforduló összes alakjának gyakorisága szerint (lemmafreq) a következő volt (8. táblázat). Ha az aranyalma szó után (lemmafreq 400-nál) húzzuk meg a határt a nem gyakori–gyakori között, akkor személyenként: B.T. (közepes Broca-afáziás): van gyakorisági hatás, mert a nem gyakori szónál lényegesen kevesebb a helyes célszó, mint a gyakori szavaknál, G.M.E. (anómikus afáziás): független a gyakoriságtól, nincs helyes célszó, T.J. (anómikus afáziás): független a gyakoriságtól, 2–2 helyes célszó, B.L. (vezetéses afáziás), Zs.A. (enyhe AK), K.D. (középsúlyos AK): ugyanolyan arányban fordul elő helyes válasz nem gyakori szónál, mint a gyakorinál.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



8. táblázat: freq: a szóalak toldalékokkal együtt előforduló összes alakjának gyakorisága,

lemmafreq: a szótő összes alakjának gyakorisága.  = a vizsgálati személy nem hozta létre a 3 tagú célszót,  = a vizsgálati személy létrehozta a helyes  tagú célszót. Szó sárkánytojás sajtkukac kottatartó kardvívó kutyaszán hólapát toronydaru halászháló vízsz!r" kenyérpirító betonkever" aranyalma könyvköt" vattacukor kulcstartó fogpiszkáló sárgabarack kávéf"z" szappanbuborék zöldborsó gyertyatartó nyaklánc es"víz napszemüveg feny"fa olvasóterem nyakkend"

freq 1 28 20 52 30 33 75 44 91 98 65 128 66 135 194 132 362 411 97 449 402 278 732 549 1061 988 778

lemma freq B.T. 6 0 37 0 73 0 78 0 87 0 119 0 137 0 159 0 168 0 184 1 260 0 356 0 428 0 444 1 447 1 455 1 594 0 761 1 972 0 974 0 1106 1 1109 0 1229 0 1935 1 2639 1 2793 0 3148 1

B.L. 0 1 1 0 1 1 1 1 0 1 0 0 0 1 1 1 0 1 0 1 0 1 1 0 1 0 0

G.M.E. T.J. 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0

ZS.A. K.D. Összes 1 0 1 0 1 2 1 1 3 1 0 1 1 1 4 0 0 1 0 1 3 1 1 3 1 1 2 1 1 4 1 0 1 1 1 2 0 1 1 1 1 5 1 1 4 1 1 4 1 1 2 0 0 2 1 1 2 1 0 2 0 1 2 1 1 3 1 0 2 1 0 2 1 1 5 0 0 0 1 1 3

Tehát annak, hogy az első 2 tag milyen gyakoriságú, csakis a közepes Broca-afáziásként diagnosztizált B.T. esetében van hatása a 3 tagú összetett szavak alkotására.



Bánréti Zoltán – Szücs Márta – Mészáros Éva

. Az afáziás és Alzheimer-kóros személyek eredményeinek összehasonlítása .. A nyelvi korlátozódás mindkét csoport tagjainál érinti a rekurzív műveleteket. Vannak közös vonások. Így megfigyelhető, hogy hiányos összetett szavak szerkesztésénél az abszolút alaptag megtartása univerzálisan működik, ami azt jelenti, hogy ha történik közvetlen kísérlet az összetett célszó produkciójára, akkor bármely elem kieshet az összetett szóból, de az abszolút deverbális alaptag megmarad. A deverbális alaptag N+N szerkezetű bővítményein belül a relatív alaptag vagy a képre jobban referáló modifikáló elem marad meg (pl. porcelánbaba-készítő helyett babakészítő), illetve a legbelső relatív alaptag esik ki (pl. hegymászóirányító-oktató helyett hegymászóoktató). A hiányos célszavaknál az AK személyek mindig több, vagyis legalább 2 elemet használnak fel a célszó létrehozásánál, míg az afáziások nagyon gyakran csak az utolsó elemet, vagyis az abszolút alaptagot produkálják. Az afáziás és Alzheimer-kóros személyek eredményei között eltérések mutatkoznak egyrészt a korlátozódás mértékét tekintve, másrészt a helyettesítő stratégiákat tekintve is. AK-ban a 3 összetételi tagnál lényegesen magasabb a produkált célszavak aránya az afáziásokhoz képest, ami a rekurzív lexikai szerkesztés viszonylag ép működésére enged következtetni. Ez a fajta különbség csak a 3 tagú összetételeknél van meg, a 4 tagúaknál már nincs. A többszörös lexikai rekurziót kívánó szerkezeteknél már korlátozott a szóépítés. .. Két fő stratégia figyelhető meg: a lexikonban való keresés az afáziások egyik csoportjára jellemző, míg a szintaxisba „kilépés” az afáziások másik csoportjára, valamint az Alzheimer-kóros személyekre jellemző. A lexikonban való keresés a Broca-afáziás és a vezetéses afáziás válaszainak mintázatát jellemzi, míg a két anómikus afáziás és a két Alzheimer-kóros személy a szintaxisba „kilépés” stratégiájával reagált az összetett célszó rekurzív komplexitásának növekedésére. Ez utóbbi stratégia keretében lényeges különbség a két csoport között, hogy az AK személyek radikálisabban mozdulnak el a szintaktikai-szerkezeti műveletek irányába (birtokos szerkezet, mondat), és az AK személyeknél egyáltalán nem jelenik meg a hiperonim/szinonim kifejezések használata. Ezzel szemben valamennyi afáziás személy ad szinonim/hiperonim válaszokat, ám ezek arányát elérheti vagy megközelítheti a szintaktikai-szerkezeti válaszok részesedése a 4 tagú összetett célszavaknál az anómikus afáziások válaszaiban. A Broca-afáziás és a vezetéses afáziás személy alapvetően a lexikonon belüli keresés stratégiájával (és a lexikai rekurzió elkerülésével) reagált a célszó összetettségének növekedésére. Ennek következményeként a 4 tagú célszavakra adott

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



válaszoknál megugrott a hiányos célszavak produkciójának mértéke, és vagy eltűntek a 3 tagúaknál még alkalmazott szinonimák (Broca-afáziás) vagy stagnált az arányuk (vezetéses afáziás). A Broca-afáziás személy egyáltalán nem próbálta szintaktikai szerkezetekkel kiváltani a választ, és a 4 tagúaknál adott 8-nyi jelzős szerkezeten túl a vezetéses afáziás sem keresett szintaktikai-szerkezeti stratégiát. Ezzel szemben a két anómikus afáziás a szintaxisba való kilépés kompenzációs stratégiáját is használta. Az összetett célszó tagjainak 4-re növekedésével, válaszaikban növekedett a szintaktikai szerkezetek részesedése. A lexikai szabályok rekurzív alkalmazását úgy kerülték ki, hogy kiléptek a lexikon köréből és megpróbálták a mondattani-szerkezeti szabályok alkalmazását. Ennek során szintaktikai-szerkezeti rekurziót is produkáltak. Az enyhe és a középsúlyos Alzheimer-kóros személyek, az anómikus afáziásokhoz hasonlóan, ám azoknál radikálisabban léptek ki a lexikai szabályok köréből a mondattani-szerkezeti szabályok tartományába. A lexikai rekurzió helyett szintaktikai-szerkezeti szabályokhoz folyamodtak, beleértve ezek rekurzív alkalmazását is. A sikeresen produkált összetett célszavak mennyiségét tekintve az enyhe Alzheimer-kóros személy (Zs.A.) természetesen sokkal jobb teljesítményt nyújtott, mint bármelyik afáziás. Ám ha a válaszok belső arányainak a nyelvtani jegyeit tekintjük, akkor az anómikus afáziások és az Alzheimer-kóros személyek válaszmintázatai között (a fentiek értelmében) van egyfajta részleges hasonlóság. Ez amellett szól, hogy – a nyelvi korlátozottságot kiváltó eltérő okok és eltérő körülmények mellett is – a lexikai rekurzió elkerülése a szintaktikai-szerkezeti szabályok körébe történő átlépéssel: egy lehetséges javítóstratégia, és ezt a nyelvtan architektúrája támogathatja.

. A vizsgálati személyek teljesítménye a mondattani rekurzió vizsgálatában .. A szintaktikai-szerkezeti rekurzió tesztanyaga megegyezett a Bánréti (2010) és Bánréti-Mészáros (2011) által alkalmazott tesztek 4. kérdéstípusával. Az alábbi szerkezeti típusú kérdést tettük fel, egyéb, nem rekurzív szerkesztést igénylő kérdésekkel felváltva, random sorrendben: X mire kérheti/mire figyelmeztetheti Y-t? X mire gondol/mit gondolhat/miben reménykedik? A tesztekben 36–36 ilyen típusú képet és ezekre feltett kérdéseket használtunk. Példák:



Bánréti Zoltán – Szücs Márta – Mészáros Éva

4. példa a tesztből:

A képen: Az apa figyelmezteti a lányt, hogy ne dohányozzon. Kérdés: Mire figyelmeztetheti az apa a lányt?

5. példa a tesztből:

A képen: A lány megmutatja a sebét a fiúnak. Kérdés: Vajon mire gondol a fiú?

A kérdéshez szerkezetileg illeszkedő válaszként fogadtuk el: – a rekurzív tagmondat-beágyazást, melyet alárendelő kötőszó vezet be (Arra kérheti, hogy vigye ki a szemetet. Arra gondolhat, hogy lázas a gyerek stb.), – a szituatív mondatokat, melyek az „idézett” szereplő tudatállapotát, kijelentését közvetlenül, első személyben jelenítik meg (Adjál kölcsön! Miért vagy szomorú?), – a szituatív mondatokat főmondatba beágyazva (Azt mondja, hogy kérem a kulcsot.), – és az olyan szándékleíró mondatokat, amelyek standard kommunikációs helyzetben jól formált válaszok lehetnek (Hát oktatja valamire a lányát.), vagy kötőmódban (Vigye ki a szemetet.).

.. Az afáziás személyek eredményei a mondattani rekurzióban A jelen vizsgálatban szereplő afáziás személyek válaszai és a Bánréti–Mészáros (2011) által vizsgált afáziás személyek eredményei között eltérést és párhuzamokat egyaránt találunk. Az eltérés abban áll, hogy a Bánréti–Mészáros (2011) által

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



9. táblázat: Afáziás személyek válaszai a . kérdéstípusra (zárójelben az adott nyelvtani

kategória részesedése az összes, szerkezetileg illeszkedő válaszon belül, zárójelen kívül aláhúzva: ezek közül a grammatikus válaszok hányada) B.T: közepes Broca-afáziás, B.L: közepes vezetéses afáziás, G.M.E. és T.J. anómikus afáziások. Személyek Kategória Egyszerű leíró mondat Puszta szituatív mondat

B.T. (,) ,

B.L.

G.M.E.

(,) , (,) ,

T.J.

Normál kontroll

(,) ,

,

(,) , (,) , (,) , (,) ,

Egyszerű mondat kötőmódban

Alárendelő kötőszós szituatív mondat

(,) ,

(,) ,

(,) ,

, 

(,) , (,) ,

,

(,) , (,) , (,) , (,) ,

,

Tagmondatok szerkezeti beágyazásai összesen (,) , (,) , (,) , (,) ,

,

Szituatív mondatok összesen

,

Alárendelő kötőszós leíró tagmondat

(,) , (,) , (,) ,

() ,

vizsgált Broca-afáziások esetében a szintaktikai rekurzió súlyosabban volt érintve, az ő válaszaiknak csak 13,8-a tartalmazott rekurzív szerkezeti beágyazást, szemben B.T. válaszainak 47-ával. A Wernicke-afáziások akkori válaszmintázata (válaszaik 40,0-a szerkezeti beágyazás és mind grammatikus is volt) valamint az anómikus afáziások válaszmintázata (válaszaik 52,3-a szerkezeti beágyazás, amelyből 39,2 grammatikus volt) már egybevágnak a jelen vizsgálatban G.M.E. és T.J. mintázatával. Továbbá Bánréti–Mészáros (2011) tesztjeiben a Broca-afáziások válaszainál a grammatikus szituatív mondatok aránya jóval meghaladta a normál kontroll válaszbeli szituatív mondatok arányát (65,9 vs. 31). Ezek alapján a mellett érveltünk, hogy a szintaktikai rekurzió korlátozódása mellett maradnak épen a tudatelméleti képességek. (Jelen tesztben a Broca-afáziás B.T. esetében a grammatikus szituatív mondatok vs. normál kontroll viszony: 47 vs. 31.) A most vizsgált személyeknél (l. 9. táblázat) a szintaktikai rekurzión alapuló szerkezeti beágyazások aránya mindegyik személynél megközelíti, bár csak egynél éri el a normál személyeknél kapott értékeket. Tehát az afáziások ezúttal nem kerülik a szerkezeti rekurzió használatát. Csakhogy ezeknek a válaszoknak jelentős része nem grammatikus. A Broca-afáziás B.T. esetében a rekurzív válaszoknak



Bánréti Zoltán – Szücs Márta – Mészáros Éva

csak az 57-a grammatikus, a vezetéses afáziás B.L. esetében pedig a rekurziót tartalmazó válaszok 61-a grammatikus, a többi nem! Ezek az értékek, a normál kontroll teljesítményéhez képest már 30-kal alacsonyabb részesedést mutatnak a hibátlan rekurzív válaszok tekintetében. Másfelől, mind a két személynél valamennyi szituatív mondat válasz grammatikus! Ez azért figyelemre méltó, mert azt mutatja, hogy nem általában a mondatalkotás korlátozott, hiszen a szituatív és egyéb mondataik mindegyike grammatikus, hanem éppen a rekurzív szerkesztésben mutatnak deficitet. Nem kerülik ugyan a rekurzív műveletet, de az nehézséget jelent számukra, és így az ilyen műveletek során fragmentizált, agrammatikus mondatokat alkotnak. Az összetett szavak építésére vonatkozó tesztekben ez a két személy a lexikonban való keresés stratégiáját alkalmazta. A két anómikus afáziás (G.M.E. és T.J.) az összetett szó építésének tesztjeiben a szintaxisba kilépés stratégiáját követte. Föltételeztük, hogy erre a lexikai szabályalkalmazás deficitje kényszerítette őket. Az összes, rekurziót tartalmazó mondatválaszon belül a grammatikus válaszok részesedése G.M.E. esetében 32,3 volt, T.J.-nél 33,4, ha pedig csak a leíró, rekurzív válaszaikat tekintjük, G.M.E.-nél már csak 12,9-uk, T.J.-nél 13,4 volt grammatikus. A puszta szituatív mondataik grammatikusak voltak, de ezek aránya (25,8, illetve 30) elmarad a másik két afáziás személy értékeitől és valamennyire a normál kontrollétól is. Viszont az alárendelő kötőszóval bevezetett, szituatív mondatválaszaik is kivétel nélkül mind grammatikusak voltak, és részesedésük lényegesen magasabb volt (19,4 és 20,0), mint a többi afáziásoké, sőt magasabb, mint a normál kontrollé. Ezek a különbségek a két afáziás alcsoport eltérő szerkesztési stratégiáját mutatják: a szintaxisba „kilépő” anómikus afáziások a szituatív mondatokra hibátlanul tudják alkalmazni a rekurzív szerkezetépítő műveleteket, míg a leíró tagmondatokra már sokkal rosszabbul, a Broca-és a vezetéses afáziás szintje alatt teljesítenek. A Broca-afáziás és a vezetéses afáziás esetében a szintaktikai-szerkezeti rekurzió deficitjét és a puszta szituatív mondatok preferenciáját találtuk (ép tudatelméleti következtetéseket). A két anómikus személynél a rekurzív művelet akkor volt elérhető, ha tudatelméleti következtetéseket hordozó tagmondatot vezetett be. Összefoglalva a megfigyeléseinket: az összetett szavak építésében a lexikai keresést követő személyek mondattani rekurzív képességei korlátozottnak bizonyultak, a tudatelméleti képességeik épsége mellett, a szintaxisba kilépést követők esetében pedig a nyelvi rekurzió éppen akkor volt elérhető a tesztben, ha tudatelméleti következtetések tartalmaihoz társult, az általánosságban ép tudatelméleti képességeken túl.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



.. Az Alzheimer-kóros személyek eredményei a mondattani rekurzióban 10. táblázat: Az Alzheimer-kóros személyek eredményei a mondattani rekurzióban. Zá-

rójelben az adott nyelvtani kategória részesedése az összes, szerkezetileg illeszkedő válaszon belül, zárójelen kívül: ezek közül a grammatikus válaszok hányada. (Hoffmann et al.  vizsgálatai) Személyek Kategória

Zs.A. K.D. Normál (enyhe AK) (középsúlyos AK) kontroll

Egyszerű leíró mondat

,

,



Puszta szituatív mondat

,



Egyszerű mondat kötőmódban

,

,

Alárendelő kötőszós szituatív mondat

,



Alárendelő kötőszós leíró tagmondat

,

(,) ,



Tagmondatok szerkezeti beágyazásai összesen

,

(,) ,



Szituatív mondatok összesen

,

,

,

A 10. táblázat alapján látható, hogy az enyhe Alzheimer-kóros Zs.A.-nál és a középsúlyos K.D.-nál az egyszerű, leíró mondatok aránya közel áll egymáshoz. Jelentős különbség mutatkozik azonban a két személy teljesítményében a szituatív mondatok és az alárendelő, leíró mondatválaszok arányát illetően. Míg a puszta szituatív mondatok részesedése a normál értékekhez hasonlóan alakul Zs.A.-nál, addig a középsúlyos K.D.-nál már egyáltalán nincs ilyen szituatív mondatválasz. A szintaktikai rekurzió működésében ellentétes tendencia mutatkozik: az enyhe AK személynél a leíró, alárendelő szerkezetek aránya a normál értékeknek valamivel több mint a fele, viszont a középsúlyos személynél meg is haladja a normál értékeket (67 vs. 45). Mindez arra enged következtetni, hogy míg enyhe AK-ban a rekurzív tudatelméleti következtetés képessége épen működik, a középsúlyos szakaszban a tudatelméleti képességek alkalmazása (szituatív mondatok) teljesen visszaszorul. Ez összefügg magának a tudatelméleti képességeknek a deficitjével, amit K.D. esetében a másodrendű hamisvélekedés-tesztben mutatott eredménye is igazolni látszik (vö. Hoffmann et al. 2011). K.D. esetében tehát a puszta szituatív mondatokat felváltják a leíró, rekurzív mondatszerkezetek,



Bánréti Zoltán – Szücs Márta – Mészáros Éva

a tudatelméleti következtetések tartalmait a leíró szempontú, szintaktikai-szerkezeti rekurzió. Az összetett szavak építésében a szintaxisba „kilépés” stratégiáját erőteljesen preferáló Alzheimer-kóros személyeknél a nyelvi rekurzió és a tudatelméleti tartalmak disszociálódnak, szétválnak: a kór előrehaladásával a leíró perspektívájú, mondattani rekurziót tartalmazó válaszok aránya megugrik, a puszta szituatív mondatok eltűnnek. Mindez azt mutatja, hogy az Alzheimer-kór körülményei között a lexikai rekurzív szabályok viszonylagosan épen maradnak, a célszó komplexitásának növekedése a szintaxisba kilépést váltja ki, ugyanakkor az ép szintaktikai rekurzió és a rekurzív tudatelméleti következtetések szétválnak, az utóbbi korlátozódik.

. Következtetések .. A két afáziás csoport (anómikus afáziások illetve a Broca-és vezetéses afáziások) eltérő válaszmintázatai a lexikai rekurzió, a mondattani rekurzió és a tudatelméleti képességek szelektív deficitjein alapulnak. Az összetett szavak építésében a szintaxisba „kilépő” anómikus afáziások a lexikai rekurzió deficitje mellett a mondattani rekurzív műveleteket jól képesek alkalmazni a szituatív mondatokra, viszont a leíró tagmondatokra már sokkal rosszabbul, ott a Broca- és a vezetéses afáziás szintje alatt teljesítenek. Épek tehát a tudatelméleti képességeik és a rekurzív mondattani műveleteknek azok a formái, amelyek közvetlenül kapcsolódnak a tudatelméleti következtetésekhez. Ez a kapcsolat eltűnik a Broca- és a vezetéses afáziás válaszaiból: náluk a puszta szituatív mondatok preferáltak: épek a tudatelméleti következtetések, deficitesek a lexikai rekurzív műveletek (a nem „készen” tárolt lexikai egységek elérése) és korlátozottak a mondattani rekurzív műveletek. Ez a csoport követi az összetett szavak építésében a lexikai keresés stratégiáját. Az összetett szó építésében a szintaxisba „kilépés”-t követők esetében tehát a lexikai rekurzív műveletek sérültebbeknek mutatkoztak, mint a mondattani rekurzió, mert az utóbbi jobban elérhető volt akkor, ha tudatelméleti következtetéseknek adott nyelvi formát. Az enyhe Alzheimer-kórban nem találtuk jelét a rekurzív tudatelméleti következtetés korlátozódásának, szemben a középsúlyos szakasszal, ahol ezt a képességet nem használták a válaszokban. Egyszersmind a puszta szituatív mondatok alkalmazását is elkerülik. A puszta szituatív mondatok helyén leíró, rekurzív mondatszerkezetek jelennek meg. Az összetett szavak építésében a szintaxisba „kilépés” stratégiáját erőteljesen preferáló Alzheimer-kóros személyeknél a nyelvi rekurzió és a tudatelméleti tartalmak szétválnak. Az Alzheimer-kór körülmé-

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



nyei között a lexikai rekurzív szabályok a 3 tagú összetett szavakig viszonylagosan épen maradnak, a célszó komplexitásának növekedése a szintaxisba kilépést váltja ki, ugyanakkor az ép szintaktikai rekurzió és a deficites tudatelméleti következtetések elválnak egymástól. .. Az összetett szó rekurzív építésének deficitjéből nem következik a mondattani rekurzió deficitje, és fordítva: a mondattani rekurzió korlátozottsága nem eredményezi automatikusan az összetett szó rekurzív építésének deficitjét. A szóösszetételt eredményező szabályok eltérnek a szintaktikai szabályoktól. A szóképző szabályok többsége nem is rekurzív, azonban az -ó/-ő képzős alaptaggal épített összetételek a kivételek közé tartoznak: ezek rekurzívak. Mivel az ilyen összetételek konstrukciós sémákat követnek (páciens viszony alkotása az -ó/-ő képzős alaptaggal), az összetétel tagjai közti relációt szemantikai argumentumok (tematikus szerepek) biztosítják. A séma annyit mond, hogy vannak XY összetételek, amelyekben a fent leírt viszony áll fenn. A létrejött alakzatot egységnek tekintve, az (XY)+Z között is hasonló lehet a viszony. Ily módon létrejöhet egy (XYZ) lexikai egység, amelyhez egy V elem csatlakozhat és így tovább. Ezt tekintettük lexikai rekurziónak. Ebben az egyes szavak közti reláció jelölőjét nem a szintaxis biztosítja (sőt, éppen el kell „nyomni” a szintaktikai jelölőket, mint pl. a finit igeformát és az esetragot). A rekurzió alapja a konstrukciós séma megismétlése és nem a szintaktikai szabály. Ugyanakkor maga a lexikai rekurzió művelete egyfajta „saját” szintaxissal rendelkezik, ezt mutatja produktivitása, és az, hogy benne az elemek sorrendje szigorúan kötött: képvágó versus vágókép. A tesztekben észlelt produkciós különbségeket az magyarázza, hogy nem egyetlen rekurzív művelet különféle nyelvi szinteken történő alkalmazása sérülhet vagy maradhat épen, hanem nyelvtani alrendszerekhez kötött rekurzív műveletekről van szó, amelyek szelektíven korlátozódhatnak. Ugyanakkor ezek a műveletek nem függetlenek egymástól, hiszen az egyik sérülése kiváltja a másik helyettesítő felhasználását, javító stratégiaként. Hauser et al. (2002) művére utalva mondhatjuk, hogy a nyelvben van rekurzió a szintaxison kívül is: a lexikai rekurzió. A tudatelméleti következtetésekben megnyilvánuló rekurzív műveletek ugyancsak disszociálódhatnak, elválhatnak mind a mondattani, mind a szóösszetételbeli rekurzivitástól. A fenti három műveletcsoport sem független egymástól. Mindháromra azt találtuk, hogy amennyiben valamelyikük korlátozódik, akkor egy másik, ugyancsak rekurziót tartalmazó műveletosztály jelenhet meg, javító, kompenzáló stratégiák részeként. A szóépítésbeli rekurzió korlátozódása esetén a szintaxisba kilépés, a szintaktikai rekurzió korlátozódása esetén a rekurzív tudatelméleti következtetések „túlhasználata” egyszerű nyelvi formákban, valamint a tudatelméleti képességek korlátozódása esetén a leíró, rekurzív mondattani szer-



Bánréti Zoltán – Szücs Márta – Mészáros Éva

kezetek „túlhasználata” jelenik meg. Ezek az összefüggések valószínűsítik, hogy a fenti műveletek ugyan alrendszer-specifikusak, de nem egy szigorú modularitással bíró kognitív rendszer moduljainak részei, mert akkor nem lehetne őket kölcsönös, „egymást javító” stratégiákban alkalmazni. Inkább azon feltételezés melletti adalékoknak tekintjük őket, amely szerint az emberi elme általánosságban rendelkezik a rekurzív műveletek képességével, és ennek az általános képességnek specifikus megjelenéseit találjuk különféle kognitív rendszerek szabályaiban. Irodalom APA 2000. Diagnostic and statistical manual of mental disorders. Fourth edition. Text revision (DSM-IV-TR). Washington, DC: American Psychiatric Association (APA). Bánréti, Zoltán 2009. Restricted discrimination between local and global economy in agrammatic aphasia. In: Kai Alter – Merle Horne – Magnus Lindgren – Mikael Roll – Janne von Koss Torkildsen (szerk.): Brain talk: Discourse with and in the brain. Papers from the first Birgit Rausing Language Program Conference in Linguistics. Lund: University of Lund. 49–60. Bánréti, Zoltán 2010. Recursion in aphasia. Clinical Linguistics & Phonetics 24: 906–914. Bánréti Zoltán – Mészáros Éva 2011. A szintaktikai rekurzivitás afáziában. Általános Nyelvészeti Tanulmányok 23: 192–226. Bar-Hillel, Yehoshua 1953. On recursive definitions in empirical science. In: Proceedings of the 11th International Congress of Philosophy, Brussels. Vol. 5. Amsterdam: North-Holland. 160–165. Bickerton, Derek – Eörs Szathmáry (szerk.) 2009. Biological foundations and origin of syntax. Cambridge MA: MIT Press. Brisco, Ted 2009. What can formal or computational models tell us about how (much) language shaped the brain? In: Bickerton – Szathmáry (2009, 369–385). Chomsky, Noam 2007. Approaching UG from below. In: Uli Sauerland – Hans-Martin Gärtner (szerk.): Interfaces + recursion = language? Chomsky’s minimalism and the view from syntax–semantics. Berlin & New York: Mouton de Gruyter. 1–29. Dressler, Wolfgang U. 2006. Compound types. In: Garry Libben – Gonia Jarema (szerk.): The representation and processing of compound words. Oxford: Oxford University Press. 23–44. Evans, Nicholas – Stephen C. Levinson 2009. The myth of language universals. Behavioral and Brain Sciences 32: 429–448. Everett, Daniel L. 2009. Pirahã culture and grammar: A response to some criticisms. Language 85: 405–442. Fitch, Tec*mseh W. – Marc D. Hauser – Noam Chomky 2005. The evolution of the language faculty: Clarifications and implications. Cognition 97: 179–210. Folstein, Marshal F. – Susan E. Folstein – Paul R. McHugh 1975. “Mini-mental state”. A practical method for grading the cognitive state of patients for the clinician. Journal of Psychiatric Research 12: 189–198.

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban



Friederici, Angela D. 2009. The brain differentiates hierarchial and probabilistic grammars. In: Juan Uriagereka – Pello Salaburu (szerk.): Of minds and language: A dialogue with Noam Chomsky in the Basque country. Oxford: Oxford University Press. 184–194. Gentner, Timothy Q. – Kimberly Fenn – Daniel Margoliash – Howard Nusbaum 2006. Recursive syntactic pattern learning by songbirds. Nature 44: 1204–1207. Hauser, Marc D. – Noam Chomsky – W. Tec*mseh Fitch 2002. The faculty of language: What is it, who has it, and how did it evolve? Science 298: 1569–1579. Hoffmann Ildikó – Bánréti Zoltán – Szücs Márta – Mészáros Éva 2011. A mondattani rekurzió enyhe és középsúlyos Alzheimer kórban. In: Bánréti Zoltán (szerk.): Rekurzió a nyelvben II. Neurolingvisztikai megközelítés. Budapest: Tinta Könyvkiadó. 63–86. Hofstadter, Douglas 1980. Gödel, Escher, Bach: An eternal golden braid. London: Penguin. Hulst, Harry van der 2010a. Re: Recursion. In: Hulst (2010b, xv–lii). Hulst, Harry van der (szerk.) 2010b. Recursion and human language (Studies in Generative Grammar 104). Berlin: De Gruyter Mouton. Hunyadi, László 2010. Grouping, the cognitive basis of recursion in language. In: Hulst (2010, 343– 370). Jackendoff, Ray – Steven Pinker 2005. The nature of language faculty and its implication for evolution of language. Cognition 97: 211–225. Katz, Jonah – David Pesetsky 2009. The recursive syntax and prosody of tonal music. Előadás a Conference on Recursion keretében, University of Massachusetts, Amherst, 2009. május 26–28. Kenesei István 2008. Funkcionális kategóriák. In: Kiefer Ferenc (szerk.): Strukturális magyar nyelvtan 4. A szótár szerkezete. Budapest: Akadémiai Kiadó. 601–638. Kiefer Ferenc 2000. A szóösszetétel. In: Kiefer Ferenc (szerk.): Strukturális magyar nyelvtan 3. Morfológia. Budapest: Akadémiai Kiadó. 519–567. Koschmann, Timothy 2010. On the universality of recursion. Lingua 120: 2691–2694. Levine, John 2007. Machines, languages and computation. Előadás a University of Strathclyde-n, 2007. november 19. Mondini, Sara – Claudio Luzzatti – Giusy Zonca – Caterina Pistarini – Carlo sem*nza 2004. The mental representation of verb–noun compounds in Italian: Evidence from a multiple singlecase study in aphasia. Brain and Language 90: 470–477. Monti, Martin M. – Lawrence M. Parsons – Daniel N. Osherson 2012. Thought beyond language: Neural dissociation of algebra and natural language. Psychological Science OnlineFirst. Published on July 3, 2013, as doi: 10.1177/0956797612437427. Osmanné Sági Judit 1991. Az afázia diagnózisa és klasszifikációja. Ideggyógyászati Szemle 44: 339– 362. Osmanné Sági Judit 1994. A De Renzi–Vignolo beszédmegértési teszt adaptációjának eredményei. Ideggyógyászati Szemle 52: 300–332. Parker, Anna R. 2006. Evolving the narrow language faculty: Was recursion the pivotal step? In: Angelo Cangelosi – Andrew D.M. Smith – Kenny Smith (szerk.): The evolution of language. London: World Scientific. 239–246. Pinker, Steven 1999. A nyelvi ösztön. Budapest: TypoTEX Kiadó.



Bánréti Zoltán – Szücs Márta – Mészáros Éva

Pinker, Steven – Ray Jackendoff 2005. The faculty of language: What’s so special about it? Cognition 95: 201–236. Rosen, Wilma G. – Richard C. Mohs – Kenneth L. Davis 1984. A new rating scale for Alzheimer’s disease. American Journal of Psychiatry 141: 1356–1364. Tallerman, Maggie – Frederick Newmeyer – Derek Bickerton – Denis Bouchard – Edith Kaan – Luigi Rizzi 2009. What kinds of syntactic phenomena must biologists, neurobiologists, and computer scientists try to explain and replicate? In: Bickerton – Szathmáry (2009, 135–160). Tariska Péter – Kiss Éva – Mészáros Ágota – Knolmayer Johanna 1990. A módosított Mini Mental State vizsgálat. Ideggyógyászati Szemle 43: 443. Tomalin, Marcus 2007. Reconsidering recursion in syntactic theory. Lingua 117: 1784–1800. Tomasello, Michael – Joseph Call 2008. Does the chimpanzee have a theory of mind? 30 years later. Trends in Cognitive Sciences 12: 187–192. Wagner, Michael 2007. Prosody and recursion in coordinate structures and beyond. Kézirat, Cornell University. WHO 1993. International classification of diseases and disorders. Tenth edition (ICD ). Geneva: World Health Organisation (WHO).

Melléklet: Teszt a lexikai rekurzió vizsgálatára szóösszetételekben Próba: Ebbe hamuzunk. Mi ez? Próba: Ezzel az ollóval metszik a gallyakat. Mi ez? Próba: Ebben tartják a tollat! Mi ez? Próba: Ebben etetik a madarakat! Mi ez? Próba: Ő tisztítja a kéményeket. Mi a foglalkozása? Próba: Ezzel szárítják a hajat. Mi ez? Próba: Ezzel fogják meg az egeret. Mi ez? Próba: Ezzel verik a habot. Mi ez? Próba: Ő emeli a súlyt. Mi ő? Próba :Ezt fűzzük a cipőbe. Mi ez? Próba: Ezzel húzzák ki a dugót az üvegből. Mi ez? Próba: Ez főzi a kávét. Mi ez? Ez a szer tisztítja. Mi lehet a neve? Ezzel adagolják. Mi lehet a neve? Hogyan nevezné egy szóval? Próba: Ez elijeszti a madarakat. Mi a neve? Próba: Ezzel festik a hajat. Mi ez? Ezzel adagolják. Mi lehet a neve? Próba: Ez a gép hűti az ételt. Mi ez? Ő szereli. Mi a foglalkozása? Próba: Mi ez? Ő gondozza. Mi lehet a foglalkozása? Próba: Mik ezek? Ő festi őket. Mi lehet a foglalkozása?

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban Sorszám  

Kép  



 

 

 

 





 

 









 

 





 

 













 

 





Kérdés Ez törli a szélvédőt. Mi a neve? Ez tartja a gyertyákat. Mi ez? Ő készíti. Mi lehet a foglalkozása? Ez a kutya vezeti a vakot. Mi ez? Itt képzik az ilyen kutyát. Mi lehet a neve a helynek? Itt tárolják a csónakokat. Mi ez? Ez tartja a kulcsokat. Mi a neve? Ő készíti. Mi lehet a foglalkozása? Ez a gép mossa az üvegeket. Mi lehet a neve? Ő faragja a fát. Mi lehet a foglalkozása? Ez a műhelye. Mi lehet a neve, mondja egy szóval! Ő takarítja. Mi lehet a foglalkozása? Ezen tartják a kottát. Mi ez? Ő lakkozza. Mi lehet a foglalkozása? Ő köti a könyveket. Mi a foglalkozása? Ő oktatja. Mi lehet a foglalkozása? Ő szövi a szőnyeget. Mi lehet a foglalkozása? Ez a tojás egy sárkányé. Mi ez, hogyan mondaná egy szóval? Ez a gép kelteti ki. Mi lehetne a neve? Ebben a szemüvegben úsznak. Mi ez? Ebben tartják. Mi lehet a neve? Ő tervezi. Mi lehet a foglalkozása? Ez szűri a vizet. Mi ez? Ő szereli. Mi lehet a foglalkozása? Ő főzi a sört. Mi lehet a foglalkozása? Ez a pirítja a kenyeret. Mi ez? Ő tervezi. Mi lehet a foglalkozása? Ebben a kocsiban laknak. Mi ez? Itt parkolhat. Mi ez? Ő takarítja. Mi lehet a foglalkozása? Ez szállítja az elromlott autókat. Mi a neve? Ez a gép keveri a betont. Mi ez? Ő kezeli. Mi lehet a beosztása? Itt játszanak a gyerekek. Mi ez? Ő takarítja. Mi lehet a foglalkozása? Ő felügyeli. Neki mi lehet a foglalkozása? A könyvtárban ebben a teremben olvasnak. Mi lehet a neve? Ő ott felügyel. Mi lehet a foglalkozása? Ő karddal vív. Mi ő? Ő edzi. Mi a foglalkozása? Ő tisztítja az ablakokat. Mi lehet a foglalkozása? Ez az alma aranyból készült. Mi ez? Ő önti. Mi lehet a foglalkozása? Ezt a férfiak a nyakukban hordják. Mi ez? Ő készíti. Mi lehet a foglalkozása?





Bánréti Zoltán – Szücs Márta – Mészáros Éva 







 

 





 

 









 

 









 

 









 

 









 

 

Ez lépcső mozog. Mi ez? Ő szereli. Mi a foglalkozása? Ő felügyel. Mi lehet az ő foglalkozása? Ez a kukac a sajtban él. Mi ez? Ő írtja. Mi lehet a foglalkozása? Ő kivágja a fákat. Mi a foglalkozása? Ez a barack sárga. Mi ez? Ő termeszti. Mi lehet a foglalkozása? Ez a lámpa irányítja a forgalmat. Mi ez? Ez vezérli. Mi lehet a neve? Ő tervezi. Mi lehet a foglalkozása? Ő eteti az éhes cápát. Mi lehet a foglalkozása? Ez szemüveg védi a szemet. Mi ez? Ő tervezi. Mi lehet a foglalkozása? Ez forralja a vizet. Mi ez? Ez a szer tisztítja. Mi lehet a neve? Ezzel adagolják. Mi lehet a neve? Hogyan mondaná egy szóval? Ezt a láncot a nők a nyakukban hordják. Mi ez? Ő készíti. Mi lehet a foglalkozása? Ő kóstolja a borokat. Mi lehet a foglalkozása? Ezt a hálót használják a halászok. Mi a neve? Ő készíti. Mi lehet a foglalkozása? Ez szűri a levegőt egy autóban. Mi lehet a neve? Ez a szer tisztítja. Mi lehet a neve? Ez a gép gyártja. Mi lehet a neve gépnek? Ezt a szánt a kutyák húzzák. Mi lehet a neve? Ő hajtja. Mi lehet a foglalkozása? Ez kotorja a havat. Mi ez? Ez a cukor hasonlít a vattára. Mi lehet a neve? Ez a gép készíti? Mi a neve? Mi ez? [Mentőautó] Ő vezeti. Mi a foglalkozása? Hogyan mondaná egy szóval? Ha ő oktatja, akkor mi lehet a foglalkozása? Ez a daru olyan magas, mint egy torony? Mi lehet a neve? Ő kezeli. Mi a foglalkozása? Ő szedi a labdákat. Mi ő? Ezzel lapátolják a havat. Mi ez? Itt tárolják. Mi ennek a neve? Mi ez? [Szappanbuborék] Mi van a kezében? Ez a szer írtja a kullancsot. Mi a neve? Ezzel fújják. Mi lehet a neve? Ez a gép gyártja. Mi lehet a neve? Ő éppen kereszteli a hajót. Mi az alkalom neve? Mi ez? [Borsó] Ő pucolja. Mi lehet a foglalkozása?

Az összetett szavakat építő lexikai rekurzió afáziában és Alzheimer-kórban 



 

 





 

 





 

 



Ez a baba porcelánból készült. Mi a neve? Ők készítik. Mi lehet a foglalkozásuk? Ő köti a virágokat. Mi a foglalkozása? Milyen víz folyhat az ereszből? Ez gyűjti. Mi lehet a neve? Ő megmássza a hegyet. Mi ő? Ha ő irányítja, akkor mi ő egy szóval? Ő oktatja. Mi lehet a foglalkozása? Ők simogatják a kígyót. Mik ők? Ez főzi a kávét. Mi ez? Ez a szer tisztítja. Mi a neve? Mi van a kezében? Ebben tartják. Mi lehet ennek a neve? Ő eloltja a tüzet. Mi a foglalkozása? Mi ez? [Karácsonyfa] Ha ő díszíti, akkor mi ő?

Lexical recursion and compounding in aphasia and in Alzheimer’s disease Abstract: We examined the processes of lexical recursion by tests requiring the productive and recursive construction of compound words. Normal, aphasic and Alzheimer patients participated in these tests. We also replicated some sentence recursion tests. Aphasics fell into two groups in terms of their patterns of responses. Anomic aphasics exhibited severe impairment in lexical recursion. They attempted repair strategies involving “defection into syntax” as a substitute for constructing the target compound words: they produced sentences or syntactic structures rather than complex compounds. In anomic aphasics applying the compensatory strategy of defection into syntax in tasks involving the productive construction of compound words, lexical recursive operations turned out to be more impaired than syntactic recursion. The other aphasic group involved Broca’s and conduction aphasics. They reacted to tasks requiring lexical recursion, i.e. the productive and recursive construction of compound words, by the strategy of lexical search: they preferred the use of simplex synonyms or hyperonyms to constructing the target compounds. Their recursive lexical operations showed a deficit and their recursive syntactic operations were also limited. In the case of Broca’s and conduction aphasics, a deficit of productive application of lexical recursion was observable, one that was highly sensitive to the complexity of the compound word to be constructed; and recursive syntactic operations were severely restricted. Persons with Alzheimer’s disease strongly preferred the strategy of defection into syntax in tasks involving the productive and recursive construction of compound words. Lexical recursive rules remained relatively intact up to three-constituent compounds, but increasing complexity of the target word triggered the strategy of defection into syntax rather than lexical search. Threeand for constituent compounds were substituted for by descriptive, recursive sentences. These investigations have shown that a deficit of recursive construction of compound words does not entail any deficit of syntactic recursion, and conversely, limitations of syntactic recursion



Bánréti Zoltán – Szücs Márta – Mészáros Éva

do not automatically result in any deficit of recursive compound formation. Recursion yielding a compound is based on a productive semantic construction and not on syntactic rule. On the other hand, the operation of lexical recursion itself has its “own” syntax, as it were; this is exactly what its productivity shows. The production differences observed in the tests mentioned here are explained by the fact that we do not seem to have to do with a single recursive operation whose application may be impaired or remain intact at various levels; rather, we encounter separate recursive operations bound to individual grammatical subsystems that may be selectively impaired. Keywords: recursion, syntax, lexicon, aphasia, Alzheiemr’s disease

Az irónia megértése autizmusban: egy kognitív pragmatikai modellhelyzet* Győri Miklós ELTE Gyógypedagógiai Pszichológiai Intézet, Budapest [emailprotected]

Kivonat: A tanulmány egy körülhatárolt kutatási terület főbb eredményeit tekinti át: azokat az empirikus-kísérleti módszertanú kutatásokat összegzi, amelyek a nyelvi irónia megértésének folyamatait igyekeztek feltárni autizmussal élő személyek esetében. Bemutatja, hogy a téma Happé (1993) úttörő tanulmánya óta pszicholingvisztikai, neurolingvisztikai és kognitív pszichológiai kutatások sorozatát inspirálta, köztük a szerző néhány saját vizsgálatát is; s azt, hogy mind a kutatási kérdések, mind pedig az eredmények túlmutatnak magán a vizsgált jelenségen. Az autizmussal élő személyek iróniamegértése az empirikus pragmatikai kutatás sajátos modellhelyzetének tekinthető: olyan, nyelvészeti és lélektani szempontból jól definiálható, kísérleti eljárásokra lefordítható pragmatikai szituáció, amelyben a szándékközpontú kommunikáció- és pragmatikaelméletek egyes alapfeltevései, illetve az ezek alapján kidolgozott pszicholingvisztikai modellek érvényessége is vizsgálható. Kulcsszavak: autizmus, iróniamegértés, pszicholingvisztika, relevanciaelmélet, szándékfelismerés

. Bevezetés E tanulmányban egy meglehetősen körülhatárolt kutatási terület főbb eredményeit tekintem át. Azokat az elsősorban empirikus-kísérleti módszertanú kutatásokat összegzem, amelyek az irónia megértésének folyamatait igyekeztek feltárni autizmussal élő személyek esetében. A szűk fókusz ellenére ez a téma szisztematikusan egymásra épülő pszicholingvisztikai, neurolingvisztikai és kognitív pszichológiai kutatások egész sorozatát inspirálta, köztük néhány saját vizsgálatomat is. Mind a kutatási kérdések, mind pedig az eredmények lényegesen túlmutatnak a vizsgált jelenségen. Az autizmussal élő személyek iróniamegértése sajátos modellhelyzetnek tekinthető: olyan, nyelvészeti és lélektani szempontból viszonylag jól definiálható, és így kísérleti eljárásokra jól lefordítható pragmatikai szituációról van szó, amelyben a szándékközpontú kommunikáció- és pragmatikaelméletek egyes alapfeltevései, illetve az ezek alapján kidolgozott pszicho* A fejezet elkészítését és a bemutatott empirikus munkák egy részét az OTKA K  sz. kutatási pályázata támogatta. Ezúton is köszönöm Pléh Csabának és Stefanik Krisztinának a kézirat formálódó változataihoz fűzött kommentárjaikat.



Győri Miklós

lingvisztikai modellek érvényessége is vizsgálható, s lehetőség kínálkozik az idegrendszeri háttérfolyamatok azonosítására is. Az alábbiakban tehát ezt a tágabb kontextust is szem előtt tartva tekintem át a területen közölt kutatásokat és főbb következtetéseiket, s eközben kitérek néhány fontos módszertani kérdésre, a modellalkotás során fontos szerephez jutó néhány kognitív lélektani fogalomra, s természetesen a tipikus személyek iróniamegértési folyamataival kapcsolatos néhány eredményre és modellre. Először, mintegy a történeti rendet is követve, felvázolom, miként jelenik meg az irónia megértése a relevanciaelméletben, majd néhány olyan kognitív lélektani adalékot tisztázok tömören, amelyek az intencionalitás megértésével kapcsolatosak. Ezt követően a 4. szakaszban röviden bemutatom az autizmus jelenségkörét, illetve – a korábbi tárgyalásra építve – jelentőségét az empirikus-kísérleti pragmatikai kutatás számára. E tanulmány gerincét az 5. szakasz adja, ott mutatom be és elemzem az empirikus kutatásokat. Végül, az Összegzésben igyekszem megmutatni, hogy néhány fontos következtetés levonását is megengedik a felhalmozott eredmények, s bizonyos mértékig ki is jelölnek néhány tisztázandó kutatási kérdést. E tanulmány nagymértékben épít egy, az autizmus pszicholingvisztikáját összefoglaló munkámra (Győri megj. előtt). A téma nem csekély klinikai és terápiás-gyakorlati jelentőségére e szövegben nem térek ki.

. A relevanciaelmélet az irónia megértéséről A relevenciaelmélet (Sperber–Wilson 1986; 1995), mint az jól ismert, átfogó kommunikációelmélet, így egyben jelentéselmélet és pragmatikaelmélet is. A szerzők, elsősorban Grice (1957; magyarul: 1997) szándékalapú jelentéselméletére építve, álláspontjukat a tisztán kódalkalmazáson alapuló jelentés-, nyelv- és kommunikációelméletekkel szemben fogalmazzák meg. Sperber és Wilson osztenzív-inferenciális modelljében minden (nyelvi vagy nem nyelvi) kommunikatív aktus egy osztenzív cselekvés eredménye. A kommunikátor mintegy „felmutat”, azaz a befogadó számára manifesztté tesz valamilyen információt, amely aztán a befogadó számára egyfajta evidenciaként szolgál. Mégpedig olyan evidenciaként, amelyből kiindulva, s más evidenciákat (így például a kontextuális információt) is figyelembe véve, a befogadó következtethet a kommunikátor (informatív) szándékára. Ezeket a következtetési folyamatokat pedig jelentős részben a relevancia vezérli – csakúgy, mint a kommunikátor oldaláról a kommunikatív aktus megtervezésének folyamatait. A befogadó szempontjából így akkor lesz sikeres az ő értelmezési aktusa, ha pontosan felismeri a kommunikátor (valódi) szándékát (szándékait). A kommunikátor szempontjából pedig akkor, ha az általa kommu-

Az irónia megértése autizmusban



nikálni kívánt (informatív) szándékát ismeri fel a befogadó. A szorosabban vett nyelvi rendszer, amely Sperber és Wilson feltételezésében is kódszerűen működik, a létrehozott/feldolgozott kijelentések révén egy sajátos evidenciatípust tesz elérhetővé a nyelv birtoklóinak. A nyelvi jelentés így kettős természetűként tételeződik: a nyelvi kód által determinált mondatjelentésből (is) kiindulva a fent jelzett következtetési folyamatok juttatnak el bennünket a pragmatikailag és kommunikációs szempontból interpretált jelentésig, a beszélő/kommunikátor szándékainak megértéséig. A relevanciaelmélet jelentős figyelmet kapott nemcsak a nemzetközi kutatói közösségekben, de a hazaiakban is, ideértve mind az átfogó nyelvészeti, nyelvfilozófiai reflexiókat (pl. Kenesei 2003; Németh T. 2008a;b), mind a pszichológiát (pl. Kiss 1997a;b; 2005). A relevanciaelmélet által az irónia megértéséről kínált modell természetesen nem az egyetlen, bizonyos alapvonásaiban nem is tekinthető teljesen újnak, s nem is részletező. Itt nem tekintjük át az alternatív modelleket, ezt több szerző megtette már – pl. maga Wilson és Sperber (1992), Giora (1995), empirikusan is ütköztetve őket Filik és Moxey (2010) – bár egyes mozzanatokra alább még visszatérünk. Sperber és Wilson szerint az irónia (és néhány, azzal összefüggő további trópus) lényegi jellegzetessége az, hogy az a (beszélői) gondolat, amelyet az ironikus kijelentés interpretál, már maga is interpretáció; mégpedig valaki más korábbi gondolatának, vagy a beszélő egy múltbéli gondolatának az interpretációja. Másképp fogalmazva, ezek a kijelentések szükségszerűen valaki más gondolatának másodrendű értelmezései. Tovább specifikálva az interpretált gondolat természetét, egy korábban már kifejtett elképzelésük, az echoikus említés elmélete (echoic mention theory) mellett érvelnek (Sperber–Wilson 1981; Wilson–Sperber 1981). Ennek lényege, hogy az irónia használatakor egy olyan vélekedést (saját korábbi, vagy másoktól származó, pl. konszenzuálisan osztott vélekedést) „visszhangoz” a beszélő, amelynek igaznak kellene lennie, de (az adott kontextusban) nem az. A visszhangzott vélekedésnek nem szükséges bármely adott személy által valaha is expliciten kifejezett hiedelemnek lennie. A befogadó feladata (leegyszerűsítve) az, hogy felismerje: a beszélő szándéka az, hogy emlékeztetve egy vélekedésre, amelynek igaznak kellene lennie, kifejezze, hogy az adott kontextusban az hamis. Érdemes megemlíteni, hogy eredeti érvelésükben Sperber és Wilson (1986) nem hivatkoznak empirikus módszertanokkal nyert eredményekre, hanem fogalmi-nyelvészeti elemzésekre építenek. Ugyanakkor épp a relevanciaelmélet megjelenésének évében közölt Gibbs (1986) olyan kísérleti adatokat, amelyek támogatják a fenti modellt. Gibbs két iróniamagyarázat, az echoikus említés elmélete és az úgynevezett sztenderd pragmatikai modell (standard pragmatic model) érvényességét tesztelte, részben olvasási idők, részben pedig emlékezeti teljesít-



Győri Miklós

mények összehasonlításán keresztül. Olyan kísérleti elrendezést alakított ki, ahol ugyanazt a mondatot minden esetben kétszer olvasták a kísérleti személyek, egyszer olyan kontextust követően, amely a mondat szó szerinti értelmezését determinálta, míg a másik esetben egy másik kontextusmondat ugyanazon célmondatot ironikus kijelentésként vezette be. A szerző egyrészt azt vizsgálta, vajon eltér-e az ugyanarra a mondatra adott megértési idő attól függően, hogy szó szerinti vagy ironikus kijelentésként kell értelmeznünk. Úgy vélte, ha a sztenderd pragmatikai modell a helyes, akkor hosszabb megértési idő szükséges ironikus kijelentésként, mint szó szerintiként. A feltevés hátterében az állt, hogy e modell szerint először a mondat szó szerinti jelentését dolgozzuk fel, kialakítva a mondatjelentés reprezentációját, s ezt egy utólagos kognitív művelettel fordítjuk az ellenkezőjére – de csak akkor, ha a szó szerinti jelentés nem illeszkedik a kontextusba. Az ironikus kijelentés esetében a sztenderd pragmatikai modell által jósolt hosszabb megértési időt a szükségesnek vélt további kognitív művelet, a jelentésnek az ellenkezőjébe történő transzformációja okozná. Az echoikus említés elmélete azonban nem feltételezi, hogy először a szó szerinti jelentést reprezentáljuk, s csak egy további művelettel juthatunk el a szándékolt jelentésig, így e modell helyessége esetén nem volt várható az ironikus kijelentésekre megnyúlt olvasási-megértési idő. Gibbs nem talált szignifikáns különbséget a két olvasási idő átlaga között, így arra következtetett, hogy ez a módszer az echoikus elmélet helyessége mellett szolgáltatott empirikus érvet, s nem támogatta a sztenderd pragmatikai modellt. Másik kísérleti eljárásában azt vizsgálta, van-e különbség a szó szerinti és ironikus kijelentésekre való emlékezés hatékonysága között, illetve összefüggés az ironikus kijelentésekre való emlékezés és az ironikus kijelentés „echoikussága” között (azaz mennyire expliciten megfogalmazott vélekedést visszhangoz az ironikus kijelentés). Ezekből az emlékezeti vizsgálatokból származó eredmények is az echoikus említés elméletét támogatták a sztenderd pragmatikai modellel szemben.

. A mentálisállapot-tulajdonítás kognitív alapjai „Nem áll szándékomban egész »beszélő életünket« bonyolult pszichológiai esetek seregével benépesíteni, nem reménykedem abban sem, hogy megoldok valamiféle, a szándékolásra vonatkozó pszichológiai talányt, de szeretnék röviden érvelni a mellett, hogy semmiféle speciális nehézség nem keletkezik azáltal, ahogy a »szándék« szót a jelentéssel kapcsolatban használom” – írja kulcsfontosságú munkájában Grice (1997, 196, ford. Terestyéni Tamás). Nos, a részben a relevanciaelmélet által inspirált hatalmas mennyiségű, nagyrészt empirikus, kisebb

Az irónia megértése autizmusban



részben fogalmi jellegű pszichológiai kutatás fényében Grice szándéka ellenére benépesedett a nyelv és a kommunikáció kutatása „bonyolult pszichológiai esetek seregével”; s úgy tűnik, még egy sor „speciális nehézség” is származott abból, hogy a szándék és a jelentés fogalma között ilyen szoros kapcsolat jött létre. Az elmúlt évtizedekben ugyanis a kognitív lélektan, ezen belül a kognitív fejlődéslélektan, majd később a kognitív idegtudományok egyik fő érdeklődési területévé vált az az emberi képesség, hogy különféle ágenseknek viselkedésük és kontextuális információk alapján mentális állapotok koherens halmazát tulajdonítsuk, s cselekvéseiket e tulajdonított mentális állapotok kölcsönhatásainak következményeként értelmezzük. Már az 1970-es évek végén fellendülő empirikus pszichológiai kutatás kezdetein világossá vált, hogy mind fogalmi hátterét, mind operacionalizációját, mind pedig a nyert adatok értelmezését tekintve igen összetett jelenségkörről van szó. (A hazai szakirodalomban például Kiss (2005) ma is jó forrás az alapvető kérdéseket és empirikus pszichológiai eredményeket tekintve; ezeket szűkebb fókusszal magam is tárgyaltam (Győri 2006); az igen gazdag nemzetközi szakirodalomban a filozófiai-fogalmi alapokról például Carruthers és Smith (1996) kötete nyújt jó tájékozódást.) Az alábbiakban erre a képességre és kutatási témára a hazai szakirodalomban elterjedt naiv tudatelmélet kifejezést fogom alkalmazni, amely az angol naive theory of mind fordítása (noha magam a „naiv elmeelmélet” fordítást pontosabbnak és helyénvalóbbnak vélem). Röviden utalni kell rá, hogy részben más tudományterületeken, részben a pszichológián belül is számos további címke is használatos a naiv tudatelmélettel rokon fogalmakra; így a mentalizáció, a népi vagy folk pszichológia (folk psychology), az elmeolvasás (mindreading), a mentálisállapot-tulajdonítás stb. Következik a fentiekből, de tegyük explicitté: a szándékok, köztük a Grice nyomán a relevanciaelmélet által konceptualizált kommunikációs és információs szándékok is mentális állapotok. Így, mai lélektani fogalmainkat alkalmazva, definíció szerint a naiv tudatelméleti képességünk segítségével tulajdonítjuk őket különféle ágenseknek. Azaz, komolyan véve a relevanciaelmélet (és általában a szándékalapú jelentés-, pragmatika- és kommunikációelméletek) kognitív-lélektani implikációit, arra a következtetésre jutunk, hogy a naiv tudatelméleti képesség működése előfeltétele a rugalmas emberi kommunikációnak, beleértve ebbe a kommunikatív nyelvhasználatot is. Annál is inkább feltételezhető ez, mert a szándékokat, mint a többi mentális állapotot, más mentális állapotok kontextusában, azokkal szoros szemantikai-logikai összefüggésben tulajdonítjuk. Mint két bekezdéssel korábban utaltam rá, a naiv tudatelméleti képesség kutatása a modern kognitív lélektan és kognitív (ideg)tudományok egyik kitüntetett területe, így természetesen messze túlmutatna a jelen tanulmány keretein



Győri Miklós

a főbb konszenzusok és viták akár csak felületes áttekintése is. Ehelyett tehát csak néhány olyan következtetést összegzek röviden, amelyek véleményem szerint jól megalapozottnak tekinthetők az immár három és fél évtizedes kutatómunka eredményeképpen, és a naiv tudatelméleti képesség kulcsfontosságúnak tűnő jellegzetességeit érintik. Noha mentálisállapot-tulajdonításra utaló viselkedéseket más fajoknál is kimutattak etológiai és összehasonlító lélektani vizsgálatok, a jelenleg rendelkezésre álló bizonyítékok a naiv tudatelméleti képességet az emberre jellemző összetettségében inkább humánspecifikusnak mutatják (pl. Penn et al. 2008). Ma már számos kísérleti eredmény szól a mellett, hogy a tipikus emberi kognitív fejlődés során a második életévben már működik vélekedéstulajdonítás (pl. Onishi–Baillargeon 2005). Ez a képesség komplexitásával összevetve igen korai kibontakozás – más, itt nem kifejtett érvekkel együtt – az elsajátítás specifikus biológiai megalapozottságára utal. Ebbe az irányba mutat a képesség kulturálisan univerzális jelenléte is (nem tudunk olyan kultúráról, amelynek ne lenne része az emberi viselkedések mentális állapotokkal történő magyarázata), valamint bizonyos fejlődési mérföldkövek szintén univerzálisnak tűnő szekvenciája. Ugyanakkor egyértelmű, hogy számos kultúraspecifikus mozzanat is megjelenik a mentális állapotok konceptualizációjában és az attribúciókat működtető elvekben. Mind fejlődési, mind szerzett sérülésekből (így például afáziás esetekből) nyert adatok azt mutatják, hogy a mentálisállapot-tulajdonítás – a nyelv, elsősorban a grammatika feltételezett autonómiájával párhuzamba állíthatóan – mutat bizonyos mértékű funkcionális önállóságot. Másrészt azonban az is jól dokumentált, hogy a fejlődés néhány mozzanatában szoros kölcsönhatás zajlik a nyelvelsajátítás és a naiv tudatelméleti fejlődés között (magyarul l. Győri et al. 2004). Neurális alapjai közül – melyek minden bizonnyal a központi idegrendszer számos struktúráját magukban foglalják – adatokkal igen jól alátámasztott az elülső homloklebenynek (prefrontális kéreg) és a halántéklebeny középvonali régiójának (mediális temporális kéregterületek) a szerepe (l. Spotorno et al. 2012).

. Az autizmus jelenségköre és jelentősége a pragmatikai vizsgálódások számára Az autizmus – vagy tágabban fogalmazva: az autizmus spektrum zavarok (autism spectrum disorders) – iránt az 1980-as évek közepe óta intenzív és sok irányból jelentkező érdeklődés egyik vezérmotívuma éppen a nyelv, a kommunikáció és a kogníció fejlődési és funkcionális kapcsolatainak mélyebb megértése, amelyre ez a sajátos emberi fejlődési pálya különleges lehetőséget kínál (l. erről pl. Győri

Az irónia megértése autizmusban



2006). Ennek egyik aspektusaként az 1990-es években komoly figyelmet kapott az a hipotézis, amely szerint az autizmus esetében a nyelvi és a kommunikációs folyamatok sajátos fejlődési disszociációját látjuk. Ezen értelmezés szerint a „tiszta” esetekben a (szűken értelmezett) nyelvi rendszer ép, miközben a kommunikatív funkciók sérültek (mind a verbális, mind a nonverbális aspektusok), s ez utóbbi sérülés hátterében a mentálisállapot-tulajdonítás, azaz a naiv tudatelméleti képesség zavara áll (pl. Frith–Happé 1994; Happé 1993; 1994b, magyarul: Győri megj. előtt; Hahn–Győri 2008). Mint általában a kognitív tudományokban és a pszicholingvisztikában, a disszociációs (moduláris) magyarázat itt is élénk vitához vezetett, mivel mind klinikai szempontból, mind a kognitív hátteret tekintve, mind pedig átfogó teoretikus nézőpontból komoly ellenérvek merültek fel. Az alábbiakban előbb néhány alapvető információt közlök az autizmusról, részben annak sajátos nyelvi-kommunikációs jellegzetességeiről, s majd a következő szakaszban fordulok az iróniamegértés kutatásának részletesebb bemutatásához.

.. Az autizmus néhány alapvető jellegzetessége Az autizmus neurokognitív fejlődési zavar, hátterében az idegrendszer atipikus fejlődése húzódik meg. Ez az atipikus idegrendszeri szerveződés mai ismereteink szerint többnyire már születés előtt jelen van, s a későbbiekben sem tér vissza a tipikus útra, ez kezeléssel sem idézhető elő. Egész életen át fennálló, bár dinamikusan változó – s az esetek nagy többségében egyre enyhébb viselkedéses eltéréseket okozó – humán fejlődési variációról van szó. Ma úgy látjuk, elsősorban genetikai tényezők eredményeképpen áll elő, ugyanakkor környezeti tényezők szerepét is feltételezzük, noha természetüket és szerepüket nem ismerjük egészében (összefoglalóért l. Sokol–Lahiri 2011, magyarul röviden Győri 2012). Az esetek egy kis hányada részben vagy egészében születés körüli agyi sérülés eredménye (Bailey et al. 1996). Noha gyorsan növekszik tudásunk a sajátos idegrendszeri mintázatokról, még nem teszi lehetővé e zavarok neurális jegyek alapján történő felismerését, így a diagnózis továbbra is viselkedéses jegyeken alapul. Így az autizmus spektrum zavarok mai meghatározásának alapja minőségi fejlődési zavar a viselkedések három területén: (1) a kölcsönös társas viselkedésekben, (2) a kölcsönös kommunikatív viselkedésekben, és (3) az érdeklődés és a tevékenység adaptív, rugalmas szerveződésében. Hagyományosan a kölcsönös társas és kommunikatív viselkedések zavarát tartjuk az autizmus domináló jellegzetességének. Miközben számos társas és kommunikációs viselkedésmintázat jelen lehet a személy



Győri Miklós

repertoárjában, a markánsan sérült mintázatok mindig a reciprocitással (kölcsönösséggel) kapcsolatosak: a korlátok a másik személy perspektívájának és belső állapotainak a megértésével, és a saját társas-kommunikatív viselkedésekben történő figyelembe vételével kapcsolatosak. A kommunikatív viselkedések zavarai mind a nyelvi, mind a nem nyelvi kommunikációban jelentkeznek. A korlátok megnyilvánulnak mind a személy saját aktív kommunikatív viselkedéseiben (ritkán ezek szinte teljes hiányaként), mind pedig mások kommunikatív viselkedéseinek értelmezésében. Akárcsak az autizmus szinte minden jellegzetessége esetében, itt is érvényes, hogy rendkívül tág az egyéni változatosság tere, jelentős változások történnek a fejlődéssel. Az alapvető tendencia pozitív (enyhülő korlátok, fejlődő képességek), ugyanakkor a nehézségek (többnyire enyhébb formában) egész életében elkísérik a személyt. Mind fogalmilag (a definitív jegyeket tekintve), mind a ténylegesen megjelenő tüneti mintázatokat illetően igaz az, hogy szorosabban vett nyelvi zavar (azaz a nyelv formális aspektusainak a nyílt viselkedésben megnyilvánuló eltérése) nem feltétlenül van jelen az autizmus spektrum zavarok minden esetében. Ugyanakkor a nyelv pragmatikai aspektusainak és kommunikatív használatának valamilyen eltérése az esetek döntő többségében jól kimutatható (feltételezhetően: minden esetben; l. Eigsti et al. 2011) és diagnosztikus jelentőségű. Itt nem térünk ki arra a teoretikus szempontból is fontos és igen összetett kérdésre, jellemzik-e az autizmus spektrumot átfogóan sajátos (de az esetek többségében nyilvánvalóan igen finom) eltérések a nyelv formális aspektusaiban, elsősorban a grammatikában. A kérdést részletesebben tárgyalja Eigsti et al. (2007; 2011); Kjelgaard–TagerFlusberg (2001); Tager-Flusberg–Joseph (2003); Tager-Flusberg et al. (2005); magyarul pedig Győri (megj. előtt) ad rövid áttekintést.

.. Pragmatika autizmusban A pragmatikai zavaroknak tehát kiemelt helyük van az autizmus spektrum zavarok nyelvi-kommunikációs profiljában. Itt is igen fontos szem előtt tartani a felszíni (viselkedéses) variabilitást. Az erősen érintett esetekben nem beszélhetünk pragmatikáról: nem csak azért nem, mert egyáltalán nincs jelen nyelvi kompetencia, amelynek pragmatikai aspektusai megjelenhetnének, de nem látunk olyan nem verbális kommunikatív aktusokat sem, amelyekkel kapcsolatban a nem nyelvi kommunikatív cselekvés pragmatikai aspektusai (pl. utalás, cselekvőváltás stb.) megvalósulhatnának. Ezzel szemben számos olyan ún. „magasan funkcionáló” személy is kap autizmus spektrum zavar diagnózist, akinél a jelenlévő pragmatikai sérülések első pillantásra nem feltétlenül szembetűnőek,

Az irónia megértése autizmusban



s esetleg csak a személy nyelvi-kommunikatív viselkedésének számos szituációra és kontextusra kiterjedő megfigyelése nyomán érhetőek tetten. Az alábbiakban a pragmatikai eltérések néhány jellegzetes aspektusát említjük igen röviden. A nemzetközi szakirodalom egy újabb hulláma friss tájékozódási lehetőséget jelent ezek és itt nem említett további kérdések (pl. prozódiai eltérések, deixis) kapcsán is – pl. Lam–Yeung (2012); Loukusa–Moilanen (2009); Peppé et al. (2006); Tager-Flusberg et al. (2005).

... A kommunikatív funkció zavarai és beszédaktusok Az autizmus korai tünetei között gyakori, hogy a gyermek viselkedésében látszólag nem vagy igen kevéssé érvényesül a nyelvhasználat kommunikatív funkciója. Erre utal például, ha nem reagál spontán és szelektív módon mások beszédére. Ugyanakkor adott esetben saját beszédét sem kommunikatív funkcióval használja: gyakoriak a monológok, a gyermek tevékenységét közlési cél nélkül kísérő beszéd, s ide sorolható – noha nagy változatosságot mutat abban, milyen mértékben és módon kommunikatív a használata – a késleltetett echolália jelensége is. Autizmussal élő gyermekek kötetlen helyzetekben kevesebb és kevésbé változatos beszédaktust produkálnak, mint az illesztett kontrollszemélyek, még akkor is, ha egyébként formális értelemben vett nyelvi kompetenciájuk megegyezik tipikusan fejlődő társaikéval (pl. Landry–Loveland 1989; Ziatas et al. 2003).

... Zavarok a társalgási készségekben A társalgás kezdeményezésével, adekvát fenntartásával, megfelelő lezárásával, a beszélőváltással, a másik személy információs állapotának megfelelő monitorozásával kapcsolatban egyaránt mutatnak nehézségeket autizmussal élő személyek, miközben nem jellemzi őket ebből a szempontból következetes mintázat (l. pl. Chuba et al. 2003, idézi Tager-Flusberg et al. 2005). A feltáró-leíró jellegű, elsősorban megfigyeléses adatgyűjtést alkalmazó vizsgálatok eredményei mellett elméletvezérelt-kísérleti módszertanú vizsgálatok is születtek e területen. Így például Surian et al. (1996) azt mutatta ki, hogy autizmussal élő gyerekek illesztett tipikusan fejlődő kortársaiknál kevésbé követik a grice-i társalgási maximákat.

... A nem szó szerinti nyelvhasználat zavarai A túlzott szó szerintiség, a nem szó szerinti nyelvhasználat zavara az egyik legmarkánsabb pragmatikai sajtosság autizmusban. Még igen jó nyelvi és intellektuális képességekkel rendelkező, felnőtt személyeknél is megjelenik, noha finomabb formában, mint gyermekkorban. Számos érintett személy használ és ért



Győri Miklós

nem szó szerinti fordulatokat, ezek azonban igen gyakran idiomatikus vagy a személy által visszatérően alkalmazott nyelvi alakzatok, amelyek meghatározott beszédhelyzetekhez is kötődhetnek. Az igazi korlát a nyelv kreatívan nem szó szerinti alkalmazásában, illetve mások változatos szituációkban megjelenő, változatos nem szó szerinti kijelentéseinek megértésében jelentkezik markánsan. Autizmusban mindenfajta nem szó szerinti nyelvi forma megértésének és produkciójának zavarát tapasztalhatjuk, de, amint Happé (1993) alább részletesebben tárgyalt klasszikus munkája kiválóan példázza, jelentős fokozatbéli eltéréseket tapasztalhatunk a tekintetben, milyen fajta alakzatok megértése van még a személy korlátain belül.

.. Mentálisállapot-tulajdonítási zavar és nyelv–kommunikáció disszociáció Mint utaltam rá, az 1990-es években felmerült egy olyan teoretikus magyarázat az autizmusban megfigyelhető nyelvi-kommunikatív sérülések alapvető mintázatára, amely erős hatással volt a terület kutatására, s nagyban hozzájárult az autizmusra irányuló figyelem további növekedéséhez. E disszociációs magyarázat (l. pl. Frith–Happé 1994; Happé 1994b) témánk szempontjából lényeges tételei három pontban összegezhetők (részletesebb elemzéséért magyarul l. Győri megj. előtt). . Az autizmus teljes jelenségkörének alapvető kognitív magyarázata a mentálisállapot-tulajdonítás (naiv tudatelméleti képesség) zavara. Egy, eredetileg Baron-Cohen és munkatársai (1985) nevéhez köthető kognitív hipotézis szerint az autizmus spektrum zavarok minden definitív tünetét az okozza, hogy az autizmussal élő személyek nem, vagy csak minőségileg korlátozott mértékben képesek felismerni mások belső, mentális állapotait (intencionális állapotait). Feltevésük szerint ez a képesség idegrendszeri okoknál fogva hiányzik vagy korlátozott autizmusban, s ez a kognitív zavar vezet az autizmus minden lényegi tünetéhez – például, azért mutatnak a kölcsönös kommunikatív viselkedések súlyos zavarokat, mert az érintett személy nem képes felismerni a mások kommunikatív viselkedései mögötti szándékokat, s saját kommunikatív viselkedéseit nem képes mások belső állapotaihoz igazítani. . A nyelv formális aspektusainak sérülése nem tartozik az autizmus lényegi vonásai közé. Frith és Happé hangsúlyozza, hogy számos kifejezetten nyelvi jellegű sérülést, sajátosságot figyelhetünk meg az autizmus spektrum zavarokban érintett személyeknél. Ugyanakkor azonban felhívják a figyelmet arra, hogy a nyelv formális értelemben (és hangsúlyozzuk: klinikailag) ép számos autizmus-

Az irónia megértése autizmusban



sal élő embernél. Ebből véleményük szerint az következik, hogy a szorosan vett nyelvi zavar nem tartozik esszenciálisan az autizmushoz, annak „tiszta” megjelenési formáját ép nyelv jellemzi (a nyelv szűk, formális értelmében). . Az autizmusban megfigyelhető kommunikációs és pragmatikai zavarok alapvetően a mentálisállapot-tulajdonítás zavarából származnak. Elsősorban Happé (1993; 1994b) érdeme, hogy e ponton kreatív módon integrálja az autizmus klinikai leírását a tudatelméleti magyarázattal, illetve a humán kommunikáció szándékalapú átfogó magyarázataival, elsősorban a relevanciaelmélettel. Elfogadva ugyanis a relevanciaelmélet és más szándékközpontú kommunikációelméletek központi feltevését, amely szerint a szándékkifejezés és a szándéktulajdonítás képezi a komplex humán kommunikáció központi kognitív mechanizmusát, arra a következtetésre jutunk, hogy a szándéktulajdonítás képessége nélkül nem lehet valaki részese a rugalmas, komplex, kölcsönös humán kommunikációs interakcióknak. Mivel a szándék mentális állapot, s az autizmust erősen jellemzi a mentálisállapot-tulajdonítás zavara, így feltételezhető, hogy a sérült szándéktulajdonítás áll a kommunikációs zavarok mögött. Noha empirikus szempontból is igen összetett kérdésről van szó, az 1980-as, 1990-es években jelentős mennyiségű bizonyíték gyűlt össze a mellett, hogy autizmussal élő személyek (elsősorban gyermekek) valóban atipikus korlátokat mutatnak a tudatelméleti képesség területén – l. erről pl. Baron-Cohen et al. (1985); Frith (2003); Győri (2003; 2006). A fenti disszociációs magyarázat vonzerejét emellett, úgy tűnik, részben az jelentette, hogy feltevéseiben és érvrendszerében is illeszkedett néhány széles körben elfogadott, noha egyben intenzíven vitatott kognitív, nyelvi és/vagy kommunikációs (meta)elmélethez. Így például a kognitív architektúra nativista-moduláris felfogásaihoz (pl. Fodor 1983); a nyelv szintén nativista és moduláris, noha nem feltétlenül „fodori” szellemű megközelítéseihez (pl. Chomsky 1995; Pinker 1994/1999); illetve a relevanciaelmélethez. Nem meglepő módon ugyanezek a sajátosságok a hipotézist erősen kérdőjelessé tették a más teoretikus alapállásokból. Maga a disszociációkkal érvelő nativistamoduláris metaelmélet alapjaiban kérdőjeleződik meg például a már az 1990-es években erősen jelen lévő, azóta pedig, úgy tűnik, számos területen dominánssá vált neokonstruktivista, neurokonstruktivista nézőpontból tekintve (pl. Mareschal et al. 2007; Müller 1996; Quartz–Sejnowski 1997). Ezen felfogások számára nem csak a metateoretikus keret, de olyan feltevések is kevéssé kézenfekvőek, mint hogy a nyelv „szigetszerűen” tipikusan működhet egy markánsan atipikus kognitív fejlődési zavarban (a „reziduális normalitás” feltevése); vagy hogy egy igen komplex fejlődési jelenséget egyetlen kauzális tényező magyarázhatna (l. pl. Thomas–Karmiloff-Smith 2002).



Győri Miklós

. Iróniamegértés autizmusban: empirikus eredmények és formálódó magyarázatok A fentiek, szándékom szerint, felvázolták azt a tágabb teoretikus-metateoretikus kontextust, amelyben az autizmussal élő személyek iróniamegértésének empirikus vizsgálata elhelyezhető, s demonstrálták, hogy igen alapvető szemléleti kérdések diszkussziójában jutnak, juthatnak szerephez az itt nyert eredmények. Az alábbiakban ezeket tárgyalom, erős hangsúllyal saját kísérleti munkáim eredményein.

.. Happé (1993) úttörő tanulmánya és korlátai Happé (1993) már többször említett munkája a naiv tudatelmélet és a kommunikációs kompetencia fentebb vázolt, a relevanciaelmélet által (is) feltételezett kapcsolatából indult ki. Ebből az következik, hogy egy személy által megértett nem szó szerinti alakzatok komplexitása attól függ, mennyire komplex kommunikatív szándékokat képes a személy felismerni és reprezentálni. Így, közeledve Happé konkrét empirikus hipotéziseihez, az irónia vagy szarkazmus megértése vélhetően nehezebb az autizmussal élő személyeknek (is), mint a metaforák megértése, mert az előbbi feltehetően (legalább) másodfokú szándéktulajdonítást igényel (szándékba ágyazott vélekedés megértését), míg az utóbbihoz elegendő az első fokú szándéktulajdonítás. Az explicit hasonlat feldolgozása nem kíván intencionalitástulajdonítást (l. a feltevésről részletesebben Happé i.m.; Sperber–Wilson 1986; Győri 2006). Happé hivatkozott munkájában ki is mutatta ezt az összefüggést a tudatelméleti teljesítmény három szintje és e három alakzat megértése közt. Autizmussal élő, jó formális nyelvi képességekkel rendelkező kísérleti személyeit három csoportba osztotta. Kialakított egy olyan csoportot, amely vélhetően nem rendelkezett tudatelméleti képességgel (nem volt képes helyesen megoldani első fokú vélekedéstulajdonítási feladatokat), egy másik csoportot, amely csak első fokú mentális állapotokat volt képes tulajdonítani, és egy harmadik csoportot, amelynek tagjai másodfokú mentális állapotokat is képesek voltak tulajdonítani (olyan, egymásba ágyazott vélekedéseket, mint pl. János nem tudja, hogy Mari tud a találkozóról). Egyszerű feladatokat adott nekik, amelyekben háromféle alakzatot kellett megérteni: hasonlatokat, metaforákat, és ironikus kijelentéseket. Azt várta, hogy amennyiben helyesek a relevanciaelmélet predikciói, akkor a hasonlatot mindhárom csoport meg fogja érteni, míg a metaforát és az iróniát már nem érti az a csoport, amelyik nem rendelkezik naiv tudatelmélettel, s az iróniát már

Az irónia megértése autizmusban



csak a másodfokú naiv tudatelméleti képességgel rendelkezők lesznek képesek értelmezni. Pontosan ezt az eredményt kapta, s ez a relevanciaelmélet egyik első empirikus megerősítésének is tekinthető. (További példákkal szolgál Henst– Sperber 2004.) Az 1. táblázat szemlélteti a vizsgálati elrendezést és az eredmények lényegi mintázatát. 1. táblázat: A Happé (1993) által végzett vizsgálatban alkalmazott elrendezés és az ered-

mények alapvető mintázata (Hahn–Győri 2008 nyomán)

Happé tanulmányára máig gyakran hivatkoznak mind az autizmus kognitív és kommunikációs jellegzetességeinek, mind a relevanciaelméletnek az empirikus irodalmában. Fontos ugyanakkor látni, hogy legalább négy okból óvatosnak kell lennünk következtetései elfogadásával. Egyrészt, egy ilyen komplex jelenség kapcsán naturalista módszertani keretek közt mindig konvergáló bizonyítékokat várunk el egy hipotézis elfogadása érdekében. Önmagukban is igen figyelemre méltóak Happé eredményei, de feltétlenül szükség van további megerősítésekre. Másrészt – s az előbbi megjegyzést mintegy illusztrálva is – egyes releváns adatok igen ellentmondásosak. E tanulmány második szakaszában említettük



Győri Miklós

Gibbs (1986) kísérleti eredményeit, amelyek az irónia echoikus említés elméletét, s ezzel a relevanciaelméleti értelmezést támasztották alá, s Happé (1993) is ilyenként idézte őket. Fontos jelezni, hogy más szerzők később Gibbsének ellentmondó adatokat kaptak (Giora 1995; 1998, l. McDonald 1999 is): ők azt találták, hogy ugyanazon kijelentés szó szerinti értelmezésének kialakítása kevesebb feldolgozási időt igényelt, mint az ironikus értelmezésé. Harmadszor, igen fontos körülmény, hogy legalább két, az iróniamegértés szempontjából is jelentős további kognitív eltérés is széles körben jelen van az autizmussal élő személyeknél. Az egyik az ún. gyenge centrális koherencia vagy részletközpontú feldolgozás, a beérkező információk tipikusnál gyengébb spontán integrációja a kontextusra érzékeny módon. A másik az ún. végrehajtó működések (executive functions) zavara, azaz a belső folyamatok gyengébb koordinációja összetett viselkedésekben (részletesebben: Győri 2003; 2006; Happé 1999; Happé–Frith 2006; Hill 2004; Russell 1997). Számos empirikus eredmény mutat arra, hogy autizmusban a nyelvi-kommunikációs korlátokhoz a naiv tudatelméleti nehézségeken kívül hozzájárulnak mind a koherenciateremtési eltérések (pl. Frith–Snowling 1983; Joliffe–Baron-Cohen 1999), mind a végrehajtó működések zavara (Bishop–Norbury 2005a;b). Fontos tisztázandó kérdés, mennyiben és milyen mintázatban jutnak ezek szerephez az iróniamegértés nehézségeiben. Negyedszer, felvethető, vajon azok az autizmussal élő személyek, akik képesek az irónia megértésére, vajon ugyanazokkal a feldolgozási folyamatokkal oldják-e meg ezt a feladatot, mint a tipikus személyek. Ezt a kérdéskört mutatom be alább röviden, elsősorban saját kísérleti eredményeimen keresztül.

.. „Valódi” iróniamegértés vagy „kerülőutas” pragmatikai stratégiák Klinikai és laboratóriumi megfigyelések is utalnak arra, hogy azok az autizmussal élő személyek, akik képesek mentális állapotokat tulajdonítani, olyan kognitív folyamatokra támaszkodva teszik ezt, amelyek lényegileg eltérnek a tipikustól. E kompenzációs feltevés szerint (l. Győri 2006; Győri et al. 2002; Happé 1994a) e személyek valójában nem birtokolják a naiv tudatelméleti képességet, s így nem is reprezentálnak mentális állapotokat. Ehelyett általános problémamegoldó rendszereikre támaszkodva valamilyen alternatív, atipikus stratégiát alkalmaznak e feladatok megoldása során – azaz, elképzelhető, hogy esetükben az irónia megértése nem a szándéktulajdonításon alapul. Egy ilyen kompenzációs jellegű, alternatív stratégia, amennyiben létezik, feltehetően csak kis számú, jól körülírt és kevéssé összetett helyzetben alkalmazható, szemben a tipi-

Az irónia megértése autizmusban



kus mentálisállapot-tulajdonítás működésének alapvetően rugalmas és produktív jellegével. Happé egy másik empirikus tanulmányának eredményei (Happé 1994a) utalnak arra, hogy legalábbis egyes autizmussal élő személyeknél valóban ilyen „nem-mentalizációs” kerülőutas stratégiák állhatnak legalábbis egyes társas és kommunikatív teljesítmények mögött. Egy kísérletsorozatunk (Győri et al. 2002; 2004; Győri 2006) – egyéb kérdések mellett – éppen annak tisztázására irányult, vajon valódi mentálisállapot-tulajdonítás, vagy valamilyen kerülőutas pragmatikai stratégia áll az iróniamegértés mögött autizmussal élő személyeknél. Az I. vizsgálatban 22 autizmus spektrum zavarral élő felnőtt személy (4 nő és 18 férfi) vett részt, és hozzájuk intellektuális képességekben illesztett, autizmust nem mutató személyek egy 21 fős csoportja. A kísérleti helyzetben fejenként összesen 30 rövid történetet olvastak egy számítógép monitorán, önidőzített, mondatonkénti bemutatással, és minden történetet követően két eldöntendő kontrollkérdésre válaszoltak a billentyűzet lenyomásával. Minden történet utolsó mondata a főhős egy kijelentése volt (célkijelentés). Amikor ennek elolvasása után a résztvevő lenyomta a szóköz billentyűt, egy (eldöntendő) interpretációs kérdés jelent meg. Ez egy értelmezést kínált a beszélő által szándékolt jelentésről (pl. Valójában Zoli úgy értette, hogy az ebéd tényleg finom?). A résztvevőnek az „igen” vagy a „nem” billentyű lenyomásával kellett jeleznie, hogy helyesnek tartja-e ezt az értelmezést. Ekkor az interpretációs kérdés helyett egy szintén eldöntendő jellegű érzelmiállapot-kérdés jelent meg, amely arra vonatkozott, milyen érzelmi állapotban volt a főhős, amikor a célkijelentést tette (pl. Amikor Zoli ezt mondta, csalódott volt?). Amikor a vizsgálati személy erre is válaszolt, egy üzenet jelent meg a képernyőn, amely pihenőt ajánlott fel a vizsgálati személynek, és jelezte, hogy a szóköz billentyű lenyomásával kezdheti a következő történet olvasását. Íme, a teljes példa: ()

Zoli minden nap otthon ebédelt, általában konzervet. Ma finom ebédet akart. Elő is keresett a kamrából egy töltöttkáposzta-konzervet. Amikor felbontotta, kiderült, a konzerv már megromlott, és nagyon büdös lett. Zoli undorodva azt mondta: Ez aztán a finom ebéd! VALÓJÁBAN ZOLI ÚGY ÉRTETTE, hogy az ebéd tényleg finom? AMIKOR ZOLI EZT MONDTA, csalódott volt?

Az ingertörténetek mindig 6 mondatból álltak, ahol a 6. mondat a főhős egy kijelentése volt. A 28 ingertörténetből 16 esetben az interpretációs kérdésre pozitív



Győri Miklós

volt a helyes válasz, ezeket tekintettük céltörténeteknek, és vontuk bele reakcióidő- és hibaarány-elemzésekbe. A fennmaradó 12 történet esetében az interpretációs kérdésre elvárt válasz negatív volt, ezek csak a hibaelemzésbe kerültek be. Az érzelmiállapot-kérdésre elvárt válasz mind a cél-, mind a töltelék történetek felénél pozitív, felénél negatív volt, de ezeket a válaszokat csak a hibák mentén elemeztük. A történetek 50-a végződött szó szerint értett kijelentéssel, míg a másik 50 esetében ironikus volt a kulcskijelentés. A kompenzációs mechanizmusokra vonatkozó sejtésünk az volt, hogy az ironikus kijelentések értelmezése, mint feladat, lehetőséget biztosít lokális inkoherenciajegyek alapján történő következtetésre. Ezt alkalmazva a személy anélkül, hogy a kontextus egészét a benne részt vevő ágensek belső állapotai figyelembevételével feldolgozta volna, pusztán az ironikus kijelentés szó szerinti jelentése és bizonyos egyszerű, felszíni jegyek közötti nyílt ellentmondást észlelve döntene úgy, hogy a kijelentést ellenkező jelentésben kell értelmezni. Egy ilyen stratégia, úgy tűnik, a nem autizmussal élő személyeknél is működik, ha hiányzik a teljes kontextus, de jelen van „lokális inkoherenciajegy”. Könnyedén detektálható például a kijelentés ironikus volta az alábbi esetben: János dühösen azt mondta: Ez a nap nagyon jól sikerült!. Ezt a hipotetikus stratégiát lokális jegyek alapján történő rövidre zárási stratégiának neveztük el. Akkor fogadtunk el helyesen megválaszoltnak egy történetet, ha mind az interpretációs, mind az érzelmi kérdés esetében helyesen válaszolt a személy. Autizmussal élő kísérleti személyeink teljesítményét a helyesen megválaszolt történetek aránya alapján az 1. ábra mutatja. Figyelemre méltó, hogy mindössze egyetlen személy teljesített a teljesen véletlenszerű válaszadás esetén várható 25-os teljesítmény közelében (a BZS kódú személy). Az e fölött álló legalacsonyabb tapasztalt érték 50 (SMA teljesítménye), amelynek valószínűsége véletlen válaszadás esetén p = 0,0027; a tökéletes feladatmegoldás valószínűsége random válaszadási stratégia esetén elhanyagolható. A teljesítményadatok tehát azt sugallják, hogy – előzetes várakozásunkkal éles ellentétben – kísérleti személyeink többsége képes volt egy kijelentés ironikus voltának felismerésére, a beszélő kommunikációs szándékának és az ezzel összefüggő érzelmi állapotának a kikövetkeztetésére. Az intuícióellenesen magas, noha az autizmust nem mutató kontrollszemélyekétől így is szignifikánsan elmaradó teljesítmény magyarázatára ugyan egy kompenzációs mechanizmus működése kínálkozik, ám a jelen kísérletben alkalmazott feltételezett kompenzációs ingerváltozó, a lokális inkoherenciajegyek jelenléte vs. hiánya mentén végzett statisztikai elemzés nem mutatott szignifikáns különbséget. Így – noha a kompenzációs stratégia alkalmazása továbbra is valószínűsíthető maradt – nem sikerült kimutatnunk annak mechanizmusát. S nem

Az irónia megértése autizmusban



1. ábra: Autizmussal élő kísérleti személyeink teljesítménye a helyesen megválaszolt tör-

ténetek arányában az írott irónia megértését vizsgáló feladatban (Győri et al. 2002 nyomán)

vált elvethetővé az a magyarázat sem, hogy kísérleti személyeink többsége valódi mentálisállapot-tulajdonítás révén tulajdonította a megfelelő kommunikatív szándékot és azzal koherens érzelmi állapotot. II. vizsgálatunk célja annak tisztázása volt, valóban mentalizációs feldolgozási stratégián alapulnak-e az I. vizsgálatban mutatott teljesítmények, vagy egy olyan további lehetséges kompenzációs stratégián, amelynek jelenlétét nem kontrolláltuk az első vizsgálatban. Most tehát azt feltételeztük, hogy működhet egy olyan kompenzációs stratégia, amelynek a fő algoritmikus lépései a következők: ()

1. reprezentáld a kijelentés szó szerinti jelentését! 2. reprezentáld a világ pillanatnyi állapotát a kontextus alapján! 3. vesd össze a két reprezentációt, összhangban vannak-e? 4a. HA IGEN: következtess arra, a beszélő „szó szerint” beszélt 4b. HA NEM: következtess arra, a beszélő nem szó szerint beszélt; vedd kijelentése szó szerinti jelentésének az ellenkezőjét, mint „valódi jelentést”!

Azaz elegendő lehet, ha a személy észleli az ellentmondást egyrészt a világ pillanatnyi állapota, másrészt a kijelentés szó szerinti jelentése között, és amennyiben nyílt ellentmondást tapasztal, ellenkező értelműként kezeli a kijelentést. Az I.



Győri Miklós

vizsgálatban alkalmazott ingertörténetek megengedtek egy ilyen stratégiát, amelyet mi valóságalapú rövidre zárási stratégiának neveztünk el. Annak érdekében, hogy ellenőrizzük, kísérleti személyeink ezt, vagy szándéktulajdonításon alapuló stratégiát alkalmaznak-e, olyan feladathelyzetet alakítottunk ki, ahol a két stratégia alkalmazása eltérő válaszokhoz vezet. Olyan ironikus befejezésű történeteket alkottunk tehát, amelyekben a főhősnek a világ pillanatnyi állapotáról hamis vélekedései vannak, így ezek fényében tett, ironikusnak szánt kijelentése valójában szó szerint igaz (pl. valaki ironikusan azt mondja: Na, ma aztán szép idő van!, mert nem tudja, hogy közben odakint elállt az eső és süt a nap). Az ilyen történeteket hamis ironikus történeteknek neveztük el, a feladatot pedig hamis irónia feladatnak. Egy másik, teljes példa: ()

János házat épített, és megkérte a testvérét, jöjjön el a hét végén segíteni. Az meg is ígérte, hogy szombaton reggel nyolckor ott lesz az építkezésen. János nagyon örült ennek, mert remélte, többen jobban haladnak majd. Szombaton reggel tízig várta a testvérét, ám az nem jött el. Ekkor szomorúan elment, mert dolga volt, és egész hétvégén nem volt ideje visszamenni az építkezésre. Nem tudta, hogy testvére szombat délben megérkezett, és egész hétvégén a többiekkel dolgozott a házon. János így csak annyit mondott neki, amikor hétfőn találkoztak: Te igazán sokat segítettél! VALÓJÁBAN JÁNOS ÚGY ÉRTETTE, hogy egyáltalán nem segített? AMIKOR JÁNOS EZT MONDTA, hálás volt?

Ha a személy a hamis irónia teszt megoldása során szándéktulajdonítást végez, s így a beszélő kijelentését annak vélekedései kontextusában értelmezi, akkor a kijelentést ironikusnak fogja tekinteni (annak ellenére, hogy szó szerint igaz); míg ha a feltételezett kompenzációs stratégiát alkalmazza, akkor a kijelentést a világ pillanatnyi állapotának fényében értelmezi, és nem ironikusnak, hanem szó szerinti értelműnek fogja találni (annak ellenére, hogy a beszélő ironikusnak szánta). Tizenhat, autizmus spektrum zavarral élő személy vett részt a II. vizsgálatban (13 férfi és 3 nő). Az ingerek bemutatásának, a személy válaszadásának és az adatok rögzítésének módja megegyezett az I. vizsgálatban alkalmazottal. A személyek 2 gyakorló történetet, majd 17 ingertörténetet olvastak. Az ingertörténetek legfeljebb 8 mondatból álltak, ahol az utolsó mondat a főhős egy kijelentése volt. A 17 ingertörténetből 3 hamis ironikus történet volt, 1 pedig hamis szó

Az irónia megértése autizmusban



szerinti történet, ahol a személy téves vélekedésén alapulva tesz egy kijelentést, amely szó szerinti jelentésében értelmezendő, ám ellentmond a világ pillanatnyi állapotának. A történetek nem tartalmaztak lokális inkoherenciajegyeket. Az eredmények részben erősen arra utalnak, hogy (1) az autizmussal élő személyek egy része képes összetett szándéktulajdonításra, s az iróniamegértés esetükben ezen alapul: 5 vizsgálati személyünk ebben a vizsgálatban minden történet esetében mindkét kérdésre helyesen válaszolt. (A tökéletes feladatmegoldás valószínűsége véletlenszerű válaszadási stratégia esetén itt is elhanyagolható.) Ugyanakkor igen valószínű, hogy (2) az autizmussal élő személyek egy másik része valóban alkalmazta az általunk feltételezett kompenzációs jellegű rövidre zárási stratégiát a feladat megoldása során: 2 vizsgálati személy mutatta azt a teljesítménymintázatot, amely ezzel áll összhangban (helyes válaszok az egyszerű szó szerinti és ironikus, következetesen helytelen válaszok a hamis szó szerinti és hamis ironikus történetek esetében). Véletlenszerű válaszadási stratégia esetén ennek a mintázatnak is elhanyagolható a valószínűsége. Adataink arra utalnak, hogy az egyik ilyen stratégia a beszélő szándékai és más mentális állapotai helyett a világ pillanatnyi állapotára alapozni a következtetési folyamatokat, kiegészítve azzal a képességgel, hogy kijelentések szó szerinti jelentését „felülírják” annak ellenkezőjével. Fontos nem elfeledkezni róla, hogy (3) e fenti két, jól azonosítható csoport mellett autizmussal élő vizsgálati személyeink jelentős része (itt a 16 főből 9) olyan „átmeneti” teljesítménymintázatot mutatott, amely nem illik bele egyik csoportba sem, ugyanakkor összességében a véletlennél itt is szignifikánsan jobb megértési teljesítményt találtunk. Így felmerül az az alapvető, ritkán tárgyalt kérdés, vajon egyáltalán tartósan jellemzőnek, stabilnak tekinthetőek-e ezek a folyamatok, vagy a sajátos idegrendszeri szerveződés következtében a tipikus személyekhez képest „törékenyebb” működés jellemzi az autizmussal élő személyeket ebből a szempontból? (4) Végül – s talán összefüggésben az előbbi eredménnyel és felvetéssel – ki kell térnünk arra a paradoxonra, hogy autizmussal élő személyeink egy része igen összetett feladathelyzetben volt képes demonstrálni képességét a szándéktulajdonításon alapuló iróniamegértésre, noha a nem szó szerinti nyelvhasználattal kapcsolatos nehézségek a hétköznapi életben erősen jellemzik az autizmust. Intuíciónk itt az, hogy talán a már említett végrehajtó működések korlátai akadályozzák meg, hogy az összetett és gyorsan változó hétköznapi helyzetekben következetesen megmutatkozhasson az esetenként jelenlévő szándéktulajdonítási és a részben ezen alapuló kommunikációs kompetencia. A pszichológiai, pszicholingvisztikai kísérletezés „lecsupaszított” laboratóriumi helyzeteiben ezzel szemben vélhetően kevésbé rontják a teljesítményt ezek az átfogó kognitív korlátok.



Győri Miklós

Alább utolsóként ismertetendő kutatásunk az imént felvetett két kérdést vizsgálta meg: Stabilnak tekinthető-e egyáltalán az iróniamegértési teljesítmény autizmusban, és a működése (s annak stabilitása) mutat-e összefüggést a belső folyamataink szervezését végző végrehajtó működésekkel?

.. Pragmatikai kompetencia autizmusban: stabilitás és összefüggések a végrehajtó működésekkel A nemzetközi szakirodalomban is elsőként összetett méréssorozatot alakítottunk ki annak vizsgálatára, mennyire stabilak rövid távon (perc–óra–nap idői nagyságrendekben) egyes kulcsfontosságú kognitív képességek autizmussal élő, jó intellektuális és formális nyelvi képességekkel rendelkező személyeknél. Vizsgáltuk az iróniamegértés stabilitását is, a fentebb röviden ismertetett módon (3 szó szerinti, 3 egyszerű ironikus, 3 hamis szó szerinti, és 3 hamis ironikus történetet mutatva be számítógépes eljárással), és a végrehajtó működések stabilitását, egyebek mellett az ún. Hanoi tornyai eljárás egy változatával (részletesebben és előzetes eredményekért l. Borsos–Győri 2012; Győri et al. 2010; Megellai–Győri 2012). A vizsgálatban két héten belül öt mérési napon összesen háromszor alkalmaztuk az irónia megértését mérő eljárást, és szintén háromszor a Hanoi tornyai eljárást, így viszonylag finom képet nyerhettünk arról, mennyire stabilak a kérdéses képességek, s van-e közöttük együttjárás. 21, autizmus spektrum zavarral diagnosztizált fiatal felnőttől gyűjtöttünk adatokat, s ezeket összevetettük 20 tipikusan fejlődő, illesztett személytől nyert adatokkal is. Első elemzéseink alapján az autizmussal élő személyek iróniamegértési teljesítménye összességében hasonló – meglepően magas – szintű volt, mint az előző vizsgálatainkban, de így is elmaradt a tipikus személyek által nyújtott teljesítménytől. Ugyanakkor egyértelműen kevésbé mutatkozott stabilnak (az egymást követő mérések eredményei közötti korrelációk kevésbé következetesek voltak, mint a tipikus kontrollszemélyeknél), de szoros együttjárást mutatott a Hanoi tornyai feladatban mutatott teljesítménnyel, és így vélhetően a belső folyamatok és a viselkedés célszerű összerendezéséért felelős átfogó kognitív folyamatokkal. Természetesen itt is érvényes az a korábban hangsúlyozott módszertani fenntartás, hogy összetett kérdések vonatkozásában egyetlen empirikus vizsgálat eredményeit önmagában nem tekintjük döntőnek, s eredményeink értelmezésében még inkább óvatosságra kell, hogy intsen az, hogy ezek előzetes elemzésekből származnak. Azaz egyelőre tentatív érvényességgel ugyan, de mégis arra mutatnak, egyrészt, hogy más kognitív folyamatokhoz hasonlóan, az iróniameg-

Az irónia megértése autizmusban



értésben részt vevő mechanizmusok is kevésbé stabilak, „törékenyebbek” autizmus spektrum zavarban, mint tipikus személyek esetében. Másrészt arra utalnak, hogy szoros összefüggés lehet az iróniamegértés összetett pragmatikai folyamatai és az átfogó kognitív koordinációt végző végrehajtó működések között – fontosnak tűnő párhuzamban pl. Bishop és Norbury (2005a,b) már hivatkozott eredményeivel, ahol egyes végrehajtó működések és a kommunikatív kompetencia között mutattak ki összefüggést autizmusban. További megerősítést igényel, mégis, ezen eredmények fényében még inkább kézenfekvőnek látszik az a magyarázat, amelyet fentebb vetettem fel az autizmussal élő, „magasan funkcionáló” személyek által a laborhelyzetben nyújtott viszonylag jó iróniamegértési teljesítmény és a hétköznapi életben mutatott, a nem szó szerintiséggel kapcsolatos gyakori nehézségek közti látszólagos ellentmondás kapcsán. Az autizmusban eleve „törékenyebb” pragmatikai (iróniamegértési) kompetenciát az összetett hétköznapi helyzetekben erősebben és nagyobb eséllyel korlátozza a végrehajtó működések zavara. A kevésbé összetett, „fókuszált” laboratóriumi kísérleti helyzetekben ez a korlát azonban kevésbé érvényesül. Noha, mint jeleztem, további empirikus alátámasztásra van szükség, ebbe az irányba mutatnak Glenwright–Agbayewa (2012) friss, szintén számítógépes helyzetből nyert eredményei autizmussal élő személyek iróniamegértési kompetenciája kapcsán.

.. Iróniamegértés a tipikus és az atipikus agyban Végül vessünk egy rövid pillantást néhány olyan vizsgálatra, amelyek az irónia megértésének folyamataiban részt vevő, azokat megvalósító idegrendszeri struktúrák és folyamatok azonosítására törekszenek, részben tipikus fejlődésű személyek, részben autizmussal élő személyek esetében. Célunk természetesen nem a részletes és teljes áttekintés (az önálló tanulmányt kívánna), hanem annak illusztratív felmutatása, milyen módon relevánsak az idegtudományi módszerekkel nyert eredmények az itt tárgyalt empirikus kérdésekre, s mindenekelőtt arra vonatkozóan, van-e szoros összefüggés az iróniamegértés és a szándék(mentálisállapot-) tulajdonítás között.

... Tipikus személyektől nyert eredmények Spotorno et al. (2012) áttekinti az összes korábban publikált funkcionális agyi képalkotásos módszerrel végzett vizsgálat eredményeit, amelyek az iróniamegértést kísérő agyi aktivitást vizsgálták tipikusan fejlődő személyeknél. Noha ezek nem vizsgálták közvetlenül a mentálisállapot-tulajdonítás és az iróniamegértés



Győri Miklós

agyi mechanizmusainak összefüggését, kivétel nélkül mind a hét tanulmány megemelkedett aktivitást talált a tipikus személyek középvonali (mediális) prefrontális kéregterületein. Ezt a kérgi területet lényegében konszenzuálisan az összetett mentálisállapot-tulajdonítási folyamatok egyik agyi központjának tekintjük. Spotorno és munkatársai (i.m.) szintén megemelkedett aktivitást mutattak ki itt az ironikus kijelentések feldolgozása során. Ugyanakkor saját vizsgálatukban megemelkedett agyi tevékenységet találtak abban a három további agyi struktúrában is, amelyeket szintén a mentálisállapot-tulajdonítás neurális alapjai közt tartunk számon (a jobb és bal oldali tempo-parietális területeken és a precuneusban, a fali lebeny felső középvonali felszínén). Spotorno csoportjának eredményei tehát erős bizonyítéknak tűnnek a mellett, hogy a nyelvi irónia megértése valóban mentálisállapot-tulajdonítást igényel – maguk is így értelmezik adataikat, összhangban például Shibata et al. (2010) következtetéseivel. Ugyanakkor nem elhanyagolható tény, hogy a naiv tudatelméleti feldolgozásban érintett négy terület közül három megemelkedett aktivitását nem mutatták ki a korábbi iróniamegértési vizsgálatok. Spotornóék szerint ennek módszertani okai vannak, amelyek elsősorban az ironikus kijelentések kontextualizálásával kapcsolatosak. Így azonban további empirikus vizsgálatokat igényel annak a felmerülő, és számunkra itt különösen fontos kérdésnek a megválaszolása, hogy vajon ezekben a korábbi vizsgálatokban így a tipikus személyek is valamilyen nem mentalizációs jellegű stratégiát használva végezték az ironikus kijelentések feldolgozását? Azaz jelen lehetnek nem a mentálisállapot-tulajdonításon alapuló feldolgozási stratégiák tipikus személyek esetében is, ahogyan azt saját eredményeink mutatták az autizmussal élő személyek vizsgálatakor?

... Autizmussal élő személyektől nyert eredmények Ismereteim szerint eddig egyetlen olyan funkcionális képalkotást alkalmazó kutatás eredményeit publikálták, amely közvetlenül az iróniamegértés neurális alapjaira irányult autizmussal élő személyeknél. Wang et al. (2006) vizsgálatában az autizmusban érintett személyek – hasonlóan saját, itt tárgyalt vizsgálataimhoz – a véletlennél szignifikánsan nagyobb eséllyel értették meg az ironikus kijelentéseket, noha teljesítményük a tipikus kontrollcsoporté alatt maradt. Érdekes, de mások eredményeinek fényében (l. ismét a tárgyalt vizsgálatainkat, illetve pl. Pexman et al. 2011 és Glenwright–Agbayewa 2012 viselkedéses módszereket alkalmazó munkáit) mégsem teljesen meglepő módon azt találták, hogy sikeres iróniamegértés esetén az autizmussal élő személyek agyában is megemelkedett aktivációt mutattak azok a – részben a naiv tudatelméleti működésekkel összefüggő – területek, amelyek a tipikus személyek esetében is, sőt, bizonyos terüle-

Az irónia megértése autizmusban



teken ez az agyi aktivitás intenzívebb is volt. A szerzők értelmezése szerint ez arra utal, hogy az autizmussal élő személyek egy részénél működnek a kommunikatív szándékok felismerésére szolgáló idegrendszeri mechanizmusok, ezekre támaszkodnak is az irónia megértésekor, ám a sikeres feldolgozás nagyobb erőfeszítést kíván, mint a tipikus személyek esetében.

. Összegzés E tanulmányban igyekeztem megmutatni, hogy az iróniamegértés vizsgálata autizmusban az empirikus nyelvpszichológiai, s ezen belül pragmatikai vizsgálódásoknak olyan területe, ahol egy viszonylag jól definiált és kísérleti eszközökkel jól megragadható, önmagában is érdekes jelenség kutatásán keresztül járulhatunk hozzá a jelenségen mégiscsak túlmutató, nem ritkán alapvető jelentőségű teoretikus kérdések megválaszolásához. Az autizmust tekintve meglehetősen tiszta, noha összetett kép látszik körvonalazódni. Az eredmények az autizmust az iróniamegértés folyamatait tekintve heterogénnek mutatják: úgy tűnik, az érintett személyek egy részénél valódi, s valódi szándéktulajdonításon alapuló kommunikációs-pragmatikai kompetencia mutatkozik meg a sikeres iróniamegértésben. Ugyanakkor ez a kompetencia is bizonyos értelemben atipikus: működtetéséhez mintha a tipikusnál nagyobb kognitív erőfeszítés volna szükséges, s mégis „törékenyebb”, instabilabb volna; úgy tűnik, a leegyszerűsített laboratóriumi körülmények közt nagyobb eséllyel működik sikeresen, mint a valós élethelyzetek összetett kontextusaiban. Feltételezhető, de nem bizonyított, hogy e korlát mögött legalább részben a belső folyamatokat összerendező végrehajtó működések korlátjai, saját előzetes eredményeink alapján talán ezek, illetve a tudatelméleti működés atipikus instabilitása húzódhatnak meg. Az autizmussal élő személyek egy része azonban, feltehetően, legalább esetenként nem szándéktulajdonításon alapuló, „kerülőutas” kompenzációs stratégiákat is alkalmaz, amikor ironikus kijelentéseket (helyesen) értelmez. Úgy tűnik, egy ilyen kerülőutas stratégiát sikerült azonosítanunk, ez a kontextuális realitás és a kijelentés szó szerinti jelentése összevetésének segítségével azonosítja az ironikus kijelentéseket. Ez a stratégia azonban demonstrálhatóan kevésbé hatékony, mint a valódi szándéktulajdonításon alapuló iróniamegértés. Mindemellett természetesen továbbra is tényként kezelendő, hogy az autizmusban érintett személyek egy harmadik, jelentős csoportja nem, vagy csak igen korlátozottan képes az irónia megértésére.



Győri Miklós

Általánosabb következtetésként kínálkozik, hiszen mind az autizmusból, mind a tipikus iróniafeldolgozás idegrendszeri hátterének vizsgálatából nyert adatok alátámasztják, hogy szoros összefüggés van (más kognitív folyamatok mellett) a mentálisállapot-tulajdonítás és az irónia megértése között. S ennyiben ezek az eredmények a szándékközpontú kommunikáció- és pragmatikaelméletek melletti evidenciáknak is tekinthetőek. Még akkor is igaznak tűnik ez a következtetés, ha nem csak autizmusban, de tipikus személyek iróniamegértési folyamataiban is helyet kaphatnak, az adott helyzetben rendelkezésre álló információk függvényében, nem mentalizációs stratégiák is. E következtetések fényében nem tűnik megalapozatlannak az a várakozás, hogy az iróniamegértés kutatása, s kitüntetetten az autizmusban működő iróniamegértési folyamatok és korlátok megértése a jövőben is hozzájárul majd a nyelvi és kommunikációs képességek mögötti mentális és neurális rendszerek és folyamatok jobb megértéséhez. Irodalom Bailey, Anthony – Wendy Phillips – Michael Rutter 1996. Autism: Towards an integration of clinical, neuropsychological, and neurobiological perspectives. Journal of Child Psychology and Psychiatry 37: 89–126. Baron-Cohen, Simon – Allan M. Leslie – Uta Frith 1985. Does the autistic child have a ‘theory of mind’? Cognition 21: 37–46. Bishop, Dorothy V. M. – Courtenay Frazier Norbury 2005a. Executive functions in children with communication impairments, in relation to autistic symptomatology. 1: Generativity. Autism 9: 7–27. Bishop, Dorothy V. M. – Courtenay Frazier Norbury 2005b. Executive functions in children with communication impairments, in relation to autistic symptomatology. 2: Response inhibition. Autism 9: 29–43. Borsos Zsófia – Győri Miklós 2012. A komplex-explicit tudatelmélet és a klinikai tünetek kapcsolatának stabilitása magasan funkcionáló autizmusban: előzetes eredmények. Előadás a Magyar Pszichológiai Társaság XXI. Országos Tudományos Nagygyűlésén. 2012. május, Szombathely. In: A tudomány emberi arca. A Magyar Pszichológiai Társaság XXI. Országos Tudományos Nagygyűlése. Kivonatkötet. 125–126. Carruthers, Peter – Peter K. Smith (szerk.) 1996. Theories of theories of mind. Cambridge: Cambridge University Press. Chomsky, Noam 1995. Language and nature. Mind 104: 1–61. Chuba, Hillary – Rhea Paul – Steve Miles – Ami Klin – Fred Volkmar 2003. Assessing pragmatic skills in individuals with autism spectrum disorders. Presentation at the National Convention of the American Speech-Language-Hearing Association, Chicago. Eigsti, Inge-Marie – Loisa Bennetto – Mamta B. Dadlani 2007. Beyond pragmatics: Morphosyntactic development in autism. Journal of Autism and Developmental Disorders 37: 1007–1023.

Az irónia megértése autizmusban



Eigsti, Inge-Marie – Ashley B. de Marchena – Jillian M. Schuh – Elizabeth Kelley 2011. Language acquisition in autism spectrum disorders: A developmental review. Research in Autism Spectrum Disorders 5: 681–691. Filik, Ruth – Linda M. Moxey 2010. The on-line processing of written irony. Cognition 116: 421– 436. Fodor, Jerry A. 1983. The modularity of mind. An essay on faculty psychology. Cambridge MA: MIT Press. Frith, Uta 2003. Autism: Explaining the enigma (Second edition). Malden MA & Oxford: Blackwell. Magyarul: Autizmus. A rejtély nyomában. Budapest: Kapocs, 1991. Frith, Uta – Francesca Happé 1994. Language and communication in autistic disorders. Philosophical Transactions of the Royal Society of London B/346: 97–104. Frith, Uta – Maggie Snowling 1983. Reading for meaning and reading for sound in autistic and dyslexic children. Journal of Developmental Psychology 1: 329–342. Gibbs, Raymond W. 1986. On the psycholinguistics of sarcasm. Journal of Experimental Psychology: General 115: 3–15. Giora, Rachel 1995. On irony and negation. Discourse Processes 19: 239–264. Giora, Rachel 1998. Graded salience and indirect negation. Metaphor and Symbol 13: 83–101. Glenwright, Melanie – Abiola S. Agbayewa 2012. Older children and adolescents with high-functioning autism spectrum disorders can comprehend verbal irony in computer-mediated communication. Research in Autism Spectrum Disorders 6: 628–638. Grice, H. Paul 1957. Meaning. Philosophical Review 67: 377–388. Grice, H. Paul 1997. Jelentés. In: Pléh Csaba – Síklaki István – Terestyéni Tamás (szerk.): Nyelv – kommunikáció – cselekvés. Budapest: Osiris Kiadó. 188–197. Győri Miklós 2003. A neurokognitív fejlődés moduláris zavarai: az autizmus. In: Pléh Csaba – Kovács Gyula – Gulyás Balázs (szerk.): Kognitív idegtudomány. Budapest: Osiris Kiadó. 738– 759. Győri, Miklós 2006. Autism and cognitive architecture. Domain specificity and cognitive theorising on autism. Budapest: Akadémiai Kiadó. Győri Miklós 2012. A neurokognitív fejlődési zavarok viselkedésgenetikája. In: Bereczkei Tamás – Hoffmann Gyula (szerk.): Gének, gondolkodás, személyiség. Bevezetés a humán viselkedésgenetikába. Budapest: Akadémiai. 237–273. Győri Miklós megj. előtt. Nyelv, kommunikáció és megismerés atipikus mintázatai és kapcsolatai autizmus spektrum zavarokban. In: Pléh Csaba – Lukács Ágnes (szerk.): A magyar pszicholingvisztika kézikönyve. Budapest: Akadémiai Kiadó. Győri Miklós – Gy. Stefanik Krisztina – Kanizsai-Nagy Ildikó – Balázs Anna 2002. Naiv tudatelmélet és nyelvi pragmatika magasan funkcionáló autizmusban: reprezentációs zavar, performanciakorlát vagy kompenzáció? In: Racsmány Mihály – Kéri Szabolcs – Pléh Csaba (szerk.): Architektúra és patológia a megismerésben. Budapest: Osiris Kiadó. 11–39. Győri, Miklós – Ágnes Lukács – Csaba Pléh 2004. Towards the understanding of the neurogenesis of social cognition: Evidence from impaired populations. Journal of Cultural and Evolutionary Psychology 2: 261–282.



Győri Miklós

Győri, Miklós – Krisztina Németh – Barbara Batta – Krisztina Stefanik 2010. On short-term cognitive stability/instability in ASD: findings from a neuropsychological study on high functioning young adults. Conference poster with oral presentation. 9th Autism-Europe Conference, Catania, Italy, 8–10 October, 2010. Hahn Noémi – Győri Miklós 2008. A kommunikáció modelljei és alapfolyamatai. In: Csépe Valéria – Győri Miklós – Ragó Anett (szerk.): Általános pszichológia 3. Nyelv, tudat, gondolkodás. Budapest: Osiris Kiadó. 196–224. Happé, Francesca 1993. Communicative competence and theory of mind in autism: A test of relevance theory. Cognition 48: 101–119. Happé, Francesca 1994a. An advanced test of theory of mind: Understanding of story characters’ thoughts and feelings by able autistic, mentally handicapped and normal children and adults. Journal of Autism and Developmental Disorders 24: 129–154. Happé, Francesca 1994b. Autism. An introduction to psychological theory. London: University College of London Press. Happé, Francesca 1999. Parts and wholes, meanings and minds: central coherence and its relation to autism. In: Simon Baron-Cohen – Helen Tager-Flusberg – Donald J. Cohen (szerk.): Understanding other minds: Perspectives from developmental cognitive neuroscience (2nd ed.). Oxford: Oxford University Press. 203–221. Happé, Francesca – Uta Frith 2006. The weak coherence account: Detail-focused cognitive style in autism spectrum disorders. Journal of Autism and Developmental Disorders 36: 5–25. Henst, Jean-Baptiste van der – Dan Sperber 2004. Testing the cognitive and communicative principles of relevance. In: Ira A. Noveck – Dan Sperber (szerk.): Experimental pragmatics. Houndmills, Basingstoke/New York: Palgrave Macmillan. 141–172. Hill, Elizabeth L. 2004. Evaluating the theory of executive dysfunction in autism. Developmental Review 24: 189–233. Joliffe, Therese – Simon Baron-Cohen 1999. A test of central coherence theory: Linguistic processing in high-functioning adults with autism or Asperger syndrome: Is local coherence impaired? Cognition 71: 149–185. Kenesei István 2003. A filozófia a nyelvészetben, avagy hová tűnt a nyelvfilozófia? In: Farkas Katalin – Orthmayr Imre (szerk.): Bölcselet és analízis. Budapest: Eötvös Kiadó. 100–117. Kiss, Szabolcs 1997a. Issues in developmental “Theory of mind” research from the point of view of Relevance Theory. In: M. Groefsema (szerk.): Proceedings of the University of Hertfordshire Relevance Theory Workshop. Hatfield Peverel: Peter Thomas and Associates. 131–140. Kiss Szabolcs 1997b. Relevanciaelmélet és metareprezentáció. In: Balogh Tibor – Pléh Csaba (szerk.): Mindennapi tudat: etológia, filozófia, pszichológia. Szeged: MTA Szegedi Területi Bizottsága. 59–67. Kiss Szabolcs 2005. Elmeolvasás. Budapest: Új Mandátum. Kjelgaard, Margaret – Helen Tager-Flusberg 2001. An investigation of language impairment in autism: implications for genetic subgroups. Language and Cognitive Processes 16: 287–308. Lam, Yan Grace – Siu Sze Susanna Yeung 2012. Towards a convergent account of pragmatic language deficits in children with high-functioning autism: Depicting the phenotype using the Pragmatic Rating Scale. Research in Autism Spectrum Disorders 6: 792–797. Landry, Susan H. – Katherine A. Loveland 1989. The effect of social context on the functional communication skills of autistic children. Journal of Autism and Developmental Disorders 19: 283–299.

Az irónia megértése autizmusban



Loukusa, Soile – Irma Moilanen 2009. Pragmatic inference abilities in individuals with Asperger syndrome or high-functioning autism. A review. Research in Autism Spectrum Disorders 3: 890–904. Mareschal, Denis – Mark H. Johnson – Sylvain Sirois – Michael Spratling – Michael Thomas – Gert Westermann 2007. Neuroconstructivism. Vol. I: How the brain constructs cognition. Oxford: Oxford University Press. McDonald, Skye 1999. Exploring the process of inference generation in sarcasm: A review of normal and clinical studies. Brain and Language 68: 486–506. Megellai Gábor – Győri Miklós 2012. Végrehajtó működések rövid távú instabilitása magasan funkcionáló autizmusban: előzetes eredmények. Előadás a Magyar Pszichológiai Társaság XXI. Országos Tudományos Nagygyűlésén. 2012. május, Szombathely. In: A tudomány emberi arca. A Magyar Pszichológiai Társaság XXI. Országos Tudományos Nagygyűlése. Kivonatkötet. 126-127. Müller, Ralph-Axel 1996. Innateness, autonomy, universality? Neurobiological approaches to language. Behavioral and Brain Sciences 19: 611–675. Németh T. Enikő 2008a. Intenciók a pragmatikában. A nyelvhasználat különböző formái. In: Bibok Károly (szerk.): A morfológiától a pragmatikáig: Tanulmányok Pete István 80. születésnapjára. Szeged: Szegedi Tudományegyetem. 410–435. Németh T., Enikő 2008b. Verbal information transmission without communicative intention. Intercultural Pragmatics 5: 153–176. Onishi, Kristine H. – Renee Baillargeon 2005. Do 15-month-old infants understand false beliefs? Science 308: 255–258. Penn, Derek C. – Keith J. Holyoak – Daniel J. Povinelli 2008. Darwin’s mistake: Explaining the discontinuity between human and nonhuman minds. Behavioral and Brain Sciences 31: 109– 130. Peppé, Sue – Joan McCann – Fiona Gibbon – Anne O’Hare – Marion Rutherford 2006. Assessing prosodic and pragmatic ability in children with high-functioning autism. Journal of Pragmatics 38: 1776–1791. Pexman, Penny M. – Kristin R. Rostad – Carly A. McMorris – Emma A. Climie – Jacqueline Stowkowy – Melanie R. Glenwright 2011. Processing of ironic language in children with highfunctioning autism spectrum disorder. Journal of Autism and Developmental Disorders 41: 1097–1112. Pinker, Steven 1994/1999. The language instinct. New York: William Morrow & Company. (Magyarul: A nyelvi ösztön, Budapest: TypoTEX, 1999.). Quartz, Steven – Terrence J. Sejnowski 1997. The neural basis of cognitive development: A constructivist manifesto. Behavioral and Brain Sciences 20: 537–596. Russell, James (szerk.) 1997. Autism as an executive disorder. Oxford: Oxford University Press. Shibata, Midori – Akira Toyomura – Hiroaki Itoh – Jun-ichi Abe 2010. Neural substrates of irony comprehension: A functional MRI study. Brain Research 1308: 114–123. Sokol, Deborah K. – Debomoy K. Lahiri 2011. The genetics of autism. In: Johnny L. Matson – Peter Sturmey (szerk.): International handbook of autism and pervasive developmental disorders. New York: Springer. 77–98. Sperber, Dan – Deidre Wilson 1981. Irony and the use-mention distinction. In: Peter Cole (szerk.): Radical pragmatics. New York:: Academic Press. 295–318.



Győri Miklós

Sperber, Dan – Deirdre Wilson 1986. Relevance: Communication and cognition. Cambridge MA & Oxford: Blackwell. Sperber, Dan – Deirdre Wilson 1995. Relevance: Communication and cognition. Second edition. Cambridge MA & Oxford: Blackwell. Spotorno, Nicola – Eric Koun – Jérome Prado – Jean-Baptiste van der Henst – Ira A. Noveck 2012. Neural evidence that utterance-processing entails mentalizing: The case of irony. Neuroimage 63: 25–39. Surian, Luca – Simon Baron-Cohen – Heather van der Lely 1996. Are children with autism deaf to Gricean maxims? Cognitive Neuropsychiatry 1: 55–72. Tager-Flusberg, Helen – Robert M. Joseph 2003. Identifying neurocognitive phenotypes in autism. In: Uta Frith – Elisabeth Hill (szerk.): Autism: Mind and brain. Oxford: Oxford University Press. 43–66. Tager-Flusberg, Helen – Rhea Paul – Catherine Lord 2005. Langauge and communication in autism. In: F. Volkmar – R. Paul – A. Klin – D. Cohen (szerk.): Handbook of autism and pervasive developmental disorders. Third edition. Vol. 1. Hoboken, NJ: Wiley. 335–364. Thomas, Michael – Anette Karmiloff-Smith 2002. Are developmental disorders like cases of adult brain damage? Implications from connectionist modelling. Behavior and Brain Sciences 25: 727–788. Wang, A. Ting – Susan S. Lee – Marian Sigman – Mirella Dapretto 2006. Neural basis of irony comprehension in children with autism: The role of prosody and context. Brain 129: 932–943. Wilson, Deidre – Dan Sperber 1981. On Grice’s theory of conversation. In: Paul Werth (szerk.): Conversation and discourse. New York: St. Martin Press. 155–178. Wilson, Deidre – Dan Sperber 1992. On verbal irony. Lingua 87: 53–76. Ziatas, Kathryn – Kevin Durkin – Chris Pratt 2003. Differences in assertive speech acts produced by children with autism, Asperger syndrome, specific language impairment, and normal development. Development and Psychopathology 15: 73–94.

Understanding irony in autism: a paradigmatic situation in cognitive pragmatics Abstract: The paper summarises primarily empirical-experimental studies aimed at revealing the processes underlying the comprehension of irony in individuals with autism. Since the pioneering study of Happé (1993), this issue has inspired a series of psycholinguistic, neurolinguistic, and cognitive psychological studies, including a few from the present author. The relevance of the research questions and the key findings go beyond the investigated phenomenon, narrowly defined: the comprehension of irony in individuals with autism can be regarded as a paradigmatic situation for empirical research in pragmatics. It provides a linguistically and psychologically well-defined context that is easy to control experimentally and offers opportunities to evaluate key assumptions of intention-based theories of communication and pragmatics, as well as psycholinguistic models based on these assumptions. Keywords: autism, comprehension of irony, psycholinguistics, recognition of intentions, Relevance Theory

A metafora leleplezése* Dan Sperber Közép-európai Egyetem (CEU) [emailprotected]

Deirdre Wilson University College London [emailprotected]

Kivonat: A relevanciaelméletből kiinduló, ebben a dolgozatban is leírt megközelítés alapján a nyelvi metaforák nem alkotnak természetes fajtát és a „metafora” nem elméleti érdekességű fogalom a nyelvi kommunikáció tanulmányozásában. A metaforikus értelmezésekhez ugyanazon az úton jutunk el, mint a szó szerinti, laza vagy hiperbolikus értelmezésekhez; nincs semmiféle metaforaspecifikus mechanizmus vagy csak a metaforákra alkalmazható különleges általánosítás sem. Cikkünkben úgy érvelünk az előző álláspont mellett, hogy megmutatjuk: ugyanaz a következtetéses folyamat érvényes a szó szerinti–lazán értelmezett–metaforikus kontinuum mindkét végére, és mind a szó szerinti, mind a metaforikus kijelentések hozhatnak létre irodalmi hatást. Kulcsszavak: metafora, következtetés, relevancia, szó szerinti jelentés

. Bevezetés Vajon a metaforák eltávolodnak-e a szó szerintiség normájától? A klasszikus retorika és a legtöbb későbbi elmélet szerint igen, beleértve a grice-i pragmatikát is (Grice 2011). A válasz azonban a klasszikus retorika romantikus kritikusai és egy sereg modern tudós szerint is határozott nem. Az utóbbiak körébe beletartoznak a szigorú kognitív tudósok és a posztmodern kritikai elmélet követői is. A metaforát normális jelenségnek tartó oldalon nagy különbség van azok között, akik – mint a kognitív nyelvész Lakoff, Talmy vagy Fauconnier – úgy vélik, hogy a metafora elterjedt a nyelvben, mivel az emberi gondolkodásban is fontos szerepet játszik, valamint azok között, akik a nyelvi kommunikációból eredő jelenségként írják le a metaforát, mint a pszicholingvista Glucksberg (2001) és Kintsch (2000) vagy a relevanciaelméletet követő gondolkodók. Mivel a metafora nem lehet egyszerre teljesen normális és a normális nyelvhasználattól távol álló jelenség, lehetséges, hogy létezik egy eltérő, de a metaforával mégis kapcsolatban álló jelenség – egyrészről gondolati szinten, másrészről pedig a nyelvi kommuni* Fordította Fazekas Judit.



Dan Sperber – Deirdre Wilson

kációban. Ezt a lehetőséget például Raymond Gibbs fejti ki (Gibbs 1994a;b; 1998; továbbá Gregory Murphyvel való vitájában: Murphy 1996; 1997; Gibbs 1996). Mi a relevanciaelmélet mondanivalójára koncentrálunk a nyelvi metafora megközelítésében. A relevanciaelmélet metafora-megközelítése deflációs, vagyis szűkítő. A legtöbb retorikai, irodalmi és filozófiai hagyomány nagy súlyt fektet mind a metafora fontosságára, mind pedig különlegességére. Mi elismerjük a metafora fontosságát, különlegességét azonban vitatjuk. Persze a metaforák mindenhol megjelennek a nyelvhasználatban, hozzájárulva a Barthes által emlegetett „le plaisir du texte”-hez, a szöveg öröméhez. Az egyes írók vagy műfajok speciális metaforahasználata ugyanúgy tanulmányozásra érdemes, mint a metafora mint hosszú és gazdag történelemmel rendelkező kiemelkedő kulturális fogalom. Ennek ellenére mi továbbra is csak a szó szerinti, laza és hiperbolikus értelmezéseket magában foglaló kontinuum egyik felén elhelyezkedő esetek összességeként látjuk a metaforát. A metaforikus értelmezésekhez pontosan ugyanolyan módon jutunk el, mint a többi értelmezéshez. Nincsen specifikusan a metaforákhoz kapcsolódó mechanizmus, vagy különleges, csak rájuk jellemző általánosítás. Más szavakkal: a nyelvi metafora nem természetes fajta és a „metafora” a nyelvi kommunikáció tanulmányozásának sem elméleti jelentőséggel bíró fogalma. A relevanciaelmélet metaforáról alkotott véleménye meglehetősen szikár és azoknak is csalódást okoz, akik úgy érzik, hogy a nyelvi metaforák megérdemelnék saját jól kidolgozott elméletüket, vagy egy tágabb nyelvi, esetleg gondolati elmélet középpontjában kellene elhelyezkedniük. Széles körben elfogadott nézet szerint a nyelvhasználatot egy szó szerintiségen alapuló norma vezérli, amelyet a metafora és a többi átvitt nyelvhasználati mód megsért – ez okozza különlegességüket. Ez a nézet egyenesen következik abból a még elterjedtebb nézetből, amely szerint a nyelv szerepe a kommunikációban annak lehetővé tétele, hogy a beszélő kódolja, a hallgató pedig dekódolja az üzenetet. Ezen „kódmodell” nimbuszának ledöntése az első szükséges lépés a metafora megfelelő perspektívába helyezése felé.

. A nyelv szerepe a kommunikációban A kód a jelek és az üzenet szisztematikus párosításából jön létre. Az üzenet olyan jelekbe való kódolása, amelyeket a fogadó majd dekódol, a nagyon egyszerű üzenetek átadásának nagyon egyszerű módja. Az állatok is folyamatosan ezt teszik. Formálisan nézve az emberi nyelvek is kódoknak tekinthetők: egy mögöttes nyelvtan által generált hang–jelentés párok rendszeréből állnak. De annak ellenére, hogy kódok, az emberi nyelvek nagyon messze állnak az állati kom-

A metafora leleplezése



munikációtól. Először is az emberi nyelvek nyilvánvalóan összehasonlíthatatlanul gazdagabbak. Nemcsak hogy kifejező elemek hatalmas repertoárjával rendelkeznek – a lexikonnal –, amelyeknek nincs megfelelőjük az állati kommunikációban, de ezek az elemek a mondattan segítségével határtalan kombinációs lehetőséget is rejtenek magukban. Az emberi nyelvek egy másik tekintetben is különböznek az állati kódoktól. Ennek is nyilvánvalónak kellene lennie, de alig kerül említésre: az emberi kódok erősen hiányosak. Ha a kommunikáció tisztán kódoláson és dekódoláson keresztül történne, akkor minden jelnek minden megjelenésekor egyértelműen ugyanazt a tartalmat kellene közvetítenie. A többértelműség – amikor ugyanahhoz a jelhez több üzenet kapcsolódik – elakasztja a dekódolási folyamatot. Vannak esetek még az állati kommunikációban is, amikor a jel által kódolt üzenet a kontextus függvényében változik. A méhek táncában például a méhek mozdulatainak iránya jelzi, hogy melyik irányban kell keresni a virágport, de ez a jelzés a nap állásához képest viszonyított. Az ilyen limitált kontextusérzékenységek kezelhetők automatikus kódszerű egyértelműsítő szabályokkal és alkalmazhatók egy kódoló–dekódoló rendszerben. Az emberi kommunikációban megjelenő nyelvi megnyilatkozások azonban túlságosan is kontextusérzékenyek ahhoz, hogy automatikusan, tisztán kódszerű kifejezésekben lehessen őket kezelni. A természetes nyelvekben megjelenő mondatok tipikusan többszörösen többértelműek; olyan referenciális kifejezéseket tartalmaznak, amelyeknek a jelentését nem lehet kizárólag dekódolás útján meghatározni (itt, te, most); az általuk nem egyértelműen kódolt jelentések gyakran elliptikusak (Add ide) vagy nem teljesek. Bár a nyelv formálisan kódnak tekinthető és az emberi kommunikáció nyelvi kódolást és dekódolást foglal magában, van egy jelentős rés a mondat által kódolt szemantikai struktúra és azon jelentés között, amit a beszélő közvetít a mondat egy bizonyos helyzetben történő közlésével. A metaforák és egyéb trópusok esetében ezt a rést sokszor kivételnek tekintik, és a szó szerinti és az átvitt értelem közötti különbségként írják le. Szerintünk a metaforák nem különlegesek, és az összes kijelentés, beleértve a szó szerintieket is, nagymértékben aluldeterminálja az általa közvetített jelentést. Az emberi nyelv nem úgy hiányos kód, hogy valami baj lenne vele s meg kellene próbálnunk fejleszteni (ahogy az analitikus tradíció egyes filozófusai javasolták). Éppen ellenkezőleg, úgy gondoljuk, hogy az emberi nyelvek tökéletesen alkalmasak a kommunikációbeli szerepük betöltésére. Ez a szerep azonban nem lehet a beszélők által közölni szándékozott jelentés kódolása. Az emberek nemcsak a nyelv segítségével kommunikálnak, hanem használnak számos osztenzív jelzést is, melyek olyan cselekedetek (pl. gesztusok vagy



Dan Sperber – Deirdre Wilson

beszéd) vagy cselekedetek maradványai (pl. írás), amelyek a címzett figyelmének felkeltését és valamely tartalomra irányítását célozzák. Számos ilyen osztenzív jelzés nem tartozik kódhoz, ezáltal tulajdonképpen nem is kódol semmit. Így az osztenzív jelzések használatával az emberek képesek nyelv és bármilyen más kód nélkül kommunikálni. Hogyan tud egy inger egy olyan jelentést közölni, amelyet nem kódol magában? Úgy, hogy bizonyítékot szolgáltat arról, hogy a közlő szándékában állt ezen jelentés átadása. Tegyük fel, hogy Vera mérges Lacira és nem akar vele beszélni. Amikor Laci megpróbál beszélgetést kezdeményezni, elképzelhető, hogy Vera • nyomatékosan a plafonra mered; • elkezd újságot olvasni. Ezek a cselekedetek nem tartoznak semmilyen elfogadott kódhoz. Ennek ellenére a plafonra bámulás vagy az újságolvasás azt üzeni Lacinak, hogy Vera inkább foglalkozik ezekkel a dolgokkal, mint hogy vele beszéljen. Mivel ezek a cselekedetek osztenzív jelzések (vagyis Vera azért élt velük, hogy Laci figyelmét felkeltse és egy bizonyos tartalom felé irányítsa), Laci érti, hogy Vera jelzései azt jelentik, hogy a lány nem akar vele beszélni. Nem azért értelmezi így Vera jelzéseit, mert valami alapvető kód ezeket a jeleket szisztematikusan ezen jelentésekhez kötötte, hanem mert a lány cselekedetei ezt az értelmezést juttatják az eszébe és Vera viselkedésének lehetséges legjobb magyarázata az, hogy feltételezi: valóban ezen tartalom közlése volt a lány szándéka. Egy inger közvetíthet egy általa nem kódolt jelentést azáltal, hogy bizonyítékot szolgáltat arra nézve, hogy a beszélő szándéka azon jelentés átadása volt. Itt a jelentéshez nem dekódolás, hanem következtetés útján jutott el a hallgató. Ami igaz az emberi kommunikációban dekódolt kommunikatív ingerekre, az igaz a kódolt ingerekre is: a beszélő által átadni szándékozott jelentést nem direkt módon dekódolják, hanem egy arra vonatkozó bizonyíték kódolásán keresztül. Az előbb leírt helyzetben elképzelhető, hogy Vera • mérgesen néz Lacira és szorosan összeszorítja a száját; • mérgesen néz Lacira és mutatóujját a szája elé emelve azt suttogja, „Pssszt!”. Ez utóbbi esetekben Vera egy konvencionálisan csendet kérő gesztust használ, melyből Laci arra következtethet, hogy a lány nem akar vele beszélni. A korábbi példákkal ellentétben úgy tűnhet, hogy ha valaki összeszorítja a száját, vagy azt

A metafora leleplezése



suttogja, „Pssszt!”, azzal egy bizonyos jelentést kódol, de ez a kódolt jelentés jóval bizonytalanabb a Vera által közölni kívánt jelentésnél. Ugyanez a gesztus egy másik helyzetben jelezheti a titoktartás kérését is. Azonban a jelen helyzetben elegendőek arra, hogy a Vera által közölni kívánt jelentést átadják. Az előbb látott helyzetben Vera esetleg azt akarja közölni, hogy „süket és néma vagyok”. Megnyilatkozásának dekódolt nyelvi tartalma nyilvánvalóan nem közvetíti direkt módon a szándékolt jelentést, de szolgáltat egy olyan kezdőpontot a jelentés kikövetkeztetéséhez, amely tulajdonképpen nem is különbözik olyan nagyon a korábban látott szorosan bezárt szájtól. Mindkét esetben a beszédképtelenség aktiválódik Laci elméjében, ennek értelmét pedig könnyű az adott szituációban megtalálni. Ezek a példák azt az általános jelenséget illusztrálják, hogy az emberi kommunikáció következtetésen alapszik, akár nyelvet, akár valamilyen más kódrendszert használ. A beszélő bizonyítékokat szolgáltat az általa közölni kívánt tartalomról és a címzett kikövetkezteti ezt a jelentést a bizonyítékok és a kontextus együttese alapján. A bizonyíték nem feltétlenül kódolt, és ha kódolt, akkor sem feltétlenül nyelvi; de minden esetben bemenetet szolgáltat egy következtetésen alapuló folyamathoz, amelynek célja a beszélő által közölni szándékozott jelentés értelmezése. Ennek alapján felmerül a következő kérdés: Mi értelme van egyáltalán a nyelvhasználatnak, ha azt, amire a nyelvet használjuk, nélküle is meg tudjuk valósítani? A nyelv bizonyítékok határtalan készletével szolgál a közlő által átadni kívánt jelentésre nézve, ezek a bizonyítékok pedig annyira árnyaltak, komplexek és gazdagon strukturáltak lehetnek, amennyire a beszélő csak szeretné. A nem verbális bizonyítékok sokkal limitáltabbak. A nyelv (és kizárólag a nyelv) segítségével az emberek képesek végtelen kifinomultsággal beszélni bármiről, ami csak eszükbe jut, attól függetlenül, hogy rá tudnak-e mutatni vagy le tudják-e utánozni. Az, hogy a kijelentések interpretációi nem kódoltak, csak a nyelvi jelentésük által bizonyítottak, nem von le a nyelvi kommunikáció gazdagságából, hanem éppen ellenkezőleg növeli azt: minden egyes mondat számos értelmezést enged meg, amelyek bőven túllépik a kódolt jelentéseket. Ezt a legjobban természetesen a kreatív metaforák illusztrálják.

. Hogyan irányítja a relevancia a következtetés útján elért megértést? Eddig a filozófus Paul Grice nézeteit vázoltuk a verbális kommunikációról egy radikálisabb formában. Grice a beszélő által közvetíteni kívánt jelentést olyan nyilvánvaló szándékként írta le, amely arra irányul, hogy valamilyen kognitív



Dan Sperber – Deirdre Wilson

hatást érjen el a hallgatóságban azáltal, hogy a hallgatóság felismeri az ezt a hatást elérni kívánó szándékot (Grice 2011). Így a beszélő által közvetíteni kívánt jelentés egy szándék, egy mentális állapot. Mások mentális állapotait nem lehet egyszerűen érzékelni vagy dekódolni, csak következtetni lehet rájuk mások viselkedéséből és a háttérinformációkból. Az a különbség a beszélő által közvetíteni kívánt jelentés és a többi mentális állapot között (amelyeket az emberek általában megtartanak maguknak), hogy az előbbi esetben a beszélő szándéka az, hogy a hallgatók felfedezzék a közvetíteni kívánt jelentés értelmét, és kommunikációs viselkedés formájában bizonyítékokat is szolgáltat erről a szándékáról. Így felmerül a lehetőség, hogy létezik olyan következtetési folyamat, amely csak a megértésre alkalmazható. Grice általában természetesnek vette – Searle (2009) pedig explicit módon ki is jelentette –, hogy amikor valaki a nyelvet használja kommunikációra, akkor valószínűleg szó szerint fejezi ki magát. Így tulajdonképpen feltételezhető, hogy alapvetően a közölni kívánt jelentés a szó szerinti jelentés (Grice ,,mi hangzott el”-je), így csak az implicit részről (a grice-i implikatúrákról) kell következtetéseket levonni. Ez gyakorlatilag annak kimondásához vezet, hogy a beszélő által közölni szándékozott jelentés részben dekódolt, részben kikövetkeztetett. A metaforák és egyéb trópusok, ahol a kijelentés még csak nem is része a beszélő által közölni kívánt jelentésnek, ebben az értelemben kivételesek: Grice szerint egy metafora esetében a beszélő nem azt mondja, amit mondani látszik, csak „úgy tesz, mintha mondaná”, úgyhogy ebben az esetben a jelentésre teljes mértékben következtetni kell. Szerintünk viszont a nyelvi megértéshez nem tartozik hozzá a szó szerintiség feltételezése, sem pedig valamiféle alapvető értelmezés. A metaforák semmilyen módon nem kivételesek. Az összes szándékos emberi kommunikáció az előbb leírt módon folyik: a beszélő bizonyítékot szolgáltat az általa közölni szándékozott jelentésről – ez az osztenzív jelzés –, és a hallgató a bizonyítékok és a kontextus segítségével kikövetkezteti a jelentést. A nyelvi jelek csak egyik fajtáját képezik az osztenzív jeleknek. A verbális kommunikáció mindig kontextusérzékeny és következtetésen alapul. Pontosan hogyan működik a következtetésalapú megértés? A relevanciaelmélet pontos jellemzéssel szolgál a relevanciáról és annak az emberi megismerésben játszott szerepéről, hogy előterjeszthessen egy ellenőrizhető elméletet a megértés folyamatához. Ebben az elméletben kritikus szerepet játszanak a relevanciával kapcsolatos elvárások. Mi a relevanciát nem csak a kijelentések vagy más osztenzív ingerek tulajdonságaként elemezzük, hanem olyan tulajdonságként, amely a kognitív folyamatok minden bemenetét jellemezheti: a különböző látványok, hangok, kijelentések, gondolatok, emlékek, feltételezések mind relevánsak lehetnek egy személy

A metafora leleplezése



számára egy bizonyos időpontban. Egy bemenet akkor releváns, amikor az előzőleg elérhető információs kontextusban való feldolgozása új kognitív hatást eredményez. Az input megválaszolhat egy kérdést, amely foglalkoztatta a személyt, felkelthet vagy lecsendesíthet egy kétséget, megerősíthet vagy megcáfolhat egy gyanút, kijavíthat egy hibát. Mindezek a kognitív hatások gyümölcsöző együttműködést eredményeznek a bemenet és a feldolgozás kontextusa között. Az interakció lehet többé vagy kevésbé hatékony, a bemenetek pedig többé vagy kevésbé relevánsak. Mi tesz egy bemenő jelet relevánsabbá a másiknál? Tételezzük fel, hogy egy szakács tízfős csoportnak készít ebédet, és arra az információra lenne szüksége, hogy hányan szeretnének vegetáriánus menüt. Ebben az esetben az az információ, hogy hárman vegetáriánusok, relevánsabb lenne számára, mint az, hogy hárman buddhisták (amelyből valószínűleg, de nem biztosan következik, hogy vegetáriánusok). Általában informatívabb azt megtudni valakiről, hogy buddhista, mint azt, hogy vegetáriánus, de ha a kontextus miatt csak az ételpreferenciái járnak következményekkel, akkor a kevésbé informatív bemenet a relevánsabb. Minél nagyobb a bemenő jel feldolgozásából származó kognitív hatás, annál relevánsabb az információ az azt feldolgozó személy számára. A kognitív hatás az input relevanciáját meghatározó két faktor egyike. A másik tényező a hatások elérésébe fektetett feldolgozási erőfeszítés. A bemenő jelek megjelenítéséhez, valamint a kontextuális információ és a kognitív hatások eléréséhez percepciós, emlékezeti vagy következtetéses erőfeszítésre van szükség. Például tételezzük fel, hogy a fent leírt szituációban választani lehet egy nyílt kijelentés, amely szerint három vendég vegetáriánus és egy brosúra között, amely mind a tíz vendég rövid életrajzát tartalmazza, s amely többek között azt is magában foglalja, hogy vegetáriánusok-e. Ebben az esetben a brosúra kevésbé lenne informatív, mint a nyílt kijelentés, bár mindkettő magában foglalja a szükséges információt. Dióhéjban: ()

a. Minél nagyobb az input feldolgozásával nyert kognitív hatás, annál nagyobb az input relevanciája. b. Minél kisebb az ezen hatások eléréséhez szükséges feldolgozási erőfeszítés, annál nagyobb a relevancia.

A kognitív hatékonyság nagyrészt az adott pillanatban legrelevánsabb input kiválasztásán és az azt legjobban megerősítő háttérinformációval való összekapcsolásán múlik. Az erős tendencia a legrelevánsabb input kiválasztására biztosítja a megismerés gazdaságosságát. A következő javaslatot tesszük:

 ()

Dan Sperber – Deirdre Wilson A relevancia kognitív alapelve: Az emberi kogníció a relevancia maximalizálását célozza meg.

Az emberek nem járnak mindig sikerrel a relevancia maximalizálásában, de nagyon törekszenek arra, hogy a megismerésbe fektetett rengeteg erőfeszítésük megérje a fáradságot. Az emberi érzékelő mechanizmusok általában a potenciálisan releváns ingereket válogatják ki, az emberi felidéző mechanizmusok általában a potenciálisan releváns háttérinformációkat aktiválják és az emberek következtetésre alkalmas folyamatai általában a legproduktívabb módon dolgozzák fel ezeket. Mindennek egy sor kísérletileg vizsgálható következménye van (Henst–Sperber 2004). Mi itt csak a relevancia kognitív alapelvének az emberi kommunikációra vonatkozó következményeivel foglalkozunk. Lehetetlen lenne bárki számára megjósolni, hogy a másik mire fog figyelni és az milyen gondolatokat fog elindítani benne, ha a figyelmüket és a gondolati folyamataikat nem a relevancia figyelembe vétele irányítaná. A relevancia maximalizására való törekvés szükséges az emberi gondolati folyamatok megmagyarázhatóvá és kiszámíthatóvá tételéhez. Ugyanez a törekvés teszi lehetővé, hogy ne csak megmagyarázni és kiszámítani tudjuk mások gondolati folyamatait, hanem manipulálni is, olyan ingerek létrehozásával, amelyekről feltételezhető, hogy felkeltik a másik érdeklődését és megjósolható, hogy milyen módon fogja azokat interpretálni. Vera tudja, Lacinak fontos, hogy a vendégei jól érezzék magukat, ezért látható helyen hagyja poharát, feltételezve, hogy Laci fel fog rá figyelni és arra a következtetésre jut, hogy a lány szeretne még egy italt. Ez még nem a következtetéses kommunikáció egy esete, mert annak ellenére, hogy Vera arra számít, hogy Laci erre a következtetésre jut majd, csak arra mutató bizonyítékokat szolgáltat, hogy szomjas, nem pedig arra, hogy tudatni akarja Lacival, hogy szomjas. Ha szemkontaktust létesített volna Lacival és az üres poharát lengette volna előtte, vagy azt mondta volna neki, hogy Üres a poharam, akkor a jelzés osztenzív lett volna és valódi kommunikációs viselkedésről beszélhetnénk. Osztenzív jelzés használata egy szokásos nem osztenzív jellel szemben nemcsak a dolgok állására vonatkozó információval látja el a címzettet (pl.: Vera szeretne még egy italt) hanem a feladó ezen információ nyílt átadására irányuló szándékáról is. Egy osztenzív jelzéssel a kommunikátor nyíltan kéri a címzett figyelmét. Mivel a figyelem általában a legrelevánsabb elérhető inputra irányul, a kommunikátor implicit módon azt közvetíti, hogy ez az ő üzenete. A relevanciaelméleti pragmatika központi állítása szerint az osztenzív jelek olyan relevanciaelvárásokat támasztanak, amelyeket más bemeneti jelek nem, és ezek az elvárások vezérlik a megértési folyamatot. Mi pontosabban ezt állítjuk:

A metafora leleplezése ()



A relevancia kommunikációs alapelve: A következtetés útján történő kommunikáció minden esete a saját optimális relevanciájának feltételezését hordozza magában.

A kommunikációs alapelvben említett optimális relevancia feltételezésének pontos tartalma van. Az adott közlésről (vagy kommunikációs aktusról) feltételezzük, hogy eléggé releváns lesz ahhoz, hogy megérje feldolgozni, amiből következik, hogy relevánsabbnak kell lennie, mint a többi, a címzett figyelméért az adott időpontban versengő inputnak. A közlőnek és a címzettnek legalább egy közös célja van: hogy a kommunikáció sikeres legyen – vagyis a címzettnek meg kell értenie azt, amit a kommunikátor közölni akart. Minél relevánsabb a közlés és minél kevesebb feldolgozási erőfeszítést igényel, annál valószínűbb, hogy a címzett meg fogja érteni. Így a kommunikátortól elvárható, hogy saját kifejezőkészségének határain belül és anélkül, hogy saját céljai (különösen a kommunikáció által elérni kívánt célja) ellen tenne, maximális relevanciát próbáljon nyújtani. Annyi relevanciát, amennyi a kommunikátor képességeinek és preferenciáinak megfelel, de minden esetben elég relevanciát ahhoz, hogy feldolgozásra érdemes legyen. A relevancia kognitív alapelve követendő utat és nyugvópontot is kínál a címzett számára a kijelentés értelmezésének megkonstruálásához. Mivel a relevanciát befolyásoló két tényező közül az erőfeszítés az egyik, a követendő út az, amelyik a legkevesebb erőfeszítést igényli. A nyugvópont pedig az, amikor a jelenlegi interpretáció (amelyet a beszélő explicit vagy implicit módon közölni akart) kielégíti a közlés által támasztott relevanciaelvárásokat. A beszélő szempontjából a legegyszerűbb módja annak, hogy emelje üzenetének relevanciáját, ha úgy fejezi ki magát, hogy az általa közvetíteni kívánt interpretáció legyen az első, amelyhez a címzett eljut a legkisebb erőfeszítés útját járva. Illusztrációként vizsgáljuk meg a (4) alatti párbeszédet: ()

a. Gyuri: Jó lenne, ha Dönci szülinapi buliján lenne valamilyen műsor. b. Ildi: Karcsi varázsló. Kérdezzük meg őt.

Tegyük fel, hogy a varázsló Gyuri számára kétértelmű és a következő jelentésekkel bír: (i) valaki, aki természetfölötti képességekkel rendelkezik és varázsol; vagy (ii) valaki. aki bűvésztrükkökkel szórakoztatja a közönséget. Egy szülinapi gyerekzsúrra szervezett előadásról való beszélgetés kontextusában valószínűleg a második jelentés fog először aktiválódni és ez az az információ vagy emlékeztető, amely szerint barátjuk, Karcsi varázsló. Ebben az értelemben valószínűleg kielégíti Gyuri relevanciaelvárásait, mivel arra utal, hogy elképzelhető, hogy Karcsi előad majd valamit Dönci zsúrján. Azáltal, hogy Ildi feltételezte, hogy a



Dan Sperber – Deirdre Wilson

kijelentése releváns lesz Gyuri számára, azt várta, hogy Gyuri levonja majd ezt a következtetést, amely így a jelentés egy implicit részének, vagyis implikatúrának tekinthető. A varázsló bűvésztrükköket bemutató személyként való egyértelműsítése összeillik ezzel az implikatúrával és a két rész igazolja egymást, mivel együttesen támogatnak egy olyan értelmezést, amely az elvárt módon releváns. A Kérdezzük meg őt mondat jelentése nagyon sematikus és hiányos, amely Ildi közlésének második felét teljesen nyitottá teszi végtelen számú értelmezés számára. Az őt utalhat Karcsira, Döncire, vagy akárki másra. A kérdezzük vonatkozhat tanács, segítség, vélemény, szívesség vagy bármi más kérésére. Így az egész mondat jelentheti azt is, hogy Kérdezzük meg Döncit, szeretné-e, hogy Karcsi bűvésztrükköket mutasson be a szülinapján. Ez az interpretáció értelmezhető lenne az adott helyzetben és a grice-i társalgási maximákkal és egyéb sztenderd társalgásikoherencia-elméletekkel is kompatibilis. Mégis egy olyan kontextusban, ahol a kijelentés első fele Karcsi varázsló, azt implikálja, hogy Karcsi mutathatna be bűvésztrükköket Dönci zsúrján, és az első értelmezés, amelyet a legkevesebb erőfeszítés útján érünk el, az lesz, hogy Ildi megkérhetné Karcsit, hogy adjon elő valamit. Mivel ez kielégítené Gyuri relevanciával kapcsolatos elvárásait, el kell ezt fogadnia szándékolt jelentésként, anélkül, hogy olyan további értelmezési alternatívák után kutatna, amelyek szintén relevánsak lehetnek. (Ezen további potenciális értelmezések egyike sem lehetne optimálisan releváns, mivel extra feldolgozási erőfeszítésre lenne szükség az előhívásukhoz. Így nem érdemes őket figyelembe venni, hacsak nincs valami okunk annak feltételezésére, hogy Ildinek nem sikerült optimálisan relevánsan kifejezni magát.) Ebben a példában Ildi szó szerint fejezi ki magát, ami rámutat, hogy milyen messzire mehet a nyelvi jelentésén túl egy szó szerint értett kijelentés értelmezése is, és hogy ez nem egyszerűen a dekódoláson múlik. Mi a mellett érvelünk, hogy ugyanaz a folyamat, amely ebben az esetben szó szerinti értelmezéshez vezet, más esetekben akár nem szó szerinti értelmezést is eredményezhetne.

. A jelentés felépítése A szavak vagy egyéb nyelvi kifejezések dekódolt jelentései kiindulópontot szolgáltatnak a jelentés következtetésen alapuló megalkotásához. A megkonstruált jelentés lehet szűkebb a dekódolt jelentésnél, mint az (5) mondat esetében. ()

Cukros vagyok.

Az (5) példában a cukros szót ’normális vércukorérték feletti’-ként értelmezzük.

A metafora leleplezése



Más esetekben a megkonstruált jelentés tágabb lehet a dekódolt jelentésnél, mint a (6) alatti mondatok esetében. ()

a. Hollandia lapos. b. A kövek kört formáznak. c. (Pikniken egy nagyjából lapos kőre mutatva): Az egy asztal! d. (Zsebkendőt nyújtva valakinek): Itt egy Kleenex. e. (Papírszalvétát nyújtva valakinek): Itt egy Kleenex.

A lapos használata a (6a)-ban és a köré a (6b)-ben: közelítések. A közelítés a bővítés vagy a laza használat egy esete, melyben egy viszonylag szigorú jelentéssel bíró szó kiterjed más elemekre is (ezeket Lasersohn 1999 „pragmatikus holdudvar”nak nevezi), amelyek szigorúan nem tartoznak a nyelvileg kijelölt jelentéshez. Az asztal használata a (6c) példában és a Kleenexé a (6d) és (6e) esetében a kategóriakiterjesztés példái. A kategóriakiterjesztés a laza használat vagy bővítés egy újabb esete, egy viszonylag pontos jelentéssel bíró szó olyan elemekre való kiterjesztését foglalja magában, amely elemek egyértelműen kívül esnek a nyelvileg kijelölt jelentésen, de osztoznak a jelentés elemeivel néhány kontextuálisan releváns tulajdonságban. Így a (6c) példabeli lapos kő határozottan nem asztal, de rendelkezik olyan tulajdonságokkal, amelyek jó asztalhelyettesítővé teszik az adott helyzetben. A (6d) példában szereplő zsebkendő nem Kleenex (papírzsebkendő), de éppúgy megfelel a célnak. A (6e) példabeli papírszalvéta még csak nem is zsebkendő, de ez a zsebkendőhöz legközelebbi elérhető dolog és ez is majdnem ugyanannyira megfelel a célnak. A szűkítés esetében a szó szerintiség részben megmarad: a cukros esetében is cukorról van szó. A kiterjesztés esetében azonban a szó szerintiség nem marad meg: Hollandia nem szó szerint lapos, a kövek nem formáznak szó szerint kört, a nagyjából lapos kő nem szó szerint asztal, és se a zsebkendő, se a papírszalvéta nem szó szerint Kleenex. A szűkítés és a bővítés nem két funkcionálisan különböző nyelvhasználati mód. Mindkettő magában foglalja a jelentéskonstruálás azonos folyamatát, amely bizonyos esetekben a kódolt fogalom szűkítéséhez, míg más esetekben a bővítéséhez vezet. Hogyan érkezünk el ezekhez a szűkített vagy bővített jelentésekhez? Az előzőekben leírt, relevancia által vezérelt megértési folyamatok révén. Az (5) esetében a cukor alapján dekódolt szó szerinti jelentés irreleváns közhely lenne, mivel mindenkinek (sőt mindennek) van vércukra. Tulajdonképpen nincs rá okunk, hogy azt gondoljuk, a hallgató létrehoz és figyelembe vesz egy ilyen közhelyet. Inkább az történik, hogy a cukor fogalma aktiválódik a hallgató elméjében és egy



Dan Sperber – Deirdre Wilson

releváns értelmezés felé vezeti. Ez a fogalom rendelkezik egy olyan paraméterrel, amely különböző értékeket vehet fel, melyek egy része a körülmények szempontjából releváns (például mivel arra utalnak, hogy a beszélő beteg és nem ehet édességet). A kijelentés releváns átfogó értelmezéséhez való eljutás folyamán a dekódolt fogalom, a cukor kezdőpontot nyújt egy szűkebb alkalmi fogalom, a magas vércukor* megalkotásához, amely a kontextus szempontjából releváns módon tér el a normától, és olyan implikációi vannak, amelyek megérik a hallgató feldolgozási erőfeszítéseit. A megértés közben felidézett ismeretek következtetéses viszonyban állnak azokkal a fogalmakkal, amelyek felidézik őket, és nem pusztán a következtetéstől független, múltbeli együttes megjelenésen alapuló asszociációk. Vagyis azok a gondolatok, amelyeket egy kijelentésben megjelenő szó idéz fel, valószínűleg igazak a szó nyelvileg meghatározott jelentésére vagy ezzel egyenértékűen az olyan elemekre, amelyek a fogalomnak a szó által kódolt kibővítésébe tartoznak. A szűkítés esetében az implikációk csak a kódolt fogalom kiterjesztésének egy részében érvényesek (pl. csak bizonyos vércukorszintek jeleznek betegséget). A kiterjesztésnél az implikációk nemcsak a kódolt fogalom kiterjesztésében érvényesek, hanem az adott kontextusban kiemelkedő olyan elemekre is, amelyek a kiterjesztésen kívül esnek, de olyan, a kiterjesztésen belüli elemekkel közös tulajdonságokkal rendelkeznek, amelyek meghatározzák ezeket az implikációkat (pl. biciklizni nemcsak lapos, hanem nagyjából lapos talajon is könnyű). Először azok az implikációk jutnak a hallgató eszébe, amelyeket a kijelentés és a környezet egyszerre aktivál és egészen addig adódnak hozzá az értelmezéshez, míg a hallgató relevanciaelvárásai kielégülnek. Azon a ponton a kijelentés explicit tartalma (egy kijelentés esetében azok a propozíciók, amelyeknek az igazságával kapcsolatban a beszélő elkötelezi magát) visszamenőlegesen kerül meghatározásra az értelmezés implicit és explicit komponenseinek kölcsönös egyeztetésével. Egy megnyilatkozás explicit tartalmának kontextuálisan implikálnia kell az implicit tartalmat. Relevanciaelméleti terminusokkal fogalmazva: egy megnyilatkozás explikatúrájának az implicit premisszákkal kell az implicit konklúziókat biztosítania (ahol mind az implicit premisszák, mind az implicit konklúziók az implikatúrák bizonyos fajtái; a kölcsönös összehangolási folyamatokkal kapcsolatban l. Sperber–Wilson 1998; 2005; Carston 2002; Wilson–Sperber 2002; 2004). A szigorúan szó szerinti értelmezésekhez – amelyek nem tartalmazzák sem a lexikalizált fogalmak szűkítését, sem a bővítésüket – is ugyanúgy az implicit és explicit tartalmak kölcsönös összehangolásán keresztül jutunk el. A szó szerinti értelmezés akkor jön létre, amikor a megnyilatkozást elvárt módon relevánssá tevő implikációk a lexikalizált fogalom explicit tartalmának jelenlététől függnek

A metafora leleplezése



(nem pedig annak valamilyen szűkítésétől vagy bővítésétől). A szó szerinti értelmezés nem alapértelmezett, nem ezt vesszük először figyelembe és nem feltétlenül könnyebb megkonstruálni, mint a nem szó szerinti jelentéseket. Tulajdonképpen bizonyos szó szerinti értelmezésekhez nehéz eljutni, mint a (7) mondatban: ()

Ha Hollandia lapos lenne, a víz a határoktól a középpont felé folyna.

Egy földterületet lapos-ként leírva kiterjesztjük a fogalmat azzal, hogy nem csupán a minden terepre jellemző egyenlőtlenségeket hagyjuk figyelmen kívül, de a föld gömbölyűségét is. A „laposság” szó szerinti megközelítésétől való második eltérés nem könnyen javítható. Ugyanazon megnyilatkozás értelmezése megfelelő lehet hiperbolikusan, lazán vagy szó szerint az aktuális tényektől függően, nincs éles határvonal a különböző értelmezések között. Nézzük például a (8) mondatot. ()

Ildi Lacinak: Forr a leves.

Ha Laci túl messze van ahhoz, hogy közvetlenül megfigyelhesse a leves állapotát, hogy tud a lehetséges értelmezések közül egyet kiválasztani? A relevancia figyelembevételével. Tegyük fel, hogy Laci az emeleten dolgozik; amikor megérzi az Ildi által készített leves illatát, azt mondja, hogy lejön megkóstolni, és Ildi a (8) mondattal válaszol. Ekkor Ildi megnyilatkozása azért lenne releváns, mert figyelmeztetné, hogy nem érdemes lejönnie: a forr hiperbolaként funkcionálna, azt közvetítve, hogy túl forró a kóstoláshoz. Vagy tegyük fel, hogy Laci főzi a levest, de kiment a szobából, Ildi pedig tudja, hogy a levesnek nem szabadna még forrnia. Ekkor Ildi megnyilatkozása már akkor is elég releváns lenne, ha a leves csak majdnem forrna; ez inkább a forr szó laza, közelítő használata, mint hiperbola. Végül feltételezhetjük azt is, hogy Laci, aki a levest főzi, kiment a szobából, de Ildi tudja, hogy Laci le akarta fölözni a levest, amikor az felforr. Ekkor ahhoz, hogy elég releváns legyen, szó szerint kell értelmezni a kijelentését.

. A szó szerinti–laza–metaforikus kontinuum Nézzünk kreatívabb példákat a kategóriabővítésre. ()

a. Zizek egy új Derrida. b. Poggyászban a rózsaszín az új fekete. (New York Times, 2005. szeptember 4)



Dan Sperber – Deirdre Wilson

A (9a) példában a Derrida általános főnévként jelenik meg, amely a Derridaszerű lángoló, zavaros filozófusokra utal. (Zizek egy ilyen jellegű szlovén kulturális szereplő.) A (9b) mondatban a fekete a divatszínek kategóriájára utal. A kategória mindkét esetben kiterjed további elemekre, amelyek olyan tulajdonságokban egyeznek a kategóriatagokkal, amelyek nem feltétlenül alapvetőek, de mindenképpen feltűnőek. Ezek a példák – a Kleenex elnevezés minden zsebkendőre való használatával szemben – nem elemezhetők pusztán laza használatként. A (9a) mondat nem azt állítja, hogy a Zizek és Derrida közti különbségek lényegtelenek, hanem hogy Zizek egy olyan tágabb kategóriához tartozik, amelynek Derrida a legszembetűnőbb tagja. A (9b) mondat sem azt állítja, hogy a rózsaszín nagyjából megegyezik a feketével, hanem hogy a bőröndszínek kategóriájában az ezelőtt a fekete által elfoglalt helyet foglalja most el. Mindazonáltal a (9a) és (9b) mondat értelmezhető a szokásos eljárással: a Derrida vagy a fekete szó jelenléte segít az olyan, egyrészt Zizekkel, másrészt a rózsaszínnel kapcsolatos implikációk előidézésében, amelyek a megnyilatkozást az elvárt módon relevánssá teszik. Az explicit és implicit tartalmak, valamint az implikatúrák összehangolásával az explicit tartalom egy olyan ideiglenes fogalmat (Derrida* vagy fekete*) tartalmazva jön létre, amely kontextuálisan magában hordozza ezeket az implikációkat. A metaforák és a hiperbolák egy kontinuum mentén helyezkednek el. Első látásra úgy tűnhet, hogy a hiperbola esetében csak mennyiségi különbség van a kódolt fogalom és a kontextuálisan megalkotott fogalom között, mint a (10a) mondatban, míg a metafora minőségi különbséget is tartalmaz, mint a (10b). ()

a. Géza a legkedvesebb ember a világon. b. Géza egy angyal.

A minőségi/mennyiségi megkülönböztetés azonban nem éles. Például a (11a) és (11b) mondat általában inkább hiperbolaként, mint metaforaként kerülne besorolásra, habár mind minőségi, mind mennyiségi különbség van a hihető és nem hihető dolgok között, vagy egy szent és egy hétköznapi ember között: ()

a. Géza hihetetlenül kedves. b. Géza egy szent.

Mindenesetre akár hiperbolaként, akár metaforaként soroljuk be őket, a (11a) és (11b) mondatot ugyanúgy értelmezzük: a kódolt fogalom elősegíti azokat a kontextuális implikációkat, amelyek a megnyilatkozást az elvárásoknak megfelelően relevánssá teszik. A hiperbola vagy metafora által közvetített fogalom pedig egy kiemelkedő típusa az ezen implikációk által jellemzett kedvességnek.

A metafora leleplezése



A kategóriabővítés és a metafora egy kontinuum két végpontján helyezkedik el. Elképzelhető olyan érvelés is, amely szerint a kategóriakiterjesztés a definiálást vagy legalábbis a kódolt fogalom jellemző tulajdonságainak tágabb kategóriára való kivetítését is magával vonja, míg a metaforákban megjelenő kiterjesztés periferikus vagy legalábbis részleges tulajdonságokon alapul, mint a (12a–b) példában. ()

a. Nádszál az ember, semmi több, a természet leggyengébbike. (Blaise Pascal; Pődör László fordítása) b. Ködös a tudatom.

A gyengeség nem definiáló tulajdonsága a nádszálnak (és csak bizonyos mesterséges összehasonlító osztályhoz képest számít tulajdonságnak); hasonlóképpen a részek megkülönböztetésének nehézsége sem a ködöt definiáló tulajdonság. Vannak olyan metaforák is, amelyek a lexikalizálódott kategória meglehetősen középponti tulajdonságán alapulnak. Például egy állati testrész kiterjesztését egy emberi testrészre, mint a (13) mondatban, általában metaforaként osztályozzák. ()

Henrik büszke volt a sörényére.

Egy kategória átmehet egyre periférikusabb terjedést magával vonó folyamatos táguláson, így szükségszerűen elvesztve a lexikalizálódott kategória leginkább középponti jellemzőit. Hasonlítsuk össze a (9a)-t (Zizek egy új Derrida) a (14a–b) mondattal. ()

a. Rebecca Horn a kortárs művészet Derridája. b. Ferran Adria inkább Derrida, mint Danko. (Adria az El Bulli világhírű séfje, Danko pedig egy híres San Franciscó-i séf, http://tinyurl.com/otw7x84)

Mindegyik esetben más-más fogalom (Derrida*, Derrida**, Derrida***) épül fel és mindegyik egy kicsivel távolabb van az eredeti fogalomtól (amennyiben elfogadjuk, hogy személyek fogalmai is létezhetnek), vagyis Jacques Derrida reprezentációitól. A központi és periferikus tulajdonságok keveredhetnek, mint a (15) mondat esetében, amely egy olyan videóval kapcsolatos megjegyzés, melyben George W. Bush állítólag megtörli a szemüvegét egy gyanútlan nő pólójában a Jay Leno vezette tévéműsorban.

 ()

Dan Sperber – Deirdre Wilson Számára mi mind ember formájú Kleenexek vagyunk. (http://www.iflipflop.com/2004/10/metaphor-george-bush-uses-woman-as.html)

Itt a nő implicit módon Kleenexként van leírva, mivel őt (vagy legalábbis a ruháit) lehet akként használni, ez pedig azt a sugalmazza, hogy Bush az embereket kis értékkel rendelkező, újrahasznosítható tárgyaknak látja. A legtöbb hiperbola csak bővíti a kódolt fogalmat, a szűkítés nem jelenik meg. A (10a) mondatban például a világ legkedvesebb embere (az egyes szám ellenére) kiterjed a világ összes emberére, beleértve Gézát is. Ezzel ellentétben a legtöbb metafora szűkítést és bővítést is tartalmaz, így nem lehetnek egyszerűen a kategóriabővítés esetei. A metaforikus (10b) mondatban az angyal értelmezése angyal*, amely egyrészről szűkítve van a prototipikus tagokra (kizárva a bosszúálló angyalokat, a düh angyalait és a bukott angyalokat), másrészről tágítva, magában foglalva az összes nagyon kedves, gondoskodó embert. A bővítés és szűkítés e kombinációja azonban nem a metafora definiáló tulajdonsága. A metaforikus (15) mondatban például a Kleenex ki van terjesztve valami olyasmire, mint az újrahasznosítható elemek kategóriája, és ez magában foglalja az összes Kleenexet, nem csak a prototipikus példányokat.

. A következtetés lépései A relevanciaelmélet határozottan következtetésen alapuló megértés-megközelítése felvet egy megoldást a „létrejövő tulajdonság” problémájára a metaforával foglalkozó újabb keletű munkákban (l. például Martinich 1984; Tourangeau– Rips 1991; Gineste et al. 2000; Carston 2002; Vega Moreno 2004; 2007; Wilson– Carston 2006). Nézzük például a (16) mondatot: ()

Ez a sebész egy hentes.

Ez a megnyilatkozás nyilvánvalóan azt a képet idézi fel, hogy ez a sebész erősen inkompetens, veszélyes és így tovább. A probléma az, legalábbis az asszociációkon és „konnotációkon” alapuló metaforaelméletek számára, hogy az inkompetens, a veszélyes és hasonló tulajdonságok nem különösebben kötődnek sem a hentesekhez, sem a sebészekhez. Tehát hogyan merülnek fel, amikor a két kategória összekapcsolódik, mint a (16) mondatban? Ha a megnyilatkozás és annak értelmezései közti kapcsolatot következtetésként kezeljük, akkor a kérdés az, hogy azok a tulajdonságok, amelyek „felmerülnek” a metaforikus értelmezésnél, megjelenhetnek-e következtetés útján. A hen-

A metafora leleplezése



tesek és a sebészek egyaránt tipikusan hús vágásával foglalkoznak, de nagyon különböző módon. A sebészek élő húst vágnak, minél kisebb területen és hatalmas elővigyázatossággal, hogy elkerüljék a véredények, idegek és inak felesleges elvágását, javíthatatlan károsodást okozva. A hentesek halott húst vágnak, hogy a főzéshez hússzeleteket állítsanak elő; ez nem jár elvi korlátozásokkal arra nézve, hogy mennyit kell vágni (vagy darálni, törni, klopfolni stb.) és az idegek, inak, valamint egyéb kemény szövetek elvágására is buzdít. Így egy sebész, aki úgy kezeli a húst, mint egy hentes, valóban erősen inkompetens és veszélyes. A következtetésen alapuló út a (16) megfelelő megértéséhez magában foglalja annak felidézését, hogy hogyan bánik egy hentes a hússal és ennek alapján a hentes* ideiglenes fogalom megkonstruálását, amely azokra az emberekre utal, akik a hentesekhez hasonlósan bánnak a hússal. Tulajdonképpen minden hentes és (remélhetőleg) nagyon kevés sebész tartozik e fogalom kiterjesztésébe. Egy hentes tulajdonságaként a hentes*-séget megjelölni majdnem szószaporítás. Egy sebész esetében azonban erős inkompetenciát sugall – ráadásul az inkompetencia olyan hihetetlen fokát, hogy tulajdonképpen a (16) nemcsak metafora, hanem hiperbola is. Egy húst szerető ember, aki fontosnak tartja a gondos, precíz vágást, akár dicsérhet is egy hentest a következőképen: ()

Ez a hentes egy sebész.

A (17) mondat értelmezése szimmetrikus a (16)-nál leírttal és magában foglalja a sebész* ideiglenes fogalom megalkotását, amely azokra az emberekre utal, akik nagy gonddal vágnak húst. Egy olyan hentes, aki egyben sebész* is, kiemelkedően ért a szakmájához és megbízható. A predikátumok, amelyeket a hentes* és a sebész*, valamint az inkompetencia implikációja az olyan sebésznél, aki hentes* és a kompetencia implikációja az olyan hentesnél, aki sebész*, együtt problémamentesen idéződnek fel egy következtetésen alapuló megértési folyamat során, amelyet a relevancia keresése irányít. Ez a keret ígéretesnek tűnik, és segít a metafora következtetésalapú és tradicionálisabb, asszociációs megközelítései közti különbség megragadásában. Az összes következtetésalapú kapcsolat asszociáció, de nem minden asszociáció következtetésalapú. Úgy tűnhet, hogy azon állítással, hogy az értelmezés kizárólag következtetéses kapcsolatokon alapul, megfosztottuk magunkat némi magyarázó erőtől. Ahogy ez a példa is mutatja, éppen ellenkezőleg. Egy teljesen következtetésalapú elméletben a terület-feltérképezéseket inkább a metaforikus nyelvhasználat eredményeként, mint előzményeként érdemes szemlélni, amely a metaforamegértés erőfeszítés oldalához járul hozzá, inkább a kontextuális feltételezések és



Dan Sperber – Deirdre Wilson

implikációk elérhetőségének módosításával, mint azzal, hogy központi szerepet játszik valamely kognitív nyelvészeti elméletben (Gibbs–Tendahl 2006).

. A kontextuális implikációk erőssége, az implikatúrák erőssége Ha fenntartjuk, hogy a metaforák a nyelvhasználatban nem alkotnak külön, egyedi kategóriát, akkor vajon tagadjuk azt a nyilvánvaló igazságot, hogy a metaforákhoz gyakran szembeötlően kreatív és erős nyelvhasználat kapcsolódik? Amennyiben nem tagadjuk ezt – és valóban nem tesszük –, hogy magyarázható ez a fajta nyelvhasználat? A megnyilatkozások kognitív hatás keltésével érnek el relevanciát. Lehet számos kognitív hatásuk, vagy csak néhány, ezek a hatások pedig lehetnek erősebbek vagy gyengébbek. Illusztrációként feltételezzük, hogy időben érkezel a reptérre, hogy felszállj egy járatra, amelynek délután 2-re kell Atlantába érnie. Egy bejelentést hallva, amely szerint lehetséges, hogy a járat késni fog, a következőt mondod a légitársaság egy alkalmazottjának: ()

Öt előtt Atlantában kell lennem. Oda fogok érni?

Az alkalmazott a (19a) vagy a (19b) mondattal válaszol: ()

a. Hát, a járata legalább 20 perccel később indul. b. Hát, a járata legalább 2 órával később indul.

A (19b) mondatnak nyilván több kontextuális implikációja van, mint a (19a)-nak. Mindkettő szolgál némi alappal a (20) konklúzióhoz. ()

Öt után fog Atlantába érni.

Másképpen azt mondhatjuk, hogy (19a) és (19b) gyengén implikálja (20)-at. Az ilyen gyenge implikációk (vagy valószínűsítések) szintén kognitív hatások, és hozzájárulnak a kognitív input relevanciájához. Mivel annak valószínűségét, hogy későn fogsz Atlantába érni, a (19b) jobban emeli, mint a (19a), a (20) erősebben következik (19b)-ből. Mégis, ha bármely megnyilatkozás alapján feltételeznéd, hogy ötnél később érsz majd Atlantába, ez a következtetés a saját háttérbeli hiedelmeidtől függne nagy mértékben, habár nyilvánvalóan szerepet játszana benne az is, amit a légitársaság alkalmazottja mondott. Összességében ez a példa rámutat, hogy egy megnyilatkozás kontextuális implikációi hogyan változhatnak minőségileg és erősség tekintetében egyaránt.

A metafora leleplezése



Tulajdonképpen a legtöbb kontextuális implikáció inkább valószínűsíthető, mint biztosra vehető a rájuk kontextuálisan utaló premisszák alapján, mivel az implikáció függ olyan más kontextuális premisszák igazságértékétől, amelyek általában kevésbé biztosak. Egy következtetésre való biztos utalást lehet a legerősebb kontextuális implikáció határeseteként szemlélni (l. Sperber–Wilson 1995, 2. fejezet). Egy kompetens beszélőnek jó oka kell hogy legyen arra a feltételezésre, hogy amit mond, az releváns lesz a hallgató számára. Maga a hallgató is adhatott erre okot, különösen, ha feltett egy kérdést, így tudatva a beszélővel, hogy az arra adott válasza releváns lesz a számára. Így ha egy ismeretlen megkérdezi tőled az utcán, hogy hány óra, biztos lehetsz benne, hogy releváns lesz számára, ha megmondod neki az időt, még akkor is, ha nem tudod, vagy nem is érdekel, hogy ez hogyan lesz releváns és nem utalsz a relevancia erősebb feltételezésére, mint amennyit minden megnyilatkozás magában hordoz. A legtöbb társalgásban a beszélőnek nem lehet jó oka azt gondolni, hogy a megnyilatkozásai elég relevánsak lesznek, kivéve, ha van némi fogalma azokról a kognitív hatásokról, amelyeket el fognak érni. A hallgató szempontjából elég gyakran biztonsággal feltételezhető, hogy a beszélőnek mind a szándékai, mind az elvárásai arra irányultak, hogy ő levonjon néhány olyan következtetést, melyet le is vont, mivel másképpen a beszélő nem feltételezhette volna, hogy a megnyilatkozása optimálisan releváns lesz az ő számára. Ezek a szándékolt implikációk a megnyilatkozás implikatúrái. Minden implikatúrát lehet erősebben és kevésbé erősen implikálni. A beszélő gondolhat egy olyan speciális implikációra, amelytől a megnyilatkozásának relevanciája függ, és lehet erős szándéka arra nézve, hogy a hallgató vonja le ezt a következtetést; ebben az esetben ezt a következtetést erősen implikálja. Ellenkező esetben a lehetséges értelmezések egy bizonytalan sorára is gondolhat, amelyek nagyjából hasonlóak, és amelyeknek bármely részhalmaza hozzájárulna megnyilatkozásának relevanciájához; és lehet egy olyan gyenge szándéka az összes, a sorban szereplő következtetésre nézve, hogy a hallgató vonja le azt a következtetést: ezek a gyenge implikatúrák. A beszélő szándékai a megnyilatkozásaiból levonható következtetetésekkel kapcsolatban e két véglet között bárhova eshetnek. Az implikatúrák erőssége a beszélő arra irányuló szándékának nyilvánvaló erősségétől függ, hogy egy bizonyos következtetés le legyen vonva. Fontos, hogy az implikatúrák erősségét megkülönböztessük a kontextuális implikációk erősségétől (attól függetlenül, hogy az is implikálva volt-e): mi annak a valószínűsége, hogy igaz, amennyiben adott, hogy az a premissza, amelyből kontextuálisan le lett vezetve, igaz volt. Amikor a légitársaság alkalmazottja a kérdésedre, hogy odaérsz-e majd ötre Atlantába, a (19a–b) alatti, kissé kitérő válaszokat adja, biztosnak kell lennie



Dan Sperber – Deirdre Wilson

abban, hogy amikor megmondja, hogy még mennyit kell várnod a beszállásra, alapot ad arra, hogy gyenge következtetéseket vonj le a saját késésed kockázatával kapcsolatban, így indirekt módon megválaszolva kérdésedet. Más szavakkal, úgy veheted, hogy az alkalmazott arra utal, hogy valóban elkéshetsz, de rád hagyja, hogy eldöntsd, mennyire komoly ez a kockázat. Az utalás gyenge.

. Költői hatások Az optimális relevanciát néhány erős implikációval, sok gyenge implikációval, vagy az erős és gyenge implikációk bármilyen kombinációjával lehet elérni. Egy relevanciára törekvő beszélő implikálhat (vagyis előrebocsáthat és szándékában állhat közölni) néhány erős implikatatúrát, vagy a gyenge implikatúrák egy széles skáláját (amelyek lehetnek erős vagy gyenge implikációk). Sokféleképpen lehet relevanciát elérni, ezek a módszerek mind az átadott implikációk, mind az implikálás erőssége tekintetében különböznek. Itt különösen azzal az esettel foglalkozunk, ahol a relevanciát olyan gyenge implikatúrák egy széles skálája biztosítja, amelyek maguk is gyengén implikáltak. A beszélőnek – vagy írónak, mivel a relevancia elérésének e módszere különösen jól fejlett az irodalomban – jó oka van annak feltételezésére, hogy a nagyjából azonos tartalmú potenciális implikációk széles skálájából elég sok igaz, vagy valószínűleg igaz, habár nem tudja, hogy melyek ezek (ezért gyenge implikációk) és se nem tudja előrebocsátani, se nem foglalkozik különösebben azzal, hogy előrebocsássa, hogy melyiket fogja majd a közönség figyelembe venni és elfogadni. A mellett érveltünk, hogy a gyenge implikatúrák ilyen széles skálájával elért kognitív hatások költői hatásként azonosíthatók (Sperber–Wilson 1995, 4. fejezet, 6. rész; Pilkington 2000). A valóban lényeges költői hatás erősen kreatív formája lehet a nyelvhasználatnak (mind a kommunikátor, mind a közönség részéről). Az ilyen típusú hatásokat a költői, laza vagy metaforikus kifejezések alkothatják meg, bár a klasszikus japán haikukban, amelyek a világirodalom leghatásosabb költői formái közé tartoznak, tipikusan szó szerinti nyelvhasználattal találkozunk. Nézzük Basho híres 1680-as haikuját: ()

A száraz ágon varjú telepedett meg. Ősz van, este van. (Fordította Tandori Dezső, 1981)

Ez az egyszerű, szó szerinti leírás gyengén sugallja az olyan implikációk széles körét, amelyek együttesen írnak le egy tájat, egy évszakot, egy időpontot, egy han-

A metafora leleplezése



gulatot és így tovább, ezáltal érve el egy erős összhatást, amely minden olvasónál különbözik bizonyos mértékben. Ezzel ellentétben a metaforák jó része nem különösebben költői. Itt nem azokra a konvencionális metaforákra gondolunk főleg, amelyek elvesztették a költőiségüket, ha egyáltalán rendelkeztek ilyesmivel (költői volt-e valaha az asztal lába kifejezés?), inkább azokra a kevésbé konvencionális, de nem különösebben kreatív metaforákra, amelyek inkább egy egyszerű ötletet hangsúlyoznak, mint egy bonyolultabbat vetnek fel. Nézzünk egy hétköznapi metaforát a (22) mondatban: ()

Nő a durva udvarlónak: Vegye le rólam a mancsait!

Itt a mancsai nyilvánvalóan a hallgató kezeire utal. A szó használata állati mancsokkal, esetlenséggel, állatiassággal és hasonlókkal kapcsolatos fogalmakat, eszméket és képeket is aktivál. A relevanciaelmélet szempontjából az, hogy ezek a fogalmak aktiválódtak, arra utal, hogy relevánsak lehetnek és az aktiválásukra fordított erőfeszítés, bár mellékes, arra mutat, hogy relevánsnak kellene lenniük (másképp az erőfeszítés az optimális relevancia feltételezésével ellentétben kárba veszne). Míg a lehetséges implikatúrák széles skálája járulhat hozzá a megnyilatkozás relevanciájához (hogy a címzett esetlen, durva, vadállati vágyai vannak és így tovább) egyik sem a beszélő erős implikációja. Mi a mellett érvelünk, hogy ezek gyengén implikáltak: a hallgatót valóban arra bátorítják, hogy legalább néhányat vegyen figyelembe és a beszélő által átadni szándékozott jelentés részének lássa őket. Ezek a homályos hatások azok, amelyek a mancsait használatát a kezeit használatánál relevánsabbá teszik. A klasszikus retorika szerint a mancs szó szerinti jelentését a (22) mondatban a kéz átvitt értelme váltja fel. Az újabb keletű, kategóriabővítésen alapuló megközelítések szerint a mancs kiterjesztése magában foglalja a végtagok egész skáláját (legyenek azok állati vagy emberi testrészek). Mindkét elemzésben az esetlenségre és a vadállatiságra való utalások a mancs szó konnotációjaként adódnak hozzá az átvitt jelentéshez. Itt a „konnotációk” szigorúan véve asszociációk: a múltbeli együttes megjelenésben gyökereznek, és bármely irányba mehetnek. Tulajdonképpen a mancs szóhoz rengeteg olyan asszociáció kapcsolódhat az esetlenségen és az állatiságon kívül, amelyek egy metaforában aktiválódhatnak, egészen a macska mancsának puhaságától az oroszlán mancsának erejéig. Az asszociációs pszichológiában megjelenő asszociációk túlságosan homályos folyamathoz vezetnek, másrészt pedig túl erőteljesek ahhoz, hogy a gyenge implikatúrák finomságát és irányultságait magyarázzák. Ahogy fentebb megjegyeztük, mi inkább folyamodnánk kizárólag a megfelelő következtetéses kapcsolatokon



Dan Sperber – Deirdre Wilson

alapuló asszociációkhoz és ragaszkodnánk általában is inkább a megértés következtetéses, mint asszociációs magyarázatához. A (22) mondatban az állítólagos konnotációk a mancs szó szerinti érteméhez (vagyis a mancshoz) kapcsolódnak, nem pedig az átvitt jelentéséhez, a kézhez vagy valamiféle végtaghoz. Egy következtetéses szemszögből nézve azon ötlet, amely szerint a mancs szó szerinti jelentése elmarad, míg a másodlagos jelentések megmaradnak, rejtélyesebb még a Chesire-macska mosolyánál is, amely a macska hűlt helyén időzik tovább, míg a mancs szó szerinti jelentése konnotációinak az azt helyettesítő átvitt jelentést kellene ékesíteniük. Mi azt az alternatív elemzést részesítjük előnyben, amely mellett ebben a tanulmányban érveltünk. A (22) feldolgozásakor a hallgató próbaképpen kifejleszt párhuzamos értelmezéseket a beszélő által közölni szándékozott jelentés explicit és implicit jelentéseiről, és ezt akkor fejezi be, amikor összeállnak abban az értelemben, hogy az explicit tartalom kontextuálisan utal az implikált következtetésekre és az explicit és az implicit tartalom együttesen kielégíti a hallgató relevanciával kapcsolatos elvárásait. Az explicit és az implicit tartalom közti kapcsolat megfelelő következtetéses alapja, továbbá az e tartalmakat meghatározó kölcsönös összehangolási folyamat természete miatt a megnyilatkozás szavainak dekódolt jelentései által felidézett implikációknak valódi implikációknak kell lenniük: vagyis a dekódolt jelentések kiterjesztéseinek legalább egy részét meg kell tartaniuk. Az ideiglenes fogalmak, amelyek ezen implikációk hordozására lettek megkonstruálva, legalább átfedésben lesznek a megnyilatkozás által kódolt fogalmakkal (különben tisztán asszociációs kapcsolatokkal lenne dolgunk, nem pedig következtetésesekkel). Mivel a mancs és a kéz fogalmának kiterjesztése nem ér össze, szerintünk a mancs a (22) mondatban nem használható a kéz jelentésének átadására. Valamiféle végtag közvetítésére sem használható, mivel a kiszélesített fogalom nem elég specifikus ahhoz, hogy kontextuálisan utaljon az esetlenségre, az állatiasságra és így tovább. Feltételezzük, hogy az ideiglenes fogalmak arra az alapra építenek, hogy a legtöbb metaforikus kifejezés eredetileg ideiglenes, vagyis használatuk pontos körülményeihez igazodnak és így valószínűtlen, hogy körülírhatóak lennének egy szokásos nyelvi kifejezés által. Ezért folyamodunk a „*” jelöléshez és ábrázoljuk pragmatikailag a mancs által átadott fogalmat mancs*-ként. A mancs* a legkönnyebben létrehozható fogalom, amelynek kiterjesztésébe beletartoznak a hallgató kezei is, és amely hordozza azokat a gyenge kontextuális implikációkat, amelyek általában igazak a prototipikus mancsokra: esetlenül és durván használják őket stb. Ezek a gyenge implikációk maguk is gyengén implikáltak: vagyis a beszélő átadási szándékai gyengék voltak. Ezen értelmezés szerint a megnyilatkozás azáltal ér el optimális relevanciát, hogy egy erős explicit kérést fogalmaz

A metafora leleplezése



meg, hogy a hallgató mozdítsa el a mancs*-ait és gyengén implikálva, hogy esetlenül és durván viselkedik. Fontos megjegyezni, hogy az így létrehozott mancs*, mind a mancs bővítését, mind pedig szűkítését tartalmazza, a legtöbb metaforikus használatot átadó ideiglenes jelentéshez hasonlóan. Így még egy olyan gyakori metafora is, mint a Vegye le rólam a mancsait!, egy sor gyenge implikatúra által szerzi relevanciájának egy részét: egy cseppnyi költőiség, még ha szerény is. A kreatívabb metaforák esetében a relevancia sokkal nagyobb mértékben (vagy akár teljesen) függhet az ilyen gyenge implikatúráktól oly módon, amely helyénvalóvá teszi a „költői hatás” említését. Nézzük Carl Sandburg Köd című versét, amelynek első két sora a kreatív metafora leggyakrabban idézett példája: ()

Lassan, mint a macska lépeget a köd. Nesztelen leül, bámulva a kikötőt s a várost – azután továbbmegy. (Keszthelyi Zoltán fordítása)

A „macskaként való lépegetés” felidéz egy sor csenddel kapcsolatos implikációt, mint például simaság, óvatosság. A következő négy sorral együtt olyan mozgást idéz fel, amely egyszerre öntudatosnak és nyugodtnak tűnik, így arra késztet, hogy ne véletlennek, hanem misztikus erők által elrendezettnek lássuk. A verseket újra és újra elolvassák. A második olvasásánál a vers egésze szolgáltat olyan kontextust, amelyben az első két sor értelmezhető. Basho korábban idézett szó szerinti haikujához hasonlóan Sandburg kiterjesztett metaforája gyengén implikál egy sor folyamatosan bővülő implikációt, amelyek kombinálják egy hely, egy atmoszféra és egy hangulat leírását, erős átfogó hatást elérve, amely olvasóról olvasóra és olvasásról olvasásra változik. Az, hogy a köd csendben, simán vagy óvatosan érkezik, nem része a vers explicit tartalmának. Az explicit tartalom része inkább az, hogy a köd macskaként lépeget*. És mi ez a fogalom? Ez egy olyan tulajdonság fogalma, amelyet nehéz vagy lehetetlen definiálni, egy olyan tulajdonságé, amely különösen a macskák egyes tipikus mozdulataira érvényes (bár nem minden mozdulatukra – a macska lépegethet erőszakos vagy játékos módon is), és a vers szerint a köd mozgására is jellemző. Hogyan jutunk el a macskaként lépeget* fogalomhoz? Azáltal, hogy úgy vesszük, hogy a költő a köd érkezéséhez azt a tulajdonságot kapcsolta, amelyet kontextuálisan a mint a macska lépeget kifejezés vet fel.



Dan Sperber – Deirdre Wilson

Sandburg versének példája valószínűleg segít abban, hogy tisztázza, hogyan és miért különösen valószínű, hogy a metaforák költői hatás létrehozása által érnek el optimális relevanciát: az ideiglenes fogalom létrehozásához szükséges erőfeszítés ehhez mérhető hatást igényel és az értelmezőnek a konstrukciós folyamatban meghagyott szabadsága miatt valószínűtlen, hogy ez néhány erősen implikált erős implikációból áll. Nem arról van szó, hogy metaforák esetében a fogalmak létrehozása automatikusan több erőfeszítést igényel (Gibbs 1994b; Noveck 2001). Számos metafora nagyon könnyen feldolgozható, míg – ahogy minden tudománnyal foglalkozó diák tudja – egy megfelelő szó szerinti értelmezéshez néha sokkal nehezebb eljutni, mint egy laza vagy metaforikus értelmezéshez. Nem is az a helyzet, hogy a szó szerinti kifejezés valójában kevésbé képes költői hatás elérésére, mint a metafora, ahogy a Basho-haiku és a Sandburg-féle haikuszerű vers összehasonlításánál is láthattuk. Összességében pusztán arról van szó, hogy minél közelebb kerül valaki a szó szerinti/laza/metaforikus kontinuum metaforikus végéhez, annál nagyobb értelmezésbeli szabadság jut a hallgatónak vagy az olvasónak és annál valószínűbb, hogy a relevanciát a gyenge implikációk egy széles skálájával, vagyis költői hatással éri el. Így amikor metaforákat más szóhasználathoz hasonlítunk, egy kicsit kevesebb van ebből, egy kicsit több pedig abból, de semmi olyasmi nem jelenik meg, ami egy külön elméletre tartana igényt, különösen nem egy jelentős elméletre. Irodalom Carston, Robyn 2002. Thoughts and utterances. The pragmatics of explicit communication. Oxford & Cambridge MA: Blackwell. Gibbs, Raymond W. Jr. 1994a. Figurative thought and figurative language. In: Morton Ann Gernsbacher (szerk.): Handbook of psycholinguistics. San Diego: Academic Press. 411–446. Gibbs, Raymond W. Jr. 1994b. The poetics of mind: Figurative thought, language, and understanding. Cambridge: Cambridge University Press. Gibbs, Raymond W. Jr. 1996. Why many concepts are metaphorical. Cognition 61: 309–319. Gibbs, Raymond W. Jr. 1998. The fight over metaphor in thought and language. In: Albert Katz – Cristina Cacciari – Raymond W. Gibbs Jr. – Mark Turner (szerk.): Figurative language and thought. Oxford: Oxford University Press. 88–118. Gibbs, Raymond W. Jr. – Markus Tendahl 2006. Cognitive effort and effects in metaphor comprehension: Relevance theory and psycholinguistics. Mind and Language 21: 379–403. Gineste, Marie-Dominique – Bipin Indurkhyna – Victor Scart 2000. Emergence of features in metaphor comprehension. Metaphor and Symbol 15: 117–135. Glucksberg, Sam (szerk.) 2001. Understanding figurative language: From metaphors to idioms. Oxford: Oxford University Press. Grice, H. Paul 2011. Tanulmányok a szavak életéről. Budapest: Gondolat.

A metafora leleplezése



Henst, Jean-Baptiste van der – Dan Sperber 2004. Testing the cognitive and communicative principles of relevance. In: Ira A. Noveck – Dan Sperber (szerk.): Experimental pragmatics. Houndmills, Basingstoke/New York: Palgrave Macmillan. 141–172. Kintsch, Walter 2000. Metaphor comprehension: A computational theory. Psychonomic Bulletin & Review 7: 257–266. Lasersohn, Peter 1999. Pragmatic halos. Language 75: 522–551. Martinich, Aloysius P. 1984. A theory for metaphor. Journal of Literary Semantics 13: 35–56. Murphy, Gregory L. 1996. On metaphoric representation. Cognition 60: 173–204. Murphy, Gregory L. 1997. Reasons to doubt the present evidence for metaphoric representation. Cognition 62: 99–108. Noveck, Ira A. 2001. When children are more logical than adults: Experimental investigations of scalar implicature. Cognition 78: 165–188. Pilkington, Adrian 2000. Poetic effects: A Relevance Theory perspective. Amsterdam & Philadelphia: John Benjamins. Searle, John R. 2009. Beszédaktusok. Budapest: AKTI/Gondolat. Sperber, Dan – Deirdre Wilson 1995. Relevance: Communication and cognition. Second edition. Cambridge MA & Oxford: Blackwell. Sperber, Dan – Deirdre Wilson 1998. The mapping between the mental and the public lexicon. In: Peter Carruthers – Jill Boucher (szerk.): Language and thought: Interdisciplinary themes. Cambridge: Cambridge University Press. 184–200. Sperber, Dan – Deirdre Wilson 2005. Pragmatics. In: Frank Jackson – Michael Smith (szerk.): Oxford handbook of contemporary analytic philosophy. Oxford: Oxford University Press. 468– 501. Tourangeau, Roger – Lance Rips 1991. Interpreting and evaluating metaphors. Journal of Memory and Language 30: 452–472. Vega Moreno, Rosa 2004. Metaphor interpretation and emergence. UCL Working Papers in Linguistics 16: 197–222. Vega Moreno, Rosa 2007. Creativity and convention: The pragmatics of everyday figurative speech. Amsterdam & Philadelphia: John Benjamins. Wilson, Deirdre – Robyn Carston 2006. Metaphor, relevance and the “emergent property” issue. Mind & Language 21: 404–433. Wilson, Deirdre – Dan Sperber 2002. Truthfulness and relevance. Mind 111: 583–632. Wilson, Deirdre – Dan Sperber 2004. Relevance theory. In: Laurence R. Horn – Gregory Ward (szerk.): The handbook of pragmatics. Oxford & Malden MA: Blackwell. 607–632.



Dan Sperber – Deirdre Wilson

The exposure of metaphor Abstract: According to the approach relying on relevance theory, used in this paper, metaphors do not form a natural kind, and “metaphor” is not a concept of theoretical relevance in the study of linguistic communication. Metaphorical meanings are arrived at on the same road as literal, loose, or hyperbolic interpretations. There is no metaphor specific mechanism or a generalization only valid to metaphors. We are for this stance in our paper by showing that the same inferential processes are valid for both ends of the literal-loose-metaphoric continuum and both literal and metaphoric expressions can have a literary effect. Keywords: inference, metaphor, literal meaning, relevance

A kulturális diffúzió és a kognitív vonzerő: a nyelvi változás kutatásának egy lehetséges kerete* Olivier Morin Közép-európai Egyetem (CEU) [emailprotected]

Kivonat: A tanulmány elsősorban nyelvi példákra összpontosítva magyarázatot próbál adni arra, hogy hogyan terjednek a hagyományok az átadás kockázatai s az idő múlása ellenére. Ehhez két dolgot kell megoldani. Az első a lefáradás, a második a szokások „leállása”. A lefáradást mindannyian ismerjük a fülbesúgós játékokból: az átadási láncban néhány lépés után összegződnek a hibák. A „leállásnál” nem az átviteli hibákról van szó: az átviteli lánc a sikertelenség miatt szakad meg. Hogyan oldjuk meg ezeket a problémákat? A válasz attól függ, hogy melyiket tartjuk súlyosabbnak. Dolgozatomban a mellett érvelek, hogy ha egy hagyomány nem áll le, akkor sikere szinte teljesen kiegyenlíti a gyakori átadás okozta károkat. Feltéve, hogy a siker a kulturális fennmaradás kulcsa, ennek két okát elemezzük: a hozzáférhető egyéneket és a vonzó hagyományokat, az utóbbira összpontosítva. A hagyományok akkor vonzóak, ha megragadóak, érdekesek vagy hasznosak – ami természetesen sok forrásból fakadhat. Azt próbáljuk megjósolni, hogy milyen attrakciós mozzanatok segítik elő egy hagyomány sikerét egy populációban, az egyének hozzáférhetőségének függvényében. A kognitív antropológusok kedvenc gondolatából indulunk ki, hogy bizonyos kulturális elemek olyan pszichológiai mechanizmusokat mozgósítanak, amelyek a legtöbb embernél megtalálhatóak. Ezek többnyire „általánosan attraktívak”. Ezért sikeresebbek lesznek más hagyományoknál. Elméletünk szerint azonban nem mindig győznek. Többnyire akkor győznek, amikor a hozzáférhetőség alacsony. Vagyis olyan elszórt népességeknél, ahol az információtárolási technikák kevéssé fejlettek, s ahol a nemzedékváltás túl gyors ahhoz, hogy az idősebbek instruálják a fiatalokat. Ilyen esetekben az „általános attraktivitás” irányítja a kulturális terjedést. Ez magyarázza, hogy bizonyos hagyományok fennmaradnak olyan népességeknél is, ahol a kapcsolatok nehezen fenntarthatók. Virágoznak olyan elszórtan élő népességekben, amelyeknek nincsenek erre szolgáló erős intézményeik s nincsenek információtárolási technológiáik. Kulcsszavak: kulturális átadás, attraktivitás, átadási hibák, többszörös átadás

A szavak, a beszédhangok és a mondattani szabályok kulturális dolgok, vagyis másokkal való kapcsolatban sajátítjuk el őket. A hallgatók közösségének folyamatos hatása nélkül kifejezéseink, kiejtésünk, szókincsünk nem ilyen lenne, vagy mindenféle rendszer nélkül változna az egyének között. Még azok is, akik szerint mélységében tekintve az emberek ugyanazt a nyelvet beszélik, nos, még ők is elismerik, hogy ha van is ez az egyetemes nyelv, meg kell engedni, hogy számos változata lehet, melyek nem véletlenszerűek, hanem szinte teljesen * Fordította: Pléh Csaba.



Olivier Morin

a kulturális átadásnak köszönhetőek. A kulturális átadás révén a szókincs és a mondattan bizonyos vonásai hosszú ideig képesek fennmaradni, sokszor tovább is, mint maguk a nyelvek. Ebből a szempontból számos nyelvi jelenség az emberi hagyományozás körébe tartozik. Olyan gyakorlatok ezek, amelyek hosszú utat tesznek meg térben, és különösen az időben, mégpedig a kulturális átadásnak köszönhetően.

. A torzítás és a sikertelenség Ahhoz, hogy megértsük, miből is áll a nyelvi gyakorlatok túlélése vagy eltűnése, hasznos egy kicsit beletekintenünk, hogy milyen mechanizmusok tartják életben általában a hagyományokat. A kérdés úgy foglalható össze, hogy a túlélés érdekében egy hagyománynak két problémát kell megoldania. Az egyik a torzítás, a másik a sikertelenség problémája. A torzítás problémája ismertebb és számos vizsgálat utal rá. Ez az a probléma, amelyet a gyerek-körjátékban történő sorozatos fülbesúgással szoktunk illusztrálni. Ha egy átviteli láncon megy végig egy üzenet, akkor néhány kis változás elég ahhoz, hogy összegződjenek a másolási hibák. Ha az átvitel nem tökéletes minőségű, gyorsan eltűnik az átviendő anyag. A sikertelenség problémája nem az átvitel minőségével, hanem a mennyiségével kapcsolatos. Lehet, sőt, gyakori is, hogy egy gesztust pontosan adunk vissza, s egy gondolatot is pontosan megőrzünk, anélkül azonban, hogy továbbadnánk. Ilyenkor az átviteli lánc nem a hibák, hanem az eredménytelenség miatt szakad meg. Hogyan lehet megválaszolni ezt a két kérdést? Két módon. Lehet abból kiindulni, hogy a torzítás a komolyabb probléma, a sikertelenség pedig majd magától megoldódik. Fordítva is lehet azonban gondolkodni, felvetve, hogy ha egy hagyomány a sikertelenség kérdését megoldja, akkor többé-kevésbé el fog tűnni a torzítás is. Az első megoldási mód jellemzi azt a nagyszámú szerzőt, akik a kultúra alapjává az utánzást teszik. Szerintük – és köztük mindmáig a legkiválóbb Gabriel Tarde (1895) 19. századi francia szociológus – az emberek kényszeresen hozzá vannak szokva ahhoz, hogy lemásolják az őket körülvevő viselkedéseket és gondolatokat, különösen, ha nagy tekintélyű vagy nagy számú modelltől érkeznek. E felfogás szerint az embereknek megvan az a képességük, hogy az őket körülvevő dolgokat pontosan utánozzák, s így tartós hagyományokhoz jutnak. Ez a megoldás nagyon régóta velünk van és számos mai szerző is ezt hirdeti. Ha sokan bizonyos mértékű mimetikus képességeket tulajdonítanak is unokatestvéreinknek, legtöbben gondosan hozzáteszik, hogy a mi fajunkon kívül az utánzás

A kulturális diffúzió és a kognitív vonzerő



sosem elég hűséges ahhoz, hogy a legegyszerűbb technikai eljárásokon túl, bárminek az átvitelét biztosítsa; ezt csak az emberi utánzás pontossága engedi meg. Azért van több hagyományunk, mint más állatoknak, mert olyan kognitív képességeink vannak, amelyek lehetővé teszik az utánzást és a kulturális formációk kommunikálását és fejbentartását. Dolgozatom alternatívát kínál ezzel a felfogással szemben. Kiindulásként a prioritásokat fordítom meg. Az utánzáselméletet mindenekelőtt a torzítás érdekli, mivel képviselői úgy vélik, hogy a torzítatlan utánzás révén a sikertelenség könnyen megoldható. Szerintem éppen fordított a helyzet: ha megoldjuk a sikertelenség kérdését – de csak, ha megoldottuk – akkor fel sem merül a torzítás kérdése, legalábbis nincs szükség arra, hogy a pontos átvitel mechanizmusaira hivatkozva oldjuk meg. Ugyanakkor, ha a sikertelenség kérdését nem oldjuk meg, akkor a torzításé sosem fog megoldódni. A hagyományok nem maradnak fenn a siker hiányában. Ahhoz, hogy fennmaradjanak, terjedniük kell. Semmi értelme a jó átvitelnek, a jó utánzásnak, vagy a memorizálásnak, ha ez a folyamat csak egyszer megy végbe és csak néhány egyént érint. A hagyományok túlélését nem az átviteli mechanizmusok minősége, hanem az átviteli események mennyisége határozza meg. A kulturális átvitelt laboratóriumban utánzó kísérletek, amelyek sokban emlékeztetnek a fülbesúgós játékra, lehetővé teszik az elv illusztrálását. Néhány átviteli epizód elég ahhoz, hogy az átviendő anyag annyira átalakuljon, hogy felismerhetetlenné váljon. Gyakran úgy gondoljuk, hogy ez az átvitel hűségének hiányát jelzi. A torzítás végeredményben a másolási hibák összegződése. Szerintem ezt a kérdést nem lehet megoldani hűségesebb átvitellel. Elég, ha kicsiny hibákból elég sok van ahhoz, hogy ezek a hibák összegződjenek, s a hibák összege sosem nulla. A laboratóriumi körülményeken kívül azonban a hagyományok gyakran átalakulnak, ezzel együtt viszont tartósan fennmaradnak. Vagyis a terjedési lánco*kkal kapcsolatos kísérletekben megfigyelt torzítás nem a hűtlenségből ered. De akkor honnan származik? Szerintem abból, hogy ezekben a kísérletekben a résztvevőknek nincs joguk arra, hogy ugyanazt a dolgot többször átadják különböző személyeknek, vagy hogy különböző személyektől kapják. Tilos bennük az ismétlés, akárcsak a fülbesúgós játékban, és tilos az átviteli események redundanciája és megsokszorozása. A valóságban a kulturális átadási lánco*k sosem ilyenek, s ennek köszönhetően maradnak fenn. Egy hagyomány kulturális sikerét az ismétlés, a redundancia és a több szálú terjedés biztosítja. Ezek nélkül még a legpontosabb átvitel sem tudja megmenteni őket a kihalástól. Ehhez az átvitelnek már nem kell különösebben pontosnak lennie. Tanulmányomban a kulturális siker okait vizsgálom. Ez két dologtól függ: a rendelkezésre álló egyénektől és a hagyományok vonzerejétől. Az egyének



Olivier Morin

hozzáférhetőségét a technikák, az intézmények és a nemzedékek közötti kapcsolatok segítik, amelyek révén tudnak azután a hagyományok terjedni. A hagyományok vonzereje a kellemességgel, érdekességgel, hasznossággal kapcsolatos. Látni fogjuk, hogy bizonyos kulturális gyakorlatok sokkal sikeresebbek, mint mások, mivel egyetemes, vagy legalábbis nagyon általános pszichológiai mechanizmusokra építenek. A terjedési lánc elmélete szerint attól függ, hogy sikeres-e egy hagyomány átvétele egy populációban, hogy mennyire állnak rendelkezésre az egyének. Elméletem szerint, amikor a hozzáférhetőség körülményei nehezek – olyan népességeknél, amelyek nagyon szétszóródtak, gyengék az információtárolási technikáik, vagy túl gyors a nemzedékváltás ahhoz, hogy az idősebbek instruálni tudják a fiatalabbakat – a legáltalánosabb vonzerők győzedelmeskednek. Ennek köszönhetően cirkulálnak bizonyos hagyományok olyan populációk körében, amelyekben nem könnyű a kapcsolatteremtés. Erőteljes intézmények és információtárolást segítő eljárások nélkül nem képesek erre. Nagy távolságokat a hagyományok csak úgy képesek megtenni, ha nagyszámú átvitel történik. Mindegyik személy egy kis lépést tesz. Sok kis lépésre van azonban szükség, vagyis a hagyomány sok különböző egyént kell, hogy érdekeljen, sok egymástól eltérő kontextusban. Sokan elfogadják azt a tézist, amely egy, a kulturális átadásnak szentelt különböző diszciplínák jövőjéről szóló kötet bevezetőjében szerepel: „A kultúra fennmaradása alapvetően átviteli kérdés: az egyik egyéntől egy másikhoz, vagy az egyik csoporttól egy másikhoz való átvitel függvénye” (Schönpflug 2009). Ártatlannak tűnik ez a kijelentés. A kultúrák terjedése egyszerűen átviteli epizódok sorozatából áll. Ha egy hagyomány alapvető jellemzői nagy téri és idői távolságban is megmaradnak, ez annak köszönhető, hogy az információ mindegyik átvitelnél megmarad. Azért csábító ez a gondolatmenet, mert az emberek túl komolyan veszik a torzítás problémáját, a hűséges átvitel pedig egy próbálkozás ennek megoldására. Szeretném bebizonyítani, hogy a hagyományok fennmaradása elsősorban nem az átviteli minőség függvénye. A jó átvitel se nem elégséges, se nem szükséges feltétele a hagyomány megmaradásának. Ahhoz ugyanis arra van szükség, hogy az átvitel elég gyakori legyen ahhoz, hogy redundáns, robusztus és javítható terjedési mintákat alakítson ki.

. Az átvitel könnyű, a terjedés nehéz .. Az átvitelnek nincs tehetetlensége A sikertelenség problémáját azért is nehezebb vizsgálni, mert a szakirodalom ezt elhallgatja. Úgy kezelik, hogy a kulturális átvitel tehetetlen. Egy gyakorlatot egy-

A kulturális diffúzió és a kognitív vonzerő



szer átvisznek, s akkor hajlamos lesz arra, hogy újra átvigye magát. Megfelelő körülmények között ez a természetes átviteli lendület spontán állandó hagyományokra vezethet. „A kultúra megjelenése a személyközi kommunikáció természetes és elkerülhetetlen következménye” (Conway–Schaller 2003). „Az utánzás fontos társas tanulási mód, amely spontán módon stabil kultúrákhoz vezethet” (Marino 2007, idézi Claidière–Sperber 2010). Tarde egész doktrínája az utánzás tehetetlenségén alapszik, azon, hogy az utánzás mindig önmagát ismétli. „Ha egy agyban valahol egy új gondolat, egy új ízlés valamilyen módon meggyökerezett, számos párhuzamos és egymással kommunikációs kapcsolatba került agyban többé-kevésbé gyorsan elterjed ez az újítás. [. . .] Vagyis: egy gondolat vagy egy szükséglet, ha létrejött, azonnal, magától terjedni kezd” (Tarde 1895/1993, 125). Természetesen nem mindig állnak fenn eszményi körülmények. Az átvitel emberi közegben történik. Ha az emberek nem élnek elég sokáig, vagy messze földre utaznak, azaz, ha nem hozzáférhetőek, akkor a hagyományok nem jutnak messzebb, mint ők. A harmincezer évvel ezelőtt létezett szájhagyomány egy jó része elveszett. Nem azért, mert nem volt hatékony az átadása, hanem azért, mert akik átadták, utód nélkül kihaltak, s nem voltak kapcsolatban a mai emberek őseivel. Mások azért tűntek el, mert azok a csoportok, amelyekben a hagyomány körözött, nem voltak elég nagyok ahhoz, hogy a véletlen kihalást elkerülendő elég nagyszámú példányuk maradjon fenn. Henrich (2004) példákkal leírja ezt a folyamatot. Senki sem tagadja, hogy ezek a tényezők korlátozzák az átvitel hatékonyságát. Az utánzás tehetetlenségében hinni annyit jelent, mint abban hinni, hogy ha eltekintünk a problémáktól, a kulturális átvitel puszta tehetetlensége révén tartós hagyományokat eredményez. Sok kutató gondolja úgy, hogy ezek az átviteli mechanizmusok minden egyéb folyamat nélkül kultúrát eredményeznek. Semmi sem illusztrálja ezt jobban, mint a memetika metaforája, amelyet Dawkins (1984; 1989) óta nagyon gyakran alkalmaznak a kultúra új megközelítései. Ez a kép azt hirdeti, hogy a hagyomány átvitel, a terjedés maga járványszerű. Ha egy fontos népességben elterjed egy vírus, ahol a kapcsolatok könnyűek és a populáció a mortalitást ellensúlyozva elég nagy, spontán diffúzió megy végbe. Szelekciós nyomás irányult erre. Ideális körülmények között egy vagy két speciális átviteli mechanizmus elégséges a széleskörű terjedés biztosítására. A feltételek ritkán eszményiek. Az emberek között nem mindig van elég interakció, a hordozók populációi elsorvadnak, vagy ritkulnak, más vírusok jelennek meg stb. Annak köszönhetően, hogy a vírus állandóan továbbviszi magát, a kultúra terjedése önmagából ered. Egy teljesen sima, súrlódásmentes felületen Galilei golyója körbemenne a Földön. Hasonló módon, a kultúra különböző utánzási elméletei a sikert az átviteli tehetetlenség ingyenes és elkerülhetetlen következményének tekintik. De ez mégsem így van. Ha valamit mondunk, csinálunk vagy ismétlünk,



Olivier Morin

utánzunk, egy igen korlátozott kontextuson túllépve kevés dolog tevődik át. Az egyéni, Tarde által jelentéktelennek nevezett újításokat, futó invenciókat az emberek nem adják spontán módon tovább. Nem indul el ezekből említésre méltó diffúziós lánc. A társas hatás bizonyos gyakorlatok felé vezethet, de nem eredményez lavinaszerű társadalmi járványokat. A sikertelenség problémája magától nem oldódik meg. Mindebben a hagyományok igenis eltérnek a járványoktól. Egy vírus terjedése néhány pontos, kifinomult mechanizmus függvénye, amelyek nagy szerepet játszanak a sikerében. Elég sokszor átvihető anélkül, hogy megváltozna. Önálló biológiai entitás, amely maga biztosítja a saját életét, akárcsak reprodukcióját és terjedését. Gondolati és magatartási működésünk viszont eltér ettől. Átvitele különböző mechanizmusokat használ fel, amelyeknek egy része hozzávetőleges, s amelyek nem azért jöttek létre, hogy pusztán a kultúrát szolgálják. A kényszeres utánzás felfogásának képviselőivel szemben, a gyakorlatok spontán módon nem reprodukálódnak. Ha elég sokszor átadták (a gondolatot vagy a viselkedést), menet közben sokszor átalakul, és ott is hagyják. Miért? Nem azért, mert a kulturális átvitel nem elég hatékony. Az átvitel olyan pontos tud lenni, amilyet csak akarunk. Ez azonban még nem elégséges ahhoz, hogy stabil diffúziós lánco*kat hozzon létre. Az átviteli mechanizmusok bár megbízhatóak, de nem tökéletesek. Vannak bizonyos hibáik. A terjedési lánc tiszta szekvenciális modelljeinél a hibák gyorsan összeadódnak anélkül, hogy az információveszteség helyrehozható lenne.

.. Néhány transzmissziós epizód még nem hoz létre terjedési mintát Ennek bizonyítására egy szociálpszichológiai kísérletsorozatból indulhatunk ki, amelyet a kulturális átadás elmélete egy idő óta, mint divatjamúltat, félretett. A kísérleti pszichológiában először 1932-ben Frederic Bartlett kezdte el használni az átadási lánco*kat. Bartlett (1932/1985) különböző anyagok megőrzését vizsgálta. Különösen nevessé vált egy amerikai indián mese, A szellemek háborúja megőrzése az átadási hálóban. A személy rekonstruálta történetet, miután elolvasta, azután egy másik személy is elolvasta ezt a rekonstrukciót, azután egy harmadik számára neki kellett rekonstruálnia a mesét stb. Ezt az egyszerű eljárást azóta számtalan vizsgálatban használták a kulturális átadás modellálására embereknél és más állatoknál (Whiten–Mesoudi 2009; Mesoudi–Whiten 2008). A laboratóriumi terjedési minták eszményi eszközt nyújtanak annak vizsgálatára, hogy vajon az átadási mechanizmusok önmagukban feloldják-e a tor-

A kulturális diffúzió és a kognitív vonzerő



zítás problémáját. Ezekben a lánco*kban a kulturális átadás epizódok sorozatává válik, amelyek lépésenként történnek, minden egyéb tényezőt kiiktatnak. Bartlett kísérletében s az összes folytatásban szigorúan lineáris a láncolat. A valamit átad B-nek, aki azt továbbadja C-nek, aki D-nek küldi tovább stb. Minden egyén egyetlen egyéntől kapja meg a továbbadandó anyagot és egyetlen alkalommal. A lineáris láncolatban minden lépés megbízhatósága egyetlen átadási epizód függvénye. Ilyen körülmények között egyedül az átadási mechanizmusok minősége határozza meg az anyag megőrzését. Laboratóriumon kívül azonban a terjedési lánco*k nem lineárisak, s ez sok mindent megváltoztat. Az átadás többször ismétlődhet. A egyik nap átad valamit B-nek, azután másnap is és harmadnap is. Bármilyen is az átadási mechanizmus, bármilyen legyen is a megbízhatósága és hatékonysága, a különböző alkalmak révén javítani lehet ezt. Ez az ismétlés problémája. Az üzenet különböző egyénektől is jöhet egy személy helyett. A, A′ és A′′ átadnak valamit B-nek. Különböző forrásokból kapva valamit, nagyobb az esély arra, hogy jobban megkapjuk. Az egyazon hagyomány különböző változatainak konfrontálásában rejlő redundancia megakadályozza B-t abban, hogy újra lemásolja azokat az egyedi hibákat vagy változatokat, amelyek valamely modellnél előfordulnak. Ez a hatás független az átviteli mechanizmusok minőségétől, megbízhatóságától és hatékonyságától. B szintetizáló képességének a függvénye, aki egy hagyomány rekonstruálása érdekében szembesíti és válogatja a különböző mutatókat. Ez az átvitel redundanciájának kérdése. Egyetlen forrásból kiindulva is megjelenhet több példányban egy terjedési lánc. A átad valamit B-nek és B′ -nek, akik a maguk részéről C és C ′ és C ′′ -nek, azok pedig D, D′ és D′′ -nek. Ha egy lánc párhuzamos terjedési lánco*kra sokszorozódik meg, akkor stabilabbá válik. Mindegyik terjedési allánc egy kiegészítő túlélési esélyt nyújt. A szekvenciális terjedési lánc viszont egyetlen fonalat sző, semmibe nem tud kapaszkodni, ha ez a fonal megszakad. Ez igaz még akkor is, ha egy szekvenciális lánc hűséges és szélsőségesen hatékony mechanizmusokat használ, vagy ha ezek nem tökéletesen hatékonyak. Ez a terjedési lánco*k megsokszorozódásának problémája. A fülbesúgós játék terjedési mintájában minden ismétlés, redundancia és megsokszorozódás ki van zárva, éppen ez definiálja a játékot. Ott csak az átviteli mechanizmusok minősége számít. A lineáris láncban nem jut túl messzire az átvitel. Már Bartlett is ezt figyelte meg. 6 átadási lépésnél A szellemek háborúja a felére csökken. Az utolsó változat 180 szóból áll, míg az eredeti 330-ból, s a történet néhány alapvető témája eltűnik, kezdve a címben is szereplő szellemekkel. Ugyanezt találjuk minden munkában, amelyek ugyanezen indián történettel reprodukálják Bartlett munkáit. Kurke et al. (1989) munkájában a mércék és a



Olivier Morin

csoportok függvényében 5 lépés után a történet 20–30-a maradt meg (l. még Northway 1936). Semmi sem változik, ha az átviendő anyag ismerősebb. Ezt Allport és Postman (1947) klasszikus rémhírterjedési vizsgálata igazolta. Hétköznapi helyzeteket mutató rajzok leírását használták a kísérletben. 5 vagy 6 átviteli lépés után a leírás 70-a eltűnt. Mesudi és Whiten (2004) munkájában 4 átviteli lépés után egy köznapi esemény 25 mondatos leírásából csak 3 mondat marad meg. Ugyanez a helyzet, ha szavakat használunk mutatóként és nem mondatokat. Az elfelejtett anyagot nem találjuk ki újra, vagy nem értelmezzük újra: az átadási mintából származó történetek egyszerűen szegényesebbek és rövidebbek, mint a kiinduló történet. Tiszta információveszteséggel van dolgunk. Bangerter (2000); Ward (1949); Hall (1951) munkáiban hasonló eredményeket kapunk (az utóbbi kettő rajzok átadásával foglalkozik). Három kísérletben (Higham 1951; Kashima 2000; Mesoudi et al. 2006) a problémát úgy próbálták kezelni, hogy bizonyos történeteket másoknál érdekesebbé tettek. A szerzők ugyanis rájöttek arra, hogy az emberek puszta tehetetlenségből mégsem adnak át mindent. Higham kísérletében, amelyet egyetemistákkal végzett, az egyik történet az elkövetkezendő vizsgákról szólt. A három kutatás szerint az érdekesség megnöveli a túlélési esélyt egy lineáris terjedési láncban, de nem eléggé ahhoz, hogy kiegyenlítse az elkerülhetetlen információveszteséget. Még a legérdekesebb történetek is, igen rövid láncnál is, csak kevéssé adódnak át. Kashimánál 5, Higham és Mesoudi munkájában 4 lépés után a szerzők szerint az eredeti anyag 0–50-a marad meg, a felénél több még a legérdekesebb történetből sem. Meg lehet nézni egy történet megjegyzésének minőségi mozzanatait is. Bizonyos témák inkább maradnak meg, egy jellegzetes elbeszélő struktúra megmarad, bizonyos szerkesztési szabályoknak megfelelően. Mindezek a történetjellemzők megszenvedik a lineáris terjedést. Nem ez a helyzet azonban a szájhagyománynál (Lord 1960; Rubin 1995). A meglehetősen hosszú eposzok és balladák nem szó szerint jegyződnek meg. Ahogy Lord másokkal együtt rámutatott, a szó szerintiség nem fontos az elbeszélők és a hallgatók számára. Ugyanakkor, ha a különböző szövegváltozatokat összehasonlítjuk, bizonyos vonások, formulák, a témák, az intrikus fordulatok stb. megmaradása kétségtelen. Rubin (1995) kvantitatívabban is bemutatja ezt. Vannak azután olyan szájhagyományok, mint pl. a gyermekmondókák, amelyek szó szerint maradnak fenn évtizedekre, vagy akár évszázadokra is (Morin 2010). A szájhagyomány történeteinek kulturális fennmaradása kísérletileg nem reprodukálható szekvenciális és lineáris láncolatokban. Ugyanakkor a laboratóriumokban sem lehetetlen stabil terjedési mintákat létrehozni. Vannak olyan kísérletek, amelyekben ez sikerült. Mindig két feltétel szükséges ehhez: a terjedési

A kulturális diffúzió és a kognitív vonzerő



minta nem szigorúan lineáris, s a személyek közvetlenül érdekeltek az átadott dolog felidézésében. Ezekben a kísérletekben (Baum et al. 2004; Caldwell–Millen 2008; Weick–Gilfillan 1971) kis csoportokat kérnek meg egy problémamegoldás eljárásainak ellenőrzésére. Jutalmat kapnak, ha sikerül a problémát megoldaniuk. A csoportok apránként megújulnak. Minden új jövevény, különböző személyektől, különböző dolgokat tudhat meg. Azt vesszük észre, hogy egyedi hűség nélkül, a személyek a működő megoldásokat adják tovább. A láncolatokban a jó ötletek a kísérlet végéig fennmaradnak. Weick és Gilfillan munkájában 8, Caldwell és Millen munkájában 10, Baum és munkatársai kutatásaiban pedig 12 nemzedéken át. Erre a szakaszra széles körben elfogadják a jó ötleteket és ezek kétségkívül megmaradnak a következő nemzedékeknél is. Mi történik, ha egy nem lineáris láncban egy olyan hagyomány átvitelét vizsgáljuk, amely a résztvevők számára nem hasznos és nem érdekes? Weick és Gilfillan (1971) egyik kísérlete választ ad erre a kérdésre. Két megoldást javasoltak a résztvevőknek egy probléma megoldására. Mindkettő ugyanolyan hasznos volt, de az egyik nehezebben volt alkalmazható. 8 nemzedék során a könnyebb megoldás adódott át, míg a nehezebb egyáltalán nem. Két további vizsgálatban (Jacobs– Campbell 1961; Zucker 1977) azt akarták elérni, hogy a kísérletben részt vevők egy vizuális illúziót adjanak át. Mások tanúbizonyságának hatására egy fénylő pontot véltek felfedezni, amely pedig a valóságban nem is volt ott. A csoportokat kis lépésekben újították meg úgy, hogy az illúzióra érzékennyé tett személyeket naivakkal cserélték ki. Az újabb nemzedékek bevonása során az illúzió rendkívüli mértékben csökkent. 12 lépés után teljesen eltűnt (Jacobs és Campbell), vagy már 8 lépés után is (Zucker). Ezek a kutatások arra mutatnak, hogy laboratóriumban csak akkor lehet hosszú terjedési mintákat elérni, ha a terjedési minta nem teljesen lineáris és az átadandó dolog elég fontos és érdekes a személyek számára ahhoz, hogy reprodukálják. Ez annak felel meg, hogy hajlékony utánzók vagyunk, nem utánzunk mindent (Gergely et al. 2002). Bármily kicsinyek legyenek is a veszteséges átadási minták, a laboratóriumi modell két feltétellel működővé tehető: belső vonzerő (érdekes legyen felidézni a dolgot) és a többszöri átadás lehetősége, vagyis az átadási minta ne legyen teljesen lineáris. Később látni fogjuk, hogy e két mozzanat a kulturális stabilitás kulcseleme. Pillanatnyilag jegyezzük meg azt, hogy egy gyakorlat ismételt utánzása nem vezet stabil hagyományokhoz, még kis lépésekben sem.



Olivier Morin

.. Nem az átvitel hűsége a probléma Ha ezekben a kísérletekben a terjedés meglehetősen morzsalékos, ez talán azért van, mert nem hűséges? Az érintett kísérletek egy részében ez valóban így van. A személyek nagyon rosszul idézik fel, amit át kell adniuk. Kashima kísérletében a történet nagy része (a helyzettől függően akár háromnegyede) már az első átadási lépésnél eltűnik. Talán jobb eredményeket kapunk, ha hatékonyabb átviteli mechanizmusokat állítunk előtérbe? Kétségkívül így van, de ez nem oldaná meg a problémánkat. A lineáris és szekvenciális átadási helyzet a torzítás problémáját még akkor sem oldaná meg, ha az átadás rendkívülien hűséges volna. Claidière és Sperber (2010) az állatokkal kapcsolatos átviteli lánco*kra vonatkozó, számos kísérletet összefoglaló cikkében ezt mutatja ki. Ezekben a kísérletekben állandóan megújított népességekben próbálják mérni egy magatartás terjedését. Az állatok, például a majmok, némi táplálékra tehetnek szert akkor, ha két eljárás közül választanak, s az egyik egy modellt követ. A két eljárás láthatóan azonos hatékonyságú. A fajtárs gesztusának pontos utánzása nem segíti a majmot a keresett táplálék megszerzésében. Az utánzás önkényes, mivel a majomnál semmi más nem preferáltatja az egyik módszert a másikkal szemben. Az első utánzót egy második utánzó elé állítják, akit azután egy harmadiknak mutatnak meg és így tovább. Az átviteli lánc néha nem ilyen lineáris, néha nem egy egyén kerül szembe egy másik egyénnel, hanem egy néhány főből álló csoport, amelyet állandóan megújítanak. Mindezek a kísérletek követik az általános szabályt: nem eredményeznek stabil diffúziós mintát, tíznél hosszabb lánco*kat. Pontosabban az állatoknál szimulált átadási lánco*kban mindegyik állatnak van esélye, hogy az előző nemzedék modelljét utánozza. Claidière és Sperber szerint elég, ha néhány egyén nem utánoz, s így megjelenik a nem utánzók vonala, amely gyorsan a többséggé válik. Bár az állatok nagy többsége pontosan utánozza modelljét, a pontatlan utánzók kisebbsége befolyásolja a terjedést. A néhány átadási megtöréstől visszakerül a terjedési lánc oda, ahol terjedés nélkül lenne, kettőből egyszer használják. Ezt a gondolatmenetet ki lehet terjeszteni minden olyan átadási láncra, ahol a reprodukálók számára nem túl érdekes hagyományokról beszélhetünk: legyen szó egy haszontalan eljárás vagy egy amerikai indián mese átadásáról. Az elégtelen utánzás könnyen összeomláshoz vezethet. Ha a magatartás átadása könnyű is és pontos is, ebből még nem következik a terjedés. Az adott körülmények között semmiféle tehetetlenség nem tartja meg az ismétlést. Ahhoz, hogy ez a lendület terjedjen és összegződjön, speciális mechanizmusokra van szükség: diffúziós mechanizmusokra.

A kulturális diffúzió és a kognitív vonzerő



.. Az átadás mennyisége többet számít, mint a minősége Már találkoztunk ezekkel a diffúziós mechanizmusokkal. Ezek az ismétlés, a redundancia és különösen az átvitel megsokszorozása. Jól ismertek ezek és senki sem tagadja a fontosságukat. Sokszor azonban olyan dolgoknak tartják őket, amelyeknek létezése nem szorul magyarázatra. Pedig egyszerűségük ellenére összetett tényezők hatását tükrözik, amelyek a hagyományok stabilitásának valódi okai. Megmagyarázom, hogyan biztosítják ezek a mechanizmusok a kulturális diffúziót és hogyan befolyásolják egymást.

.. A hagyomány számos robusztus átviteli mintán keresztül halad Ha a fentiekben vázolt elképzelés érvényes, akkor szoros kapcsolat kell, hogy legyen az átviteli események száma és a hagyomány túlélési esélye között. Egy kulturális elem átviteli gyakoriságának mértéke és a túlélés közti jelentős korrelációkat, nagy mennyiségű és könnyen hozzáférhető adatokkal, a történelmi nyelvészet dokumentálja. Ha a nyelvet egy másik szempontból nézzük, akkor azt mondhatjuk, hogy egy szó minden nyilvános használata egy átviteli lehetőség vagy ismétlési lehetőség azoknál, akik hallják. Akik valaha tanultak idegen nyelvet, tudják, hogy egy új szó átvétele nem egy alkalommal történik. A szó mindegyik használata kicsit stabilizálja a szót a közhasználatban. Önnél is, aki épp az imént olvasta az előző mondatot, stabilizálja egy kicsit a stabilizál szót. Most, hogy elolvasta ezt a szót, kicsivel több esélye lesz arra, hogy ez az ige (használatával, konnotációival, helyesírásával) eszébe jusson, s újra használja. Egy szó gyakorisága jó becslés az átvitel mennyiségére. Olyan mutató ez, amelyre kiváló adatok vannak. Mark Pagel egy 2007-es cikkében munkatársaival együtt kimutatta, hogy az angolban, a spanyolban, a görögben és az oroszban a szó használatának gyakorisága jól megjósolja a szavak élettartamát. Senkit nem lep ez meg, engem azonban a hatás mérete érdekel. A szavak élettartamát több mint felerészt a gyakoriságuk határozza meg. Ez messze a legjobb prediktora egy szó túlélésének. Nicholas Ostler (2005) ennél jobb minőségű módszerekkel hasonló következtetésekre jutott a nyelvek túlélését elemezve. Nagyszámú nyelv túlélési idejét összehasonlítva, két tényezőt mutatott ki, amelyek szerinte a legfontosabb prediktorok: az egyik az, hogy írásos vallási liturgiába kerül be (mint az ógörög vagy a szanszkrit), a másik pedig az, hogy nagy sűrűségű populáció beszéli (mint az egyiptomit vagy a kínait). Az általa megvizsgált összes mutató közül ez a két prediktor, különösen a második van a legszorosabb kapcsolatban egy



Olivier Morin

nyelv használati gyakoriságával, azzal, hogy milyen gyakran kerül kapcsolatba egy egyén élete során a nyelvvel. Itt sem az az érdekes, hogy ezeknek a prediktoroknak szerepük van, hanem az, hogy mennyivel fontosabb meghatározói a kulturális túlélésnek, mint az eszünkbe jutó más tényezők: például egy erős állam megléte, egy irodalmi kultúra megléte, a gyarmatok stb. Igaz, az olyan mutatók, mint egy szó gyakorisága, igen homályosak. Nem tudnak különbséget tenni az ismétlés, a redundancia és a megsokszorozódás között és nagyszámú különböző tényezőt tükröznek. Ezzel együtt korántsem triviális következtetésekre vezetnek. Ilyen például, hogy ugyanaz az átviteli mechanizmus, a szóbeli közlés nagyon eltérő stabilitású terjedési mintákat valósíthat meg. Egy szó túlélési esélyét nem átviteli pontossága szabja meg, hanem használati, vagyis átviteli gyakorisága. Ezt a gyakoriságot számos dolog befolyásolja: milyen könnyű megjegyezni egy szót, milyen hasznos a hétköznapokban, milyen sokan használják stb. Eddig semmi eredetit nem mondtam. Már Tarde doktrínájának is lényege volt, hogy a kulturális formák stabilitásának kulcsa az ismételt átadás. Hasonló érvelésre alapozott Tarde, amikor azt jósolta, hogy a gyakran ismétlődő rítusok tovább megmaradnak, mint azok a vallások, amelyekhez tartoznak. Ezt egyébként egyszer meg kellene vizsgálni. Sok adat szól a mellett, hogy az ismétlés és a redundancia robusztussá és javíthatóvá teszi a terjedési mintákat. A sokszorozódással azonban kevesebbet foglalkoztak. A kulturális átadás mai elméleteit jobban érdekli a terjedési csatornák megbízhatósága, mint mennyisége.

. A redundancia és az ismétlés megszilárdítják a terjedési mintákat Sok vizsgálat szól az ismétlés és a redundancia stabilizáló hatásáról. Tudjuk, hogy a redundancia és az ismétlés még akkor is képesek stabilizálni a hagyományokat, amikor az átvitel nem túl hűséges. Bizonyos mennyiségű redundanciára és ismétlésre ugyanis szükség van. Ha egy kulturális elemet csupán egyetlen modelltől és egyetlen alkalommal lehet elsajátítani, az ki fog halni, még akkor is, ha alkalmazkodási előnye van azoknak, akik használják, vagy akkor is, ha egyéni tanulással könnyen kialakítható (Enquist et al. 2010). Jól tudjuk tehát, hogy milyen szerepe van az ismétlésnek és a redundanciának abban, hogy egy terjedési csatorna stabilabbá váljon, mint akkor lenne, ha stabilitása pusztán átviteli mechanizmusok megbízhatóságától függne. Az is világosan megállapított tény, hogy egy elem bemutatási gyakorisága növeli annak memorizálhatóságát. Ezt, amióta csak van emlékezetpszichológia, vagyis

A kulturális diffúzió és a kognitív vonzerő



Ebbinghaus 1885-ös vizsgálatai óta ismerjük és részletesen feltárták hatását a kulturális stabilitásra (Rubin 1995). Ami jól memorizált, az tovább marad az emlékezetben, tovább áll rendelkezésre átadáshoz, s mindez nem hagyja érintetlenül a hagyományok stabilitását. Merész módon alkalmazza Harvey Whitehouse (2000) antropológus ezt az elvet a vallási rítusok átadására. Elmélete szerint a rítusok memorizálása nem ugyanolyan kereteknek felel meg attól függően, hogy ismétlődő vagy nem ismétlődő rítusokról van szó. Meghökkentő és élénk emlékekre van szükség ahhoz, hogy egy utoljára tíz évvel ezelőtt használt rítust az emlékezetembe idézzek. A ritkán ismételt rítusok az érzékekre nagyon ható elemeket (például fizikai fájdalmat) használnak (Whitehouse évekig foglalkozott terepmunkával a pápua új-guineai beavatási rítusok tanulmányozása során). Ha viszont egy rítust gyakran ismételnek, egy másik emlékezeti formát használhatunk a megjegyzésére: az ismétlődő rutinokat és gesztusokat leképező emlékezetet. Ez az emlékezet érzéketlen az erős érzelmekre. Az előzővel ellentétben azonban érvek és szövegek is helyet kaphatnak benne. Whitehouse szerint a kétféle emlékezeti típus két eltérő rítust alapoz meg. Vannak ritka, de kiugró rítusok, amelyeknek az ünneplése erős érzésekhez kapcsolódik, és vannak rutinként végzett, unalmas és meglehetősen stabil rítusok. Az egyik fennmaradásának az érzelmi erősség, a másikénak a gyakoriság az alapja. Az ezeket az elméleteket mozgató intuíció igen nyilvánvaló. Az ismétlés és a redundancia lehetővé teszi, hogy a diffúziós lánco*k, amelyek egyébként eltűnnének, stabillá és javíthatóvá váljanak. De ez lenne minden?

.. A hagyományoknak meg kell sokszorozódniuk, hogy túléljenek Whitehouse a rítusok átadásával kapcsolatos elméletével rámutat arra, hogy az emlékezetben kiugró, ritka rítusok még egy szempontból eltérnek a gyakori, rutinszerű rítusoktól, amit az elmélete nemigen tud magyarázni: a ritka rítusok megoszlása nem ugyanolyan, mint a gyakoriaké. A rutinszerű rítusok térben jobban eloszlanak, mint a ritkák (amelyek gyakran csak kis közösségekre érvényesek). Idői terjedésük is eltérő: a gyakori rítusok, ha változnak, egészükben és hirtelen változnak. Egy-két messianisztikus ház kivételével a rutinszerű rítusok sikere nagyobb, mint a ritkáké. Nincs-e valamilyen kapcsolat a rutinszerű rítusok ismétlése, sikere és terjedése között? Az, hogy egy rítust gyakran megismételnek, mégpedig igen gyakran nyilvánosan, nyilván befolyásolja a terjedését. A gyakran átvitt dolog nemcsak jobban megjegyződik és könnyebb pontosan reprodukálni, hanem a gyakori



Olivier Morin

átvitel kedvez a diffúziónak is. Mivel ezeket a rítusokat gyakran nyilvánosan ünneplik, több az alkalom a velük való találkozásra és az átvételükre. Jobban terjednek és nagyobb távolságot tesznek meg, gyorsabbak és gyorsabban képesek helyettesíteni, nagyobb sávban, mint a ritkábban átadott rítusok. Mindez következményekkel bír a hagyomány stabilitására is. Ha egy rítust számos faluban alkalmaznak, mindegyik faluban független terjedési láncot indíthat el. Ezzel csökken a hagyomány kihalásának veszélye. Egyenként mindegyik terjedési minta törékeny lehet; ha elegen vannak azonban, akkor egyesek közülük összevonódhatnak anélkül, hogy a hagyomány folyamatosságát veszélyeztetnék, míg egyetlen izolált lánc az összes kihalási kockázatot tartalmazza. Emiatt van az, hogy az új-guineai beavatási rítusok közül sokat állandóan kihalás fenyeget, mivel kis falusi közösségekhez tartoznak, bármilyen jól memorizáltak legyenek is (Barth 1975).

.. Egy hagyomány stabilitása együtt jár a sikerével Diffúzión azt értjük, hogy egy hagyományt eléggé hasonló formában megtalálhatunk térben elég távol levő helyeken, de különösen időben nagy távolságban. A stabilitás egy hagyomány diffúziójának csak egyik dimenziója. Lehet, hogy egy hagyomány nagyon elterjedt, nagy létszámú közösséget ér el anélkül, hogy a korlátozott téri és idői keretet túllépné. Ezek a hagyományok nagyon sikeresek, de kevésbé stabilak. A sikeres és a stabil hagyományok szembeállítását mindenki észrevette, aki a kulturális átalakulással foglalkozik. Tarde az elsővel kapcsolatban divatutánzásról beszélt, míg a másodikkal kapcsolatban szokásutánzásról. Bármilyen nevet adjunk is neki, mindenki érzi a különbséget. A gyereküknek nevet választó szülők, különbséget tesznek a hagyományos nevek és a divatos nevek között, amelyeknek egészen más az idői ciklusuk (Lieberson 2000). Korreláció van aközött, hogy milyen gyorsan válik egy név népszerűvé és hogy milyen gyorsan veszti el népszerűségét, s a szülők elég jól észlelik és meg tudják jósolni ezt a dinamikát (Berger–Le Mens 2009). A nagyon gyors siker a stabilitás kárára van: e szempontból a stabil hagyományok és a divatsiker közötti népszerű megkülönböztetés megalapozott. Felhívjuk azonban a figyelmet arra, hogy nem a siker az instabilitás oka. A siker hirtelensége fenyeget instabilitással. Maga a siker épp ellenkezőleg, a stabilitás egyik tényezője. A Berger által vizsgált adatok a nevekkel kapcsolatban ezt igazolják. Könnyen általánosítható ez az elv: a nagyon elterjedt keresztnevek, dalok és eljárások tovább megmaradnak. A divat és a szokás szembeállítása, bármilyen intuitív legyen is, elrejti azt a tényt, hogy – bár van néhány olyan eset, amikor

A kulturális diffúzió és a kognitív vonzerő



stabilitás nélküli a siker, s amikor a stabilitás nem jár együtt sikerrel – általában együtt jár a kulturális diffúzió e két tényezője. A siker a stabilitás egyik döntő összetevője. Bevett dolog a kulturális diffúzió mennyiségi oldalától eltekinteni. Ha egy hagyományőrző embertől azt kérjük, hogy mondja el kultúrája történetét, akkor a válasza szinte mindig a stabilitás és a megőrzés meséje. Hiányzik belőle a siker és a megsokszorozódás. Az általunk feltételezett három terjedési mechanizmus – az ismétlés, a redundancia és a megsokszorozódás – lehetővé teszi, hogy a kulturális diffúzió sikeres legyen, miközben az egyszerű átadási eseményláncolat ezt nem teszi lehetővé. Ezek biztosítják a kulturális transzmisszió sikerét még akkor is, amikor a transzmisszió mechanizmusai nem pontosak és nem hatékonyak. Ha a transzmisszió minden epizódnál rosszul működik, ezt javítani lehet azzal, hogy növeljük az epizódok számát. Az ismétlés révén több alkalommal lesz módunk tanulni. Össze tudjuk kombinálni a különböző változatokat, hogy amortizáljuk az átmenet hibáit a redundancia segítségével. Végül, különböző terjesztési lánco*kat indítunk el, arra számítva, hogy ezek egy kis része kielégítő pontosságú lesz még akkor is, ha egészében az átvitel közepes színvonalú. Mindezeknek köszönhetően az átviteli mechanizmusok magas megbízhatósága nem szükséges ahhoz, hogy jó kulturális diffúziót kapjunk. Fentebb azt is láttuk, hogy ez nem kielégítő tényező. Az átvitelt illetően a mennyiség fölényben van a minőséggel szemben. Bizonyos értelemben a régi jogi közhely, amely szerint egy tanú nem tanú, a kulturális átadásra is érvényes. Az egyetlen közvetítő révén átadódó hagyomány minden dologban tőle függ. Ki van szolgáltatva mindenféle véletlennek és átalakulásnak.

.. Miért sokszorozódnak meg a hagyományok? Egy hagyomány ismétlése, redundanciája és megsokszorozása között ott áll az átadások mennyisége. Miért adódnak át igen gyakran bizonyos hagyományok? Három dolognak köszönhetően. Először is a megelőző terjedés révén, annak köszönhetően, hogy hány egyén ismeri őket és ezek hogyan oszlanak meg a térben és időben. A második tényező a hagyomány vonzereje: az ismert hagyományt tovább akarjuk adni. Végül a harmadik tényező a hozzáférhetőség. Ahhoz, hogy egy hagyományt gyakran átadjanak, szükség van arra, hogy hordozói, akik különböző téri és idői pillanatokhoz tartoznak, más egyénekkel kölcsönhatásba tudjanak lépni – olyan terjedési lánco*kat létrehozva, amelyek túlmennek az általunk elfogadott tér-idői pontokon. A tér és az idő is el tudja az embereket választani egymástól.



Olivier Morin

.. A hozzáférhetőség; bizonyos képességeknél könnyebb a kapcsolat Minden csoportban vannak olyan egyénpárok, akik könnyen kapcsolatba lépnek egymással, s mások, akiknél többé-kevésbé hiányzik ez a lehetőség. Sok minden megakadályozhatja két ember kommunikációját. Például, ha nem egy időben élnek, ha földrajzilag távol vannak egymástól, ha nem tudnak találkozni stb. Egy adott populációnál is különböző mértékben hozzáférhetők az emberek a kommunikáció számára. A laboratóriumi kulturális terjedésvizsgálatokban például mindenki csak a láncban található két szomszédjával érintkezhet, s igen gyakran csak egyszer. Ezek a körülmények igen szokatlanok. A mi társadalmunkban kortársaink nagy számával tudunk kapcsolatot létrehozni és választott módon sok emberhez tudunk kapcsolódni. Ezek a körülmények ugyancsak különlegesek. A hozzáférhetőséget számos, többnyire egyszerű tényező befolyásolja. Az egyik az egyének élettartama. Ahol tovább élnek az emberek, ott több kortársuk van, mint ahol rövid az átlagos életkor. Így azután a teljes népesség nagyobb része hozzáférhető. Egy nagy területen szétszórtan elhelyezkedő populációnál kisebb populációs résszel tudunk kapcsolatot teremteni, mint egy sűrűn lakott területen. A hozzáférhetőség fogalma ezt a szembeállítást akarja kifejezni. A társadalomtudományokban vizsgált szociális hálók azért nem képviselik jól a hozzáférhetőséget, mert olyan populációkat modelleznek, amelyeket jól ismerünk, s amelyek kevéssé újulnak meg. Engem azok a populációk érdekelnek, amelyek állandóan megújulnak, s amelyeket részleteiben nem ismerünk. A társas kapcsolatok részletei kevésbé izgatnak, ezzel szemben a téri és idői mozzanatok nagyon. A társas hálózatok kapcsolatban vannak a hozzáférhetőséggel. Egy populáció annál hozzáférhetőbb, minél több barátunk vagy kapcsolatunk van ott. A hozzáférhetőség formálisabban is megszervezhető az intézmények segítségével. Egy populáció megszervezhető úgy, hogy tagjai könnyen kapcsolatba kerüljenek egymással. Az ilyen intézmények – a posta, az egyház, az újságok – hozzáférhetőségi szereplők, aminek révén a kulturális átvitel segítői lesznek. Ezek a szociológiai tényezők, bármilyen fontosak is legyenek, nem az egyetlenek, amelyek egy populáción belül meghatározzák a hozzáférhetőséget. Ez részben skálakérdés is. Minél fontosabbnak tartjuk az idői és téri skálát, annál közepesebb lesz a hozzáférhetőség. Minél nagyobb területet foglal el egy populáció, annál nehezebb lesz egy tagjának a populáció jó részével kapcsolatba kerülnie. Minél tovább él egy populáció időben, annál távolabb kerülnek egymástól időben az egyének, s annál kevésbé hozzáférhetők egymás számára. Így jellemezve túl általánosak ezek a tényezők. A valóságban sok minden befolyásolja őket. Néhány újabban megjelent technika bizonyos mértékig átlép

A kulturális diffúzió és a kognitív vonzerő



a hozzáférhetőségi korlátokon. Sokat tudunk például az írás hatásáról (Goody 1979; Severin 2007; Bloch 1997) és a kognitívabb eljárásokról, mint az emlékezet, a mnemotechnika és a retorika más fejezetei (Yates 1966). Ami az intézményeket illeti, ezek még több problémát vetnek fel. Az orális kultúrákról fogunk beszélni. Ezek olyan helyzetek, ahol a terjedést nem bonyolult eljárások biztosítják és nem is intézmények. Az „orális” bizonyos értelemben félrevezető jelző, hiszen itt a hagyományok nem mindig a szavakkal kapcsolatosak, és átadásuk sem mindig a nyelven keresztül valósul meg. Másrészt vannak olyan verbális eljárások, mint például a rituális formulák, amelyek kifinomult emlékezeti technikákon alapulnak azért, hogy átadhatóak legyenek, s amelyek sok szempontból az írásbeliségre támaszkodnak (Severin 2007). Itt sem a beszéd művészetével foglalkozunk, hanem a különösebb technikai támasz nélküli átadásokkal.

.. Különböző módjai vannak a megsokszorozódásnak, különböző diffúziós lánco*kkal A nagyobb hozzáférhetőség két módon képes stabilizálni a terjedési lánco*kat. A térben vagy időben távoli pontokat összekapcsolva néhány átviteli lépéssel jelentős távolságokat képes megtenni. Ezek a lánco*k kevés emberen mennek át ebben az értelemben. Rövidek, ugyanakkor kiterjedtek, mégis messzire jutnak el, mintha a kulturális terjedés hétmérföldes csizmát vett volna fel. A másik lehetőség, amikor bizonyos egyének nagy létszámú populációt képesek elérni. Kialakulhatnak olyan terjedési minták, amelyek néhány pontból kiindulva nagyszámú láncot tartalmaznak. Az ilyen hagyományok nagyon kiterjedt hálózatokat teremtenek, megsokszorozzák az elágazásokat, amelyek párhuzamosan és nem szeriálisan működnek. Az ilyen hálózatokat nevezzük nagynak. Amikor viszont a hozzáférhetőség közepes, akkor nehézzé válik a néhány lépéses, mégis távolsági átvitel, illetve a nagy terjedési hálózatok kialakítása. Ilyen populációknál a legvalószínűbb hálózatok kevésbé kiterjedtek, hosszúak és szűkek. Az utóbbi esetben térben vagy időben nagy távolságot járnak be, de nagyszámú átadási lépéssel, és kevésbé hajlanak a sokasodásra. Nézzünk egy analógiát! Egy olyan országban, ahol a városokat fejlett útrendszer köti össze, egymástól nagy távolságban lévő városok között közvetlen kapcsolatok vannak, s a legtöbb város több más várossal is kapcsolatban áll. Itt olyan hosszú utakat tudunk megtenni, amelyek csak néhány várost érintenek, vagy egyetlen városból kiindulva sok várost kapcsolnak össze. A kiterjedt és kifinomult utak könnyen járhatóak. Képzeljünk el egy másik országot, kevésbé fejlett úthálózattal. Itt nehéz messzire jutni anélkül, hogy nagyszámú különböző várost



Olivier Morin

érintenénk. Egy adott városból kiindulva csak kisszámú más városba lehet eljutni, a többiek csak közvetve érhetők el, más városokon keresztül. Ebben az országban a hosszú utak sok lépésből állnak és a pályák keskenyek. Rövidek azok az útvonalak, amelyeken kisszámú szakasz van, és amelyek megosztottak. Olyan populációban, ahol a hozzáférhetőség nagy, a terjedési lánco*knak sok formája és mérete lehet, és formájukat nem korlátozza a méretük. Lehet találni hosszú és széles, hosszú és keskeny, hosszú és kompakt, hosszú és sűrű, valamint sokféle rövid láncot. Egy lánc lehet hosszú, miközben nem keskeny, vagy nem kompakt. Ahol viszont a hozzáférhetőség gyengébb, ott a lánco*k formája és mérete kevésbé szabad és jobban megjósolható. A nagy és sűrű lánco*k inkább rövidek, míg a hosszúak inkább kompaktak és keskenyek. Minél gyengébb a hozzáférhetőség, annál inkább meghatározza a lánc hosszát. A rajta található csomópontok száma, és másrészt a hossz, korlátozza a szélességet. A hosszú lánco*k ilyen hálózatban kompaktak és keskenyek. A legtöbb emberi populáció a neolitikumtól kezdődően a hozzáférhetőség robbanásszerű növekedésén ment át többször is. A népsűrűség növekedése, az információtárolási eszközök megváltozása, az intézmények kialakulása, mind többször átalakult fajunk története során. Mindezen felfordulások következtében a ma ismert hozzáférhetőség lényegében abnormálisnak tekinthető. Ugyanakkor a hozzáférhetőség robbanásszerű növekedése nem volt általános és egyetemes. Nem egyformán érintett minden populációt és minden kulturális területet. Sokan vannak, akik nem tudnak nagy számban kapcsolatba kerülni más egyénekkel több évszázadon, vagy több száz kilométeren átlépve. A legtöbb hagyomány kompakt, hosszú és keskeny terjedési lánco*kkal él. Ez annál inkább igaz, minél hosszabb szakaszokat veszünk. Egy populáción belül a hozzáférhetőség fontosabbnak tűnik, ha csak 50 évet tekintünk a történetéből 500 év helyett, hiszen az 500 évvel ezelőtti egyéneket nehezebb elérni, mint az 50 évvel ezelőttieket. Minél messzebbre lépünk vissza az időben, annál távolibbak és elhanyagolhatóbbak lesznek a mai kor hozzáférhetőségi robbanásai.

. A kulturális szelekció: sok címzett, kevés kiválasztott A megosztás nehéz dolog. Az átadott dolgok jó része nem vesz részt a diffúzióban. Pascal Boyer (2000) egy kifejezését átvéve, van egy kulturális szelekció, amely sok címzett mellett kevés kiválasztottat eredményez. A hagyományok sikere nagyon egyenetlen. A legnépszerűbb hagyományok nem ismernek felső határt, ugyanakkor kevés ilyen, többséget elérő hagyomány van. Ez a helyzet az amerikai keresztnévadással (Hahn–Bentley 2003), a szóhasználati gyakorisággal (Pagel et al.

A kulturális diffúzió és a kognitív vonzerő



2007), sőt még a különböző kutyafajták gyakoriságával is (Bentley et al. 2007). Ez a helyzet a nyelvek népszerűségével is. Kétségtelenül így van ez a vallások népszerűségénél is. Egy kézen megszámlálhatók azok a hagyományok, amelyek eléggé eltérnek egymástól, s a mai hívők jórészét vonzzák. Régóta felismerték, hogy itt egy hatványfüggvényről van szó, egy olyan statisztikai megoszlásról, amelyet Pareto (1896) óta jól ismernek a társadalomtudományok. Ennek lényege az, hogy kevesen vannak a kiválasztottak, legyen szó keresztényekről, könyvekről, vagy kutyafajták sikeréről. Azt látjuk, hogy minden kategóriánál a sikeresség a kategória nagyságának a függvénye, egy adott negatív kitevővel. Ha azt akarjuk megtudni, hogy hány könyvet adtak el 10 millió példányban, akkor egy negatív hatványra kell ezt a számot, a 10 milliót emelnünk. A hatványfüggvények alapvető érdekességét az adja, hogy nagyon egyenlőségellenesek. Más eloszlásokkal szemben nincs előre meghatározható felső határuk. Valószínűtlen, de nem lehetetlen, hogy egy könyvet 1 milliárd példányban adjanak el. A hatványfüggvények tehát szélsőségeket eredményeznek. Ámde ahhoz, hogy egy eloszlás szélsőségeket eredményezzen, nem kell hatványfüggvényt követnie. A legtöbb említett példa csak bizonyos határig vagy közelítőleg követ hatványfüggvényt. Gyakran lazán használjuk ezt a kategóriát. Ez a helyzet például a könyveladási sikereknél (Clauset et al. 2009). A részletek számunkra most nem érdekesek, csupán az érdekel bennünket, hogy a szélsőséges megoszlások jellemzője, hogy nagyon egyenlőségellenesek. A legnépszerűbb hagyományok sikerét nehéz megjósolni, akár hatványfüggvénnyel, akár anélkül. Semmi meglepő nincs a sikeres hagyományok ilyen egyenlőtlen megoszlásában. Amint egy dolog sikere egy átviteli folyamat függvénye, ez rendkívül változatossá teszi (Simon 1955). Ugyanez a helyzet az influenzajárványokkal. A legtöbb embert érintő járványok nagyon ritkák, ezek közül azonban néhány sokkal súlyosabb, s nehéz előre megmondani, mennyire terjednek a legjelentősebb járványok. A madárinfluenza különféle járványai által érintett madarak száma szélsőséges megoszlást követ (Small et al. 2007). A hagyományok sikere mindegyik vizsgált esetben szélsőséges megoszlást mutat. Vajon érvényes-e ez stabilitásukra is? Az adatok hiánya miatt legfeljebb annyit mondhatunk, hogy ez várható. Elméletileg a siker egyenlőtlen megoszlásának tükröződnie kellene annak élettartamában (a hagyományok stabilitása terjedésük egyik aspektusa és sikerük egyik következménye). Tudjuk például, hogy a legnépszerűbb nevek egyben a legtartósabbak is, bár a korreláció nem tökéletes. Ennek legalább három oka lehet. A diffúzió önmagát ismétli. Azoknak a hagyományoknak, amelyek nagyon jelen vannak egy populációban, nagyobb az esélyük az újra átvitelre és a túlélésre. Esélyük van arra is, hogy a sikerük ne véletlen következmény legyen, hogy vonzóbbak legyenek a többieknél, ami segíti



Olivier Morin

további terjedésüket. Végül bizonyos helyzetekben a kulturális szelekció a győzteseket díjazza, megvédve őket más hagyományok versenyétől. Nehezebb mennyiségileg vizsgálni az időben a hagyományok túlélését, mint adott időben a sikerüket. Ehhez arra lenne szükség, hogy olyan adataink legyenek, amelyek képesek megkülönböztetni a tartós és a múlékony hagyományokat. Mint látni fogjuk, ez a helyzet az indoeurópai szavak életével kapcsolatban. Ismereteim szerint a legteljesebb anyag egy nagyon furcsa példa: a cinkék éneke (Ficken–Weise 1984; Ficken–Popp 1995; Baker et al. 2000; Baker– Gammon 2008). A madártanászok meggyőződése, hogy ezek a madarak fajtársaiktól tanulják az éneklést. Az elszigetelten felnövő madarak éneke abnormális (Ficken–Weise 1984). Bizonyos dallamok átadódnak. Egy adott területen szinte minden madár által énekelt dallamok hiányozhatnak más területeken, akár csak néhány kilométerrel arrébb. Vannak azonban más dallamok, és ezekből sokkal több van, amelyek egyéni újítások és más cinkék sosem veszik át őket. Az, hogy a dallamok legnagyobb része egyáltalán nem hagyományos, jórészt megmagyarázza a különböző dallamok eltérő sikerét. A Ficken és Weise (1984) által regisztrált 180 dallammintából 104 egyenként a regisztrált dallamoknak kevesebb mint 0,1-át képviseli. Még akkor is megjelennek az egyenetlenségek, ha az egyéni dallamoktól eltekintünk, és csak azokat vesszük figyelembe, amelyeket több madár énekel. A szerzők által készített 5 felvétel tartalmaz két rendkívül gyakori dallamot, amely néhány tíz kilométernyi területen megjelenve a dallamok egyharmadát képviseli. A legtöbb további dallam csak egy vagy két megfigyelési pontra korlátozódik. Baker és munkatársai (2000) hasonló adatokat mutatnak be. Vannak ezzel analóg megfigyelések a csimpánz-kultúrában is. Kummer és Goodall (1985, 213) megjegyzi, hogy „a megfigyelt viselkedések közül csak kevés adódik át másoknak, s ritkán terjednek ki az egész csapatra”. A siker és az élettartam kapcsolatban vannak egymással. Baker és Gammon (2008) a több madár által énekelt 80–90 dallamot elemezve megemlíti, hogy ezek egyharmada nem élt túl egy szezont. A második harmadba tartozók 2–7 évszakot élnek meg. A harmadik harmad (24 dallam) a vizsgált időszakban végig megmarad 8 szezonon át, s talán még tovább is. Ezek a legsikeresebbek, 4–6-szor annyi madár osztozik bennük, mint a többiekben. Ez a siker nem teljesen a véletlennek köszönhető. Vannak akusztikus vonások, amelyek megjósolják, hogy mely dallamok maradnak meg több madárnál. Milyen sokáig maradnak meg ezek a túlélők? Jóval tovább. Ficken és Popp (1995) 11 olyan dallamtípust regisztrált, amelyek 19 év alatt nem változtak. A 19 év a széncinkék életében 6–7 teljes populációs megújulást eredményez, ami az embereknél legalább 4 évszázad lenne. Nem is tudjuk, milyen soká tartanának még ezek a dallamok.

A kulturális diffúzió és a kognitív vonzerő



Kevés hasonló finomságú munka van az emberi hagyományok idői fennmaradásáról. Vannak azonban statisztikailag könnyen ellenőrizhetők, például a keresztnevek az Egyesült Államokban és Európában (Hahn–Bentley 2003; Lieberson 2000). A keresztnevek sikere szélsőséges eloszlást mutat. Vajon igaz-e ez a stabilitásukra is? Úgy tűnik, hogy igen. Berger és Le Mens (2009) rámutat, hogy a vizsgált francia keresztnevek közül a legtöbb 40 évnél hamarabb az eredeti népszerűségének 10-ára esik vissza. Adataik egy kicsit alulbecsülik bizonyos keresztnevek élettartamát, amelyek később visszatérhetnek, vagy gyengébb népszerűséggel is fennmaradnak. Másrészt alulbecsülik a törékenyebb keresztnevek mennyiségi jelentőségét, mivel minden évben csak azt nézik meg, hogy mely neveket adták az adott évben 3-nál többször és összességében 20-nál többször. Ez a törvény által megkívánt anonimitás miatt van így. Feltehetjük, hogy ez a két torzítás eléggé kiegészíti egymást ahhoz, hogy megbecsülhetővé tegye a törékenyebb keresztnevek túlélési esélyét. Annyi azonban jól látható, hogy a túlélés esélye nagyon egyenlőtlenül oszlik meg. Ha minden névnek 50 esélye lenne, hogy 40 év alatt eltűnjön (ami a legtörékenyebb neveknél fenn is áll), akkor a regiszterben szereplő kb. 20.000 névből csak egy töredék maradna meg 5 évszázadon át. A valóság azonban nem ezt tükrözi. A legnépszerűbb francia keresztnevek egészen az ókorig visszavezethetők. Gyakran annyira evidensnek tűnik, hogy az eltűnt elemek sokaságában van egy kisszámú fennmaradó, hogy ezzel nem is törődünk. Az irodalomtörténészek például megelégszenek annyival, hogy az utóbbi négy évszázadban megjelent és olvasott regényeknek csak egy végtelenül kicsi részét olvassuk ma is. Ne feledjük, hogy mindig olyan művekről van szó, amelyeknek jelentős sikerük volt, s nem az íróasztalfiókban maradt kéziratokról. Franco Moretti (1998; 2000) az európai regény kvantitatív vizsgálatának egy úttörője, a Brit Birodalomban 1838 és 1861 között működő 15 vándorkönyvtár katalógusait vizsgálta meg. 1845-ben a Grey hadnagy, a csillagász, A régi családi legenda, az Anna, a bandita menyasszonya, Donna Mor eljegyzései, A skót regiment, A kereskedő lánya voltak a Delbee-ben működő Columbel mozgókönyvtár első katalóguslapjai. Ezek csak a sikerkönyvek. Mára közülük csak egy vagy kettő ismerős, a többiekről néma csend, eltűntek. [. . .] A könyvek jó része örökre eltűnik. A jó része kifejezés alábecsüli a lényeges mozzanatot: a mai irodalmi kánont 200 címre becsüljük, ami igen magas érték. Ez a valaha közölt regényeknek csak fél százalékát jelenti. (Moretti 2000, 207)

Moretti egy kicsit túlfeszíti az érvelést. Lehet, hogy azon könyvek közt is, amelyek nem részei az irodalmi kánonnak, vannak olyanok, amelyeket olvasnak. Másoknak nincs ilyen szerencséjük, de lehet, hogy maradt belőlük példány, amely majd egy nap olvasóra talál, ami egy kis virtuális túlélést eredményezhet ezeknek a



Olivier Morin

könyveknek. Nem mindegyik olyan elfelejtett, mint a Donna Mor eljegyzései. Ezzel együtt ezek a történetek azoknak a technikáknak és intézményeknek köszönhetik túlélésüket, amelyek mesterségesen, a közönség érdektelensége közepette is fenntartják őket. Ha egy hagyománynak ez sikerül is, mint a fenti katalógus irigylésre méltó olvasókört verbuváló regényeinek, a múltbeli túlélés nem biztosítja további túlélését és kevés lendületet ad a folytatáshoz. Bizonyos sikeren felül ez azonban már nem igaz. A legnépszerűbb hagyományok elég sokfelé eloszlottak ahhoz, hogy sikerük magától biztosítva legyen. Ezeknél, de csak ezeknél, megvan a tehetetlenségi nyomaték. Az ilyeneknek szerencséjük volt. Sikerük nem pusztán vonzerejüknek köszönhető. Tudjuk, hogy a diffúzió eredményeként szélsőséges sikermegoszlások jönnek létre, akár van szelekció, akár nincs (Bentley et al. 2007). De pusztán csak szerencséjük lenne ezeknek a hagyományoknak?

.. A hagyományok vonzerejüknek köszönhetően élik túl a kulturális szelekciót Véletlenszerű-e a szelekció? Nem. Bizonyos hagyományoknak nagyobb esélyük van a túlélésre, mint másoknak, például mert vonzóbbak. Annak, hogy a kulturális szelekció nem pusztán a véletlen következménye, furcsa következményét figyelhetjük meg a kulturális repertoárok méretében. Az irodalomtörténet ad erre példát. Moretti az említett vándorkönyvtár-vizsgálatban megemlíti, hogy a kis könyvtárak olvasóinak nagyobb arányban ajánlottak klasszikus könyveket (a Bentley-katalógusban, vagy a Dictionary of National Biography 55.000 szócikkében hivatkozott munkákat). A nagy könyvtárakban kisebb szerepet kapnak a klasszikusok a kevésbé ismert és a kevésbé terjesztett könyvekhez képest. Ugyanakkor a kis könyvtárak irodalmi ízlésükben nem konzervatívak. Kínálatukhoz képest ugyanolyan arányban ajánlanak idegen, külföldi könyveket, mint a nagy könyvtárak. A nagy könyvtárak abszolút számban több klasszikust vásárolnak, mint a kicsik, bár nem vesznek meg minden klasszikust, amit megvehetnének. Miért kisebb náluk a klasszikusok aránya a teljes kínálatban? Azért, mert módjuk van arra, hogy mélyebbre menjenek prioritási listájukban és diverzifikálódjanak. Erre más példákat is ismerünk. Amiensben a 16. században a sikeresebb naprakész könyvek arányában kétszer olyan jól reprezentáltak a kereskedők és a mesterek könyvtáraiban, akiknek kevés könyvük van, mint más tulajdonosoknál (Chartier 1982). Vagyis a könyvtár méretének csökkenésével megnő a klasszikusok aránya, ami a kulturális szelekció egy mutatója. Ha a könyvek vásárlása véletlenszerű

A kulturális diffúzió és a kognitív vonzerő



folyamat eredménye lenne, akkor a klasszikusoknak ugyanannyi esélyük lenne arra, hogy bekerüljenek a katalógusba, mint másoknak. A klasszikusok aránya ugyanolyan lenne a kis és a nagy könyvtárakban. Az, hogy nem ez a helyzet, arra utal, hogy a klasszikusok vonzóbbak (hírnevük, irodalmi értékük, vagy alacsonyabb áruk miatt). Ezt a hatást, bár Moretti ezt az elemzést nem végezte el, úgy is tekinthetjük, mint amely feltárja a kulturális szelekciót irányító preferenciákat és vonzalmakat. Amit a klasszikusoknál látunk, az nem érvényes az idegen eredetű könyvekre. Az, hogy az idegen könyvek viszonyítva ugyanolyan gyakoriak kis könyvtárakban, mint nagyokban, arra utal, hogy a könyvtárosok nem veszik figyelembe a szerzők nemzetiségét, amikor könyvet vásárolnak. A prioritásokban a nemzeti irodalom és a külföldi irodalom nincs rangsorolva. Az ember az ellenkezőt gondolhatta volna, hiszen, mint Moretti rámutat, ebben a korszakban a brit könyvtárakban az idegen szerzők aránya kicsiny és idővel csökken. Hiányzik a könyvtárméret hatása a külföldi könyvek arányára, ami arra utal, hogy ezek iránt a könyvek iránt ugyanakkora igény volt, mint a többiek iránt, vagyis az idegen könyvek is vonzóak voltak, legalábbis a könyvtárosok szemében. A kis mozgókönyvtárak tartalmát irányító szelekció annál erőteljesebb, minél gyengébbek az erőforrásaik, vagyis a vásárlási képességük és a könyvek tárolásának lehetősége. A nagy könyvtárak, mivel jobban finanszírozottak és hatalmasak, bizonyos mértékig mentesülnek a választás kényszere alól. A gazdag és jól finanszírozott könyvtáraknál a könyvek sikere kevésbé függ a vonzerejüktől, mint a kis könyvtáraknál. Általában feltételezhetjük, hogy egy hagyomány vonzereje erősebb olyan helyzetekben, ahol a diffúzió érdekében nehezebb sokasodni. Minél nagyobb egy népesség hozzáférhetősége, annál nagyobb szerepet játszik a sokasodás, az ismétlés és a redundancia. Ilyenkor sokszor megjelenhet az átadás során egy hagyomány, még akkor is, ha nem vonzó. A vonzerő csak akkor játszik szerepet, amikor van valami korlátozás. Ha az intézmények, a technika vagy a demográfiai körülmények miatt nagy számban van igény egy hagyományra, akkor nem nagyon számít, hogy elég érdekes-e. Így például Leonyid Brezsnyev életrajza, amelyet az SZKP KB Marxizmus-Leninizmus Intézete 1978-ban publikált, nem nagyon vonzotta a tömegeket. Ekkoriban egy brit kritikus a következőket írta (James 1978): „Olyan unalmas könyv ez, amelynek olvasása közben elaludna egy vándorló dervis is, ha akár csak egy oldalt is felolvasna valaki fennhangon. Az égből hullani kezdenének a madarak és a kutyák alól kicsúszna a lábuk.” Mindennek nem volt túl nagy jelentősége Brezsnyev életrajzának terjesztésében. Rövid távon, egy intézményes és technikai háttérnek köszönhetően a terjesztés biztosítva volt, mégpedig széles körben. Az olvasók egy része a hűség vagy a megfelelés érdekében



Olivier Morin

volt kénytelen olvasni a könyvet. Kétségkívül kis arányban voltak azok, akik a szöveggel kénytelenek voltak találkozni. A szovjet terjesztési rendszernek köszönhetően azonban a teljes sáv óriási volt. Nem minden hagyomány tud ilyen kedvező körülményekre számítani. Mit tegyünk, ha a hozzáférhetőség korántsem eszményi? Egy diffúziós lánc nem tud túl messze érni a diffúzió három tényezője, az ismétlés, a redundancia és a sokszorozódás híján. Ha nem elég nagy az egyének hozzáférhetősége a hagyományok könnyű terjedéséhez, akkor ezeknek elég vonzóaknak kell lenniük ahhoz, kiváltsák ezt a terjedést.

.. Bizonyos vonzerők lokális kontextushoz kapcsolódnak, mások viszont általánosabbak Egy gyakorlat akkor vonzóbb, ha egy másiknál nagyobb az esélye a reprodukálásra, vagy az alkalmazásra. Ezt az alapgondolatot számos tényező alakítja. Oly sok minden tehet egy gyakorlatot vonzóvá! Sokszor az egyedi kontextusra jellemző események sokaságáról van szó. Első látásra kevés dolog van, ami egyszerűen elég általános lenne ahhoz, hogy elméleti munkákba bekerüljön és ugyanakkor elég specifikus ahhoz, hogy elég érdekes legyen. Nem ez azonban a véleménye a kulturális epidemológiát művelőknek, s tágabban azoknak, akik pszichológiai szempontból tekintenek a kultúrára. Ezek a kutatók is elismerik, hogy a hagyományoknak többnyire helyi, esetleges, az adott kontextusra érvényes magyarázatuk van a sikerüket illetően. Bizonyos hagyományok, mint például a bocskai, helyi vonzerejüknek köszönhetik sikerüket, amely történelmi elemzéssel tárható fel. A lokális vonzerő mellett vannak azonban általánosabbak is. Nagyszámú helyzetben sok ember választásait irányítják ezek. Az általános vonzerő tényezőinek köszönhetően bizonyos gyakorlatok és bizonyos eszmék szinte mindig nagyobb eséllyel bírnak az átadásra és az adaptációra. Majd mindenkit elcsábítanak (Sperber–Hirschfeld 2004; Atran 2003; Boyer 2001). Régóta felismerték ezeket az általános vonzerőket és kulturális következményeiket. Nézzük például a hangszimbolika esetét. Platón Kratüloszáig megy vissza az a feltevés, amely szerint bizonyos jelentések kifejezésére bizonyos hangok megfelelőbbek. A pszichológusok régóta rámutattak, hogy igen eltérő kultúrákban azonos dolgokra igen hasonlóan használják a hangokat az emberek. Nagyobb esély van arra, hogy egy kerek formát bubá-nak, vagy egy szögleteset kiki-nek nevezünk, mint fordítva, akkor is, ha még olvasni sem tudunk, mint Köhler (1947) megemlíti.

A kulturális diffúzió és a kognitív vonzerő



Evolúciójuk során a nyelvek szintén bizonyos dolgokat jobban kifejező hangokat választottak ki. Ennek köszönhető, hogy például az angol naiv beszélők a véletlen szintnél jobban képesek kitalálni, hogy két joruba szó közül melyik jelenti azt, hogy ’mély’, és melyik azt, hogy ’sekély’. Ezt a jelenséget sokszor igazolták. Az eredményeket lehet úgy értelmezni, hogy az emberi nyelvek egy adott jelentés szempontjából intuitívabb és természetes hangok irányába fejlesztik a jelölést. A szavak hangalakja általános vonzerőt képez, amely bizonyos jelentésekre bizonyos hangokat preferál.

.. A hagyományok vonzereje nemcsak kognitív Két tényező befolyásolja, hogy egy hagyomány inkább átadódik-e vagy sem. Az egyik azzal kapcsolatos, hogy milyen könnyű átvinni, megjegyezni és visszaadni valamit. A másik pedig azzal kapcsolatos, hogy mennyire van kedvünk ehhez. Különböztessük meg a kognitív és a motivációs vonzerőket. Egy hagyomány akkor rendelkezik kognitív vonzerővel, ha megfelel információfeldolgozási képességeinknek, vagyis könnyen tárolható és reprodukálható; motivációs vonzereje akkor van, ha olyan érzelmeket és/vagy döntési mechanizmusokat mozgósít, amelyek a reprodukálás irányába hatnak. A kognitív és a motivációs vonzerők lehetnek helyiek vagy általánosak. Bizonyos hagyományok csak korlátozott számú személynél könnyen érthetőek és memorizálhatóak. A modális segédigék alkalmazásának szabálya a mai angolban könnyebben érthető és használható, mint más szabályok. Az angol korábbi beszélői, és azok számára, akik egyáltalán nem beszélnek angolul, lehet, hogy más szabályok intuitívabbak lennének. A kultúra új megközelítései közül a kognitív vonzerők iránt leginkább a kulturális epidemológia érdeklődik (Sperber 2001). A kulturális epidemológia időnként a kultúra szigorúan kognitív megközelítéseként mutatkozik be. Az emlékezet, a kategorizáció, következtetés és más információfeldolgozási mechanizmusok szerepét vizsgálja a kulturális átadásban. A valóságban azonban a kulturális epidemológia képviselői két végéről égetik a gyertyát. Kutatásaik nem pusztán a hagyomány kommunikációjára és a memorizációra alapozódnak. A legtöbben a hagyományokat nemcsak tárolt információnyalábként értelmezik, hanem olyan gyakorlatként, amely hordozóinál érzelmeket és motivációkat vált ki. Kétségtelen, hogy a nem kognitív tényezők iránti érdeklődés lehetne élénkebb is. Bírálhatjuk a kultúra pszichológiai értelmezőit, hogy többnyire csak információátviteli vagy hatékony hagyományátadási képességekre van szemük, s kevés mondanivalójuk van arról, hogy mit van kedvünk sokszor átadni. Ahhoz,



Olivier Morin

hogy a hagyományok elérjék azokat a helyeket és korszakokat, ahol támaszra lelnek, nagyon sokszor olyan emberi lények tömegéhez kell eljuttatnunk őket, akik a számítógépektől eltérően vágyakkal és ellenérzésekkel jellemezhetők. Ha egy hagyomány tetszik nekik, nagyban továbbadják. Módot fognak találni arra, hogy memorizálják és megértsék, még akkor is, ha nehéz. Ellenkező esetben nem adják tovább és nem őrzik meg a hagyományt még akkor sem, ha ez könnyen menne. A kognitív vonzerő talán azért kapott nagyobb figyelmet, mert egyrészt jobban ismert, és a mai pszichológiai kutatással jobban összhangban van. Talán megfelel ez annak az előítéletnek is, hogy a kulturális átvitel terén nagyobb a szerepe az átvitel minőségének, mint a mennyiségének. Kétségtelen, hogy az információtárolás megbízhatósága, a kommunikáció hitelessége elsősorban kognitív képességekkel kapcsolatos. Egy gyakorlat reprodukciójának vagy alkalmazásának vágya nagyobb szerepet játszik a sokszorozásában, mint megőrzésében az egyes személyeknél. Márpedig a kulturális átadás Bartlettre visszavezethető hagyományában, amely oly népszerű még ma is, minden az átvitel pontosságán és az átvitt dolog megjegyzésén múlik. Ahhoz, hogy egy történet egy laboratóriumi átadási hálóban megmaradjon, könnyen átadhatónak és könnyen megjegyezhetőnek kell lennie, s nemigen érdekes az, hogy a személyek szeretnék-e sokszor átadni, vagy hidegen hagyja őket. A többnyire önkéntes kísérleti személyek instrukciókat kaptak arra, hogy egyszer mondják el a történetet és többször nem is tehetik ezt meg. Természetesebb körülmények között bizonyos történeteket eszükbe sem jutna másodszor elmondani, míg másokat sokszor elmondanának. Ezt már észrevették a rémhírek terjedésével kapcsolatos úttörő vizsgálatok szerzői: A rémhírek terjedését normálisan befolyásoló mély motívumok helyett azt látjuk, hogy a laboratóriumi rémhír terjedése annak függvénye, hogy mennyire akarnak részt venni a személyek a kísérletben. A kísérlet keretein belül a személy szeretne pontos maradni, nem hívjuk elő az ő saját félelmeit, saját gyűlöleteit vagy reményeit. Összehasonlítva ezt a valós élettel, ő nem a rémhír spontán terjesztője. (Allport–Postman 1947, 64)

A laboratóriumi helyzetekben korlátozzuk a motivációs tényezők hatását, és így csak a kognitív mozzanatok kerülnek elemzésre. Nem akarom azt mondani, hogy ezek a korlátok nem számítanak. Ha egy hagyomány nem tud sokszorozódni, akkor mindenáron arra kell törekedni, hogy pontosan adják át és megjegyezzék, annak érdekében, hogy bármilyen kicsi esélye is legyen a túlélésre. Ez azonban a diffúzió túlélésének, vagyis stabilitásának csak egyik tényezője. A diffúzió másik tényezője, a siker, laboratóriumban semlegesítődik. Szó sincs a két elmeműködés közötti éles határról. A legtöbb vizuális vagy akusztikus mechanizmus összefügg a figyelem irányításával. Időnként nagyobb erőfeszítést fordítunk bizonyos in-

A kulturális diffúzió és a kognitív vonzerő



formációk feldolgozására, ugyanakkor számos érzelmi mechanizmusban szerepet játszanak bizonyos észlelési ingerek. Gyakran azok a könnyen megjegyezhető információk, amelyek erős érzelmeket váltanak ki, s amelyeknek a felidézése örömet jelent. Ez talán azért érvényes, mert bizonyos érzelmi mechanizmusok ezekre az információfeldolgozásokra specializálódtak, bizonyos ingerek pedig azért kellemesek, mert könnyen feldolgozhatóak. Reber et al. (1998) kimutatta, hogy a személyeik szebbeknek és vonzóbbaknak tartották azokat az ingereket, amelyekkel gyakrabban vagy tovább találkoztak, vagy amelyek világosabb kontrasztban voltak a környezetükkel. A fekete négyzetet fehér háttérrel szebbnek tartjuk, mint szürke háttérrel. Hasonló eredményeket kapunk más okokból könnyebben feldolgozható ingerekkel is. A „szőrös” képek például kevésbé vonzóak még akkor is, ha annyira gyenge a fókuszvesztés, hogy észre sem vesszük. Miközben gyakran befolyásolják egymást, azért érdemes elválasztani egymástól a kognitív és a motivációs mozzanatot, hogy ne redukáljuk a kulturális átadást a puszta kognitív dimenzióra, ami nagy veszély.

. Az átvitel nem memorizálás és a kultúra nem kollektív emlékezet Ha a kulturális átadást magyarázó sikerkönyvek valamelyikét olvassuk, például Gladwell (2007) Fordulópont c. könyvét, a könyvet bezárva meggyőződésünkké válik, hogy egy gyakorlat elterjedésének két alapvető oka van: hogy milyen presztízsű személyek támogatják és hogy mennyire van összhangban az emberi emlékezettel. Gladwell az emlékezetre méltó (memorábilis) kifejezés két értelmével játszik. Az emlékezetre méltó vacsora, nem egy könnyen leírható és könnyen felidézhető, hanem egy kiváló vacsora. A világpiacon nagy kereskedelmi sikert elérő élelmiszertermékek nem memorábilisak, hanem elsősorban kellemesek. Bizonyos kontextusokban egy ételrecept egyszerűen leírható és megjegyezhető, ma azonban a világ gasztronómiai kultúrájában nem ez a helyzet. Minden intézményes és technikai eszközünk megvan arra, hogy a receptek átadása ne jelentsen problémát. A nagy üzleti sikert jelentő ételreceptek egy jó része bonyolult és kevés ember ismeri őket. Nem könnyű megjegyezni őket. A makarón, az új francia sütisztár sikere nem korlátozódik a makarón receptjének sikerére. Nem mindig kell megkülönböztetnünk azt, ami egy étkezésben emlékezetre méltó vagy ami egy versben emlékezetre méltó. Ráadásul néha a kettő együtt jár. Ha azonban megfeledkezünk a különbségtételről, akkor odáig juthatunk, hogy a kulturális hagyományok kognitív memorabilitása stabilitásuk fő oka lesz, amely kizárja a motivációs tényezőket. Sokszor ide jut el a kulturális



Olivier Morin

epidemológia is, mint az alábbi idézet is mutatja. „A minimálisan intuícióellenes történetek megjegyezhetőbbek, könnyebben érthetőek és könnyebben átadhatóak a többieknek. Nagyobb megjegyezhetőségük és érthetőségük következtében (de talán nem más tényezők miatt) nagyobb esélyük van arra, hogy kulturálisan népszerűvé váljanak” (Norenzayan et al. 2006). Ara Norenzayan és kollegái a cikkben egy bizonyos történettípus (azok a történetek, amelyekben néhány intuícióellenes mozzanat van, de nem sok) és kulturális sikerük közt korrelációt mutatnak ki. Történetfelidézést használva laboratóriumban kimutatták, hogy van egy jellemző, ami bizonyos történeteket megjegyezhetőbbé tesz másoknál. Rámutattak, hogy azok a Grimm-mesék, amelyek jobban megfelelnek e mintának, több Google-találatot eredményeznek. De vajon, ahogy ők teszik, ennek alapján a megjegyezhetőség és a siker között oksági viszonyt tételezhetünk föl? Ez egyáltalán nem biztos. Egy kulturális tárgy sikere a Google-ban nem hasonlít a megjegyezhetőséghez, mint az orális kultúrában lenne. A szóban átadott történetet az elbeszélőknek meg kell jegyezniük és tovább kell adniuk. A Google használói viszont a nélkül tudnak továbbküldeni dolgokat akár egyedeknek, akár csoportoknak, hogy memorizálnák őket. Az interneten sikert eredményező tényezők nem kognitívak, hiszen szinte ingyen van az információátvitel és a tárolás, hanem motivációsak. Az adja a siker titkát, annak köszönhető egy tartalom átadása, továbbküldése, hogy milyen érdeklődést vált ki. A motivációs tényezők nincsenek elválasztva a megjegyezhetőségtől. Egy érdekesebb dolog nagyobb figyelmet vált ki és jobban megjegyezzük. Ahogy Boyer és Ramble (2001) megjegyzi, egy hagyomány megjegyezhetősége talán nincs közvetlen oksági viszonyban a kulturális sikerével, de kétségkívül korrelál számos olyan dologgal, amelyek vonzóvá teszik. Mivel a megjegyezhetőség könnyen mérhető, használható a vonzerő mutatójaként. Ilyen esetekben azonban a megjegyezhetőség csak a hagyomány mutatója és nem a siker oka. A megjegyezhetőség még az orális kultúrában sem a kulturális diffúzió alapja. Egy hagyomány megjegyzése nemcsak a megjegyezhetőségtől függ. Nem jegyzünk meg mindent, ami megjegyezhető. Ebbinghaus (1885) óta tudjuk, hogy kifinomult eljárásokkal megjegyezhetővé tudunk tenni olyasmit is, ami természeténél fogva nem az. A hagyományok megjegyezhetősége korlátozza átvitelüket, ezt a korlátot azonban könnyű megkerülni. Épp erről tanúskodnak az orális kultúrák: a genealógiák, vagy az ősök isteneinek listái, amelyek a hagyományos kultúrák részét képezik, alig könnyebben memorizálhatók, mint a telefonkönyv.

A kulturális diffúzió és a kognitív vonzerő



Másrészt egyik populációról a másikra változnak a memorizáció és a hagyomány sikerének kapcsolatai. Ha egy adott társadalomban jól memorizált egy hagyomány, több esély van arra, hogy átadják, de ennek két feltétele van. Az, hogy akik memorizálják, hosszú ideig éljenek, és mások számára hozzáférhetőek legyenek. Az egyszerű tényezők korántsem triviálisak. Pontus Strimling modelláló kutató és két kollégája két paraméter függvényében vizsgálták egy hagyomány diffúzióját (Strimling et al. 2009). Az átvitel és a megjegyzés valószínűségét variálták. Ha a népesség sosem újul meg – szegények sosem mennek el és végtelen soká élnek – akkor egy bizonyos idő után mindenki találkozik minden hagyománnyal, bármilyen rosszul átvittek legyenek azok. Ilyenkor a megjegyzés eredményez különbségeket. Ha azonban valószerűbbé tesszük a modellt és lehetővé tesszük, hogy szabályos időközökben a populációból kihulljanak tagok és újak jelenjenek meg, akkor megváltoznak a dolgok. Minél gyorsabban újul meg a populáció, annál nagyobb lesz az átvitel valószínűségének szerepe. Ahhoz, hogy stabil legyen, a hagyománynak elég gyakran kell továbbítódnia az új jövevényekhez, hogy kompenzálja a régiek kihullását. Ezt a hatást az egyének interakciógyakorisága modulálja. Ha az egyéneknek sok az interakciós lehetőségük, minden hagyomány terjed valamennyire, bármilyen legyen is vonzereje. Ahhoz tehát, hogy a hagyomány stabillá váljon, arra van szükség, hogy a populáció valahogyan hozzáférhető legyen. Ha az egyéneknek kevés interakciójuk van, vagy ha a populáció megújulása nem teszi lehetővé, hogy találkozzanak a következő és korábbi generációkkal, a hozzáférhetőség közepes lesz. Az emlékezet más tényezőkkel szemben teret veszít. Ezek a más, motivációs tényezők eredményezik azt, hogy egy hagyomány hordozói reprodukálják és használják a hagyományt. A francia társadalomtudomány nagy hagyománya, hogy a társadalom kultúráját mint kollektív emlékezetet tekinti (Halbwachs 1925). Erőteljes kifejezésről van szó, amely átvitt értelemben is hibákkal és tévedésekkel teli fogalmat takar. Nemcsak azért, mert szerintem a társadalmak túl folyékonyak és túl kevéssé megragadhatóak ahhoz, hogy – mint az egyénekhez – emlékezetet rendeljünk hozzájuk. A hagyományok nem kollektív emlékek, de nem is egyéni emlékek összességei, vagy az emlékművekben, könyvekben vagy számítógépeken tárolt emlékek nyomai. Olyan gyakorlatok ezek, amelyek a nagyon diffúz közös térben mennek végbe. Memorizálásuk, átvitelük egyéb lépéseiknek csak egy szakasza, nem a legnehezebb vagy legfontosabb. Felhasználhatóak az emlékek visszaszerzésére, mivel a múltra vonatkoznak, nem ez azonban a szerepük. Általában nem azért vannak, hogy hűségesen visszaadjuk őket, s különösen nem azért, hogy egy nép emlékezetébe ivódjanak.



Olivier Morin

. Mikor irányítja pszichológiánk a kultúrát? A kulturális epidemológia tehát a kognitív és egyéb pszichológiai tényezőket abból a szempontból vizsgálja, hogy ezek hogyan befolyásolják a hagyományok terjedését azzal, hogy vonzóvá teszik őket. A kultúrák evolúciójának meglehetősen elvont tendenciáit próbálja magyarázni igen általános érvényű pszichológiai hipotézisekkel. Lévi-Strauss (1962) feltevésével ért egyet: a kultúra az emberi szellem egyetemes struktúráinak tükröződése. Nagy léptékben nézi tehát a dolgokat. Amikor meglátjuk a dolgokat, akkor messziről tekintünk rájuk. A hagyományok vonzerejének legáltalánosabb tényezőit tekintve, amelyek szinte a világon mindenhol megszerettetik őket, eltekintünk a helyi tényezőktől, amelyek talán sokkal fontosabbak. Ha a kultúra általános pszichológiai korlátok között működik is, a szkeptikusok szerint ezek érdektelenek, egyetemes, gyenge háttérzajt alkotnak. Nem akarjuk a háttérzajt hallgatni, hanem az ebből kiemelkedő dallamokat, vagyis azokat a hagyományokat, amelyek az egyes kultúrák sajátjai. Ebben a pontban ezekkel az ellenvetésekkel foglalkozom. A legáltalánosabb pszichológiai mechanizmusok kulturális hatása nem egyetemesen gyenge. Időnként csak egy diszkrét háttérzaj, de sokkal fontosabbá is válhat. Minden attól függ, hogy milyen terjedési láncot vizsgálunk. A hosszú, egyenes és kompakt lánco*knál a legáltalánosabb vonzerőknek nagy hatásuk van. Más lánco*knál szétfolyóbb az általános vonzerő hatása. Illusztráljuk ezt néhány speciális esettel, ahol valamely hagyomány terjedését igen általános pszichológiai tényezők befolyásolják.

.. Az érzelmeinkre ható udvariassági szabályok tartósabbak, mint a többi Az erkölcsi normák evolúciójával foglalkozva, Shaun Nichols (2002) filozófus tett egy jóslást a jó modor történetéről Európában. Az etikettszabályok – étkezési szabályok, a testtartás és a testápolás szabályai stb. – önkényesnek tűnnek, ugyanakkor nem pusztán egy vak konzervativizmus révén tartjuk fenn őket. Vannak köztük olyanok, amelyek annak köszönhetik állandóságukat, hogy megsértésük érzelmeket vált ki, akár tanúi vagyunk a megsértésnek, akár csak elképzeljük. Nichols, összhangban számos pszichológussal, úgy gondolja, hogy az undor bizonyos vonásai (a „magundor”) a különböző kultúrákban eléggé állandóak. Jóslata szerint azok az etikettszabályok, amelyek olyan cselekedeteket tiltanak, amelyek az undornak ezeket az elsődleges és általános oldalait aktiválják, a többieknél nagyobb eséllyel bírnak a terjedésre és a megmaradásra. Elias (1939/2004) a reneszánsz Európa szokásváltozásairól szóló könyvében megvizsgálja Erasmus

A kulturális diffúzió és a kognitív vonzerő



polgári viselkedési szabályait, A keresztény fejedelem neveltetése (1530) c. művét. Független kódolóktól azt kérdezte, hogy a könyv különböző részeiből kivett különböző szabályoknál a szabály által szankcionált magatartás elsődleges undort vált-e ki, vagy sem. Az elsődleges undor kritériumait a pszichológiai irodalomból vett listával adja meg (Rozin et al. 2000). Más kódolóknak pedig azt kellett eldönteniük, hogy vajon az adott szabály őrájuk még ma is érvényes-e. Nichols vizsgálatának eredménye az, hogy az undorító (elsődleges értelemben undorító) magatartásokat befolyásoló etikettszabályok jó része mindmáig fennmaradt Erasmus idejétől kezdődően, a többi pedig nem. Elias számára ez a „viszolygási küszöb fokozatos emelkedését” jelenti. Nichols szerint azonban nem az európaiak viszolygási küszöbe mozdult el, hanem az etikett ért el fokozatosan ehhez. A kulturális átvitel a gusztustalan cselekedetek elleni normákat állított előtérbe, mert ezek a normák intuitívabbnak és kevésbé önkényesnek tűntek, mint a többi. Ebben a sajátos esetben nehéz szétválasztani Elias és Nichols értelmezését. Vannak azonban más vizsgálatok, amelyek azt mutatják, hogy az olyan hagyományok, amelyeket legalábbis részben az undor motivál, sikeresebbek, mint a többi. Daniel Fessler és Carlos Navarrete (2003) antropológusok 78 kultúrát összehasonlítva rámutatnak arra, hogy messze a hús a legtöbb tabuval összekapcsolódott élelmiszer. Az általuk vizsgált 12 földrajzi régióból 11-ben legalább kétszer annyi a húsra vonatkozó tabu, mint a más élelmiszerekre vonatkozó. A hús jó élelmiszertabu, mert az emberek általános undorérzetének kitüntetett kiváltója (az ezzel az érzelemmel foglalkozó specialisták is osztják ezt a nézetet, Rozin 1999). Ezek a tanulmányok egy meglehetősen nagy irodalmat képviselnek, amely bizonyos hagyományok sikere és az undorral való kapcsolatuk között korrelációkat mutat ki. Heath és munkatársai (2001) egy másik példát adnak a városi legendákról. A modern városi folklór fura módon kedveli a gusztustalan pletykákat a koszos éttermekben felszolgált szervektől az agyfertőzést okozó poharakig. A gusztustalan pletykák népszerűebbek az olyan történeteknél, amelyek rémületet, együttérzést, vagy más erőteljes érzelmeket váltanak ki (Heath et al. 2001).

.. Az általánosan vonzó hagyományok nem mindig jelennek meg Tegyük fel, hogy a hústabukon alapuló európai etikettrendszer azért stabil, mert e tabuk vonzereje nagyon általános, pszichológiai mechanizmusoknak köszönhetően az emberek jó részénél megtalálhatóak. Általánosítható-e, amit ezekből az esetekből tanultunk? Ez korántsem kézenfekvő. Talán különleges körülmények kellenek ahhoz, hogy a legáltalánosabb attraktorok érvényesüljenek a helyi attraktorokkal szemben. Szerintem az etikettel és az étkezési tabukkal kapcsolatos



Olivier Morin

dolgok azért vonzóak szinte mindenki számára, mert olyan körülmények között kerülnek átvitelre, amelyek igen sajátosak. Miért tudta Saun Nichols vagy Norbert Elias a gusztustalan viselkedésekre vonatkozó szabályok túlélését feltárni? Részben azért, mert elég hosszú időt figyeltek meg ahhoz, hogy időközben a kevésbé népszerű szabályok kihaljanak. Elias adatai azt mutatják, hogy Erasmus kézikönyvének legtöbb szabálya, legalábbis a kézikönyvszerzők között, nagyon népszerű volt a megjelenését követő évtizedekben. A korának leghíresebb szerzője által írott könyv hatása óriási volt. A 130 kiadás hamarosan négy nyelven, azután még több nyelven megjelent. Biztosan voltak olyan emberek, akik a kézikönyv szinte minden szabályát be akarták tartani. Ugyanakkor ezek közül sok nem kapcsolódott erős érzelmekhez, s idővel kihaltak. Az undorral kapcsolatos normák fölénye nem egyik napról a másikra jelent meg. Ahhoz, hogy ezt észrevegyük, meglehetősen hosszú idői sávot kell tekintenünk. Az európai udvariassági szabályok, a városi legendák hosszú, sűrű és keskeny terjedési lánco*kon jelennek meg. Ez azt jelenti, hogy nagyszámú egyén adja át őket és a csatornák nem elég szélesek ahhoz, hogy bármely egyén, Erasmus befolyásával rendelkezve, egyedül irányíthatná őket. Számos egyéni szellem ítéletét túlélték ezek a hagyományok, egymástól többé-kevésbé független szellemekét. Ha kevésbé számosak, vagy kevésbé függetlenek lettek volna, ez megzavarná az általános vonzerő kifejeződését. Az általános vonzerőhatást két módon lehet megzavarni: terjedési balesetek lefedhetik, másrészt helyi attraktorok eltéríthetik a folyamatot.

... A terjedés alternatívái megzavarják az általános attraktorok hatását Nézzük először a véletlent és a baleseteket! Képzeljük el, hogy van két egyformán vonzó hagyományunk. Lehet, hogy véletlen révén az egyik jobban elterjedt, mint a másik. Ez akkor valószínűbb, ha az átviteli alkalmak kevésbé gyakoriak és egyenlőtlenül oszlanak meg. Két olyan hagyomány, amelyeknek ugyanakkora esélye van az átvitelre, nagyon egyenlőtlenül oszolhat meg, ha kicsiny az átviteli események száma. Ez a centrális határeloszlási tétel egyszerű alkalmazása: ha tízszer dobunk fel egy érmét, akkor kisebb az esély arra, hogy ugyanannyi fej és írás legyen, mint ha százszor dobnánk fel. Itt azonban nem ér véget a véletlen hatása a kulturális életre. Ritkán fordul elő, hogy két hagyománynak ugyanannyi alkalma lenne az átadásra. Földrajzi véletlenek, demográfiai véletlenek, társas kapcsolatok eredményeként bizonyos hagyományok sokkal jobban terjedhetnek, mint mások, miközben nem vonzóbbak. Nagyon hozzáférhető népességeknél az egyik hagyományt egy olyan intézmény,

A kulturális diffúzió és a kognitív vonzerő



vagy információtárolási technika, vagy olyan egyének továbbítják, akik nagyobb közösséghez férnek hozzá kapcsolataik révén, hosszú életkoruk vagy mobilitásuk miatt. Mindez nagyszámú átadási alkalmat teremt, amelyek ugyanakkor egyenlőtlenül oszlanak meg és elosztási egyenlőtlenségeket eredményezhetnek, amelyeknek semmi közük nincs a hagyományok általános vonzerejéhez.

... A lokális vonzerők lokálisan legyőzhetik az általános vonzerőt Mindehhez hozzákapcsolódik még a lokális tényezők vonzereje. Számos esetben a lelkünknek tetsző hagyományok, amelyek nagyon általános és széles körben osztott mechanizmusok révén jöttek létre, átalakulnak egy adott körülmények között vonzó lokális hatás révén. Minél lokálisabb egy vonzerő, annál inkább megadott kontextusokra korlátozódik az átviteli hatása. Minél általánosabb, annál több kontextusban lehet hatása. De vajon ettől erősebb is lesz? Nem hiszem. Az általános vonzerőt nem a hatás ereje, hanem elterjedtsége és állandósága különíti el. A Boyer (2001) által a szellemhitre használt szándékfelismerési mechanizmus vagy az említett pszichológusok szerinti elsődleges undor nem egyedüli törvényszerűségei gondolkodásunknak vagy viselkedésünknek. A kulturális választásainkat befolyásoló mentális mechanizmusok összességén belül nem ezek az egyetlenek vagy a legerősebbek. Két dolog emeli ki ezeket az általános mechanizmusokat: egyrészt, hogy feltehetően mindenkinél jelen vannak, megbízhatóak, másrészt, mivel döntéseinket befolyásolják, szinte mindig ugyanabban az irányban hatnak. Ezek az állandó és megbízható hatások helyi vonzerőkkel keverednek, amelyek, bár nem ilyen állandóak és nem ilyen megbízhatók, elnyomhatják őket. Amikor a kínai császár a mandzsu kontyot halálbüntetés terhe mellett ráerőszakolja alattvalóira, akkor erős motívumot teremt náluk a használatra. Ez az erős és lokálisan befolyásos motiváció ugyanakkor nem megbízható. A birodalom téri és idői határain kívül senki nem osztozik benne és nem is állandó. Az ellenzékiek egy jó része számára a császári rendelet éppen annak okává vált, hogy ne hordják a kontyot. Ez sokkal jobban megjósolja a kínaiak választását, mint az elvont és általánosabb tényezők, mint például a konty esztétikai vonzereje. A mandzsu konty példája azt mutatja, hogy sok százmillió ember kulturális választásait ugyanúgy tudják esetlegességek irányítani, mint egy kis csoportéit, ha egyetlen személy önkényes választása korlátozza őket szabadságukban. Az esetlegesség hatása egy kulturális terjedési hálóban nem pusztán az ott található személyek számának függvénye. Mindenekelőtt, mint látni fogjuk, a lánc formája számít. Ahhoz, hogy egy hagyomány sikerét az általános tényezők befolyásolni tudják,



Olivier Morin

arra van szükség, hogy nagyszámú különböző kontextusban jelenjen meg az átvitel próbáján. E nélkül nem lehetünk biztosak abban, hogy egy hagyomány sikere általános vonzerőt tükröz. Ezért nem lehetünk biztosak abban, hogy a modern Európában az etikettszabályok, ahogy Nichols gondolja, tényleg a gusztustalan dolgokat megtiltó normák általános vonzerejének köszönhetők. Lehet éppen ellenkezőleg arról szó, hogy fokozatosan megváltozott az európaiak érzékenysége, vagy hajlama az undorra, ahogy Norbert Elias gondolta. A jó társaságbeli európaiak annyira összekapcsolódtak oly sok hagyománnyal és intézménnyel, hogy nem lehet kizárni azt a lehetőséget, hogy undorérzésük megváltozott. A vonzó hagyományok nem mindenképpen nyernek; a kultúra nem mindig jelenik meg bölcsen ráépülve az emberi szellem egyetemes szerveződéseire. Igen különös körülményekre van szükség ahhoz, hogy az általános vonzerők nyerők legyenek a helyi vonzerőkkel és az eloszlás esetlegességeivel szemben.

.. Minél elterjedtebb egy nyelv, annál inkább leegyszerűsödik A hagyományok és megoszlásuk tehát egyszerre függ helyi tényezőktől, amelyeket a társadalomtudományok tanulmányoznak, és általánosabb tényezőktől, ezek a pszichológia uralma alatt állnak. Minél hosszabb, keskenyebb és sűrűbb lánco*kon terjed egy hagyomány, annál nagyobb az általános vonzerő szerepe. Lehet empirikus igazolást találni ezekhez a hipotézisekhez egy újabb nyelvészeti kutatási irányban. Egyre nő azoknak a szerzőknek a száma, akik szerint a nyelvek közötti formai eltérések terjedési kontextusukkal kapcsolatosak. A legelterjedtebb nyelvek, amelyeket a legváltozatosabb embercsoport beszél, egyszerűbbek, így tanulhatóbbak, mint a többi. Az ezt a felfogást hirdetők eltérnek a chomskyánus iskolától. Nem ugyanúgy képzelik el a nyelvek kulturális fejlődésében a kognitív korlátok szerepét. A chomskyánus távlat szerint számos korlátja van a nyelvelsajátításnak, amelyek specifikusak és bizonyos típusú nyelvek létrejöttét teszik lehetővé. Bizonyos nyelvek egyszerűen nem lehetségesek (Chomsky 1980; Pinker 1999). Újabban finomabban is megfogalmazódott az, hogy az emberi megismerés hogyan befolyásolja a nyelvek evolúcióját. Nicholas Evans és Stephen Levinson (2009) adatokat mutat be arról, hogy minden olyan nyelvi formával kapcsolatban vannak kivételek, amelyeknek a Chomsky-követők perspektívájában egyetemesnek kell lenniük. Evans és Levinson szerint erős tendenciákról van szó: bizonyos tényezők könnyebben megjelenhetnek, mint mások. Ha ezek a tényezők előtérbe kerülnek, az nem azért van, mintha a nyelv elsajátítására és produkálására specializált mentális mechanizmus igen precíz tényezők hatása alatt állna. Lehet, hogy ennek oka az általános kognitív korlátokban keresendő, amelyek megvan-

A kulturális diffúzió és a kognitív vonzerő



nak a nyelvelsajátításban és minden más olyan kognitív folyamatban, amelyek észleléssel és emlékezéssel kapcsolatosak. Az is lehet, hogy a nyelvek fejlődését befolyásoló korlátok inkább a kommunikációval, mint az elme működésével kapcsolatosak. Evans és Levinson a tagadás példáját említi. A legtöbb nyelv egy külön morfémát használ a tagadásra (do not, ne pas, nicht, nem stb.). Kevés olyan nyelv van, ahol a tagadást csenddel fejeznék ki. Ennek talán az az oka, hogy tagadást ritkábban fejezünk ki, mint állítást. Evans és Levinson hozzáteszi, hogy a nyelvek fejlődését befolyásoló kognitív és egyéb tényezők nem mereven befolyásolják a nyelvek formáját. Ezek a statisztikai tendenciák lehetnek súlyosak, de vannak kivételek. A legtöbb nyelv jelöli a tagadást, de nem mind. Ebből le lehet vonni azt a következtetést, bár Evans és Levinson ezt nem teszik meg, hogy nem minden nyelv egyformán könnyen tanulható. Nem mindegyik követi egyformán azokat az általános korlátokat, amelyeknek a betartása mindenkinél a könnyű használhatóságot és a könnyű elsajátítást eredményezi. Az ebben a gondolatmenetben dolgozó szerzők megvizsgáltak néhány olyan vonást, amely szerintük nehezebbé teszik a nyelveket. Számos tényező nehezen foglalható össze. Trudgill (2002), vagy Lupyan–Dale (2010) jó bevezetést ad ezekbe az elméletekbe. A szóalkotást irányító alaktani szabályok különböző komplexitásúak és különböző mértékig maradnak meg az egyik nyelvről a másikra történő átvitelnél. Ha minden nyelv egyformán érthető és elsajátítható irányba fejlődött volna, akkor egyszerű, logikus és áttetsző alaktani szabályokat alakítottak volna ki. De nem ez a helyzet. A morfológiai leegyszerűsítés mellett vannak fordított folyamatok is, a morfológiai bonyolódás esetei (Bybee et al. 1994). A szóalkotási szabályok nagyon változatosak. Bizonyos nyelvekben vannak olyan főnévragozási minták, amelyek másokban egyáltalán nincsenek meg. Egyes nyelvek sokkal jobban ragozzák az igéket, mint mások. A végződések bonyolultsága és rendszere is változatos. Bizonyos nyelvek a szóalakban sok mindent kódolnak, mások kevesebbet. Ezek a kiegészítések sokszor kötelezőek. A Peruban beszélt jagua nyelvben mutatószót csak úgy lehet használni, ha öt lehetőség közül egy olyan végződést teszünk hozzá, amely megadja, hogy milyen messze vagyunk attól a tárgytól, amelyre alkalmazzuk a mutatószót (Lupyan–Dale 2010). Ennek következményeként a morfológiailag gazdag nyelvek beszélői olyan elemeket kell, hogy megadjanak, amelyek kevésbé megszorító nyelvekben elhallgatódnak, vagy másodlagosak: I see vs. látok, látom, látlak. Vagyis enyhe tendencia van arra, hogy gazdag morfológia mellett kevésbé gazdaságosan fejezzük ki magunkat. Biztos, hogy a morfológia leegyszerűsítésével kiiktatott korlátok és bonyodalmak meg kell hogy jelenjenek a mondattanban, ha nem akarjuk elszegénye-



Olivier Morin

síteni a nyelvet. A morfológiailag szegényesebb nyelvek korlátozóbb, szigorúbb mondattani szabályokat alkalmaznak. Így például a hiányzó ragok helyére külön morfémákat vezetnek be (I see, I see it, I see you). Ezek a korlátok sokszor gazdaságosabbak és jobban áttekinthetőek, mint az általuk helyettesített alaktani szabályok. A szavakhoz kapcsolódó alaktani végződéseket ugyanis könnyen befolyásolják a fonológiai folyamatok (kutya–kutyát, egér–egeret, ló–lovat). Megjelenik bennük a szabálytalanság (Bybee et al. 1994; Lupyan–Dale 2010; Lightfoot 2006; Christiansen–Chater 2008). Ezek a szabálytalanságok igen egyenetlenül oszlanak meg a különböző nyelvek között. Mit variálnak e tekintetben annyira a nyelvek? Egyesek szerint az alaktani leegyszerűsítést az okozza, hogy egy nyelvet olyan felnőttek terjesztenek, akik nem gyermekként sajátították el. Mivel a felnőttek nagyon nehezen tudnak második nyelvet tanulni, ezért elhagyják, kiiktatják azokat a bonyodalmakat, amelyeket a gyerekek könnyen visszaadnak, s az idegen nyelvekre egyszerű szabályokat vetítenek rá (Wray–Grace 2007). Egy másik hipotézis szerint, amely az első kiterjesztésének is tekinthető, a nyelvek alaktanilag egyszerűsödnek, ha különböző és nagyon eltérő emberek beszélik őket, akiknek kevés szokásuk, hagyományuk és ismeretük közös. Könnyebb egy gazdag és bonyolult nyelvet beszélni egy olyan kicsiny közösségben, amelynek tagjai jól ismerik egymást és közös tudásaik és hiedelmeik vannak, mint sok-sok idegennél (Trudgill 2002). Lupyan és Dale (2010) újabban megvizsgálta ezt a feltevést. A tanulmány szerint az alaktani összetettséghez kapcsolódó vonások nagy száma korrelál a nyelvet átadó egyének számával. Ezt az utóbbi mutatót a beszélőpopuláció méretével lehet becsülni, vagy a földrajzi területtel, vagy azzal, hogy milyen földrajzi kapcsolatai vannak más népekkel. A kapcsolat fennáll, ha kiiktatjuk a hasonló nyelvcsaládhoz való tartozást és a földrajzi közelséget. A Lupyanék használta három változó – a beszélők száma, a téri szétszórtságuk és a szomszédos nyelvek száma – különböző vonásokat magyaráz. Például azt, hogy egy szó-e a tagadás vagy két szó, vagy egy végződés, egy segédige, vagy egy affixum, vagy éppen a birtokjelölők bonyolultságát. Minél több beszélője van egy nyelvnek, annál valószínűtlenebb, hogy agglutinatív legyen. Mások hasonló hatást mutattak ki a mondatszerkezetben és a hangtanban. Daniel Nettle (1999) rámutat, hogy a kevés beszélőjű nyelveknek nagyobb esélyük van arra, hogy ritka és nehéz mondatszerkezeteket használjanak, mint például ahol a nyelvtani tárgy a mondat elején van, lásd a jorubában „A pohár az asztalon, elveszem”. Az ilyen nyelvek átlagos mérete 750 beszélő. Trudgill (2011) megemlíti, hogy a világos haszon nélküli alaktani újítások, vagy az új szabálytalanságok megjelenése sokkal gyakoribb az elszigetelt nyelvjárásokban, mint az elterjedtebb nyelvjárásokban. Trudgill azt is kiemeli, hogy a magánhangzók eloszlásának el-

A kulturális diffúzió és a kognitív vonzerő



mélete nem működik optimálisan stabil, kicsi populációkban. A magánhangzók eloszlása a fül számára legjobban hallható szembeállításokat képviseli. Ha csak négy magánhangzója van egy nyelvnek, akkor valószínűbb, hogy az [a i o u] hangokat választja, mint az [e: i E e]-t. Mindezekben az esetekben intuitíven világos, hogy a nagyobb elterjedtségű nyelvek könnyebben tanulhatók. Lupyan és Dale másokkal együtt azt sugallják, hogy a legfontosabb tényező, amely e hatásokat magyarázza, a nyelvközösségben élő nem bennszülött, nem anyanyelvi beszélők aránya. Érvelésük a következő. A második nyelvet elsajátító felnőttek kevésbé tűrik a bonyolultságot, mint a gyerekek. Jelenlétük a nyelvközösségben a leegyszerűsített változatok forgalmához vezet, amelyet azután a bennszülött beszélők is kezdenek alkalmazni (Dale–Lupyan 2011). Egy kicsit másképp is lehet ezeket az adatokat értelmezni. Lehet, hogy a kis populációk beszélte, kulturálisan elszigetelt és kis területen élő nyelvek viszonylag rövid és széles terjedési lánco*kon adódnak át. Ez a hipotézis összhangban van azzal, amit egyes szociolingvisták, például Trudgill (2011) vagy Milroy és