Kollégánk, Damsa Andrei „From Babbles to Bytes: a short comparative journey of language development in humans and machine learning” címmel írt cikket, amely a nyelv elsajátítását, illetve kialakulását vizsgálja mind emberek, mind gépi tanulási modellek esetében. Az írást az alábbiakban foglaljuk össze.
Bevezetés
A nyelv elsajátítása annyiféle alakot ölt, ahány különböző egyén tanulja azt. Emberek esetében egy biológiai folyamat fonódott össze szorosan az evolúciónkkal, évezredeket igénybe véve, hogy eljuttassa a kommunikáció ezen formáját a mai szintre. Ezzel összehasonlítva a mesterséges intelligencia (MI) nyelvi modelljei a gyors technológiai fejlődésnek és a rendelkezésre álló hatalmas adattömegnek hála a geológiai időkben mérve villanásnak megfelelő idő alatt sajátította el a nyelv feldolgozásának és generálásának képességét. Azonban ennek a különbségnek ellenére a nyelv elsajátításának alapelvei nagyon hasonlóak emberek és gépi tanulási modellek esetében is.
Az emberi nyelv evolúciója
Az emberi nyelv eredete ősibb lehet, mint gondolnánk. Különböző régészeti felfedezések fényében következtethetünk egy kezdetleges nyelv jelenlétére több, mint 2 millió éve a homo habilis fajnál, valamint 1,5 millió évvel ezelőtt a fejlettebb Homo erectus fajnál. Azonban az összetett mondattani nyelv, amit napjainkban használunk, valószínűleg először nálunk, Homo sapienseknél jelent meg 50 ezer évvel ezelőtt.
A korai nyelv egy eszközként fejlődött ki, amely segített őseinknek tudást megosztani a környezetről, különböző veszélyekről és nyersanyagok elhelyezkedéséről. Az emberi agy megnövekedett, fejlesztve a Broca és Wernicke területeket, amelyek a nyelv feldolgozásáért és alkalmazásáért felelősek. A verbális eszközeink is átalakultak, a gége megsüllyedése hangok szélesebb választékát tette számunkra elérhetővé.
A lassú fejlődés ellenére az emberi nyelv elsajátítása nem csak biológiai, hanem szociális folyamat is volt. Szükséges ehhez a gondozók (például szülők) és a különböző (például kortárs) csoportok által szolgáltatott beszéd, amelyből a gyerekek elsajátíthatják a nyelvtant, szókincset és ezek alkalmazását.
Az informatikai korszak és a nyelvi modellek felemelkedése
A biológiai evolúció bágyadt tempójával ellentétben a MI nyelvi modellek fejlődése gyors és heves volt. Az első chatbotok, mint a 60-as és 70-es években ELIZA (egy kezdetleges, empátiát utánzó pszichológiai chatbot) és PARRY (más néven „ELIZA temperamentummal”), rendelkeztek egy kezdetleges nyelvi értelemmel, de ezek előprogramozott szövegekre támaszkodtak. Az igazi előrelépés a nyelvi értelem terén a gépi tanulás és mélytanulás megjelenésével, pontosabban a visszacsatolt neurális hálózatok (RNN -ek) és az újabb, transzformer alapú modellekkel (mint a BERT és a GPT) kezdődött.
Ennek a fejlődésnek az üzemanyaga az adatok – hatalmas mennyiségű szöveges adat. A nyelvi modelleket sokszínű internetes szövegek által tanítják, hogy képes legyenek egy kontextusban (például egy mondatban) a következő adekvát szó előrejelzésében. Eme folyamat által sajátítják el a nyelvtant, szókincset és egy adott fokú szövegkörnyezet megértését, nagyon hasonlóan egy emberi gyermekhez. Azonban a gépi modellek mindezt nyaktörő sebességek mellett teszik, órák alatt mondatok millióin átrágva magukat.
A nyelv elsajátításának konvergencia pontjai
Az idő- és folyamatbeli különbségek ellenére az emberek és gépi modellek nyelvi elsajátítási módszerei ugyanahhoz a 3 alapelvhez tartanak. Ezek a következők:
- Tapasztalati tanulás szerint ahogy az emberek eltanulják a nyelvet a környezetükben hallott beszédből, a nyelvi modellek a számukra meghatározott szövegekből tanulnak.
- Az előzőleg megszerzett tudásra építkezésnél az embergyerekek folyamatosan sajátítják el a nyelvtant és bővítik a szókincsüket, míg a gépi tanulási modellek iteratívan pontosítják az előrejelzéseiket a már tanultak alapján.
- Végül a szövegkörnyezethez való alkalmazkodásnál míg az emberek gyakorlati tapasztalatokon keresztül, a társadalmi és szituációs szövegkörnyezet megértésére támaszkodnak, addig a gépek egy eltérő módszert alkalmaznak, ami során a környező szavak alapján becsülik meg a következő szó mivoltát és így generálnak a szövegkörnyezetnek megfelelő válaszokat.
Következtetés
A nyelv elsajátítása, legyen az biológiai vagy digitális, bizonyíték a környezetből való tanulás hatásosságára. Az emberek számára ez egy társadalmi együttműködés, értelmi fejlődés, és túlélési ösztön által táplált biológiai út volt. A mesterséges intelligencia esetében ez merőben eltérő mechanizmusként jelent meg, amit az informatikai korszak, technológiai fejlődés és hatalmas mennyiségű adat hajtott. Bár a folyamatok és a szükséges időmennyiség különbözik, az alapelvek – tapasztalatokból való tanulás, előzőleg megszerzett tudásra való építkezés és szövegkörnyezethez való alkalmazkodás – egyesítik ezeket az eltérő területeket a megértés és kommunikáció mentén. Ennek a témánaka a kutatása biztosan felfed még érdekfeszítő információkat a kogníció működésével kapcsolatban, mind a biológiai mind a mesterséges intelligencia szempontjából.
Az eredeti cikk angol nyelven itt érhető el.
Ne maradjon le a mesterséges intelligencia legújabb megoldásairól!
Kérje blogértesítőnket, és legyen mindig naprakész korunk legfontosabb technológiájával kapcsolatban!