Móricz Zsigmond leveleinek stilometriai vizsgálata

A Petőfi Irodalmi Múzeum Digitális Bölcsészeti Központ projektjeinek keretében a digitális szövegkiadások munkálataival karöltve különféle számítógépes nyelvészeti kutatások is folynak. Kiemelt projektként a Móricz Zsigmond levelezésének digitális kritikai kiadása alapját képező szövegek stilometriai vizsgálata kezdődött meg, amely egyfelől korábbi kutatói feltevések igazolását, másfelől új kutatási szempontok kialakítását, s azok eredményeinek szakértő elemzését célozza meg.

A kritikai kiadásokra irányuló alapkutatások közül szinte egyedülálló teljesítmény az a publikáció, mely Móricz Zsigmond mindeddig feltáratlan levelezéséből 1500 levelet tett olvashatóvá az 1892 és 1913 közötti időszakból. A kiadvány born digital keletkezési formája eleve alkalmas arra, hogy nyelvének grammatikai, szintaktikai szerveződése szinte a közzétételével egyidőben sokszintű tudományos vizsgálódás tárgya lehessen. Ennek egyik lehetősége a levélíró fiktív elbeszélői identitás-változásainak megfigyelése, melyet összehasonlító nyelvi-textológiai elemzések tárhatnak fel a levelezés-korpusz egyes időszakok és címzettek szerinti csoportosításában. Újdonsága, hogy a levelezés-kiadást kiemeli a forrástörténeti felhasználhatóság köréből, és lehetőséget nyújt intratextuális rétegek feltárására.

1. A 3000 leggyakoribb bigram klasszikus deltatávolságának dendrogramja

Bootstrap Themes

2. A 3000 leggyakoribb bigram Eder egyszerűsített deltájával mért távolságának dendrogramja

Bootstrap Themes

3. A 3000 leggyakoribb bigram klasszikus delta távolságérték alapján ábrázolt főkomponens-analízise

Bootstrap Themes

A projektről

A Móricz Zsigmond által írt, itt vizsgált 498 levél közül 259 az író első feleségének, Holics Jankának szól. Az 1902 és 1905 között írt szerelmi levelezés egyfajta “levélregényként” is olvasható. A stilometriai vizsgálat kérdésfeltevése ezen a jelenségen alapult: vajon ha évenként különválasztjuk a Holics Jankának és másoknak írt leveleket, az így létrejövő szöveghalmazok összehasonlításának lesz-e szignifikáns eredménye, kimutatható-e valamilyen, stilometriai módszerekkel mérhető különbség a levélszövegek között.

Az automatizált szövegelemzési módszernek és a kiinduló paraméterek beállításának első próbája is mutat jellegzetességeket. A szövegek ún. szóbigramjait, azaz egymás mellett előforduló szópárjait vizsgáltuk meg az R szoftver Stylo nevű csomagja segítségével. Ez az eszköz számos szövegfeldolgozó műveletet támogat, a stilometriai módszerek közül pl. az ún. távolságmértékek kiszámítását és vizualizációját. Az ábrákon a 3000 leggyakoribb bigram az ún. klasszikus deltának, valamint Eder egyszerűsített deltájának alapján számított távolsága látszik a Jankának, valamint másoknak írt levelek között. A különböző deltatávolságok kétféle vizualizációja (az ágrajzszerű dendrogram, ill. a koordinátarendszer-szerű főkomponens-analízis) együttesen lehetővé teszik levélcsoportok azonosítását, amelyek a szóbigramok alapján különböző stilisztikai jellegzetességeket mutatnak. A Jankának írott levelek közelebb állnak egymáshoz, viszont a házasságuk előtti időszak (1903–1905) levelei ezen belül is egymáshoz közelebb álló klasztert alkotnak.