Móricz Zsigmond leveleinek stilometriai vizsgálata

A Petőfi Irodalmi Múzeum Digitális Bölcsészeti Központ projektjeinek keretében a digitális szövegkiadások munkálataival karöltve különféle számítógépes nyelvészeti kutatások is folynak. Kiemelt projektként a Móricz Zsigmond levelezésének digitális kritikai kiadása alapját képező szövegek stilometriai vizsgálata kezdődött meg, amely egyfelől korábbi kutatói feltevések igazolását, másfelől új kutatási szempontok kialakítását, s azok eredményeinek szakértő elemzését célozza meg.

A kritikai kiadásokra irányuló alapkutatások közül szinte egyedülálló teljesítmény az a publikáció, mely Móricz Zsigmond mindeddig feltáratlan levelezéséből 1500 levelet tett olvashatóvá az 1892 és 1913 közötti időszakból. A kiadvány born digital keletkezési formája eleve alkalmas arra, hogy nyelvének grammatikai, szintaktikai szerveződése szinte a közzétételével egyidőben sokszintű tudományos vizsgálódás tárgya lehessen. Ennek egyik lehetősége a levélíró fiktív elbeszélői identitás-változásainak megfigyelése, melyet összehasonlító nyelvi-textológiai elemzések tárhatnak fel a levelezés-korpusz egyes időszakok és címzettek szerinti csoportosításában. Újdonsága, hogy a levelezés-kiadást kiemeli a forrástörténeti felhasználhatóság köréből, és lehetőséget nyújt intratextuális rétegek feltárására.

1. A Jankának és másoknak írt levelek közötti stilometriai távolság ábrázolása ágrajzzal (A)

Bootstrap Themes
                    A 3000 leggyakoribb bigram klasszikus deltatávolságának dendrogramja

2. A Jankának és másoknak írt levelek közötti stilometriai távolság ábrázolása ágrajzzal (B)

Bootstrap Themes
            A 3000 leggyakoribb bigram Eder egyszerűsített deltájával mért távolságának dendrogramja

3. A Jankának és másoknak írt levelek közti távolság kétdimenziós ábrázolása

Bootstrap Themes
        A 3000 leggyakoribb bigram klasszikus delta távolságérték alapján ábrázolt főkomponens-analízise

A projektről

A Móricz Zsigmond által írt, itt vizsgált 498 levél közül 259 az író első feleségének, Holics Jankának szól. Az 1902 és 1905 között írt szerelmi levelezés egyfajta „levélregényként” is olvasható. De feltárható-e valamiféle meghatározó eltérés a Holics Jankának és másoknak írt levelek között?

A stilometriai vizsgálat kérdésfeltevése a következő volt: ha különválasztjuk a Holics Jankának és másoknak írt leveleket évenkénti bontásban, az így létrejövő szöveghalmazok hogyan fognak egymáshoz viszonyulni? Ha összehasonlítjuk azokat,láthatóvá válik-e valamilyen, stilometriai módszerekkel mérhető különbség a levélszövegek között?

A vizsgálat során a szövegek ún. szóbigramjait, azaz egymás mellett előforduló szópárjait vizsgáltuk meg az R szoftver Stylo nevű csomagja segítségével. Ez az eszköz a stilometriai módszerek közül pl. az ún. távolságmértékek kiszámítását és vizualizációját támogatja. A mérések során a szóbigramok gyakoriságértékeit kapjuk meg, melyek a különböző távolságmetrikák szerint rendeződnek. Az ábrákon a Jankának, valamint másoknak írt levelek közötti távolság látszik. A különböző számítási módok alapján mért távolságok kétféle ábrázolása (az ágrajzszerű dendrogram, ill. a koordinátarendszer-szerű főkomponens-analízis) együttesen lehetővé teszik levélcsoportok azonosítását, amelyek a szókettősök alapján különböző stilisztikai jellegzetességeket mutatnak. A Jankának írott levelek láthatóan közelebb állnak egymáshoz, míg a másoknak írt levelek külön klaszterbe helyeződnek. Az ábrán az is látszik, hogy a házasságuk előtti időszak (1903–1905) levelei ezen belül is jól lehatárolható klasztert alkotnak.

A stilometriai elemzés módszertani részleteiről, tudományos hátteréről és eredményeiről ebben a publikációban olvashatsz bővebben.

Érdekesség

Az „édes” szó Móricz és Janka megismerkedésének évében még kiugróan magas számot mutatott (a legmagasabbat a közvetlenül a házasságukat megelőző évben), aztán három évvel később jelentősen csökken a gyakorisága az író Jankának írt leveleiben. De mielőtt szomorú tényként könyvelnénk el e változást, meg kell említsük, hogy bár az „édes” idővel kikopott a levelekből a leggyakrabban használt szavak közül, de átvették a helyét más „czukiságok”, mint például Janka új beceneve, a „Czuczikám” (így szólítja meg feleségét az író 1913-ban).