Kiss József által írt levelek szókészlete

Kiss Józsefnek írt levelek szókészlete

A projektről

Előkészítés

A vizualizáció Kiss József levelezésének eddig feldolgozott anyaga alapján készült el. A kéziratok átiratait a Transkribus programból txt formátumban exportáltuk, majd az e-magyar legújabb verziójának (emtsv) segítségével állítottunk elő szótövesített szólistákat, az előfordulási gyakoriság szerinti sorrendben. A szűrési lehetőségek finomítása és az azonos alakú szavak megrostálása érdekében morfológiai elemzést is használtunk. A Part-of-speech tag-ekkel ellátott listákat manuálisan tisztítottuk meg azoktól az elemektől, amelyek nem relevánsak a vizualizáció szempontjából. Ezek között található minden olyan előfordulás, amelynek a gyakorisága 10-nél kevesebb, illetve

A szólisták két bontásban készültek el, Kiss József által írt és Kiss Józsefnek írt levelek szerint.

A vizualizációról

A vizualizációk a Voyant Tools nevű eszközzel készültek. A táblázatban szereplő szavakat az adott szó gyakoriságának megfelelő számban töltöttük be az eszköz erre alkalmas mezőjébe.

A megjelenített szavak mennyisége a bal alsó sarokban lévő Terms melletti csúszkán állítható 25-től 500-ig.

A jobb felső sarokban, a kék négyzetekre kattintva további vizualizációs eszközöket lehet elérni a Visualisation Tools almenüből.

A Corpus Tools Terms almenüjéből elérhető a vizualizáció alapját képező szavak listája.

Források, linkek