A dHUpla
Digital Humanities Platform
Digitális Bölcsészeti Platform
(see English below)
A Digitális Bölcsészeti Központ által fejlesztett online publikálási környezet a közgyűjtemények szöveges forrásainak digitális közreadására szolgál, így a kéziratos korpuszok mellett a nyomtatott és born digital (digitálisan született) tartalmak közzététele is szerepel a dHUpla szolgáltatásai között. A kreatív tartalommegosztást nyelvtechnológiai elemzések és adatvizualizációk segítik.
A digitális filológiai ajánlásokat is tartalmazó, tudományos projektek tartalmainak publikálására is lehetőséget nyújtó korszerű kutatói és felhasználói felület a közgyűjteményi funkciók átalakulásának 21. századi kihívásaira reagál. A 2008-ban megújult Digitális Irodalmi Akadémia mellett, amely a legújabb kori és kortárs magyar irodalom kiemelkedő alkotásait menti át a digitális korba, a 2021-ben induló Digitális Bölcsészeti Platform elsősorban klasszikus írók kéziratos forrásait teszi elérhetővé, folyamatosan tágítva a közgyűjtemények tartalomszolgáltatásának stratégiáját.
Útmutató
Szövegkiadások
- A digitális publikációk a szövegkiadások menüpont alatt érhetőek el, ún. gyűjteményekbe rendezve.
- Egy-egy gyűjteményre kattintva rövid összefoglalót olvashatunk a projektről és a feldolgozott forrásokról.
- A gyűjteményt képező egyes szövegegységek, az ún. digitális objektumok listában jelennek meg. A lista egyes elemeire kattintva olvashatjuk a keresett tartalmat.
- Különböző szempontok szerint rendezhetjük a lista tételeinek sorrendjét, a gyűjtemény típusától függően például cím, időrend vagy kötetkompozíció szerint.
- Metaadatok gomb: az adott szöveg adatait tartalmazza.
- Megjegyzések gomb: az adott szöveggel kapcsolatos megjegyzéseket tartalmazza.
- A gyűjtemények jobb oldalán található sávban lehetőség van keresésre és a tartalom előzetes szűrésére a felsorolt kategóriák szerint. (A részleteket ld. a következő pontban.)
- A legtöbb szövegkiadás folyamatosan bővül, újabb adatokkal gazdagodik, illetve javított verziók állnak elő.
A dHUpla keresési, szűrési funkciói
A gyűjtemény tartalomjegyzékeként is használható lista mellett az alábbi műveletek elvégzésére van lehetőség:
- Szabadszavas kereséssel egyszerre kereshetünk az összes gyűjteményben.
- Külön keresősávban kereshetünk egy adott gyűjteményen belül is.
- A kereső nem különbözteti meg a kis és nagybetűt, illetve nem veszi figyelembe az ékezeteket.
- A kereső ún. szótövelő eszközt használ, tehát megtalálja egy szó eltérően toldalékolt alakjait.
- A lista jobb oldalán található ún. facettált (kombinált szűrőket alkalmazó) kereső alkalmazásával szűkíthetjük a találati listánkat: a szempontokat a szövegátiratok metaadatai, illetve a szövegközi annotációk határozzák meg, ezért gyűjteménytípusonként változhatnak.
- Lehetőség van több szűrő párhuzamos használatára, amely megkönnyíti az eligazodást a gyűjteményben.
A szövegkiadások olvasása, jelölései
- A szövegkiadások eltérő tudományos szintű, illetve célú publikációk.
- Az átiratok jelölése függ a kiadás típusától: általában az olyan alapvető textológiai jelenségeket tüntetjük fel, mint a betoldás, a törlés, az olvashatatlan/hiányzó szövegrészek, vagy szerkesztői feloldások. A kritikai kiadásokban ezen felül számos egyéb annotáció is előfordul, a publikáció céljának megfelelően.
- Az olvasó számára lehetőség nyílik az átírt szöveg olvasására, illetve az átírt szöveg és az eredeti fakszimile (kéziratfotó) együttes vizsgálatára.
Bizonyos gyűjtemények esetén a publikáció a szöveg és kéziratkép egymás melletti olvasására alkalmas (pl. Móricz Zsigmond levelezése).
Egyes kiadásokban a kéziratképek ún. szegmentálásának köszönhetően egy adott szövegrész össze van kötve a fakszimilén való pozíciójával. (pl. Kiss József levelezése).
Ez esetben az átírt szöveg bármely részére kattintva háromféle olvasási lehetőség közül választhatunk:
- soronkénti szöveg-kéziratkép nézet
- szöveg és adott kéziratkép részlete kisebb kontextusban
- osztott képernyős nézet
Entitástár
- Az Entitástár a kiadásokhoz kapcsolódó ún. névelemeket tartalmazza (személynevek, intézménynevek, helynevek, műcímek).
- Az adattár folyamatos feltöltés alatt áll.
- Itt szintén lehetőség van szabadszavas keresésre, valamint a névelem-típusok szerinti szűrésre.
- Az egyes rekordok alapadatai mellett projekt-specifikus tartalmak olvashatóak.
- A kiadásokban megjelölt névelemekről az entitástárra ugorhatunk.
Kreatív
- A kreatív aloldalon olyan tartalmak érhetőek el, amelyek szervesen kapcsolódnak az egyes szövegkiadásokhoz: kiegészítik azokat, a digitális szöveg létrehozása során előállt adatokat dolgozzák fel, illetve a kiadások készítésével párhuzamos kutatómunka eredményeként jöttek létre.
- Minden kreatív tartalom rendelkezik egy rövid leírással és használati útmutatóval.
- Az oldalon különböző típusú adatvizualizációk érhetőek el: például térképes vizualizáció; kapcsolati háló; statisztikák és diagramok; szófelhők; stilometriai elemzések.
Alapvető fogalmak
- Digitális forráskiadás: eddig publikálatlan források közzététele digitális szövegkiadás formájában.
- Tudományos digitális kiadás: tudományosan (filológiai, textológiai, irodalomtörténeti és egyéb tudományos szempontból) kidolgozott digitális szövegkiadás, amely tartalmaz szövegkrititkai jegyzeteket, tárgyi magyarázatokat, kísérőtanulmányokat.
- Digitalizált/Digitális kiadás: a digitalizált kiadás egy nyomtatott szövegkiadás digitalizált változata, a digitális kiadás egy eleve digitálisan született (born digital) szövegkiadás.
- Dokumentum: egy tematikus szempontból összetartozó, alapegységnek tekinthető szöveg, szövegegyüttes.
- Digitális objektum: a digitális szövegkiadás alapegysége.
- Projekt: dokumentum vagy dokumentumok halmazának feldolgozása digitális szövegkiadás céljából.
- Gyűjtemény: a projekt szempontjából összetartozó digitális objektumok összessége, repository.
- Digitális fakszimile: egy kézirat digitálisan létrehozott pontos mása.
- Zónázás/szegmentálás: egy kép bizonyos zónáinak megjelölése. Lehetővé teszi hiperhivatkozások létrehozását a kép meghatározott területein, amelyek különböző célállomásokhoz fognak kapcsolódni. (Image mapping)
- Szöveggondozás: a szövegben előforduló különféle hibák jelzése vagy javítása (emendálás), textológiai-filológiai jegyzetekkel, jelzésekkel való ellátása, entitások beazonosítása (pl. személynevek), valamilyen szempontú átirat készítése (pl. betűhű vagy modern átirat), szövegváltozatok összevetése, legjobb változat meghatározása vagy kialakítása, tárgyi jegyzetek írása, kísérőtanulmányok írása.
- Annotálás: a szöveg egyes alkotóelemeinek ellátása valamilyen információval (pl. címke/tag használatával).
- Facettált keresés: olyan technika, amely lehetővé teszi, hogy a felhasználók a keresési eredményeket az elemek facettált osztályozása alapján több szűrő együttes alkalmazásával szűkítsék. A facettált osztályozás minden információelemet több aspektus szerint osztályoz, lehetővé téve az osztályozások többféle módon való rendezését és kombinálását.
The online publishing environment developed by the Digital Humanities Centre is designed for the digital dissemination of textual sources from public collections. In addition to manuscript corpora, the dHUpla service also includes the publication of printed and born-digital content. Creative content sharing is supported by language technology analyses and data visualizations.
This modern research and user interface, which also accommodates digital philological recommendations and the publication of scientific project content, responds to the 21st-century challenges of transforming public collection functions. Alongside the Digital Literary Academy (DIA), which was renewed in 2008 to preserve outstanding works of modern and contemporary Hungarian literature in the digital age, the Digital Humanities Platform, launched in 2021, primarily makes the manuscript sources of classical writers accessible – continuously expanding the content service strategies of public collections.
Guidline
Text Editions
- Digital publications can be accessed under the Szövegkiadások (=text publications) menu, organized into collections.
- Clicking on a collection provides a brief summary of the project and the processed sources.
- The individual text units within a collection, known as digital objects, appear in a list. Clicking on an item in the list allows users to read the content.
- The list can be sorted based on different criteria, depending on the type of collection – for example, by title, chronological order, or volume composition.
- Metaadatok (=metadata) button: contains information about the given text.
- Megjegyzések (=comments) button: displays notes related to the text.
- On the right-hand side of the collections interface, a search bar allows users to search and filter content based on predefined categories. (For details, see the next section.)
- Most text editions are continuously updated with new data and improved versions.
Search and Filtering Functions
In addition to the list, which serves as a table of contents for the collection, users can do the following actions:
- Free-text search: Enables searching across all collections simultaneously.
- Collection-specific search: A dedicated search bar allows searching within a specific collection.
- The search function is not case-insensitive and ignores accents.
- A stemming tool is used, meaning the search engine can find different inflected forms of a word.
- The faceted search tool (located on the right side of the list) allows users to refine search results based on metadata and intertextual annotations, which may vary depending on the collection type.
- Multiple filters can be applied simultaneously to enhance navigation within the collection.
Reading and Markings of Texts
- Text editions serve different scholarly levels and purposes.
- The markings in transcriptions depend on the type of edition: typically, fundamental textological phenomena such as insertions, deletions, unreadable/missing text sections, or editorial interpretations are indicated. In critical editions, additional annotations may also be included, depending on the publication's purpose.
- Readers have the option to view the transcribed text, and in most cases the original facsimile (manuscript image) can be viewed as well.
- In certain collections, the publication allows for side-by-side reading of the text and its manuscript image (e.g., Zsigmond Móricz’s Correspondence).
- In some editions, thanks to the segmentation of manuscript images, specific text sections are linked to their exact position in the facsimile (e.g., József Kiss’s Correspondence). In such cases, clicking on any part of the transcribed text offers three reading options:
- Line-by-line text-manuscript view
- Text with a smaller contextual manuscript image
- Split-screen view
Named Entity Repository
- The Entitástár (Named Entity Repository) contains named elements related to the publications, such as personal names, institution names, place names, and titles of works.
- The database is continuously being updated.
- Users can perform free-text searches and filter results based on the types of named element.
- In addition to basic data, each record includes project-specific content.
- Named elements marked in the editions are linked to the Named Entity Repository, allowing users to navigate directly to relevant entries.
Creative
- The Kreatív (=Creative) subpage offers content that is closely related to specific text editions: these materials complement the editions, process data generated during the creation of digital texts, or result from parallel research conducted alongside the editions.
- Each creative content item includes a brief description and user guide.
- The page features various types of data visualizations, such as:
- Map-based visualizations
- Network graphs
- Statistics and charts
- Word clouds
- Stylometric analyses
Core Concepts
- Digital Text Edition: The publication of previously unpublished sources in the form of a digital text edition.
- Digital Scholarly Edition: A digitally published text edition developed with scholarly (philological, textological, literary-historical, and other scientific) approaches, which includes critical notes, explanatory notes, and additional studies.
- Digitized Edition: A digitized edition is a digital version of a printed text edition, while a digital edition refers to a text edition that was originally created in digital format (born digital).
- Document: A text or group of texts that can be considered a basic unit from a thematic perspective.
- Digital Object: The basic unit of digital text edition.
- Project: The processing of a document or a set of documents for the purpose of creating a digital text edition.
- Collection: The set of digital objects that are related to each other in the context of a project, functioning as a repository.
- Digital Facsimile: A digitally created exact replica of a manuscript.
- Segmentation: Marking certain zones of an image, which allows for the creation of hyperlinks in specific areas of the image, linking to different destinations. (Image mapping)
- Textual Editing: The identification or correction of various errors in a text (emendation), the addition of textological-philological notes, the identification of entities (e.g., personal names), preparing a specific version of a transcription (e.g., letter-accurate or modern transcription), comparing text variants, determining or creating the best variant, writing explanatory notes, and composing companion studies.
- Annotation: The process of adding some information to the individual components of a text (e.g., using tags/labels).
- Faceted Search: A technique that allows users to narrow search results by applying multiple filters based on the faceted classification of the items. Faceted classification classifies each information item by multiple aspects, enabling the sorting and combining of classifications in various ways.