A magyar nyelv digitális fenntarthatóságának támogatása
DOI:
https://doi.org/10.18349/MagyarNyelv.2023.4.482Kulcsszavak:
Magyar Nemzeti Szövegtár, helyesírási tanácsadó portál, szótáricédula-digitalizáció, obi-ugor szövegkorpuszokAbsztrakt
A Nyelvtudományi Kutatóközpont projektje az MTA alapító küldetését követi, hogy anyanyelvünk a digitális térben is méltó szerepet kapjon. A nemzetközi kutatások leginkább az angolra összpontosítanak, kisebb figyelmet szentelve a magyarhoz hasonló kisebb nyelveknek. A jelen munkálatok a magyar nyelv digitális támogatására fókuszálnak, különös tekintettel a normatív magyarra és a rokon nyelvekre. (1) A Magyar Nemzeti Szövegtár a nyelvi kutatásokban kiemelkedően használt, több mint egymilliárd szavas korpusz, melyet hat stílusréteg és öt regionális nyelvváltozat alkot. A korpuszt elsősorban a magyar nyelvre vonatkozó korpuszalapú és korpuszvezérelt nyelvészeti kutatások támogatására használják, nemcsak a nyelvészeti kutatásokban, hanem a bölcsészet- és társadalomtudományok számos területén. Az új lehetőségek, mint például az újabb, jobb minőségű nyelvi elemzők, vagy a nyelvi modellek előállításához szükséges nagyméretű adatbázisok azonban szükségessé tették a korpusz bővítését és fejlesztését. (2) A helyesírás szabályozása a nyelvi norma kulcsfontosságú eleme, és a digitális térben egyre fontosabbá válik. Az MTA által támogatott Helyesírási tanácsadó portál ezt a szükségletet korszerű technológiával elégíti ki, azonban felújításra szorul a szoftverplatform, a módszertan és az ügyfélközpontúság terén. terén. (3) A magyar nyelv nagyszótárához tartozó több mint négymillió cédulából álló gyűjtemény az 19. század végén keletkezett. A cédulák rendezése és digitalizálása folyamatban van, és bár közel húsz éve megkezdődött a legépelése, teljeskörű digitális használatához még további fejlesztések szükségesek. (4) A magyar nyelv rokon nyelvei, a hanti és manysi digitális jelenlétének támogatása érdekében szükség van egy elemzett digitális korpusz létrehozására, melynek alapját írott, modern szövegek képezik. Ezek lehetőséget adnak az obi-ugor nyelvek jelenlegi állapotának dokumentálására és megőrzésére. Összegezve: ezek a kutatások hozzájárulnak a magyar nyelv digitális térben való fejlődéséhez, valamint a nyelvi kutatások széles skáláját fedik le a normatív nyelvtől a helyesírásig és a rokon nyelvekig.
##submission.downloads##
Megjelent
Folyóiratszám
Rovat
License
Copyright (c) 2023 Gábor Prószéky, Tamás Váradi
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
A periodika Open Access hozzáférésű (Gyémánt). A dokumentumok elektronikus formában szabadon elmenthetők, másolhatók; változtatások nélkül, a forrásra való hivatkozással használhatók. Az alkalmazás kereskedelmi célokat nem szolgálhat. Bármilyen terjesztési és felhasználási forma esetében az 1999. évi LXXVI. szerzői jogról szóló törvény és az ahhoz kapcsolódó jogszabályok az irányadók. Elektronikus változatára a CC BY-NC-ND (Creative Commons – Attribution-NonCommercial-NoDerivatives) licenc feltételei érvényesek.
A folyóirat a szerzők számára időbeli korlátozás nélkül és díjmentesen engedélyezi, hogy kézirataiknak a szerkesztőség által elfogadott, akár a lektori javításokat is tartalmazó, de nem végleges (ún. pre-print) változatait közzétegyék: e-mailen, a szerző vagy intézménye honlapján, illetve a szerző intézményének, egyetemének zárt vagy korlátozás nélkül elérhető repozitóriumában, illetőleg egyéb non-profit szervereken. Amikor a szerző ily módon terjeszti művét, figyelmeztetnie kell olvasóit, hogy a szóban forgó kézirat nem a mű végső, kiadott változata. Ha a cikk végső változata már megjelent nyomtatott, illetve online formában, mindenképpen javasolt és engedélyezett a szerzőnek ezen (post-print) változatot használnia. Ebben az esetben meg kell adnia a folyóiratbeli megjelenés pontos helyét, adatait is. A szerző a közlemény szerzői jogait megtartja, esetleges másodközlés esetén azonban a cikk első megjelenésének bibliográfiai adatait is közölnie kell.