A magyar nyelv digitális támogatása a magyar tudományosság szolgálatában
DOI:
https://doi.org/10.18349/MagyarNyelv.2023.4.478Kulcsszavak:
repozitóriumok, szövegkorpuszok, automatikus annotációAbsztrakt
Az MTA Könyvtár és Információs Központ repozitóriuma (a REAL) a magyar nyelvű tudományos szakirodalom jelentős másodlagos (archivált) forrása. Míg a korábbiakban ez a gyűjtemény a hagyományos könyvtári funkcionalitásnak megfelelően egyedi kutatói dokumentumigényeket szolgált ki, a itt a dokumentumok szöveges rétegei szövegkorpuszként vannak kezelve. Nyelvtechnológiai eszközök alkalmazásával történik a korpusz feltárása és széles értelemben vett szövegbányászata, többek között szakirodalmi hivatkozások és különböző névkifejezések kigyűjtése. A projekt keretében megtörténik mind a szöveg, mind az esetleges szöveghibák javítása, mind a dokumentumok leíró adatainak gazdagítása (például a tudományterület automatikus meghatározása). A projekt célkitűzése a repozitóriumi szolgáltatások és adatminőség javítása, lehetővé téve értéknövelt szolgáltatások fejlesztését a kutatói közösség számára.
##submission.downloads##
Megjelent
Folyóiratszám
Rovat
License
Copyright (c) 2023 Gábor Prószéky, Tamás Váradi, András Holl
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.
A periodika Open Access hozzáférésű (Gyémánt). A dokumentumok elektronikus formában szabadon elmenthetők, másolhatók; változtatások nélkül, a forrásra való hivatkozással használhatók. Az alkalmazás kereskedelmi célokat nem szolgálhat. Bármilyen terjesztési és felhasználási forma esetében az 1999. évi LXXVI. szerzői jogról szóló törvény és az ahhoz kapcsolódó jogszabályok az irányadók. Elektronikus változatára a CC BY-NC-ND (Creative Commons – Attribution-NonCommercial-NoDerivatives) licenc feltételei érvényesek.
A folyóirat a szerzők számára időbeli korlátozás nélkül és díjmentesen engedélyezi, hogy kézirataiknak a szerkesztőség által elfogadott, akár a lektori javításokat is tartalmazó, de nem végleges (ún. pre-print) változatait közzétegyék: e-mailen, a szerző vagy intézménye honlapján, illetve a szerző intézményének, egyetemének zárt vagy korlátozás nélkül elérhető repozitóriumában, illetőleg egyéb non-profit szervereken. Amikor a szerző ily módon terjeszti művét, figyelmeztetnie kell olvasóit, hogy a szóban forgó kézirat nem a mű végső, kiadott változata. Ha a cikk végső változata már megjelent nyomtatott, illetve online formában, mindenképpen javasolt és engedélyezett a szerzőnek ezen (post-print) változatot használnia. Ebben az esetben meg kell adnia a folyóiratbeli megjelenés pontos helyét, adatait is. A szerző a közlemény szerzői jogait megtartja, esetleges másodközlés esetén azonban a cikk első megjelenésének bibliográfiai adatait is közölnie kell.