A magyar nyelv digitális támogatása a magyar tudományosság szolgálatában

Szerzők

  • Gábor Prószéky HUN-REN Nyelvtudományi Kutatóközpont
  • Tamás Váradi HUN -REN Nyelvtudományi Kutatóközpont
  • András Holl MTA Könyvtár és Információs Központ

DOI:

https://doi.org/10.18349/MagyarNyelv.2023.4.478

Kulcsszavak:

repozitóriumok, szövegkorpuszok, automatikus annotáció

Absztrakt

Az MTA Könyvtár és Információs Központ repozitóriuma (a REAL) a magyar nyelvű tudományos szakirodalom jelentős másodlagos (archivált) forrása. Míg a korábbiakban ez a gyűjtemény a hagyományos könyvtári funkcionalitásnak megfelelően egyedi kutatói dokumentumigényeket szolgált ki, a itt a dokumentumok szöveges rétegei szövegkorpuszként vannak kezelve. Nyelvtechnológiai eszközök alkalmazásával történik a korpusz feltárása és széles értelemben vett szövegbányászata, többek között szakirodalmi hivatkozások és különböző névkifejezések kigyűjtése. A projekt keretében megtörténik mind a szöveg, mind az esetleges szöveghibák javítása, mind a dokumentumok leíró adatainak gazdagítása (például a tudományterület automatikus meghatározása). A projekt célkitűzése a repozitóriumi szolgáltatások és adatminőség javítása, lehetővé téve értéknövelt szolgáltatások fejlesztését a kutatói közösség számára.

##submission.downloads##

Megjelent

2023-12-20

Folyóiratszám

Rovat

Különfélék