Humán annotált emóciókorpusz létrehozása aktorokhoz köthető érzelmek detektálására

Szerzők

DOI:

https://doi.org/10.31400/dh-hun.2022.6.4576

Kulcsszavak:

szentimentdetektálás, érzelemdetektálás, szövegklasszifikáció, BERT, felügyelt modell, humán annotáció

Absztrakt

Tanulmányunkban egy olyan kutatási projektet mutatunk be, amelyben egy aktorokhoz (pl. intézményekhez, személyekhez) kapcsolódó, szentimentek és konkrét érzelmek klasszifikációjára képes nyelvi modell létrehozása a célunk. A modell tanítóadatbázisát egy tízezer cikkből álló, online újságokból származó, statisztikai mintavétel segítségével összeállított, humán annotált szövegkorpusz jelenti. Az annotálás során két lépcsőben először az előforduló névelemeket, illetve aktorként funkcionáló közneveket, majd ezt követően a névelemek szövegkörnyezetében megtalálható szentiment- és érzelmi tölteteket annotáljuk. Az annotált szövegek adatbázisa jó bemeneti adatot jelenthet felügyelt klasszifikációs modellek létrehozásához. Cikkünkben ismertetjük a projekt korpuszát, a felügyelt és nem felügyelt szövegklasszifikációs eljárások sajátosságait, valamint a szentiment- és érzelemdetektálás lehetséges módszereit. Ezt követően bemutatjuk a kutatásunkban alkalmazott kétlépcsős annotálási módszertant, az ennek kialakítása során felmerült problémákat és kihívásokat, illetve azokat a kutatói döntéseket, amelyeket a létrehozni kívánt modell társadalomtudományos felhasználhatóságának érdekében hoztunk meg.

##submission.downloads##

Megjelent

2022-12-31

Hogyan kell idézni

Knap, Árpád, Tímea Emese Tóth, és Zsófia Rakovics. 2022. „Humán annotált emóciókorpusz létrehozása Aktorokhoz köthető érzelmek detektálására”. Digitális Bölcsészet, sz. 6 (december):M:3-M:17. https://doi.org/10.31400/dh-hun.2022.6.4576.

Folyóirat szám

Rovat

Műhely