Humán annotált emóciókorpusz létrehozása aktorokhoz köthető érzelmek detektálására

Árpád Knap; Tímea Emese Tóth; Zsófia Rakovics

doi:10.31400/dh-hun.2022.6.4576

Szerzők

Árpád Knap ELTE TÁTK https://orcid.org/0000-0002-4290-6025
Tímea Emese Tóth ELTE TÁTK https://orcid.org/0000-0002-3584-118X
Zsófia Rakovics ELTE TÁTK https://orcid.org/0000-0002-9903-9348

DOI:

https://doi.org/10.31400/dh-hun.2022.6.4576

Kulcsszavak:

szentimentdetektálás, érzelemdetektálás, szövegklasszifikáció, BERT, felügyelt modell, humán annotáció

Absztrakt

Tanulmányunkban egy olyan kutatási projektet mutatunk be, amelyben egy aktorokhoz (pl. intézményekhez, személyekhez) kapcsolódó, szentimentek és konkrét érzelmek klasszifikációjára képes nyelvi modell létrehozása a célunk. A modell tanítóadatbázisát egy tízezer cikkből álló, online újságokból származó, statisztikai mintavétel segítségével összeállított, humán annotált szövegkorpusz jelenti. Az annotálás során két lépcsőben először az előforduló névelemeket, illetve aktorként funkcionáló közneveket, majd ezt követően a névelemek szövegkörnyezetében megtalálható szentiment- és érzelmi tölteteket annotáljuk. Az annotált szövegek adatbázisa jó bemeneti adatot jelenthet felügyelt klasszifikációs modellek létrehozásához. Cikkünkben ismertetjük a projekt korpuszát, a felügyelt és nem felügyelt szövegklasszifikációs eljárások sajátosságait, valamint a szentiment- és érzelemdetektálás lehetséges módszereit. Ezt követően bemutatjuk a kutatásunkban alkalmazott kétlépcsős annotálási módszertant, az ennek kialakítása során felmerült problémákat és kihívásokat, illetve azokat a kutatói döntéseket, amelyeket a létrehozni kívánt modell társadalomtudományos felhasználhatóságának érdekében hoztunk meg.

Humán annotált emóciókorpusz létrehozása aktorokhoz köthető érzelmek detektálására

Szerzők

DOI:

Kulcsszavak:

Absztrakt

##submission.downloads##

Megjelent

Hogyan kell idézni

Folyóirat szám

Rovat

License

Nyelv

##plugins.block.keywordCloud.title##

Információ

szerzoindex

donate