EN HU

Vektortéralapú szemantikai szóhasonlósági vizsgálatok

Tóth, Á.: Vektortéralapú szemantikai szóhasonlósági vizsgálatok.
In: MSZNY 2013: IX. Magyar Számítógépes Nyelvészeti Konferencia. Szerk.: Tanács Attila, Vincze Veronika, Szegedi Tudományegyetem Informatikai Tanszékcsoport, Szeged, 354-360, 2013. ISBN: 9789633061893
title:
Vektortéralapú szemantikai szóhasonlósági vizsgálatok
authors:
  • Tóth Ágoston
published:
2013
type:
book chapter
genre:
study, dissertation
language:
Hungarian
HAC:
Humanities, Linguistics
subjects:
számítógépes nyelvészet, disztribúciós szemantika, Nyelvtechnológia és Bioetika
abstract:
A bemutatott kísérletben kiválasztott szavakat a környezetükben előforduló szavak gyakorisági adataiból képzett vektorokkal reprezentáljuk, a vektorok összehasonlításával pedig a szavak szemantikai hasonlóságára következtetünk. A kísérleti rendszer egy feleletválasztásos feladatot old meg, melyben 30 célszó mindegyikéhez automatikusan kiválasztjuk a hozzá leghasonlóbb szót. A vizsgálandó szavak listáján 15 szemantikailag motivált párt találunk, köztük ellentéteket, szinonimákat és alá-/fölérendelt szavakat; kimenetként mindegyik szó párját vártuk visszakapni. A helyes választ a rendszernek mind a 30 szóhoz összesen 100 potenciális jelölt közül kellett kiválasztania. A pontosság maximális értéke (20 millió szavas korpusz feldolgozása után) 79% volt. A vektorokat a Magyar Webkorpuszból vett, annotációt nem tartalmazó szövegek segítségével állítottam elő, a vektorok kiszámítását és összehasonlítását saját fejlesztésű programmal végeztem.
projects:
K72983; TÁMOP-4.2.1/B-09/1/KONV-2010-0007
DEENK University of Debrecen
© 2012 University of Debrecen