Jelenlegi hely

Kutatószemináriumi előadás

Kedves Kollégák!

A doktoranduszok őszi szeminárium-sorozatának első előadója: Dobó András

Az előadás címe:    Szemantikai hasonlóság számítása nagyméretű statikus korpuszok felhasználásával

Időpont:    2012. 10. 02. (kedd)    15:00 - 16:00

Helyszín:    Árpád tér 2., tetőtéri szemináriumi szoba

Összefoglaló:

Szavak szemantikai hasonlóságának vizsgálata számos számítógépes nyelvészeti probléma megoldásának fontos eleme. Habár sok különböző
módszer létezik e feladat megoldására, az eddig elért eredmények még nem teljes mértékben kielégítőek. Jóllehet a legtöbb erre a feladatra
kialakított módszer webes kereséseket és nagy lexikai adatbázisokat alkalmaz, előadásomban olyan módszereket mutatok be, amelyek csupán
nagyméretű statikus korpuszokat használnak fel. Ezek az algoritmusok egy bináris vagy numerikus tulajdonságvektort hoznak létre minden szóhoz a korpuszokból kinyert statisztikai információk alapján. Egy szó vektora az adott szó környezetében található szavakból és nyelvtani kapcsolatokból álló tulajdonságokat tartalmaz, különféle súlyozás felhasználásával, és a szavak hasonlósága vektoraik hasonlóságaként van definiálva. A különálló módszereken kívül a kombinációik is kipróbálásra kerültek. Az algoritmusok a Miller-Charles szópárokon és a TOEFL szinonima kérdéseken tesztelve versenyképes eredményeket értek el.

Minden érdeklődőt örömmel látunk.