Jelenlegi hely

Kutatószeminárium

Félév: 
2016/17 II. félév
Helyszín: 
Árpád tér 2. II. em. 220. sz.
Dátum: 
2017-03-21
Időpont: 
15:15-16:00
Előadó: 
Hangya Viktor
Cím: 
Kétnyelvű szóbeágyazások domén adaptációja Twitter szentimentelemzéshez
Absztrakt: 

Napjainkban a mély neurális hálózatok hatalmas sikereket értek el számos kutatási területen. Ez alól nem képez kivételt a számítógépes szövegfeldolgozás sem. Az egyik sikeresen alkalmazott technika az un. szóbeágyazások, mely célja a szavak alacsony dimenziós vektorokkal való ábrázolása úgy, hogy a szemantikailag hasonló szavak hasonló vektorokat kapnak. A módszer kiterjeszthető több nyelvre is, mely során az egyes nyelvek szavait ugyanabba a térbe ágyazzuk be, így a szavak és azok más nyelv béli párjai hasonló reprezentációt kapnak. Előadásomban bemutatom, hogy a kétnyelvű szóbeágyazások hogyan használhatóak nyelvközi gépitanuláshoz, azaz hogyan lehet az angol nyelvű szövegeken tanult modellt más nyelvű szövegek osztályozásához használni. Bemutatok továbbá két módszert szóbeágyazások domain adaptációjára a Twitter domainhez.