UZEI ko ikerketa- eta berrikuntza-taldeak informazio-sistema bat garatu du, dokumentu kategorizazioen bidez dokumentu idatzien gaia zehazteko.
GAIKA sistemaren bitartez jakin ahal dugu dokumentua automatikoki tratatuaz, zein arlotakoa den (zuzenbidea, ekonomia, biologia, Informatika, ...)
Dokumentuen gaia zehaztea funtsezkoa da hizkuntza naturalaren prozesamendu bidez egiten diren hainbat jardueratan: informazio-erauzketa (IE, Information Extraction), dokumentuen berreskuratzea (IR, Information Retrieval), dokumentu-sailkatzea (Document classification/categorization), dokumentu-laburpen automatikoa (Summarization), eta abar.
Sistema honetan hizkuntza naturalaren prozesamendurako teknologiak eta testuetako terminoen detekzio automatikoa egiteko tresnak baliatzen dira.
Garapen hau 2007ko Gipuzkoako Zientzia, Teknologia eta Berrikuntzaren Sareko programak finantzatu du.
|
|