|
|
|
Egitasmo hau 2008. urtean jarri zuen abian Euskaltzaindiak, Hiztegi Batuko Lantaldearen beharrei erantzuteko, hasiera batean behintzat. Izan ere, lantaldeak egungo euskararen eskaerei erantzuteko corpus handiagoa eta eguneratua behar baitu, etengabe elikatuko dena gainera.
Lehen helburua, beraz, egungo komunikabideek argitaratzen duten materialarekin corpus monitore bat osatzea izan da, lau urtean 50 milioi hitz izango dituena, eta hizkuntzaren erabilera hurbiletik jarraitzea ahalbidetuko duena. Baina ez hori bakarrik, oinarri-oinarrian baitago egunen batean Euskaltzaindiak bideratu beharko duen Euskararen Erreferentzia Corpusaren abiapuntua, corpus monitore honek elikatuko baitu neurri batean etorkizunekoa. Eta horixe da proiektu honen helburu nagusia.
Badira lanok neurri batean automatizatzeko baliabideak eta tresnak gure artean, eta ezagutza ere bai. Horregatik, Euskaltzaindiak hiru erakunderekin batera bideratu du proiektua: EHUko Donostiako Informatika Fakultateko IXA taldea, Elhuyar Fundazioa eta UZEI.
UZEIk proiektu honetan duen egiteko nagusia, argitaratzaileekin harremanetan jarriz, edukiak etengabe eskuratu eta katalogatzea da, eduki bakoitza bibliografikoki eta testualki identifikatuz; hau da, informazio bibliografikoa eta sailkapenari buruzkoa (medioa, etab.). TEI nazioarteko estandarra baliatu da horretarako. Corpusean, oraingoz, Berria, Argia, EiTB eta El Diario Vascoren edukiak eskuratu eta katalogatu dira. Euskaltzaindiak beste hainbat komunikabiderekin sinatu ditu hitzarmenak eta, proiektuak aurrera egin ahala, horiek guztiak landuko dira proiektuaren baitan.
Bibliografia:
URKIA, M. “Corpusgintzaren garrantzia hizkuntzalaritzan eta euskararen egoera” in EUSKALTZAINDIA, ‘Corpusgintza gaur egun’ mintegiaren aktak. Bilbo, 2010.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tel.: 943 47 33 77 Faxa: 943 45 79 44
|
|
| |
|
|
|
|
|
|
|
|
|
|
|