|
|
|
euLEX: la base de datos léxica de UZEI
euLEX: la base de datos léxica de UZEI
euLEX es la base de datos léxica del euskera, un recurso lingüístico creado por UZEI para su uso en el tratamiento automático. En la actualidad, son numerosos los productos y aplicaciones diseñados para el euskera y en euskera, pero todos ellos requieren de recursos básicos propios referentes al propio idioma, además de otras herramientas adecuadas.
UZEI lleva años trabajando intensamente en el Procesamiento del Lenguaje Natural. Fruto de este trabajo es el lematizador tLEMA, creado inicialmente para lematizar términos, pero que, en realidad, también es un lematizador general. De hecho, la información de tLEMA está basada en euLEX.
En la siguiente pantalla se pueden observar todos los campos de la base de datos léxica, que pueden ser utilizados para realizar búsquedas, si bien cada categoría utiliza únicamente aquellos campos que son pertinentes en cada caso.

El contenido, en cifras
La base de datos léxica euLEX se actualiza constantemente. Se revisan y actualizan las entradas de las categorías principales, sobre todo, los términos, dado que las categorías cerradas y los afijos son muy estables. Por tanto, las entradas que se revisan diariamente son los nombres, los adjetivos y los verbos.
La base de datos euLEX contiene 105.000 entradas de diccionario (73.500 nombres, 14.600 adjetivos, 7.300 verbos, 3.600 abreviaturas y 4.800 adverbios, entre otros), 13.700 alomorfos, 7.300 formas verbales y 1.240 morfemas. Por tanto, recoge un total de casi 128.000 entradas, una muestra más que representativa para, en nuestra opinión, responder a las necesidades de los usuarios de la lengua vasca.
El Departamento de Cultura del Gobierno Vasco (Viceconsejería de Política Lingüística) ha subvencionado el trabajo realizado para poner a la venta esta base de datos en formato XML en el catálogo ELRA.
Kutxa patrocina este proyecto:

|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Tfno.: 943 47 33 77 Fax: 943 45 79 44
|
|
| |
|
|
|
|
|
|
|
|
|
|
|