Terminologia eta lexikografia Zentroa
Flash en el que se ven los libros e instalaciones de uzei
ESTÁ EN: Castellano www.uzei.com   
QUÉ ES UZEI
Presentación
Objetivos
Relaciones de cooperación
Socios
Dónde estamos
Hitzari bide egiten
Hemeroteca
Patrocinadores
TERMINOLOGÍA
Presentación
Diccionarios
Consultas
Euskalterm
Internacional
Congreso Internacional
Léxicos
LEXICOGRAFÍA
Presentación
Observatorio Léxico
Corpus del siglo XX
Diccionario unificado
Jornadas sobre corpus lingüísticos
Enlaces de interés
PRODUCTOS
Diccionarios
Libros de texto
TRADUCCIONES
Presentación
Trabajos realizados
Clientes
euLEX

euLEX: la base de datos léxica de UZEI

 

 

euLEX: la base de datos léxica de UZEI


euLEX es la base de datos léxica del euskera, un recurso lingüístico creado por UZEI para su uso en el tratamiento automático. En la actualidad, son numerosos los productos y aplicaciones diseñados para el euskera y en euskera, pero todos ellos requieren de recursos básicos propios referentes al propio idioma, además de otras herramientas adecuadas.

 

UZEI lleva años trabajando intensamente en el Procesamiento del Lenguaje Natural. Fruto de este trabajo es el lematizador tLEMA, creado inicialmente para lematizar términos, pero que, en realidad, también es un lematizador general. De hecho, la información de tLEMA está basada en euLEX.

 

En la siguiente pantalla se pueden observar todos los campos de la base de datos léxica, que pueden ser utilizados para realizar búsquedas, si bien cada categoría utiliza únicamente aquellos campos que son pertinentes en cada caso.

 

 

El contenido, en cifras

 

La base de datos léxica euLEX se actualiza constantemente. Se revisan y actualizan las entradas de las categorías principales, sobre todo, los términos, dado que las categorías cerradas y los afijos son muy estables. Por tanto, las entradas que se revisan diariamente son los nombres, los adjetivos y los verbos.

 

La base de datos euLEX contiene 105.000 entradas de diccionario (73.500 nombres, 14.600 adjetivos, 7.300 verbos, 3.600 abreviaturas y 4.800 adverbios, entre otros), 13.700 alomorfos, 7.300 formas verbales y 1.240 morfemas. Por tanto, recoge un total de casi 128.000 entradas, una muestra más que representativa para, en nuestra opinión, responder a las necesidades de los usuarios de la lengua vasca.

 

El Departamento de Cultura del Gobierno Vasco (Viceconsejería de Política Lingüística) ha subvencionado el trabajo realizado para poner a la venta esta base de datos en formato XML en el catálogo ELRA.

 

Kutxa patrocina este proyecto:

 


 

Icono eHiztegia Imprimir  Imprimir Envíalo por Email  Envíalo por Email


Castellano 
Euskara 
English 
Français 
I+D+i
Presentación
eLENA
TEIS
euLEX
GAIKA
IDITE
TermiGai
CONSULTAS ON-LINE
Euskalterm
Corpus del euskera del siglo XX
Diccionario de sinónimos
Diccionario de terminaciones
FORMACIÓN
Cursos
Materiales
BERBA
Berbabidea
Zer berri?
Liburuak berba batean
Datozen egunetan
Irakurlea berbetan
Suscripción
De interés

Tfno.: 943 47 33 77
Fax: 943 45 79 44

Patrocina

 Inicio  Contacto  :   Recomendar la página Establecer como página de inicio 
Copyright © 2005 Dynamic Macroweb & Design S.L. Todos los derechos reservados.
Web site desarrollado por DMacroWeb mediante la herramienta DM Corporative v 3.1