Skip to content

resultados

Productos e informes

Censo de recursos terminológicos

Informe del Censo de Recursos Terminológicos TeresIA (ICRTT-1.0.0-20240405) recoge la primera aproximación a la tarea de recopilación de los repertorios de terminología en español (CRTT), con un sumario y referencia de los datos básicos que remiten a los ítems recogidos. En versiones sucesivas del documento se irán incorporando todos aquellos que se detecten y, en paralelo, se enriquecerá la base de datos de recursos con todos los datos asociados a estas referencias recogidas en el informe. El Grupo de Trabajo del CRTT actualiza esta información y coordina el constante proceso de compleción y actualización de datos, de acuerdo con los diferentes socios del proyecto TeresIA.

Informe del modelo de representación (ontología) de datos en TeresIA

El informe del modelo de representación (ontología) de datos en TeresIA (IMROD-1.0.0-20240930), corresponde al entregable 2.2, asociado al «Paquete de Trabajo 2 (Generación de repositorio de contenido e identificación de recursos existentes)» y al «Hito 3 (Modelos de representación de datos en TeresIA)». En esta versión final del informe, se describe un modelo de representación creado para los metadatos de los recursos que se expondrán a través del catálogo en el portal de TeresIA

Producto e informes
KeyCARE

KEYCARE (Keyword extraction, term Categorization, and semantic Relation) proporciona una interfaz común para la extracción, categorización y asociación de términos extraídos de un texto. Su principal característica es que implementa métodos no supervisados y few-shot generalmente basados en inteligencia artificial que proporcionan alternativas viables en escenarios de pocos datos anotados. Esto ha sido implementado en una librería de Python que incluye los siguientes módulos:

KeyCARE implementa varias técnicas de extracción de términos no supervisadas, como YAKE, RAKE, TextRank o KeyBERT, para extraer automáticamente términos clave de un texto. Los métodos implementados se basan en diferentes técnicas, como métodos estadísticos, grafos y deep learning, proporcionando diversidad y adaptabilidad a la librería.

KeyCARE permite el entrenamiento y la aplicación de técnicas de clustering y clasificación para separar las palabras clave en categorías predefinidas. Los clasificadores supervisados implementados se basan en la arquitectura Transformers de deep learning, y incluyen opciones few-shot (SetFit), las cuales permiten el entrenamiento de modelos con pocos datos.

Esta herramienta también incluye técnicas para extraer relaciones jerárquicas entre dos términos mediante clasificadores basados en deep learning. Esto permite interconectar los términos extraídos y puede utilizarse para el enriquecimiento terminológico, entre otras tareas.

Esta herramienta ha sido implementada en español para el dominio biomédico, pero puede ser adaptada a otros dominios o idiomas.

Publicaciones

Próximamente