resultados
Productos e informes
Censo de recursos terminológicos
Informe del Censo de Recursos Terminológicos TeresIA (ICRTT-1.0.0-20240405) recoge la primera aproximación a la tarea de recopilación de los repertorios de terminología en español (CRTT), con un sumario y referencia de los datos básicos que remiten a los ítems recogidos. En versiones sucesivas del documento se irán incorporando todos aquellos que se detecten y, en paralelo, se enriquecerá la base de datos de recursos con todos los datos asociados a estas referencias recogidas en el informe. El Grupo de Trabajo del CRTT actualiza esta información y coordina el constante proceso de compleción y actualización de datos, de acuerdo con los diferentes socios del proyecto TeresIA.
Informe del modelo de representación (ontología) de datos en TeresIA
El informe del modelo de representación (ontología) de datos en TeresIA (IMROD-1.0.0-20240930), corresponde al entregable 2.2, asociado al «Paquete de Trabajo 2 (Generación de repositorio de contenido e identificación de recursos existentes)» y al «Hito 3 (Modelos de representación de datos en TeresIA)». En esta versión final del informe, se describe un modelo de representación creado para los metadatos de los recursos que se expondrán a través del catálogo en el portal de TeresIA

KeyCARE
KEYCARE (Keyword extraction, term Categorization, and semantic Relation) proporciona una interfaz común para la extracción, categorización y asociación de términos extraídos de un texto. Su principal característica es que implementa métodos no supervisados y few-shot generalmente basados en inteligencia artificial que proporcionan alternativas viables en escenarios de pocos datos anotados. Esto ha sido implementado en una librería de Python que incluye los siguientes módulos:
Extracción de palabras clave
KeyCARE implementa varias técnicas de extracción de términos no supervisadas, como YAKE, RAKE, TextRank o KeyBERT, para extraer automáticamente términos clave de un texto. Los métodos implementados se basan en diferentes técnicas, como métodos estadísticos, grafos y deep learning, proporcionando diversidad y adaptabilidad a la librería.
Categorización de términos
KeyCARE permite el entrenamiento y la aplicación de técnicas de clustering y clasificación para separar las palabras clave en categorías predefinidas. Los clasificadores supervisados implementados se basan en la arquitectura Transformers de deep learning, y incluyen opciones few-shot (SetFit), las cuales permiten el entrenamiento de modelos con pocos datos.
Clasificación de relaciones semánticas
Esta herramienta también incluye técnicas para extraer relaciones jerárquicas entre dos términos mediante clasificadores basados en deep learning. Esto permite interconectar los términos extraídos y puede utilizarse para el enriquecimiento terminológico, entre otras tareas.

Esta herramienta ha sido implementada en español para el dominio biomédico, pero puede ser adaptada a otros dominios o idiomas.

Difusión
-
JORNADA El factor humano en la validación terminológica: una mirada desde la traducción institucional.
13/12/2024 · Madrid, Representación de la Comisión Europea en España
-
SEMINARIO Investigación interdisciplinar en terminología: TeresIA
25/11/2024 · Madrid, ILLA/CSIC -
PRESENTACIÓN de TeresIA en la ONU
30/09/2024 · Ginebra -
CURSO de investigación en Humanidades: proyecto TeresIA
28/08/2024 · Santander, UIMP -
PRESENTACIÓN Datos de investigación en Humanidades: proyecto TeresIA
28/08/2024 · Santander, UIMP -
¿Qué es TeresIA?
Consulta nuestro pasquín -
OPERAS Conference 2024. Seminario Research for mulitilingualism in Science
26/04/2024 Zadar (Croacia) Universidad de Zadar -
OPERAS Conference 2024.Póster: ES CIENCIA. An Interdisciplinary Platform on Spanish in Science for Boosting Multilingualism.
24-26/04/2024 Zadar (Croacia) Universidad de Zadar
Publicaciones
Próximamente
