Discurso académico, traducción automática y evaluación de la calidad: comparación entre sistemas

  • Eugenia Sainz Università Ca'Foscari Venezia, Venecia, Italia https://orcid.org/0000-0002-6249-7847
  • Antonella Bove Università Ca' Foscari Venezia, Venecia, Italia
Palabras clave: evaluación de calidad de la traducción automática, métrica MQM, discurso académico español<>italiano, análisis de errores, estilo

Resumen

Este artículo quiere contribuir a la investigación sobre la evaluación de la calidad de la traducción automática con un estudio enfocado en la traducción del discurso académico del italiano al español y viceversa. Partiendo de la teoría de la pertinencia (Sperber y Wilson, 1986), el estudio compara la eficacia de los sistemas neuronales (en concreto, DeepL y Google Translate) con los generativos (ChatGPT-4o y Deepseek) a través de un análisis cuantitativo y cualitativo basado en la métrica MQM. Se parte de un corpus de longitud media, constituido por diez resúmenes en italiano y diez en español. Los resultados validan las hipótesis de partida. Primero, los sistemas generativos demuestran un mejor rendimiento que los neuronales, con un número menor de errores graves. Segundo, la mayoría de los errores afecta a la reconstrucción de la explicatura y, concretamente, a las categorías de Terminología y Precisión. Tercero, se advierte un alto nivel de variación estilística, en el que los sistemas generativos destacan por su capacidad de reformulación y mejora del texto en términos de claridad. Cuarto, el rendimiento de los sistemas resulta mejor en la dirección italiano-español. Finalmente, se confirma la centralidad del traductor humano como garante de la calidad última del texto.

Publicado
2026-06-17
Cómo citar
Sainz, E., & Bove, A. (2026). Discurso académico, traducción automática y evaluación de la calidad: comparación entre sistemas. Revista De Filología De La Universidad De La Laguna, (52), 379-416. https://doi.org/10.25145/j.refiull.2026.52.14
Sección
Artículos