Discurso académico, traducción automática y evaluación de la calidad: comparación entre sistemas
Resumen
Este artículo quiere contribuir a la investigación sobre la evaluación de la calidad de la traducción automática con un estudio enfocado en la traducción del discurso académico del italiano al español y viceversa. Partiendo de la teoría de la pertinencia (Sperber y Wilson, 1986), el estudio compara la eficacia de los sistemas neuronales (en concreto, DeepL y Google Translate) con los generativos (ChatGPT-4o y Deepseek) a través de un análisis cuantitativo y cualitativo basado en la métrica MQM. Se parte de un corpus de longitud media, constituido por diez resúmenes en italiano y diez en español. Los resultados validan las hipótesis de partida. Primero, los sistemas generativos demuestran un mejor rendimiento que los neuronales, con un número menor de errores graves. Segundo, la mayoría de los errores afecta a la reconstrucción de la explicatura y, concretamente, a las categorías de Terminología y Precisión. Tercero, se advierte un alto nivel de variación estilística, en el que los sistemas generativos destacan por su capacidad de reformulación y mejora del texto en términos de claridad. Cuarto, el rendimiento de los sistemas resulta mejor en la dirección italiano-español. Finalmente, se confirma la centralidad del traductor humano como garante de la calidad última del texto.
Derechos de autor 2026 Eugenia Sainz, Antonella Bove

Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial-SinObrasDerivadas 4.0.
Los trabajos publicados en esta revista son propiedad de sus respectivos autores y autoras, quienes conceden a la Revista de Filología de la Universidad de La Laguna el derecho de primera publicación, tal y como se recoge en nuestra Política de derechos de autoría.





