Informática aplicada a la Traducción: Las herramientas informáticas del traductor: desde procesadores de texto hasta sistemas de gestión de MT

Principales herramientas informáticas en el mundo de la traducción.

Como venimos repitiendo una y otra vez, la informática ha calado de tal forma en la labor traslativa que hoy en día no se concibe que entre las herramientas de trabajo del traductor no se encuentren diferentes programas informáticos, memorias de traducción, diccionarios electrónicos, corpus informatizados, procesadores de texto, etc.

Aunque muchas de ellas no son tan conocidas como otras, todas aportan algo, aunque sea un detalle, que puede ser de gran ayuda en la tarea de la traducción, facilitando búsquedas, mejorando la eficiencia…

Las herramientas de reconocimiento activo de terminología permiten analizar textos que se encuentran en formato electrónico para identificar con qué frecuencia aparecen determinados términos o frases. Si estos términos o frases se repiten a lo largo de la traducción, una vez los detectan, (siempre y cuando se hayan introducido previamente en su base de datos) lo proponen al usuario a través de la función de autopropagación. Un programa que lleva a cabo esta función es, por ejemplo, Logiterm.

Los concordadores bilingües permiten hacer comparaciones entre varias posibles equivalencias, identificar o evaluar traducciones potenciales de unidades léxicas, frases, oraciones o estructuras. ParaConc es un ejemplo que, además, hemos tratado en clase.

Los alineadores de bitextos podríamos decir que “crean” un bitextos (texto original con su respectiva traducción) y dividirlos en segmentos. Generalmente trabajan a nivel sintáctico uniendo las oraciones de acuerdo con la longitud de las mismas, lugar que ocupan en la unidad textual y, a veces, de acuerdo con su contenido. Como no se trata de programas de gran precisión, existen opciones de ayuda que posibilitan la mejora de la alineación o, también, otra alternativa es la alineación manual (el usuario la lleva a cabo a través de dichos programas. Es decir, no es automática). WinAlign es un buen ejemplo de alineador como también lo es ParaConc que incluye, a su vez, opciones de alineación.

Los corpus son una agrupación de textos en formato electrónico que sirven tanto para el estudio del lenguaje como de la pragmática, generalmente enfocados a un tipo de lenguaje muy concreto o específico (área temática, resgistro, tipo de texto…). Estos son especialmente útiles para el traducción, tanto si son de carácter general como si están especializados en un área determinada puesto que también pueden mostrar colocaciones en la lengua, mostrando a su vez el contexto de aparición, el registro… entre otras opciones de gran utilidad. Ejemplos de corpus considerados “representativos” son: British National Corpus y el CREA, entre otros.

Los diccionarios electrónicos son la alternativa a los diccionarios de papel, más rápidos y eficientes que los segundos. Podemos encontrarlos en línea y también en CD-ROM. Los diccionarios electrónicos no deben confundirse con los bancos de datos cuyos objetivos son distintos y su organización también difiere. La RAE, el Oxford English Dictionnary y Le Trésor de la Langue Française Informatisée son ejemplos de diccionarios completos y con una alta reputación.

Las herramientas de localización abarcan tanto el proceso traslativo como el de adaptación cultural, geográfica, política o incluso en algunos casos lingüística ya sea de un producto, página web, software… Si hablamos de herramientas de localización, debemos mencionar también sistemas de memorias de traducción y sistemas de gestión de terminología que intervienen en proyectos de localización. Catalyst es una de las herramientas de localización más conocidas.

Los sistemas de traducción automática se encargan del proceso completo de traducción de textos, con que el traductor humano solamente lleva a cabo el proceso de revisión o, también, se ocupa del cambio e inserción de otros recursos integrados en los sistemas de traducción automática como diccionarios electrónicos, textos paralelos… para obtener resultados más satisfactorios. Es decir, para no dar pie a que la ambigüedad aparezca o, del mismo modo, “forzar” al programa a que trabaje sus traducciones basándose en las reglas gramaticales básicas de una lengua. Se trata de programas muy trabajados y evolucionados —útiles en ciertas ocasiones— como Google Translate o Sytran pero que, según mi opinión, jamás desbancarán al traductor humano.

La tarea de los concordadores monolingües es el análisis de corpus, para encontrar y visualizar concordancias. Algunos muestran dichas concordancias contextualizadas (KWIC —key word in context—), es decir, cada concordancia se muestra de forma separada, lo cual es especialmente útil para estudiar cuál es el uso concreto de una palabra o una frase y cuál es su combinatoria. TextStart y WebConc son dos buenos ejemplos de concordadores monolingües.

Es fundamental tener un conocimiento amplio de las herramientas de Microsoft Office más allá del procesador de texto Word, ya que ofrece programas de asistencia en tareas de traducción como la gestión de presentaciones (PowerPoint), bases de datos (Access) y hojas de cálculo (Excel).

Los motores de búsqueda como Google, Yahoo!, Ask.com, Dmoz… analizan el contenido de páginas web y crean listas de concordancias de palabras encontradas en páginas web o en sus URL. Estos motores facilitan la búsqueda de datos a través de palabras clave presentando los resultados proclives a ser de mayor utilidad al principio de la lista de resultados que se visualiza en su interfaz. Algunos de ellos presentan opciones de búsqueda avanzada o especializada; por ello, debe conocerse su estructura y funcionamiento: para optimizar la búsqueda. Así, algunos comandos de Google interesantes para el traductor son:

- -Para buscar definiciones en google, utilizar el comando define+ el término que desee.

- -Para buscar términos en fuentes fiables: poner el término entrecomillado + inurl: eur-lex europa.eu (solo para lenguas de la unión Europea) o, también, in title + “término” para buscar páginas que tengan el término en su título (algo parecido a textos paralelos).

- Otro comando de Google es escirbir en la barra "related:+pág web que se conoce de la que se quiere encontrar una página web relacionada, que tenga que ver, cuyos objetivos están relacionados…

Los bancos de datos terminológicos asisten en la búsqueda de términos utilizaos en lenguaje especializado, traducción técnica, textos científicos… Se trata de compilaciones de términos con entradas muy estructuradas que, generalmente, almacenan información sobre conceptos fundamentales en campos especializados (términos, sus equivalentes en otras lenguas, fuentes, contextos, definiciones, observaciones…). Dos bases imprescindibles para el traductor son IATE (base de datos de la Unión Europea) y TERMIUM (del gobierno de Canadá).

Los extractores terminológicos identifican CAT (candidatos a término), es decir, unidades léxicas que en un área específica o campo de conocimiento especializado parecen ser términos. Para extraer dichos términos ponen en práctica criterios como el análisis de la frecuencia de aparición, combinatoria de palabras… Los resultados en ocasiones no son correctos o precisos por lo que tendrán que ser revisados y llevados a debate por especialistas como terminólogos, lexicólogos, traductores… TermoStat o Multiterm Extract son de los ejemplos más representativos de extractores terminológicos.

Los sistemas de gestión terminológica están especialmente diseñados para el almacenamiento y gestión terminológica (términos, equivalencias, campo de conocimiento, fuentes, definiciones, contextos…). Permiten crear, almacenar, gestionar y buscar sus propias listas de términos que, a su vez, podrán ser de utilidad en futuras traducciones. A veces son incluso más útiles que las herramientas de Office ya que trabajan conjuntamente con sistemas de memorias de traducción y herramientas de reconocimiento activo de terminología. Un buen ejemplo de sistema de gestión terminológica es BeeText Term.

Las herramientas de traducción asistida hacen referencia a sistemas que incluyen varias de las herramientas previamente citadas en un único programa. Incluyen alineadores, extractores, sistemas de gestión de terminología, etc. Algunos ejemplos son Trados, Omega T o Wordfast.

Los sistemas de memorias de traducción permiten ahorrar tiempo y esfuerzo al traductor. Son especialmente útiles en textos en los que las repeticiones son frecuentes, es decir, que ofrecen la posibilidad de reutilizar un segmento previamente traducido (autropropagarlo). No deben confundirse con sistemas de traducción automática ya que las MT solo permiten reciclar segmentos, no generar traducciones automáticas. DéjàVu, SDL Trados o Fusion Translate son tres de las memorias de traducción más conocidas y utilizadas.

En general, existen numerosas herramientas en la red que a su vez, desempeñan tareas de todo tipo. Diatopix, por ejemplo, actúa a modo de “programa detector de localismos”. Es decir, “informa” al traductor de si un término es más o menos utilizado en un zona o región a través de búsquedas en la web de forma limitad geográficamente. Por otro lado, ORBIS, por ejemplo, es una catálogo de biblioteca, útiles en la labor traslativa, como también lo puede ser el catálogo en línea de Universidad Autónoma de Madrid.

Por último, es imprescindible conocer el funcionamiento de los procesadores de texto que permiten crear, editar y guardar documentos de texto, a la vez que ofrecen funciones que facilitan la comparación y la revisión de textos tanto a traductores como a escritores o revisores. Además, permiten el cambio de formato; aspecto que cabe destacar puesto que reduce los problemas de incompatibilidad que pudieran generarse durante la manipulación del archivo o documento durante su manipulación.

Informática aplicada a la Traducción

martes, 25 de diciembre de 2012

Las herramientas informáticas del traductor: desde procesadores de texto hasta sistemas de gestión de MT

No hay comentarios:

Publicar un comentario

Datos personales