palabras X el mundo: ¿Qué es la alineación de textos?

Una de las prestaciones de las memorias de traducción es la alineación de textos. Esta técnica, que encontramos en la pestaña de «proyecto de alineación» dentro de cualquier memoria de traducción, consiste en crear un texto bilingüe a partir de un original mediante la aproximación de segmento por segmento. Entre los programas más utilizados tenemos BITEX, que se trata de una aplicación abierta, lo que resulta muy útil pues nos permite crear memorias de traducción fuera de otra aplicación.

Una vez que estamos dentro del proyecto, éste se limita sólo a dos lenguas. Añadimos los dos textos. Así, vamos almacenando una especie de glosario de términos. La pega es que simplemente se aplican reglas tipográficas, no interpretaciones textuales. ¡Cuidado! Eso conlleva que el proceso de alineación nunca es plenamente automático. Nunca podemos fiarnos al 100% de lo que va a hacer. Partimos de una base: se considera «segmento» a toda frase que va hasta un signo de puntuación fuerte. Pero nosotros podemos decidir dónde separar los segmentos. Para ello existen una serie de reglas que podemos predeterminar de antemano para que el resultado sea mejor:

- - No nos interesan las figuras, solo dificultarían el proceso;

- - Eliminar los logos o tablas y quedarnos con el contenido;

- - Configurar los acrónimos para que sus puntos no se consideren como fin de un segmento;

- - Algunos signos de puntuación sí pueden considerarse final de segmento: —.

- - Guardar los archivos en formato TXT, es el más compatible dentro de las memorias de traducción (por ejemplo, BITEX sólo acepta este formato, no PDFs).

En la primera imagen tenemos un ejemplo de la alineación de textos (podemos cortar, unir, adelantar y modificar todos y cada uno de los segmentos).

Ya tenemos guardado nuestro proyecto de alineación. El siguiente paso es abrir el documento con un editor de textos, como Notepad, para realizar una búsqueda automática de equivalentes, terminología o hacer un análisis de vocabulario. En la segunda foto podemos ver cómo el contenido se identifica mediante etiquetas que van siempre entre <>. Por tanto, cuando yo importe este archive a mi memoria de traducción, ésta interpretará la información entre las etiquetas y almacenará los contenidos. El resto de etiquetas albergan: la cabecera (header), donde aparece la herramienta que se ha usado (bitex), idioma, tipo de datos, codificación de los caracteres, etc. A continuación nos encontramos con el cuerpo (body) que incluye todos los segmentos. La información se encuentra entre las TU (translation units). Dentro de esas etiquetas pueden encontrarse otras, como por ejemplo las variables, entre comillas.

Con nuestro proyecto de alineación revisado y modificado, sólo falta importarlo a la memoria de traducción, que explicaré en mi siguiente entrada.

27 marzo 2012

¿Qué es la alineación de textos?

No hay comentarios:

Publicar un comentario

Seguidores

Blogs que sigo