Herramientas de traducción asistida


En la anterior entrada de Melodía de traducción, vimos cómo reaprovechar una base terminológica en formato XLSX para uso en memoQ. Ahora veremos cómo hacer lo propio con SDL Trados Studio. Por si no habéis leído la entrada correspondiente a memoQ, a continuación os dejo una imagen de muestra del glosario en XLSX que he usado como ejemplo.

Ejemplo de glosario en una hoja de Excel

Conversión de la base terminológica al formato de MultiTerm

Una de las grandes virtudes de SDL Trados Studio, a mi modo de ver, es su interacción con MultiTerm, que permite vincular bases terminológicas de MultiTerm (con la extensión SDLTB) a nuestros proyectos de SDL Trados Studio y gestionar la terminología de una forma más completa que en memoQ. Sin embargo, como punto negativo hay que decir MultiTerm no es el programa más sencillo de dominar del mundo si nos estamos iniciando en las herramientas TAO y las bases terminológicas, por lo que crearlas de cero o a partir de otros formatos puede sr un proceso un tanto angustioso.

Sin embargo, no todo son malas noticias. Para facilitarnos el proceso de conversión del formato XLSX original a SDLTB, contamos con la inestimable ayuda de Glossary Converter, una de las muchas apps gratuitas que podemos descargar desde la SDL AppStore, similar a la Play Store o la AppStore, y a la que podemos acceder siempre que tengamos licencia de SDL Trados Studio. Glossary Converter es una app de interfaz muy sencilla que convierte al formato que decidamos archivos de diferentes formatos usados para crear bases terminológicas. Después de descargar Glossary Converter, instalaremos la app y la abriremos. Si pulsamos el botón configuración, accederemos a todos los ajustes que podemos cambiar en la app.

Ventana principal de Glossary Converter

En nuestro caso, nos interesa elegir la primera pestaña, General, y asegurarnos de que está marcada la primera opción, MultiTerm Termbase. En las demás pestañas podremos cambiar otros parámetros si así lo necesitamos, pero en este ejemplo podemos usar las opciones predeterminadas.

Configuración del formato de salida

El siguiente paso es muy sencillo: basta con abrir la carpeta donde tenemos guardado nuestro archivo XLSX, seleccionarlo y arrastrarlo y soltarlo en la ventana de la app para que dé comienzo el proceso, cuya duración dependerá del tamaño del glosario. A continuación os dejo un enlace a un vídeo que he grabado para dar fe de lo sencilla que es esta conversión.

Conversión de glosario XLSX a SDLTB

 

Una vez terminada la conversión, si queremos ver el resultado final, solamente tendremos que hacer doble clic en el archivo SDLTB o bien pulsar el botón Administración de terminología situado en la pestaña Inicio de la cinta de opciones de SDL Trados Studio, como se resalta en la siguiente imagen. También podemos abrir la base terminológica recién creada desde el propio MultiTerm mediante la combinación de teclas Ctrl + O.

Administración de terminología en SDL Trados Studio

Gestión de bases terminológicas de MultiTerm

La siguiente imagen es una muestra de nuestro nuevo glosario de MultiTerm. Como comentaba antes, la verdad es que, desde un punto de vista estético, la gestión de bases terminológicas en MultiTerm es más atractiva que la que ofrece memoQ. Entre otras cosas, sirve para entender mejor la estructura jerárquica de las bases terminológicas y ver si cada uno de los campos está en el nivel que le corresponda (que son, de mayor a menor jerarquía, el nivel de entrada, el nivel de idioma y el nivel de término).

Vista de la base terminológica en MultiTerm

En esta entrada no pararé demasiado en las funciones de MultiTerm. No obstante, cabe resaltar que, al igual que memoQ, MultiTerm puede buscar términos duplicados o sinónimos para que los localicemos fácilmente y los podamos borrar si así lo vemos necesario. Para tal fin, simplemente tenemos que ir a la pestaña Inicio de la cinta de opciones, luego al grupo Filtros y después seleccionar Source contains synonym en la lista desplegable y pulsar el botón Modo de filtro forzado, como vemos en la siguiente captura de pantalla.

Búsqueda de términos duplicados

De vuelta en Studio, si queremos añadir nuestra nueva base terminológica a un proyecto para que podamos utilizar la terminología adecuada mientras traducimos, tan solo tenemos que abrir la ventana de configuración de proyecto, y en Combinaciones de idiomas > Bases de datos terminológicas y pulsar el botón Utilizar > Base de datos terminológica MultiTerm basada en archivo.

Vinculación de la base terminológica a un proyecto de traducción

Cómo añadir términos a nuestra base mientras traducimos

Para concluir la entrada, y del mismo modo que hemos visto con memoQ, también podemos añadir términos a nuestra base terminológica sobre la marcha a medida que vayamos traduciendo con SDL Trados Studio. Es tan sencillo como señalar el nuevo término y su traducción y pulsar Ctrl + F2 o bien Ctrl + Mayús. + F2 si queremos editar algún campo en el nuevo término. También podemos hacer lo mismo accediendo al menú desplegable con el botón secundario del ratón, tal y como se muestra en la siguiente imagen.

Nuevos términos añadidos desde el panel Editor

Una vez hayamos añadido el término, Studio nos lo mostrará en el cuadro correspondiente si aparece en otros segmentos de nuestra traducción.

Reconocimiento de términos

Como habréis visto, MultiTerm puede resultar un tanto intimidante, pero, con un poco de maña, ya no tendremos ninguna excusa para no reutilizar nuestros viejos glosarios y no aprovechar algunas de las grandes ventajas de una TAO como SDL Trados Studio. ¿A qué esperáis para poneros a ello? Y, si os interesa saber cómo reaprovechar los glosarios en memoQ, podéis leer la anterior entrada de Melodía de traducción.

No sé si os pasa a vosotros también, pero de vez en cuando, quitando archivos antiguos del disco duro, me encuentro con glosarios antiguos (incluso de la época en que estaba en la facultad) creados en hojas de Microsoft Excel. Después de separar la paja del grano y de descartar los que ya no me sirven, me gusta que no se queden en el olvido y, en estos tiempos en que cuesta imaginarse la traducción sin las herramientas TAO, quizás la mejor forma de hacerlo consista en convertirlos a glosarios compatibles con dichas herramientas. Como venimos haciendo en las entradas más recientes, vamos a ver cómo reutilizar glosarios de Excel para usarlos en dos de las TAO más comunes, memoQ y SDL Trados Studio.

La primera entrada va a estar centrada en memoQ y, como archivo de ejemplo, voy a utilizar un glosario en formato XLSX sobre aeronáutica que creé como referencia para uno de mis primeros proyectos como profesional (ha llovido mucho desde entonces). Como podéis ver en la siguiente captura, es un glosario bilingüe con un término en inglés y su equivalente en español, así como el campo terminológico al que pertenece, la fuente de donde extraje la traducción y el estado de dicha traducción, pues estaba sujeta a la aprobación del cliente.

Ejemplo de glosario en una hoja de Excel

Conversión de la base terminológica al formato de memoQ

Al igual que ocurre con las memorias de traducción, memoQ puede reaprovechar bases de datos terminológicas procedentes de otros programas o profesionales e importarlas en nuestra propia base terminológica de memoQ (con la extensión MTB). Podemos importar CSV, TSV, TMX, XLS(X), XML de MultiTerm y TBX (el estándar para intercambio de bases de datos terminológicas). A continuación, veremos cómo proceder con el glosario de ejemplo en formato XLSX, aunque primero tenemos que crear una base terminológica nueva, para lo cual iremos a la Consola de recursos > Bases terminológicas y pulsaremos el botón Crear nuevo, como en la siguiente captura de pantalla.

Bases terminológicas en la Consola de recursos

En el siguiente paso, tendremos que hacer clic en el botón Importar terminología y elegir nuestro archivo XLSX. Aquí le daremos un nombre e indicaremos los idiomas de la nueva base terminológica (conviene recordar que, a diferencia de las memorias de traducción, las bases terminológicas pueden ser multilingües, así que podemos añadir más de dos idiomas). Si así lo queremos, antes podemos cambiar los valores de detección de términos para cada idioma de la nueva base haciendo clic en el botón Valores predeterminados para términos nuevos, tal y como se ve en la siguiente imagen.

Valores predeterminados de los términos

En la lista Coincidencia podemos cambiar el valor de detección de formas flexivas del término en cuestión.

-Coincidencia parcial: conviene seleccionarlo para que memoQ encuentre formas compuestas con sufijos o prefijos del término, como ocurre en idiomas como el alemán. Por ejemplo, si la base terminológica contiene Festplatte y speicher, memoQ señalará el término Festplattenspeicherplatz.

50% prefijo: es la opción que aparece activada de forma predeterminada. Permite ligeros cambios en el término, de forma que memoQ detectará proyectos si proyecto está en la base terminológica.

-Exacto: busca el término de la forma exacta en que aparece en la base terminológica. Siguiendo el ejemplo anterior, memoQ encontraría proyecto pero no proyectos.

-Personalizado: este valor es útil si usamos caracteres comodín al añadir términos a la base terminológica. La raya vertical (|) indica el comienzo de una parte variable de un término (es decir, esa parte puede o puede no aparecer), mientras que el asterisco (*) señala que cualquier conjunto de caracteres puede ir detrás el último carácter. Por ejemplo, el término gesto* de proyect* detectará tanto gestor de proyecto como gestoras de proyectos.

En la lista Distinguir mayúsculas de minúsculas podemos decidir si memoQ tendrá en cuenta las mayúsculas y minúsculas a la hora de detectar un texto. Además, la opción Permisiva es el valor activado de forma predeterminada, en el que se combina que memoQ distinga en el caso de las mayúsculas y no lo haga en el caso de las minúsculas. Por ejemplo, si tenemos el pronombre inglés it en un glosario, memoQ mostrará el término si aparece como it o It, pero no como IT porque corresponde a una abreviatura y podría dar lugar a errores de traducción.

Una vez explicadas estas opciones, pasaremos a la segunda ventana de la importación de términos, como muestra la siguiente captura de pantalla.

Ventana de importación de términos

Ahora tenemos que indicar en qué columnas están los términos de cada idioma bajando por la lista en Campos y marcado la casilla Importar como término y elegir el idioma que corresponda. Si queremos importar otros campos, usaremos las opciones Importar como definición o Importar como otro campo. Para omitir alguno de los campos, escogeremos la opción No importar. Además, si ocurre como en el ejemplo, en el que la primera fila son nombres de campos y no términos o información relativa a dichos términos, es recomendable marcar la casilla La primera fila contiene nombres de campo para que no se incluya esa fila al importar.

Gestión de bases terminológicas

Una vez tengamos nuestra base terminológica, podemos abrirla para borrar o añadir términos, eliminar duplicados y cambiar algunos valores. Para ello, seleccionaremos la base de entre la lista, haremos clic con el botón secundario y pulsaremos Editar en el menú desplegable, como se ve en la captura de pantalla.

Edición de una base terminológica

Entonces podremos echar un vistazo a la base terminológica de memoQ recién creada y hacer los cambios necesarios, tal y como veremos más adelante.

Lista de términos de una base terminológica

En la cinta de opciones veremos varias opciones que afectan al conjunto de la base de datos. Podemos añadir o eliminar términos, importarlos o exportarlos y cambiar algunas propiedades de la base terminológica.

Opciones de edición de una base terminológica

Si pulsamos en Mostrar duplicados, memoQ buscará términos duplicados. Cuando acabe el proceso, tendremos una nueva sección en la cinta de opciones, Duplicados, como se ve en la siguiente captura.

Gestión de términos duplicados

Si marcamos los términos duplicados, podemos usar estos botones para fusionarlos, eliminarlos u omitirlos, aunque primero hay que marcar una de las apariciones como maestra para que memoQ sepa con qué términos nos queremos quedar. Al pulsar Volver al modo normal de edición, volveremos a la lista de términos.

En la sección inferior de la ventana podremos ir cambiando detalles de cada par de términos, bien de uno en uno o seleccionando varios. Antes hemos explicado las opciones de la pestaña Coincidencia. En Uso podemos indicar si es un término prohibido y escribir una frase como ejemplo de uso. En Gramática podemos indicar qué clase de palabra es el término y en Definición veremos la definición si estaba entre los campos importados o podemos escribirla nosotros mismos.

Por último, en Datos de entrada es posible cambiar algunos campos relacionados con el término, mientras que Imagen permite importar una imagen del término para que se use como referencia.

Campos de los términos de una base terminológica

Cómo añadir términos a nuestra base mientras traducimos

Como es lógico, si vinculamos una base terminológica a un proyecto de memoQ, nos interesa ir añadiendo términos nueva a dicha base por cuestiones de coherencia terminológica (entre otras ventajas, memoQ nos alertará de posibles problemas de terminológica en el control de calidad utilizando la base como patrón). Si tenemos un nuevo término, basta con resaltarlo en el segmento de origen junto con su equivalente en la lengua de destino y pulsar Ctrl + E. Así se abrirá la ventana Crear entrada de base terminológica, como en la siguiente captura de pantalla. Si no queremos hacer ningún cambio, pulsamos el botón Aceptar y el término se añadirá a la base terminológica vinculada al proyecto.

Nuevos términos desde la ventana de traducción

Desde ese momento, y siempre que no estemos editando la base terminológica, memoQ señalará los términos resaltándolos en azul en el segmento de origen, como vemos en la siguiente imagen, y también mostrará el equivalente en el cuadro Resultados. (NOTA: En este punto conviene destacar que, si tenemos abierta la base terminológica en otra pestaña para su edición, memoQ no mostrará ningún término hasta que cerremos dicha pestaña). Para insertar uno de los resultados, la combinación de teclas es Ctrl + número de resultado (Ctrl + 2, por ejemplo).

Identificación de los términos de la base terminológica presentes en el segmento

A estas alturas de la entrada, ya habréis descubierto que no es tan complicado reutilizar nuestros glosarios en memoQ para nuestro propio beneficio. A cambio de invertir parte de nuestro tiempo, las ventajas que podemos obtener de cara al cliente y a nosotros mismos también son innegables. Y, si queréis saber cómo reaprovechar los glosarios en otra TAO como es SDL Trados Studio, no dudéis más y leed la siguiente entrada de Melodía de traducción.

La anterior entrada de Melodía de traducción servía de introducción a los filtros de archivos, los cuales son empleados por las herramientas TAO para extraer el contenido traducible en archivos de diferentes extensiones. En esta segunda parte veremos cómo crear nuevos filtros de archivos para traducir archivos de extensiones no habituales en dos de las TAO más utilizados, memoQ y SDL Trados Studio.

memoQ

Si trabajamos con memoQ, podemos acceder a los filtros pulsando en el botón Consola de recursos situado en la esquina superior izquierda de la ventana principal de memoQ. Después iremos a Configuraciones de filtro y haremos clic en Crear nuevo filtro en cadena. Elegiremos esta opción en este caso porque primero se importa el archivo como delimitado por expresiones regulares y luego se añaden las variables.

Creación de un nuevo filtro de archivo en cadena en memoQ

En la siguiente ventana tenemos la ventana de creación de nueva configuración de filtro en cadena, donde elegiremos los diferentes filtros siguiendo el orden en que se aplicarán.

Elección de los filtros encadenados

Ahora podremos «toquetear» el nuevo filtro si lo seleccionamos en la lista y hacemos clic en Editar, como en la siguiente captura.

Edición de un nuevo filtro de archivo

En esta ventana podemos configurar cada uno de los filtros que forman en filtro en cadena. El primer filtro que modificaremos será el filtro de texto regex (dicho de otro modo, texto traducible delimitado por expresiones regulares), y para ello podemos cargar el archivo de origen como referencia. Ahora toca añadir los patrones de apertura y de cierre, para lo que iremos a la tercera pestaña, Incluir/excluir.

Configuración de los filtros

En dicha pestaña tendremos que elegir Las reglas definen el contenido a importar. Así indicamos a memoQ que solo queremos importar el contenido que escribamos en el campo Regla (en este caso, .* equivale grosso modo a cualquier conjunto de cero o más caracteres, salvo el salto de línea) y que se encuentra entre el patrón de apertura y de cierre.

Patrones de delimitación del texto traducible

La pestaña Vista previa muestra en color verde el contenido que memoQ importaría si usáramos el filtro tal como está configurado en ese momento. Tan solo queda editar el segundo filtro, Regex Tagger, para añadir las variables que hemos mencionado anteriormente.

Vista previa

Aquí añadiremos las variables una a una (se aplicarán en orden descendente) y marcaremos la casilla Obligatorio, ya que son etiquetas que no deben desaparecer del archivo traducido.

Lista de variables

Si creamos un proyecto e importamos el archivo de origen de extensión JM4 con este filtro, enseguida veremos el resultado. Ya solamente nos queda traducir el archivo siguiendo nuestro proceso habitual. Además, desde la propia consola de recursos podemos exportar este nuevo filtro (con la extensión MQRES) para usarlo en otro ordenador o mandárselo a otro usuario que a su vez importe el archivo de configuración de vuelta en su versión de memoQ.

Archivo listo para traducción tras aplicar el nuevo filtro

Studio

Como lo prometido es deuda, ahora vamos a ver cómo crear este filtro en SDL Trados Studio. La versión 2017, que es la más reciente, incorpora una nueva función de vista previa muy cómoda que permite comprobar si el filtro que estamos creando se ajusta a nuestras expectativas según los cambios que vayamos añadiendo al filtro. Para empezar con el nuevo filtro, tenemos que ir al botón Archivo (situado en la esquina superior izquierda) > Opciones > Tipos de archivo > Nuevo, como vemos en la siguiente imagen. También es posible llegar a esta misma ventana cambiando la configuración de proyecto, pero de esta forma nos aseguramos de que el filtro estará disponible para cualquier futuro proyecto.

Tipos de archivo en Studio

De entre las posibles opciones, elegiremos Texto delimitado por expresiones regulares.

Tipos de nuevos filtros

En la siguiente ventana, tenemos que cambiar el nombre del tipo de archivo y la expresión de comodín por la extensión de archivo correspondiente (en este caso, JM4). De este modo, Studio utilizará este filtro de forma automática cada vez que importemos un archivo con extensión .JM4. Puede haber varios filtros para la misma extensión de archivo, pero Studio empleará en ese caso el primer filtro con la casilla de verificación marcada en orden descendente (es decir, el filtro que esté más arriba en la lista de tipos de archivo).

Propiedades del nuevo filtro

Una vez creado el filtro, lo veremos en la lista situada en la sección izquierda de la ventana. Si pulsamos la flecha situada al lado del nombre, se desplegarán las diferentes opciones que tendremos que ir cambiando.

El nuevo filtro en la lista de tipos de archivos

En la primera sección, Estructura del documento, borraremos el patrón que viene de forma predeterminada y añadiremos el apropiado, tal y como haríamos en memoQ. La siguiente captura muestra el resultado.

Patrones de delimitación del texto traducible

Si cargamos el archivo JM4 de origen en la vista previa, nos daremos cuenta de que vamos por el bueno camino, aunque todavía quedan por añadir las variables. Para ello, iremos a la sección Patrones de línea y añadiremos las mismas expresiones regulares que escribimos al final de la anterior entrada. Según las características del archivo de origen, puede que sea necesario cambiar algunas opciones, aunque en este ejemplo las dejaremos tal cual aparecen de forma predeterminada. Tras añadir las variables, un nuevo vistazo a la vista previa del archivo nos dirá que el filtro cumple su función (es decir, recoge todo el texto traducible y bloquea las variables y otras etiquetas). Tan solo queda guardar los cambios y ya tendremos a nuestra disposición este nuevo filtro para usarlo en futuros proyectos.

Vista previa

Por último, si queremos exportar este nuevo filtro, solo tendremos que ir a la lista de tipos de archivo, marcar el que corresponda y pulsar el botón Exportar configuración. De esta forma, obtendremos un archivo con la extensión sdlftsettings. Si queremos importar este filtro en otro ordenador, iremos a esta misma lista, haremos clic en el botón Importar configuración y escogeremos el botón Importar configuración.

Importación y exportación de filtros de archivos

Si habéis llegado al final de la entrada y no habéis huido despavoridos, me imagino que será porque tenéis interés en crear filtros de archivos. Como tantas otras cosas en esta vida, hay que crear varios filtros y usar las expresiones regulares a base de prueba y error pero, una vez le hayáis cogido el truco, os servirá para vuestros propios proyectos y también para ofrecer un servicio añadido a vuestros clientes, en especial para aquellos que no estén familiarizados con las herramientas TAO.

En ocasiones mis clientes reciben archivos «extraños» que las herramientas TAO no reconocen, pues su extensión no figura entre las más habituales, y entonces me piden que busque una solución TAOísta para poder traducir el contenido de dichos archivos. En algunos casos, hay que buscar el modo de convertirlos a un formato intermedio que sí sea compatible con estas herramientas. Sin embargo, la mayoría de las veces, con un poco de maña, podemos crear un filtro para ese tipo de archivos que faciliten que la TAO en cuestión extraiga el contenido traducible. En esta entrada y en la siguiente veremos cómo crear nuevos filtros en memoQ y SDL Trados Studio 2017 y la forma de exportarlos para compartirlos con otros colegas o para usarlos en otro ordenador que tenga instalada alguna herramienta TAO. Si preferís saltaros la parte introductoria y ver directamente cómo crear nuevos filtros de archivos en Studio y memoQ, podéis ir a la siguiente entrada.

El primer paso: reconocer si el archivo contiene texto solamente

Lo primero que hay que hacer al recibir uno de estos archivos «extraños», por tonto que parezca, es probar suerte e intentar abrirlo con un editor de textos, como Notepad++ o el propio Bloc de notas. Dado que muchos archivos con extensiones poco frecuentes se utilizan en programación, se pueden modificar de una forma más o menos sencilla con cualquier editor de textos. También es posible que el propio archivo sea en sí mismo un archivo comprimido (como ocurre con los paquetes de Studio o los archivos MQXLZ de memoQ, por poner un par de ejemplos) y que entonces no se pueda abrir directamente con un editor de textos. En este último caso, basta con cambiar la extensión a ZIP y probar con un extractor de archivos para averiguar si es un archivo comprimido y, en tal caso, extraer los archivos que contiene.

En el archivo de ejemplo que usaré en esta entrada, me he inventado la extensión JM4. A pesar de ello, si trato de abrirlo con Notepad++, veremos que se trata de un archivo de texto no demasiado diferente de algunos con los que quizás ya nos hayamos topado antes, como en la siguiente captura de pantalla. Si el archivo contiene texto en un idioma que no sea el inglés y vemos caracteres que no se leen bien, la mayoría de veces solventaremos el problema cambiando la codificación a UTF-8. En Notepad++ podemos hacerlo eligiendo la opción correspondiente en el menú Codificación.

Un extracto del archivo con extensión poco habitual

Análisis previo del archivo

Antes de pasar a crear el filtro para este tipo de archivos, conviene analizar la estructura del archivo de origen con el fin de saber cuál es el contenido traducible y cuál es el contenido propio de programación que hay que aislar para que no se sobrescriba por error durante la traducción. Así daremos con la lógica empleada para separar cada elemento del archivo y podremos aplicarla en la herramienta TAO a la hora de crear el filtro. Empezaremos con la cabecera del archivo, como se observa en la siguiente imagen.

Cabecera del archivo

La sección señalada en color amarillo son líneas que comienzan con la barra lateral derecha (/). Echando un vistazo al contenido, podemos deducir que son comentarios añadidos por el desarrollador pero que no forman parte del código propiamente dicho. Por esta razón, se añade la mencionada barra lateral al principio de cada línea (siguiendo un patrón similar al que se ve en otros archivos de programación) o, dicho en lenguaje más técnico, «se comentan» las líneas. Lo más habitual es que no haya que traducir estos comentarios, pero, en caso de duda, no nos cuesta nada consultarlo con el cliente, pues pueden contener información valiosa para desarrolladores que sea recomendable traducir también.

En naranja vemos un nuevo patrón que se repite al principio de las siguientes líneas, que no es otro que el código o ID con el que se identifica cada cadena de texto. Dicho código tiene que quedar igual en el archivo traducido, por lo que lo aislaremos cuando creemos el nuevo filtro de archivo. A la derecha de este código, separado por un espacio y delimitado por comillas, se encuentra el contenido traducible. Una vez lo hayamos identificado, conviene seguir analizando el archivo en busca de secciones u otros elementos que sean traducibles pero que se desvíen de ese patrón, o bien elementos no traducibles dentro de las cadenas de texto.

La siguiente captura muestra algunos elementos muy habituales en archivos de este tipo:

  • En amarillo, el símbolo et (&), que se añade delante de la tecla de acceso rápido. Podemos cambiarlo de sitio, pero siempre teniendo en cuenta que no puede usarse la misma letra para más de una tecla de acceso rápido dentro del mismo menú y que es mejor evitar las letras con tramos descendentes por debajo del renglón, como la ge y la pe, ya que el acceso rápido se muestra subrayando dicha letra.
  • En azul tenemos un tipo de variable con el que se separan elementos dentro de una misma cadena de texto, ya sea por limitaciones de espacio u otras razones. En este caso, vemos el salto de línea (\n) y la tabulación (\t). Cuando traduzcamos cadenas de texto que aparezcan en más de una línea, aparte de tener en cuenta el límite de caracteres por línea (en su caso), hay que evitar la separación de sintagmas en la medida de lo posible, pues puede provocar problemas de fluidez al leer el texto (lo mismo que ocurre en subtitulación).
  • Por último, los elementos señalados en naranja son variables, parámetros que no son fijos y que se establecen con datos aportados por el usuario del programa (en este caso, datos referentes a un disco, como el nombre del cantante y de la canción). Se ven a simple viste porque van precedidos de un delimitador, como el símbolo del porcentaje en este archivo. Al igual que las demás variables, tendremos que buscar un patrón para poder bloquearlas y que así el traductor o revisor no las elimine en un descuido.

Nuestras amigas las variables

Ahora que ya conocemos el archivo de origen, toca pensar en cómo le indicaremos a la herramienta TAO de turno qué partes debe pasar por alto y cuáles debe importar para que se puedan traducir. En archivos como XML y HTML y sus variantes resulta más sencillo porque el texto traducible casi siempre está delimitado por etiquetas. Sin embargo, en este caso, hay que decirle a la herramienta TAO que este archivo sigue un patrón para separar el contenido traducible del no traducible.

Llegados a este punto, las preguntas clave son «¿Qué patrón sigue este archivo?» y «¿Cómo añadir este patrón a la herramienta TAO?». Nuestras «queridas» expresiones regulares serán nuestras mejores aliadas a partir de ahora. Aunque lo veremos en la siguiente entrada con más detalle, memoQ y Studio permiten crear filtros usando expresiones regulares. Dicho en pocas palabras, tenemos que indicar qué va antes y después del contenido traducible (ergo, todo lo que esté entre medias serán las cadenas de texto).

Antes de pasar a hablar de las expresiones concretas para este caso, tengo que aclarar que no soy ni mucho menos un experto en el tema, así que no me sorprendería que alguno de vosotros emplearais expresiones más precisas o más «bonitas». Dicho esto, a continuación os dejo las expresiones regulares que usaré como patrones de apertura y de cierre (dicho de otra forma, lo que va antes y después de dicho contenido):

Apertura:

^#.+#\s{1,}”

Esta expresión, en lenguaje normal, equivale a: inicio de línea seguido de almohadilla, seguida a su vez por uno o más caracteres cualesquiera y una almohadilla. Después van uno o más espacios y comillas.

Cierre:

“$

En lenguaje normal sería: comillas seguidas del final de línea.

-Variables:

Si bien solo los patrones de apertura y cierre son obligatorios, hemos visto que este tipo de archivos contienen variables que hay que mantener tal cual. Por tanto, es una buena idea convertir esas variables en etiquetas para que el traductor o el revisor no las omita en un descuido.

\\[a-z] = busca cualquier letra minúscula precedida de una barra lateral. Como la barra lateral es un carácter comodín en expresiones regulares, hay que añadir otra antes para indicar que estamos buscando el carácter literal en vez del comodín.

%[a-z]*\d = símbolo de porcentaje seguido por uno o cero caracteres de la a a la zeta minúscula y por un dígito.

Una vez tenemos claras las expresiones regulares que hay que añadir al filtro, solo nos queda utilizar una herramienta TAO para crearlo, como veremos en la siguiente entrada.

A casi todos nos habrá pasado en algún proyecto que nuestro cliente nos manda una nueva versión de un archivo origen para que traduzcamos también las nuevas secciones del documento. Puede darse el caso de que estos cambios lleguen al principio o a la mitad del proyecto o una vez lo hayamos terminado y entregado. La primera situación es más «sencilla» de manejar, pues todavía no hemos creado los archivos de destino y tampoco hemos pasado el control de calidad o formateado los archivos, como sí sucede al final de un proyecto. Normalmente, si la nueva versión llega cuando el proyecto ya ha concluido y si no hay demasiadas diferencias entre versiones, una buena opción consiste en recurrir al control de cambios para añadir las traducciones nuevas a los archivos que ya habíamos entregado al cliente en su día.

Sin embargo, ya recibamos la nueva versión de los archivos al principio o en mitad del proyecto o una vez concluido, es conveniente que las nuevas traducciones estén en memoQ, de forma que nuestras memorias, corpus y glosarios estén siempre actualizados. Para tal fin, en memoQ contamos con la ayuda de la función XTranslate, la cual a veces pasa desapercibida entre los usuarios de esta herramienta TAO. Aunque ahora la analizaremos con más detalle, podemos adelantar que, gracias a este método, es posible importar nuevas versiones de archivos sin temor a perder lo que llevemos traducido.

Para empezar, en la siguiente captura de pantalla se puede ver un ejemplo de un archivo ya traducido (Santander_EN.docx). Si no lo hemos hecho todavía, tendremos que confirmar las traducciones y actualizar la memoria de traducción del proyecto (Ctrl + Intro) o la memoria maestra (Ctrl + Mayús. + U), ya que memoQ recurre a ella para pretraducir la nueva versión del archivo cuando lo importemos.

Ejemplo de archivo ya traducido

Supongamos ahora que el cliente ha mandado una nueva versión del archivo Santander_EN.docx con unos pocos cambios. Para importar ese nuevo archivo de origen, habrá que ir a la lista Documentos, marcar el archivo en cuestión, hacer clic con el botón derecho del ratón y elegir la opción Reimportar. Como se ve en la siguiente imagen, acto seguido aparecerá el cuadro de diálogo Reimportar documento, donde memoQ nos dará a elegir entre importar el archivo nuevo con el mismo nombre que la anterior versión y en la misma ruta (Sí) o bien otro archivo con un nombre diferente o situado en una carpeta distinta de la original (No).

Cómo reimportar un solo archivo en memoQ

Si queremos reimportar varios archivos a la vez, tendremos que elegir Importar con opciones y, siempre y cuando no hayamos cambiado la carpeta ni el nombre de origen, memoQ reimportará todos los archivos que correspondan, tal y como se ve en la siguiente imagen. En este caso, es muy recomendable crear una copia de seguridad de la versión anterior de los archivos de origen en otra carpeta, pues tendremos que sustituirlos por la versión actualizada para que funcione la opción de reimportar varios archivos de una sola vez.

Reimportación de varios archivos actualizados en memoQ

Si nos fijamos bien, nos daremos cuenta de que el número de versión ha cambiado. En este ejemplo, el archivo santander_EN_new.docx ahora es la versión 2.0 del archivo original Santander_EN.docx (la versión 1.0).

Cambio de versión tras reimportar un archivo en memoQ

Cuando abramos este nuevo archivo para modificarlo, observaremos que está vacío. ¡Que no cunda el pánico! Todavía estamos a mitad de camino. El siguiente paso es ir a la pestaña Documentos, luego al grupo Reimportación/Revisión y hacer clic en el botón X-Translate, como se aprecia en la siguiente captura de pantalla.

Ubicación de la función X-Translate

Aparecerá una ventana en la que podremos cambiar varias opciones según convenga:

Opciones de la función X-Translate

En Origen de traducciones elegiremos la versión en la que memoQ se basará para reutilizar las traducciones para la nueva versión del archivo. En este caso, es la versión 1.0, pero en otros proyectos en que hayamos importado o reimportado el archivo varias veces (nuevas versiones, correcciones, etc.) es posible que prefiramos usar las traducciones de otra versión.

Después pasaremos a Seleccionar escenario, donde tendremos que elegir una de las siguientes alternativas:

-Actualización a mitad de proyecto. Así se mantienen tanto el estado y los porcentajes de concordancia con la memoria de los segmentos recuperados como el nombre del traductor (aunque podremos cambiarlo más tarde). Es la opción lógica si nuestras traducciones no son finales o si van a pasar por otras manos (otro traductor, revisor, etc.).
-Nueva revisión de la traducción terminada. memoQ reutiliza traducciones ya aprobadas según lo que elijamos en Traducciones a usar de la última versión principal y añade la marca XLT a cada segmento. Además, se activará una lista de diferentes opciones donde escogeremos el nuevo estado de estos segmentos pretraducidos y decidiremos si queremos bloquear dichos segmentos.

Tras pulsar el botón Aceptar, solo quedará esperar a que memoQ termine el proceso y ya podremos abrir los archivos actualizados para ver los resultados. En este ejemplo me he decantado por la segunda opción. Según lo que comentábamos antes, se ha añadido la marca XLT a cada segmento pretraducido siguiendo este método, como he resaltado en amarillo en la siguiente captura de pantalla. Asimismo, he indicado a memoQ que bloqueara estos segmentos para poder identificarlos a simple vista.

Archivo de ejemplo actualizado tras usar la función X-Translate

Tras la pretraducción, podremos recurrir a los filtros o a las vistas, según el caso, para que aparezcan solamente los segmentos de origen nuevos o con algún cambio y así no nos perdamos entre tantos segmentos ya traducidos.

Como veréis, esta es una forma muy sencilla de lidiar con las actualizaciones de archivos de origen que permite que todo nuestro trabajo esté al día sin tener que preocuparnos demasiado. Por supuesto, siempre queda otra posibilidad, que no es otra que importar la nueva versión del archivo de origen con otro nombre y como un archivo nuevo y después pretraducirlo, pero con el inconveniente de que tendremos que eliminar las versiones anteriores de la lista de archivos con el fin de evitar confusiones.

Algunas veces, cuando creamos un proyecto, importamos los archivos de origen correspondientes y los analizamos para averiguar el número total de palabras, puede darse el caso de que haya un gran número de repeticiones. En estos casos, y en especial si el plazo de entrega aprieta, resulta recomendable «aislar» las repeticiones (solo la primera aparición del segmento) por un lado y los segmentos que no son repeticiones por el otro con el fin de ahorrarnos trabajo y tiempo. En una entrada antigua de Melodía de traducción hablábamos de lo que eran las vistas de memoQ y mostrábamos varios ejemplos prácticos que nos podían ser de ayuda en nuestro trabajo diario. Ahora volvemos a este tema para tratar una forma de gestionar proyectos de este tipo (con un gran porcentaje de segmentos repetidos) utilizando dicha herramienta TAO.

El proceso consiste, en pocas palabras, en obtener dos vistas, una que contenga solamente una aparición de cada segmento repetido y otra en la que figuren los demás segmentos (es decir, todo lo que no sean repeticiones). El primer paso es crear una vista con las repeticiones seleccionando los archivos en el panel Traducciones, haciendo luego clic con el botón secundario del ratón y pulsando en Crear vista, como en la siguiente captura de pantalla.

Crear vista en memoQ

En la ventana que aparecerá, daremos un nombre a la vista y marcaremos las casillas Extraer repeticiones y Sólo una ocurrencia de cada, como en la siguiente captura. Es importante tener en cuenta que solo necesitaremos una aparición de cada segmento, ya que, gracias a la propagación automática, nuestras traducciones serán copiadas en las otras instancias de estos segmentos a medida que los vayamos confirmando y enviando a la memoria de traducción del proyecto en cuestión, con el consiguiente ahorro de tiempo.

Vista para segmentos repetidos

Una vez hayamos creado la primera vista, tendremos que hacer lo propio para los segmentos que no son repeticiones, con la diferencia de que ahora marcaremos Sólo segmentos que y elegiremos la opción No es una repetición en el menú desplegable, como se aprecia en amarillo en la siguiente imagen.

Vista para los segmentos que no son repeticiones

Otro modo de crear esta segunda vista es haciendo clic en Opciones avanzadas. De ahí iremos a Filtros comunes y elegiremos (7) Segmentos que no son repeticiones, como se ve en amarillo en la captura de pantalla a continuación.

Segmentos que no son repeticiones en las opciones avanzadas

Ahora que ya tenemos las dos vistas, las podemos traducir como si fueran documentos normales o enviar a dos traductores si las exportamos como archivos MQXLIFF o MQXLZ (como vimos en la anterior entrada del blog) para que ambos trabajen en un archivo diferente al mismo tiempo, lo que es de gran ayuda cuando el plazo de entrega del proyecto es muy apurado. Encontraremos dichas vistas en la pestaña Vistas dentro del panel Traducciones.

Las dos vistas en el panel Traducciones

Como comentábamos antes, aunque solo estamos traduciendo una aparición de cada segmento repetido, si usamos Ctrl + Intro para confirmar cada segmento y no hemos desactivado la autopropagación, memoQ copiará la traducción en los demás segmentos repetidos de forma automática, lo que supone un gran aumento de tiempo, en especial en proyectos muy grandes con un número elevado de segmentos repetidos. Si hemos desactivado la propagación automática por alguna razón, es posible reactivarla en la pestaña Traducción > Configuración de traducción > Autopropagación, como vemos en la siguiente captura de pantalla.

 

Propagación automática en memoQ

Además, como las no repeticiones están en otra vista, una vez hayamos terminado la traducción de ambas y abramos los archivos principales, será el turno de comprobar que todo el contenido está traducido, por lo que podremos exportar archivos bilingües o de destino y enviar los segmentos traducidos a una memoria maestra, entre otras tareas. Así seremos capaces de manejar un proyecto de traducción con muchas repeticiones sin más quebraderos de cabeza de los necesarios.

Como suele ocurrir, cada maestrillo tiene su librillo, lo que significa que este no es el único método para lidiar con las repeticiones. ¿Vosotros tenéis algún método en especial? ¡Animaos a contarlo en un comentario!

Si sueles trabajar con memoQ y colaboras con otros colegas intercambiando archivos bilingües, es posible que alguna vez hayas intentado actualizar tu proyecto importando un archivo bilingüe con cambios (de revisión, por ejemplo) procedentes de un compañero, solo para encontrarte con que memoQ no solo no consigue actualizar el archivo en tu proyecto, sino que trata de importarlo como un archivo nuevo. ¿Alguna vez te ha pasado? Pues en esta entrada de Melodía de traducción descubriremos la causa más frecuente de este error y veremos cómo resolverlo de una forma rápida y segura.

Archivos bilingües de memoQ: MQXLIFF y MQXLZ

En primer lugar, conviene aclarar qué entendemos por «archivos bilingües» cuando trabajamos con memoQ. Esta herramienta utiliza un formato de archivo propio, el MQXLIFF, que realmente es una adaptación del estándar XLIFF creada por Kilgray con el fin de ajustarlo al contenido «ideal» que ellos consideran que debe tener un archivo bilingüe. Aunque no los encontraremos a simple vista (como sí ocurre con los SDLXLIFF de SDL Trados Studio en el Explorador de archivos de Windows), podemos obtener versiones en MQXLIFF de los archivos traducibles de un proyecto de memoQ, ya sea como copia de seguridad o bien para intercambiarlos con otro colega que utilice memoQ u otra herramienta TAO compatible con este formato, como las versiones más recientes de SDL Trados Studio. Para este fin, basta con seleccionar los archivos que queramos exportar, hacer clic con el botón secundario del ratón y elegir la opción Exportar > Exportar archivos bilingües, tal como vemos en la siguiente captura de pantalla.

Exportación de archivos bilingües en memoQ

Se abrirá entonces la ventana Asistente para la exportación de archivos bilingües, donde veremos que ya hay tres casillas de verificación marcadas de forma predeterminada en la sección memoQ XLIFF, como se ve en la siguiente imagen. A continuación, veremos las diferencias entre activar y desactivar estas casillas.

Asistente para la exportación de documentos bilingües.

Si no hacemos ningún cambio y seguimos con el asistente de exportación, obtendremos uno o varios archivos con extensión MQXLZ. No hay nada de qué preocuparse: un archivo MQXLZ, como bien se menciona en la tercera casilla, no es otra cosa que un tipo de archivo comprimido propio de memoQ (la pista la da la letra zeta en la extensión, pues viene de zipped, «comprimido» en inglés). De hecho, si le cambiamos la extensión de MQLZ a ZIP, podremos abrirlo con un extractor de archivos, como WinRAR o el clásico WinZip, y veremos que, junto a un archivo MQXLIFF como los ya mencionados, hay otro llamado skeleton.xml debido a que hemos dejado activada la primera casilla (Incluir estructura y vista previa).

La siguiente pregunta que os haréis será: «¿Qué es ese archivo». Por decirlo en pocas palabras, el archivo skeleton.xml contiene toda la información referente al formato del archivo de origen que importamos en el proyecto de memoQ. Gracias a ese archivo, memoQ puede recuperar dicha información para crear el archivo de destino en el mismo formato que el original. Por tanto, un usuario de memoQ, aunque no tenga el documento original, puede obtener el archivo de destino correspondiente (salvo, obviamente, que haya errores que impidan que memoQ lo cree). Conseguiremos el mismo resultado desmarcando la segunda y la tercera casilla, pero a cambio de que ya no tengamos un solo archivo por cada archivo de origen, sino dos (el MQXLIFF y el skeleton.xml correspondiente), lo que complica la gestión en proyectos formados por muchos archivos de origen.

El hecho de marcar la primera casilla puede suponer una ventaja si, por ejemplo, memoQ nos da error al intentar crear el archivo de destino y queremos hacer la prueba en otro ordenador o mandarle el archivo a otro usuario de memoQ con el fin de hallar la solución al problema. No obstante, es muy probable que las agencias de traducción u otros clientes que trabajen con memoQ nos manden un archivo MQXLIFF normal para evitar que seamos capaces de crear el archivo de destino, bien por razones de confidencialidad con su cliente o por otras causas. Este MQXLIFF se consigue desmarcando las tres casillas o simplemente haciendo clic en el botón [XLIFF sin formato para otras herramientas], memoQ creará un archivo MQXLIFF que podremos importar en otro ordenador o en una herramienta TAO compatible, pero nos será imposible crear el archivo de destino en el mismo formato de archivo que el original.

¿Archivo nuevo? ¡Si es una actualización!

Los problemas con los archivos MQXLIFF y MQXLZ tienen lugar cuando se intercambian con otros usuarios de memoQ. Como vemos en la siguiente captura de pantalla, memoQ, en vez de trabajar con nombres de archivos, les asigna un código alfanumérico o ID que los identifica forma unívoca, el cual aparece tras el atributo mq:id. Sin embargo, si otro usuario lo importa en su propio proyecto de memoQ o de otra herramienta TAO, en ocasiones dicho código cambia, lo que ocasiona que, al exportarlo y tratar de importarlo en el proyecto original, memoQ no lo reconozca.

El atributo mq:id permite identificar el ID del archivo.

Como vemos resaltado en amarillo en la siguiente captura de pantalla, memoQ, como fruto de esta confusión, detectará el archivo como nuevo en vez de como una actualización a la hora de importarlo en el proyecto.

memoQ intentará importar el archivo como nuevo.

Llegados a este punto, el proceso más lógico para enmendar este problema consiste en restaurar la ID antigua en el archivo MQXLIFF actualizado con el objetivo de que memoQ lo detecte como lo que realmente es, una actualización, en vez de como un archivo nuevo. Hay diferentes formas de hacerlo, pero os dejo con los pasos que sigo habitualmente con la ayuda de Beyond Compare, un programa que permite comparar versiones de archivos y fusionarlas en una sola y sincronizar carpetas, entre otras funciones.

  1. El primer paso consiste en crear una copia de seguridad del MQXLIFF actualizado (es decir, el que hemos recibido de otro profesional), por si acaso nos equivocamos durante el proceso.
  2. Suponiendo que ya tenemos Beyond Compare instalado, seleccionamos el archivo MQXLIFF antiguo, hacemos clic con el botón secundario y buscamos la opción Select Left File for Compare (Seleccionar archivo a la izquierda para comparación), la cual identificamos fácilmente gracias al icono de una flecha de color rojo.

    Beyond Compare en el menú contextual del Explorador de archivos.

    Si el proyecto consta de varios archivos o de varias carpetas, podemos ir más rápido haciendo clic con el botón secundario sobre la carpeta raíz en la opción Select Left Folder for Compare (Seleccionar carpeta a la izquierda para comparación).

  3. Repetimos la acción con el MQXLIFF que vamos a modificar, salvo que ahora veremos la opción Compare to “[nombre de archivo/carpeta]” para que sepamos que ya hemos elegido un elemento para comparar anteriormente.
  4. Según hayamos elegido comparar archivos o carpetas, se abrirán diferentes ventanas. En el caso de la siguiente captura, hemos comparado carpetas, por lo que nos aparecen la lista de archivos. Para comparar archivos con el mismo nombre, simplemente hay que hacer doble clic en uno de ellos y ya podremos acceder a la ventana en que se compara cada pareja de archivos.

    Comparación de carpetas en Beyond Compare.

  5. De forma predeterminada, Beyond Compare muestra todo el contenido de los archivos comparados pero, dado que a nosotros solamente nos interesa buscar la fila que tiene una ID diferente, pulsaremos el botón Diffs (Diferencias), resaltado en rojo en la captura de pantalla que figura debajo. La fila que buscamos está al principio del archivo, y podemos identificarla fácilmente por la etiqueta .

Solo hay que copiar la línea del archivo izquierdo al derecho.

6.Según aparece resaltado en la captura anterior, tan solo tenemos que hacer clic sobre la fila de la izquierda (es decir, del archivo MQXLIFF que creamos nosotros), después hacer clic con el botón secundario y pulsar en la opción Copy to Right (Copiar al archivo de la derecha) y guardar el archivo situado en la parte derecha (el actualizado que queremos importar en memoQ) pulsando Ctrl + S o haciendo clic sobre el icono del disquete situado en la parte superior derecha.

7. Ahora solo queda comprobar si este cambio ha dado sus frutos importando el archivo recién corregido en memoQ. Como vemos en la siguiente captura, ahora memoQ sí lo detecta como una actualización. Si todavía fallara el proceso, se puede reintentar abriendo nuestro proyecto, exportando como MQXLIFF de nuevo el archivo que da problemas y repitiendo los pasos anteriores.

Ahora memoQ sí detecta que el MQXLIFF es un archivo actualizado.

En el raro caso de que todo lo anterior fallara, siempre podemos importar el archivo como nuevo, seleccionarlo y enviar todos sus segmentos con el atajo de teclado Ctrl + Shift + U a una memoria vacía vinculada al proyecto como memoria maestra. Después usaremos dicha memoria para pretraducir el archivo que ya teníamos en nuestro proyecto, solventar los errores que pueda haber y exportarlo para obtener el archivo de destino en el mismo formato que el original.

Como habréis visto, una vez la hayamos puesto en práctica varias veces, la solución a este problema es relativamente sencilla y rápida, por lo que no hay que asustarse si memoQ no reconoce el archivo como una actualización en un primer momento. Sin embargo, en otras ocasiones puede que la solución no sea tan fácil. ¿Alguna vez habéis tenido un problema similar que os ha sacado de vuestras casillas y que no habéis sabido resolver? ¡Animaos y contad vuestra experiencia con un comentario!

Página siguiente »