¡Hola a todos!

Después de un larguísimo tiempo sin actualizar fundamentalmente debido a la pereza y a la falta de ideas, creo que ya iba siendo hora de ponerme a redactar una entrada nueva.

Como bien dice el título, voy a tratar de un formato de archivo que suele provocar problemas a los traductores, especialmente en cuanto al formato: el PDF. Ya sabréis que un documento PDF es ideal para textos candidatos a ser impresos, como pueden ser folletos, manuales de usuario, presupuestos, facturas, etc. Los inconvenientes surgen cuando intentamos traducirlos: al no tratarse de un documento editable, nuestra tendencia es intentar copiarlo en un procesador de textos, como Word. Si tenemos la versión Pro de Acrobat o el complemento Sun PDF Importer de OpenOffice o LibreOffice, podemos editar el texto, pero no traducirlo como haríamos con las herramientas típicas (con memoria de traducción, glosarios, etc.).

Dadas las dificultades de trabajar con este formato, lo conveniente cuando recibamos un encargo de traducción en PDF es intentar solicitar al cliente una copia en un formato de archivo editable o, si no es posible, recordarle que, si desea mantener el formato del original (en caso contrario, bastará con copiar y pegar el texto en un procesador de textos, si es que el documento no está protegido), se incluirá una cantidad en concepto de gastos de maquetación (una tarifa por hora sería lo más recomendable en este caso). De todas formas, si recibimos una copia editable de ese documento, debemos asegurarnos de que el formato no traerá problemas (por ejemplo, los documentos con tablas y más tablas suelen ser bastante complicados) si no queremos acabar después por la calle de la amargura.

Si no queda más opción que trabajar con un PDF, contamos con varias opciones a las que he recurrido según el momento. Sea cual fuere el método escogido, es seguro que tendremos que realizar una maquetación del documento final, cuya dificultad y duración dependerá fundamentalmente de la complejidad del formato del PDF de origen y de las herramientas que utilicemos para editarlo.

Antes de comenzar con las opciones, me gustaría señalar que las celdas en el documento PDF de destino de los tutoriales pueden estar un poco desalineadas, pero se debe a las prisas causadas por la limitación de los minutos de extensión del tutorial. Lógicamente, una maquetación profesional debe quedar perfecta, pero ese no es el objetivo de estos tutoriales.

1. CONVERTIR EL PDF

La primera opción consiste en recurrir a un conversor de documentos PDF a otros formatos, como DOC. Hay muchísimas alternativas, como PDFZilla, al que le cuesta, sin embargo, trabajar con documentos con formato más complejo, como tablas. En el vídeo de ejemplo se puede ver como transforma un documento de prueba consistente en una única tabla en un documento editable de texto plano. Dicho de otra forma, se pierde todo el formato, con lo que no evitaríamos tener que realizar una maquetación más adelante.

De entre todos los conversores que existen, el de más calidad que he probado es el Abby FineReader, del que podéis descargar una versión de prueba (funcional durante 15 días y que permite procesar hasta 50 páginas), la cual que me ha salvado alguna vez la vida con relación a la digitalización de documentos gracias al increíble OCR que incluye. En el caso del PDF de ejemplo, lo convierte a Word a la perfección, de forma que podemos trabajar con Trados, Wordfast o, si lo abrimos con OpenOffice o LibreOffice, con Anaphraseus. Una vez hayamos acabado, podemos convertirlo a PDF con el propio Abby FineReader o mediante la opción de guardar como PDF en OpenOffice, LibreOffice, Word 2007 (mediante este complemento) o Word 2010 (incluido en la propia aplicación).

Siguiendo este último paso, nos aseguramos de poder trabajar con un documento editable, que podemos modificar, por ejemplo, para cambiar el tamaño de las filas y columnas de la tabla para que quepa el texto. Luego basta con guardarlo a PDF para terminar nuestra tarea.

2. TRABAJAR CON TRADOS STUDIO

La forma de traducir archivos PDF integrada en Trados Studio me sorprendió muy gratamente en su día, y más con los PDF de gran tamaño o de formato complejo. Para que os hagáis una idea, probé a importar un PDF de varios megas de tamaño y de unas 80 páginas, de las que el 80 % aproximadamente eran tablas. También exporté el documento de origen a Word y me quedé asombrado con la calidad de la exportación: las tablas se mantenían en su sitio y solamente se apreciaban errores menores el formato, subsanables fácilmente si se tiene un poco de maña.

Tenemos dos modos de proceder con Trados Studio en el caso de documentos PDF:

  1. Importar el documento PDF (que Studio convierte a una variante del formato XLIFF propio de SDL, el SDL XLIFF) y, a continuación, traducirlo directamente en este programa (existe incluso la opción de una vista previa del documento final). Una vez hayamos acabado, basta con ir al menú Archivo > Guardar destino como y seleccionar la opción Microsoft Word. Después abrimos el documento en Word, realizamos los retoques necesarios y lo guardamos como PDF mediante alguna de las opciones descritas en la anterior opción.
  2. Abrir el PDF con Studio y, a continuación, ir al menú Archivo > Guardar origen y elegir el formato que queramos como, por ejemplo, el propio DOC. Cuando obtengamos el archivo de origen, podemos traducirlo utilizando alguna de las opciones mencionadas anteriormente, para luego realizar los retoques de maquetación que sean precisos y guardarlo como PDF siguiendo alguna de las opciones descritas antes.

Como veis, no es nada complicado trabajar con este programa. Es una verdadera lástima que, en mi opinión, el precio de una licencia sea prohibitivo. Si se redujera este coste, estoy seguro de que sería un programa con mayor tirón, porque su calidad es, a mi modo de ver, lo mejor de SDL que yo conozco.

3.INFIX+ TAGEDITOR/SWORDFISH

Hasta hace no demasiado tiempo, desconocía el programa Infix PDF Editor, que descubría de casualidad en un retuiteo de Pablo Muñoz, el autor del más que recomendable blog Algo más que traducir. Como me gusta mucho trastear y descubrir programas nuevos, lo descargué, lo instalé y lo eché un vistazo. Para mi sorpresa (agradable, todo hay que decirlo), me di cuenta de que, pese a su nombre, este programa es más que un editor de PDF, ya que la versión Professional permite exportar el texto de un PDF como archivo XML, que podemos traducir en algunas herramientas de traducción asistida, como Tag Editor, Deja Vu X o Swordfish II, un programa del que hablaré en futuras entradas.

Para empezar, tenemos que abrir el Infix PDF Editor. Si tenemos la opción de prueba, como en mi caso, nos saldrá una ventana en la que se nos pregunta cómo queremos trabajar con Infix. Seleccionamos Professional Mode (Modo profesional) y se abrirá la interfaz principal del programa. A continuación, abrimos el PDF yendo al menú File (Archivo) y eligiendo la opción Open (Abrir). Buscamos el archivo y pulsamos Abrir.

Una vez abierto, pasamos a exportar el texto como XML, para lo cual vamos al menú Document > Translate > Export XML… (Documento > Traducir > Exportar XML) o pulsamos el atajo Ctrl + Alt + E. Elegimos una ruta y nombre del archivo y pulsamos Aceptar. A partir de ahí, podemos elegir el programa con el que traducirlo. Como dice el título, he recurrido a Tag Editor y a Swordifsh II.

1. En el caso de TagEditor, abrimos el programa y le indicamos el XML que queremos traducir, bien mediante la opción del menú o arrastrando y soltando el XML en la ventana de TagEditor. A continuación, si es la primera vez que abrimos un XML creado en Infix, TagEditor nos indicará que no ha encontrado el archivo de configuración de etiquetas (un archivo de extensión .ini), que es el que le permite a TagEditor, grosso modo, identificar las etiquetas y bloquearlas para que no las traduzcamos o borremos por error, lo que afectaría al texto final. Elegimos la opción Abrir… y lo buscamos en la carpeta de instalación de Infix, similar a “C:\Program Files\Iceni\Infix4\Translation support\Trados\trados.ini”. Cuando pulsemos Aceptar, veremos la versión bilingüe del XML, lista para traducir con TagEditor.

Después de realizar la tarea de traducción y de revisión, tenemos que crear el archivo XML de destino. Para ello, vamos a Abrir > Guardar destino como… o pulsamos Mayús. + F12. Elegimos un nombre y ruta donde guardarlo y pulsamos Aceptar.

Para terminar, abrimos Infix de nuevo y nos dirigimos al menú Document > Translate > Import XML… (Documento > Traducir > Importar XML) o pulsamos el atajo Ctrl + Alt + I. Si hemos cerrado el programa antes, Infix nos dirá que no puede importar el XML porque no lo ha exportado primero. Basta con que lo exportemos siguiendo las indicaciones anteriores y, acto seguido, importarlo de manera normal. Entonces Infix sustituirá el texto original por el de destino, con la opción de sustituir texto donde falte, y podremos ver el aspecto del PDF de destino. En caso de que tengamos que retocar alguna parte del texto, Infix nos dejará modificar el archivo con total libertad.

Puede ocurrir que Infix nos llame la atención acerca de que la fuente del texto no admite caracteres españoles, como las letras con tilde o la eñe. En ese caso, tenemos que señalarle al cliente este problema y, en su caso, sustituir la fuente problemática por otra. En el PDF de ejemplo, para poder trabajar más fácilmente con los cuadros de texto, se hace clic con el botón secundario del ratón cuando se esté editando un cuadro de texto y, en la lista desplegable que aparece, se selecciona Text Box Data Fields (Campos de datos de cuadros de texto) y, a continuación, cambiamos el valor de Move Objects Below (Desplazar objetos hacia abajo) de False (Falso) a True (Verdadero).

Para finalizar, guardamos el archivo como PDF pulsando Ctrl + S o bien en el menú File > Save (Archivo > Guardar). Si hay algún problema, como texto que no se ve en una tabla debido al tamaño de la celda, el programa nos lo indica. Aquí encontramos una de las limitaciones de la versión gratuita de este programa: si guardamos el destino como PDF, Infix añadirá una marca de agua, lo que queda cutre y poco profesional si pretendemos enviarle el documento a un cliente. No obstante, Infix nos da la posibilidad de pagar para que podamos guardar tres documentos sin marca de agua por un precio de 22 €, lo que no es un disparate si nos van a pagar una buena cantidad por la traducción. Otra posibilidad consiste en comprar una versión completa del programa, que vale 114 €, que, en mi opinión, se amortizan pronto si trabajamos con una gran cantidad de archivos PDF.

Debajo añado el enlace del tutorial en vídeo de Youtube:

2. En el caso de querer traducir el archivo con Swordfish II, lo exportaremos en Infix siguiendo las indicaciones anteriores. A continuación, tenemos que convertir el XML en un archivo XLIFF, que es con el que trabaja Swordfish. Abrimos el programa y vamos al menú File > Convert Files to XLIFF Format (Archivo > Convertir archivos a formato XLIFF). Pulsamos el botón Add files (Añadir archivos), buscamos el XML y señalamos los idiomas de origen y destino en el siguiente paso. Si tenemos probar para convertir el archivo, cambiamos el tipo de archivo en File Type y escogemos Generic XML (XML genérico). Procedemos con la traducción como con cualquier otra herramienta TAO y, para obtener el archivo XML de destino, vamos a File > Convert XLIFF Files to Original Format (Archivo > Convertir archivos XLIFF  al formato de origen), seleccionamos la ruta y el nombre con el que queremos guardar el archivo y pulsamos el botón Convert XLIFF File to Original Format. Para terminar, abrimos Infix e importamos el XML igual que con Tag Editor.

A continuación os dejo el tutorial en vídeo de Youtube:

Como veréis, el PDF es un formato que suele ocasionar problemas a la hora de traducir, pero, con unas buenas herramientas y alternativas, podemos evitarnos muchos quebraderos de cabeza y facilitarnos el trabajo. Y, por vuestra parte, ¿conocéis alguna otra forma de trabajar con documentos en PDF?

A continuación os dejo los dos tutoriales de la entrada subido a Screncast.com, con una mejor calidad.

INFIX + SWORDFISH II

INFIX + TAGEDITOR