Continuamos en este nuevo artículo con la serie dedicada al conjunto de herramientas Okapi Framework; en este caso, nos centraremos en Rainbow, la interfaz gráfica que nos facilita el acceso a las utilidades, y hablaremos sobre la potencia que ofrece gracias a las combinaciones de instrucciones incluidas.
1. Introducción
En el artículo del número 16 de La Linterna del Traductor, titulado «Okapi Tools: la navaja suiza del traductor», hicimos una presentación general a las herramientas de Okapi y presentamos a fondo Tikal. Este componente es, probablemente, el elemento principal de este conjunto de herramientas y proporciona un sinfín de funcionalidades de gran utilidad en la traducción-localización. Si bien Tikal carece de interfaz gráfica y tiene que utilizarse bajo línea de comandos, Rainbow se encarga de aportar esta interfaz visual, ágil y fácil de utilizar, para acceder cómodamente a las principales funcionalidades de Tikal.
En este breve artículo presentaremos la filosofía general de uso de la interfaz y conoceremos los pipelines, una característica que hace que Rainbow sea una herramienta con funcionalidades virtualmente infinitas.
2. Instalación de Rainbow
Como ya comentamos en el anterior artículo, Rainbow se distribuye conjuntamente con el resto de las herramientas de Okapi y se puede descargar desde su página web, en la sección Download the distribution for your platform. Las herramientas de Okapi están disponibles para Windows, Linux y Mac. Una vez descargado y descomprimido el archivo, ya disponemos de todas las herramientas, y para ejecutar Rainbow simplemente tendremos que hacer doble clic sobre el icono de la aplicación.
3. La interfaz gráfica
Para poder utilizar Rainbow es necesario entender las diferentes partes de su interfaz gráfica (figura 1). En la parte superior se encuentra la barra de menús, donde disponemos de todas las funcionalidades. Debajo de ella, la barra de iconos incluye las funcionalidades más importantes. En la línea que empieza por Root1 podremos indicar el directorio base de donde se tomarán los archivos de Input List 1, de manera que la selección de archivos sea más rápida (de igual manera, si seleccionamos Input List 2 aparecerá Root 2 y exactamente lo mismo para la 3).
Dependiendo del proceso que ejecutemos con Rainbow, necesitaremos uno o más conjuntos de archivos. Estos conjuntos se seleccionan en las Input List correspondientes, haciendo clic en el icono + o haciendo clic con el botón derecho del ratón y seleccionando la opción Add documents. En la pestaña Language and Encodings podremos indicar la lengua y la codificación de caracteres de nuestros archivos. Algunos de los procesos que ejecutemos necesitarán también algunas de las configuraciones que se encuentran en la pestaña Other Settings.
4. Los pipelines
Un concepto muy importante en Rainbow es el de pipeline, un conjunto de instrucciones o procesos que se ejecutan de forma secuencial y en los que la salida de uno de los procesos es la entrada del siguiente.
Rainbow proporciona una serie de pipelines predefinidos a los que se accede mediante el menú Utilities. Estos pipelines predefinidos ofrecen funcionalidades que van desde la creación de proyectos de traducción en diferentes formatos hasta funcionalidades de control de calidad, pasando por la extracción automática de terminología. Al seleccionar uno cualquiera, se abre una pantalla donde aparecen todos los pasos del pipeline, a menudo organizados en diversas pestañas. Cada una de estas pantallas cuenta, además, con un botón Help que enlaza con la ayuda detallada, con las instrucciones necesarias y los parámetros requeridos. En la figura 2 podemos observar, por ejemplo, la pantalla de configuración de la utilidad de creación de proyectos de traducción.
Dejamos al lector interesado la exploración de todos estos pipelines predefinidos que ofrece Rainbow.
La gran potencia de Rainbow, sin embargo, reside en la posibilidad de crear nuevos pipelines utilizando tanto cualquier funcionalidad propia de Tikal-Rainbow como cualquier script o programa externo. De esta manera, las posibilidades de Rainbow pasan a ser prácticamente ilimitadas.
Para crear un pipeline vamos al menú Utilities y escogemos la opción Edit/Execute pipeline. Aparecerá una pantalla como la que se muestra en la figura 3. En esta pantalla podemos ir añadiendo pasos con el botón Add step, que mostrará una pantalla con todos los procesos disponibles en Rainbow. Si deseamos utilizar un script o programa externo, podemos utilizar la opción External Command.
Una vez que hemos creado un nuevo pipeline, lo podremos ejecutar desde la misma pantalla utilizando el botón Execute. Podemos guardar nuestros pipelines mediante el botón Save o Save as y volver a utilizarlos en una nueva sesión con el botón Load.
Algunos ejemplos de pipelines útiles que podemos crear son: traducción —con un sistema de traducción automática disponible en Rainbow (por ejemplo Google Translate)— de un documento en un formato compatible con Rainbow, conversión de todos los archivos de un directorio de PDF a texto utilizando una aplicación externa (como puede ser pdftotext). Este segundo ejemplo es sencillo y extrapolable a la aplicación de cualquier script externo sobre un conjunto de archivos.
5. Conclusiones
En este breve artículo hemos presentado Rainbow, el componente de las herramientas de Okapi que proporciona la interfaz gráfica con la que acceder a todas las funcionalidades de Tikal. Además, permite la creación de pipelines que, gracias a la combinación de las funcionalidades de Rainbow-Tikal con programas o scripts externos, consiguen ampliar las posibilidades de esta herramienta de manera virtualmente infinita.
Antoni Oliver
Antoni Oliver es profesor agregado de los Estudios de Artes y Humanidades de la Universitat Oberta de Catalunya (UOC, Barcelona, España) y director del Máster en Traducción y Tecnologías. De formación es ingeniero técnico de Telecomunicaciones (UPC), licenciado en Filología Eslava (UB), máster universitario en Software Libre (UOC) y doctor en Lingüística (UB). Sus áreas de docencia e investigación principales son el procesamiento del lenguaje natural, la traducción automática y las herramientas de ayuda a la traducción. Ha participado en diversos proyectos de investigación y transferencia de tecnología y actualmente es el investigador principal del proyecto Traducción automática neuronal para las lenguas románicas de la península ibérica (TAN-IBE). Ha desarrollado numerosas herramientas libres relacionadas con la traducción automática (entre las que destaca el proyecto MTUOC) y la extracción automática de terminología (recogidas en el proyecto TBXTools). Es autor de numerosos artículos en revistas científicas y del libro Herramientas tecnológicas para traductores.