10 septiembre 2024
Inicio > Número 23 > Objetivo 4.0: filólogos, correctores y asesores de español en inteligencia artificial

Objetivo 4.0: filólogos, correctores y asesores de español en inteligencia artificial

Érase una vez un mundo espejo con raíces inteligentes hundidas en el nuestro traducido a verbo. Y el Verbo se hizo carne y habitó entre nosotros. Las máquinas querían conversar con el humano y los filólogos y los asesores lingüísticos, sin ser el germen del ardid ni pretenderlo, se convirtieron en maestros impulsores del nuevo universo.

Así contaremos nuestra historia, como demiurgos que, sin querer, nos convertimos en cohacedores de la 4.ª revolución industrial.

La inteligencia artificial (IA), señalada hoy como epicentro de la próxima gran transformación social, se define como aquella tecnología que imita las capacidades humanas de comprensión, razonamiento y resolución de problemas. Seamos o no conscientes, hace tiempo que pasó de los laboratorios de computación a ser agente, guía y consejera con un importante impacto social. Nos escolta cada vez con más presencia, y su rápido desarrollo en los últimos años augura avances sorprendentes en un futuro muy próximo.

Las tecnologías de procesamiento de lenguaje natural (PLN) se erigen como una de las áreas de aplicación más importantes en el desarrollo de estos sistemas inteligentes.

Paralelamente, las tecnologías de procesamiento de lenguaje natural (PLN) se erigen como una de las áreas de aplicación más importantes en el desarrollo de estos sistemas inteligentes. A través de nuestras realizaciones lingüísticas, la máquina «nos entiende», analiza nuestros sentimientos y emociones, sabe interpretar y predecir nuestros gustos, comportamientos y necesidades, nos asiste de manera sorprendente en tareas de redacción y traducción e, incluso, nos ayuda a través de la conversación por voz para dejar nuestras manos libres. Pero nada de esto es magia. Que la interacción humano-máquina sea posible a través de la decodificación del lenguaje y que en la dirección máquina-humano sea, además, formalmente correcta y adecuada depende en gran medida del trabajo de los filólogos, revisores y asesores lingüísticos que trabajan en equipos multidisciplinares con ingenieros, matemáticos, lingüistas computacionales, sociólogos, psicólogos o científicos de datos, entre otros perfiles profesionales.

El presente nos reclama. ¿Eres consciente de tu potencial impacto social?

Después de ubicarte en el momento histórico en el que nos encontramos, ¿vislumbras cuál puede ser el impacto de tu profesión aplicado al PLN?

La inteligencia artificial mira hacia las Humanidades. Tus conocimientos y destrezas son objetivo in crescendo en el mercado tecnológico y el valor de tu trabajo deja de contar por millar de matrices para aproximarse a infinito en optimización y control de calidad de procesos automáticos.

El PLN está presente en los sectores socialmente preferentes y, por tanto, debe fomentarse la creación de recursos en español.

No en vano, la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN), en su documento de 2020 sobre estrategia para la IA centrada en las tecnologías del lenguaje en España, muestra enormes oportunidades de progreso. Asegura que el PLN está presente en los sectores socialmente preferentes y que, por tanto, debe fomentarse la creación de recursos en español.

Diagrama que lleva por título “Escenario de las tecnologías IA más relevantes para su implementación en las diferentes áreas estratégicas priorizadas”.
Estrategia de Procesamiento del Lenguaje Natural 2020 (SEPLN).

La apuesta en nuestro idioma es lógica porque, a pesar de ser la segunda lengua de comunicación en el mundo, aún estamos lejos de obtener los resultados que ya se consiguen en inglés o chino, idiomas fuertemente atendidos desde la investigación y sus gobiernos.

La tecnología en español se ve muchas veces obligada a entrenar IA pivotando en la transferencia de resultados sobre corpus en inglés, lo que conduce a salidas gramaticales potencialmente peligrosas desde el momento en que su aparente naturalidad puede esconder desajustes sintáctico-estructurales, semánticos o culturales. No es lo deseable, por lo que la creación de materiales nativos libres y escalables (en distintas variedades de español) se convierte en el primer objetivo.

Por otra parte, el día a día de muchas pequeñas y medianas empresas del sector pasa por trabajar con corpus privados y confidenciales de clientes que, aun suponiendo grandes cantidades de texto, no suelen estar etiquetados y difícilmente alcanzan el volumen suficiente para que los procesos algorítmicos avanzados o relacionales sean fiables. Esto hace que el aprendizaje automático (machine learning) y otros procedimientos avanzados de aprendizaje profundo (deep learning) queden relegados, en muchas ocasiones, a herramientas asistenciales. Se mantienen, por tanto, los trabajos de etiquetado y evaluación manual y el tratamiento Small Data (precursor del Big Data) con técnicas de analítica de texto como tareas fuertemente dependientes del trabajo de los lingüistas y revisores humanos.

Representación gráfica del análisis morfosintáctico de una frase sencilla.
Analizador morfosintáctico de MeaningCloud.

En resumidas cuentas, el PLN en español necesita aún mucho trabajo de base orientado hacia una enormidad de finalidades y tareas. Pocas veces antes se ha abierto un espectro tan grande de posibilidades para los expertos en Humanidades, en general, y los especialistas en lengua española, en particular.

Lo que no sabes que sabes hacer en IA

«Acercaos a mí todos los que estáis rendidos y abrumados, que yo os daré respiro», dice san Mateo. «Cargad con mi yugo y aprended de mí», pues ese yugo «es llevadero» y, solo sintiendo el peso a nuestras espaldas, sabremos que también nosotros estamos preparados.

Mi querido filólogo/corrector/revisor, carga tu mochila con impulso y algo de hueco para unas nociones básicas de PLN y emprende el viaje.

Muchos de los conocimientos y destrezas más importantes para convertirte en agente del cambio ya los tienes. Seguir asumiendo que la tecnología de chatbots laístas, correctores automáticos deficientes o aprendizajes neuronales sesgados son cosa de otros es un error y, lo que es más grave, una irresponsabilidad. La historia nos brinda una oportunidad de colaboración que tenemos la obligación profesional y social de afrontar.

Cada vez más empresas buscan incorporar filólogos, traductores y revisores, sin que importe en exceso su especialización en computación.

Si has sido observador, en la introducción he distinguido entre perfiles humanísticos y los llamados «lingüistas computacionales». Y es que cada vez más empresas buscan incorporar filólogos, traductores y revisores que colaboren en proyectos de procesamiento de lenguaje natural, sin que importe en exceso su especialización en computación.

Los cursos formativos en fundamentos y técnicas de lingüística computacional suelen ser muy técnicos y poco accesibles para filólogos o perfiles más antropológicos. A ellos acceden candidatos tanto desde el mundo de las Humanidades como desde especializaciones informáticas, de ingeniería o matemáticas. El problema llega cuando son estos últimos quienes terminan desempeñando el rol de lingüista en las tecnológicas, a pesar de su escasa o nula formación filológica.

Hoy la noticia es que el mercado es consciente de este inconveniente y hay un interés creciente por incorporar de facto al bloque humanista, no solo por su especialización lingüística, sino también por sus capacidades innatas para tareas de revisión, evaluación y validación de sistemas inteligentes.

Julio Villena Román, ingeniero y director de Innovación de MeaningCloud (una de las empresas españolas con más recorrido en el sector), explica en su artículo: «NLP technologies: state of the art, trends and challenges» por qué, por lo general, no son suficientes las técnicas estadísticas y de aprendizaje profundo para alcanzar la excelencia en la precisión y cómo, por tanto, la labor humana de evaluación y posfiltrado llevada a cabo por lingüistas especializados es fundamental para conseguir optimizar las salidas.

Alude Villena a que el trabajo no termina cuando se despliega un modelo lingüístico en producción, sino que hay que mantenerlo, comprobando periódicamente la validez del resultado que genera (lo que requiere un gran esfuerzo de revisión humana). Suele ocurrir que en cada nuevo informe de evaluación aparezcan estructuras lingüístico-semánticas que no se detectaron durante el desarrollo inicial (ya que es imposible tener una colección de entrenamiento que cubra todas las realizaciones lingüísticas potenciales) y, en consecuencia, estos modelos deben actualizarse constantemente.

Estas tareas de mantenimiento son una cuestión clave en cualquier proyecto de inteligencia artificial responsable y muy importantes para atender de manera apropiada al descubrimiento y la compensación de lo que se conoce como «sesgos» (o realizaciones menos frecuentes) que escapan a los entrenamientos generalistas iniciales. Así describía esta función la correctora y científica de datos Judit de Diego en su artículo: «¿Leen los androides poemas automáticos? El corrector y la máquina: ¿un nuevo perfil multidisciplinar?», en el número 20 de esta misma revista:

«Precisamente, uno de los trabajos de los lingüistas computacionales es entrenar a la máquina con el lenguaje normativo y, a la vez, con sesgos lingüísticos para que esta entienda cada vez a más hablantes y la interacción sea cada vez menos rígida.»

¿Intuyes todo el trabajo que potencialmente debería caer en nuestras manos? No dejes de escuchar a Elena Álvarez en su conferencia de 2014: «Todo lo que un filólogo no sabe que sabe hacer» en la Facultad de Filosofía y Letras de Zaragoza o, más recientemente, a Carmen Torrijos en TEDx Málaga 2021: «¿Por qué programas, si tú eras de letras?»; entenderás lo que uno siente y descubre que puede aportar cuando se atreve con esta aventura.

Para cada tipo de IA o tarea lingüística de PLN hay un perfil humanista apropiado.

Pero vayamos más allá. No solo ocurre que, ante la escasez de lingüistas en PLN, muchos ingenieros e informáticos han venido ocupando su lugar. Con idéntica frecuencia, lingüistas computacionales con base filológica, pero sin conocimientos especializados en corrección o traducción, hacen las veces de asesores para el aseguramiento del correcto uso del idioma en asistentes de redacción, traducción o conversación. Esto tampoco debería ser así. Para cada tipo de IA o tarea lingüística de PLN hay un perfil humanista apropiado.

Cuidado, no confundas «lingüista computacional» con «filólogo» o «corrector»

  1. No todo lingüista computacional es filólogo.
  2. No todo filólogo es corrector.
  3. No todo lingüista computacional es corrector.

Pongamos un ejemplo: ¿debería un lingüista no especializado en corrección ortotipográfica y de estilo ser responsable de calidad de aplicaciones que asistan en la redacción?

En 2015, a colación del X Seminario Internacional de Lengua y Periodismo, organizado por Fundéu BBVA y la Fundación San Millán de la Cogolla, escribíamos en el blog de Stilus que el futuro del corrector humano sería estar detrás de los softwares contextuales y semánticos. Nos inspirábamos en la intervención del experto ortotipógrafo Javier Bezos en dicho seminario, cuando presagiaba uno de los destinos de la profesión:

A lo mejor el corrector ya pierde parte de su función de coger el texto e ir revisándolo para marcar lo que está bien o lo que está mal. A lo mejor la futura función del corrector es estar detrás de estos sistemas que te permiten la corrección.

Paralelamente, el año anterior en el mismo foro, explicaba yo por qué solo los correctores humanos expertos podrían dotar de valor diferencial a una aplicación como Stilus, basada, entre otros procesos, en conocimientos especializados como los que subyacen en las siguientes capturas de funcionamiento:

Captura de pantalla que muestra el origen y las propuestas de traducción de varias voces extranjeras.
Distinción entre voces extranjeras, adaptaciones incorrectas y extranjerismos (Stilus).
Captura de pantalla que muestra varias propuestas para evitar la locución “en base a”.
Codificación de base léxica especializada (Stilus).
Captura de pantalla con varias propuestas de corrección de un texto breve.
Informe de revisión ortotipográfica, gramatical y de estilo (Stilus).

¡RETO!

En este texto hay diez errores, ¿qué tres le quedaron en el tintero a Stilus?

«El buen uso de la lengua, escudo del periodismo para defender la verdad».

Los licenciados en Filología o Lingüística dominan la ciencia descriptiva e inferencial de la gramática, la morfología, la semántica… de las lenguas, pero, si no se han procurado una formación normativa extra (en los planes universitarios, a lo sumo, se ofrece de forma optativa), suelen desconocer aspectos como la ortografía del uso de las mayúsculas, la combinatoria de signos de puntuación, las diferencias —y su distinto tratamiento— entre adaptaciones incorrectas, voces extranjeras y extranjerismos, etc.; además de verse en dificultades para sugerir recomendaciones de estilo con argumentaciones documentadas y coherentes. Se trata de conocimientos que requieren de una especialización y un entrenamiento más allá de la excelencia filológica.

¿No parece natural el salto que estos expertos en comunicación y lenguaje deberían dar hacia al desarrollo de chatbots y asistentes conversacionales?

Y si esto ha de ser así para desarrollar un corrector automático (o un traductor, caso espejo vs. esta otra disciplina), ¿no parece natural el salto que estos expertos en comunicación y lenguaje deberían dar hacia al desarrollo de chatbots y asistentes conversacionales? Si es la primera vez que te topas con el término: «diseñador de conversación», no lo ignores, se trata de una profesión con futuro (y mucho presente) a cuyos mandos estamos accediendo ya.

Las empresas que contratan este tipo de desarrollos esperan que se les garantice que su contenido se comunique de manera correcta, efectiva, clara y de forma que coincida con la voz y la personalidad de su marca o la variante del grupo interlocutor humano previsto. Para ello, los desarrolladores han de contar en sus equipos con candidatos de excelentes habilidades de redacción y comunicación (tanto verbales como escritas), por lo que los ingenieros y lingüistas computacionales no expertos en el área no suelen ser la mejor opción.

Pero más allá del valor de este tipo de perfiles para el aseguramiento del idioma de la máquina, es conveniente que colectivos como el de los correctores y revisores humanos ocupen su lugar en la IA para encargarse de otros muchos trabajos fundamentales de base. Algunas de las destrezas intrínsecas a su profesión les hacen especialmente eficientes en tareas esenciales del PLN como:

  • Detectar errores. Su ojo entrenado, riguroso y sistemático es excepcional para localizar todo tipo de irregularidades (no solo lingüísticas).
  • Perseguir la precisión. Les caracteriza su innata disposición, paciencia y gusto por arreglar faltas (también de funcionamiento).
  • Etiquetar corpus de entrenamiento. Su incansable y competente capacidad lectora los convierte en candidatos idóneos para mantener la actitud y la concentración en tareas de etiquetado.
  • Aplicar normas o criterios de evaluación. Poseen una gran capacidad de aprender y aplicar con coherencia y sistematicidad normas o criterios específicos de evaluación en función del proyecto.

A los humanistas hoy se les considera perfiles muy interesantes en las fases de control de calidad y optimización de sistemas inteligentes.

Este tipo de razones son las que avalan que a los humanistas hoy se les considere perfiles muy interesantes en las fases de control de calidad y optimización de sistemas inteligentes. El que muchos aún arrastren un vacío profesional o que todavía sean pocos los que se atrevan a ejercer en las filas 4.0 indica, entre otras cosas, que no se está atendiendo de forma pragmática su formación e integración en la economía del cambio.

Afrontar el desafío de la IA en español es una cuestión de país

Tanto el Plan de Impulso de las Tecnologías del Lenguaje de 2015 como la Estrategia de Procesamiento del Lenguaje Natural de 2020 vienen advirtiendo de que una de las principales amenazas del desarrollo de estas tecnologías en español es la escasez de expertos con distintos niveles de especialización. Es necesario afrontar acciones bien diseñadas para transformar la oferta educativa en lingüística computacional y procesamiento de lenguaje natural, y adaptarla de manera pragmática.

También redundaba en la preocupación Carme Artigas, secretaria de Estado de Digitalización e Inteligencia Artificial, quien, en el discurso inaugural para la presentación del «Informe Sociedad Digital en España 2020-2021: el año en que todo cambió», apuntaba que necesitamos prepararnos para cubrir las necesidades profesionales que en los próximos cincos años se prevén fundamentales para afrontar el desafío de la IA en español.

Pero si bien las Humanidades deben acercarse a la ingeniería, no solo cae del lado de las letras esta responsabilidad. Además de la necesidad de generar conciencia social sobre qué es la inteligencia artificial, cómo nos afecta y cuán importante es su seguimiento y control desde un punto de vista ético y humanista, los gobiernos también deben responder con estrategias políticas y educativas responsables para formar y promocionar estos perfiles mixtos de manera práctica y adecuadamente orientada.

En muchas ocasiones, a estos humanistas no se les exigen conocimientos avanzados de programación, pero tener nociones sobre aplicaciones de PLN y formación básica en el manejo de expresiones regulares o cualquier otro ejercicio de codificación llamará la atención de los empleadores y propiciará que los propios candidatos aterricen en las empresas de manera más cómoda y menos frustrante.

El objetivo es conseguir que el humanista pueda comunicarse con los ingenieros.

En el plano educativo, para que finalicen su formación con éxito y se sientan preparados para desempeñar las funciones que de ellos se esperan, deben reducirse a lo esencial los contenidos más técnicos y potenciar el entrenamiento de destrezas analíticas, abstractivas y de extrapolación de patrones lingüísticos sobre corpus en lenguaje natural. El objetivo es conseguir que el humanista pueda comunicarse con los ingenieros para asistirse bidireccionalmente y sea capaz de codificar sus conclusiones de la manera más autónoma posible en tareas de transferencia de conocimiento a la máquina.

Por otra parte, las tecnológicas que busquen incorporar a sus equipos filólogos, correctores, traductores, expertos en comunicación… también deben adaptarse. La creación de herramientas internas, plataformas de edición o pseudocódigos intuitivos permitirá que los expertos de Humanidades programen sin necesidad de saber lenguajes concretos de programación. Esto propiciará que el arranque de la colaboración sea más rápido y operativo desde el inicio.

Por último, es interesante que las empresas del sector consideren convenientemente las distintas especializaciones lingüísticas para según qué fases o tipos de proyecto. La aportación profesional de un filólogo no será la misma que la de un licenciado en Lingüística, un traductor o un experto en corrección o lenguaje inclusivo. Dependerá de la finalidad de los desarrollos, o la naturaleza de cada tarea, el que uno u otro perfil (o la combinación de varios) resulte verdaderamente eficaz.

Estamos ante una oportunidad histórica de modernizar nuestra sociedad y nuestra economía, rescatando el valor de las Humanidades. El propio Plan España Digital 2025 propone la cuestión como asunto de Estado, con muchos objetivos a corto plazo por cumplir. Pero conseguir ser constructores, y no meros consumidores de IA en español desarrollada por americanos, dependerá de saber afrontar el reto como país.

Cruzo los dedos por el don de esta oportunidad.

BIBLIOGRAFÍA

Álvarez, E. «Todo lo que un filólogo no sabe que sabe hacer». 23 de enero de 2014. [Vídeo en línea]. [Consulta: 25-07-2021].

De Diego, J. «¿Leen los androides poemas automáticos? El corrector y la máquina: ¿un nuevo perfil multidisciplinar?». La Linterna del Traductor [en línea], n.º 20 (abril de 2020). [Consulta: 25-07-2021].

Fundación Telefónica. «Foro SDIE 2021. Las Humanidades Digitales y el futuro del empleo». 3 de junio de 2021. [Vídeo en línea]. [Consulta: 25-07-2021].

Fundación Telefónica. Informe Sociedad Digital en España 2020-2021: el año en que todo cambió. Madrid: Penguin Random House, mayo de 2021. [Consulta: 25-07-2021].

Fundéu y Fundación San Millán de la Cogolla. «¿Sueñan los androides con noticias automáticas?». 28 de mayo de 2014. [Vídeo en línea]. [Consulta: 25-07-2021].

Fundéu y Fundación San Millán de la Cogolla. «Manuales y correctores, pero si hay que elegir me quedo con…». 14 de octubre de 2015. [Vídeo en línea]. [Consulta: 25-07-2021].

Gobierno de España. Plan de Impulso de las Tecnologías del Lenguaje [en línea]. [Consulta: 25-07-2021].

Gobierno de España. Plan España Digital 2025. Madrid, 23 de julio de 2020. [Consulta: 25-07-2021].

Llantada, C. «El raro perfil del filólogo bilingüe, experto en lenguaje natural y digital». El País (6 de agosto de 2018). [Consulta: 25-07-2021].

Montero, L. «Lecciones urgentes de español para la inteligencia artificial». ABC (24 de mayo de 2021). [Consulta: 25-07-2021].

Polo, C. «El futuro del corrector humano es estar detrás de los ‘softwares’ contextuales y semánticos». Blog de Stilus (18 de noviembre de 2015). [Consulta: 25-07-2021].

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN). Estrategia de Procesamiento del Lenguaje Natural 2020. [Consulta: 25-07-2021].

Torrijos, C. «Por qué programas, ¿si tú eras de letras?». 10 de mayo de 2021. [Vídeo en línea]. [Consulta: 25-07-2021].

Villena, J. «NLP technologies: state of the art, trends and challenges». Blog de MeaningCloud (20 de noviembre de 2019). [Consulta: 25-07-2021].

Concepción Polo
Concepción Polo Bayo
+ artículos

Es licenciada en Lingüística y Filología Hispánica. Trabaja como responsable del departamento de Lingüística en MeaningCloud, empresa que aplica tecnologías semánticas y de procesamiento de lenguaje natural para el tratamiento inteligente de textos. Destaca su función como coordinadora del equipo Stilus, dedicado a la corrección automática profesional, así como a la gestión de otros proyectos de PLN para los que viene convenciendo, acompañando y formando a otros colegas filólogos, traductores y correctores en el entrenamiento de destrezas para la construcción de recursos y modelos lingüísticos.

Concepción Polo Bayo
Concepción Polo Bayo
Es licenciada en Lingüística y Filología Hispánica. Trabaja como responsable del departamento de Lingüística en MeaningCloud, empresa que aplica tecnologías semánticas y de procesamiento de lenguaje natural para el tratamiento inteligente de textos. Destaca su función como coordinadora del equipo Stilus, dedicado a la corrección automática profesional, así como a la gestión de otros proyectos de PLN para los que viene convenciendo, acompañando y formando a otros colegas filólogos, traductores y correctores en el entrenamiento de destrezas para la construcción de recursos y modelos lingüísticos.

Redes Sociales

956me gustaMe gusta
10,638seguidoresSeguir

Último número

- Advertisement -spot_img

Artículos relacionados