El lenguaje humano ante la máquina | La Linterna del Traductor

Dentro del marco del Congreso 20.º Aniversario de Asetrad, pude charlar con Manuel Palomar y Alfonso Ureña sobre varios temas de los que saben hasta decir basta: sociedad digital, inteligencia artificial, tecnologías de la información, procesamiento del lenguaje natural, modelos de lenguaje (como el polémico ChatGPT), el diseño, la minería y la administración de bases de datos, así como su análisis y tratamiento.

Commencing countdown, engines on

En 1969, inmersos en plena era del rock psicodélico y el progressive rock, empujados por una industria que cada vez necesitada de más números uno, la compañía discográfica Philips reunió las letras de un joven de Brixton y las lanzó en un breve recopilatorio por el que nadie daba un duro. Cinco años más tarde, la estadounidense Mercury Records, oliéndose el que sería un éxito sideral, cambió el nombre a aquel extraño recopilatorio y catapultó al estrellato a ese joven starman. Era ni más ni menos que David Bowie y su primer disco, Man of Words.

El lanzamiento al espacio del mayor Tom (…) nos ayudó a darle forma a la mesa redonda sobre inteligencia artificial y su relación con el lenguaje humano.

El lanzamiento al espacio del mayor Tom y su odisea flotando en un espacio en el que temía no volver a comunicarse con la Tierra nos ayudó a darle forma a la mesa redonda sobre inteligencia artificial y su relación con el lenguaje humano, herramienta de trabajo y supervivencia de todos los que trabajamos con palabras porque, otra cosa no, pero ese día allí nos dimos cita unos cuantos human beings of words.

Check ignition

Aquella mañana, en el Centro Cultural CICCA de Gran Canaria, dentro del marco del Congreso 20.º Aniversario de Asetrad, pude charlar con Manuel Palomar y Alfonso Ureña sobre varios temas de los que saben hasta decir basta: sociedad digital, inteligencia artificial, tecnologías de la información, procesamiento del lenguaje natural, modelos de lenguaje (como el polémico ChatGPT), el diseño, la minería y la administración de bases de datos, así como su análisis y tratamiento.

Iniciamos la conversación con un par de preguntas básicas para ir calentando motores: qué es la inteligencia artificial (IA)¹ y qué objetivos se persiguen con su uso. De aquí, ya obtuvimos una primera foto de nuestra particular canica azul: por un lado, las tecnologías del lenguaje humano (TLH) —entre las que se encuentran el procesamiento del lenguaje natural (PLN), la traducción automática (TA) y los sistemas conversacionales (SS. CC.)— buscan analizar, comprender y dar un paso más allá, es decir, simular la inteligencia humana a la hora de generar e interaccionar con el lenguaje escrito y oral.

You’ve really made the grade

Una vez aclarados estos conceptos básicos, en torno a los cuales orbitó toda la charla (y, spoiler, en torno a los que seguramente orbitará tu vida como profesional del lenguaje en los próximos años), Manuel y Alfonso nos ayudaron a alunizar en sus temas de estudio y especialización. Junto con sus equipos de investigación, nuestros dos especialistas ponen el PNL al servicio de tres grandes ejes: las enfermedades mentales, la inclusividad y la accesibilidad de la información.

Con Alfonso pudimos hablar sobre la labor de investigación que lleva a cabo el grupo SINAI, el cual dirige en la Universidad de Jaén.

Con Alfonso pudimos hablar sobre la labor de investigación que lleva a cabo el grupo SINAI (Sistemas INteligentes de Acceso a la Información), el cual dirige en la Universidad de Jaén. Uno de los proyectos en los que trabajan actualmente y que más nos llamó la atención fue su Big Hub, en el que el PLN busca proteger a la sociedad digital, especialmente a la más joven, ante ciertos comportamientos en las redes sociales. Su objetivo es la construcción de sistemas automáticos para detectar de manera precoz y automática casos de trastornos alimentarios, acoso, ansiedad, depresión, ideas suicidas o adicciones; este último es el objetivo del proyecto PRECOM (Detección PREcoz de COMportamientos de riesgo de adicción al juego) en un grupo vulnerable como las personas adolescentes y en el cual se sirven de interacciones con sistemas conversacionales dirigidas y libres, mediante modelos como GPT-3.

Otro de los proyectos de SINAI, el WeLee (Web Legible para todos mediante la simplificación y el enriquecimiento de textos) trabaja en pos de la igualdad poblacional a la hora de buscar y consumir información; esto es, que todos tengamos acceso inmediato a la lectura fácil. Para ello, se sirven de las TLH, con las que se detectan, identifican y eliminan obstáculos lingüísticos, lo que facilita la comprensión tanto a aquellos con dificultades lectoras transitorias (población inmigrante, población con escolarización deficiente o tardía, etc.) como permanentes (población con trastornos del aprendizaje, diversidad funcional, etc.), pues tiene la mira puesta en ofrecer una versión alternativa y enriquecida gracias a la adición de contenido extra, ya sea mediante imágenes, sinónimos o descripciones.

La inclusividad no se consigue sin combatir los discursos de odio; en SINAI son conscientes de ello.

Pero la inclusividad no se consigue sin combatir los discursos de odio; en SINAI son conscientes de ello y en el proyecto Social Fairness analizan la toxicidad y el grado de confiabilidad de la información a través de diferentes modelos del lenguaje.

También tuvimos la suerte de que Manuel nos pusiera al día de algunos de los proyectos en los que el Grupo de Procesamiento del Lenguaje Natural y Sistemas de Información (GPLSI) trabaja para mejorar la accesibilidad, la honestidad de la información y la salud mental desde la Universidad de Alicante.

Uno de ellos es el proyecto CLEARTEXT. En él, se aplican las tecnologías del lenguaje en busca de que el contenido digital sea más claro y accesible para las personas con discapacidades cognitivas; con ello se persigue la inteligibilidad de la información y la igualdad de oportunidades sociales, culturales y profesionales, lo que conlleva, sí o sí, una modernización de la Administración pública al poner en el centro del proceso a las personas y sus derechos digitales.

Otra rama de investigación muy interesante (…) es la desinformación y la economía de la verdad, conceptos que entran el terreno tan discutido de la ética en la IA.

Otra rama de investigación muy interesante en el grupo que dirige Manuel es la desinformación y la economía de la verdad, conceptos que entran el terreno tan discutido de la ética en la IA. En el proyecto TRIVIAL se analiza el contenido generado por las sociedades digitales y en el que proliferan los discursos de odio, los bulos o las conductas abusivas. De este modo y en palabras del propio Manuel:

Las tecnologías del lenguaje humano a través del modelado del comportamiento de los contenidos digitales pueden contribuir, por un lado, a la detección, mitigación y prevención de contenidos digitales nocivos, en busca de un saneamiento de las redes sociales en Internet, y, por otra parte, a la caracterización de contenidos beneficiosos y confiables, haciendo así una contribución válida y necesaria al objetivo de garantizar un entorno de comunicación respetuoso, seguro y de confianza.

El proyecto NL4DISMIS del GPLSI también combate la desinformación (ya sea por ignorancia o con la clara intención de llevar a error) que va ligada a la cantidad ingente de contenido que se genera en la actualidad y al comportamiento del usuario en los medios digitales frente a la confusión sobre los hechos reales, de fácil y rápida propagación.

El proyecto SocialFairness analiza la honestidad del contenido digital.

Sin abandonar el tema, el proyecto SocialFairness analiza la honestidad del contenido digital, el cual, como sabemos, es a menudo hostil, ofensivo y favorece que la desinformación prenda como la pólvora.

Now it’s time to leave the capsule, if you dare

Tras repasar las líneas de estudio de estos grupos de investigación, pasamos a discutir detalles más concretos relacionados con la inteligencia artificial, el procesamiento del lenguaje natural, los modelos conversacionales o la implicación o repercusión de estos conceptos en las diferentes áreas de especialización de la traducción, la corrección o la edición.

El digital es, ante todo, un mundo líquido en el que los compartimentos estancos no ayudan a avanzar con agilidad.

Uno de los temas que más interés suscitó fue la inclusión de humanistas en estos proyectos y su trabajo diario mano a mano con perfiles técnicos. Tanto Manuel como Alfonso coincidieron en lo beneficioso de los equipos multidisciplinares; el digital es, ante todo, un mundo líquido en el que los compartimentos estancos no ayudan a avanzar con agilidad. Se habló de formación recomendada (tan imprescindible es tener conocimientos siquiera básicos de lenguajes de programación como Python o SQL, como de lingüística); de las hard y las soft skills (conocimientos técnicos y habilidades personales) necesarias para el buen encaje en estos marcos de trabajo cooperativo interdisciplinar; de sesgos y techos de cristal, etc.

Obviamente, no nos olvidamos del tema candente del momento: ChatGPT. A raíz de las polémicas que estaba levantando (recordemos que, cuando se celebró el congreso de Asetrad, en mayo de 2023, el Parlamento Europeo no había aprobado aún la Ley de Inteligencia Artificial), retomamos algunos conceptos básicos, como qué es un modelo de lenguaje², por qué estamos empeñados en otorgarle unas capacidades antropomórficas que no tiene o qué importancia tiene el reinforcement learning from human feedback (RLHF o aprendizaje con feedback humano), es decir, la evaluación humana para detectar, entre otras cosas, respuestas verosímiles pero incorrectas, así como la generación de desinformación. En esto último, juega un papel importante la ingeniería rápida o de instrucciones (también lo encontraréis como prompt engineering) y la metodología del human-in-the-loop, es decir, un modelo de retroalimentación en bucle en el que la inteligencia humana interviene cuando el algoritmo no puede resolver un problema; esta evaluación e iteración constante (de ahí el loop) durante la fase de entrenamiento o la de ajuste y prueba del algoritmo detecta fallos y posibles mejoras en la creación de estos recursos.

My spaceship knows which way to go

Finalmente, tratamos cuestiones tan interesantes como la convivencia y la investigación de las lenguas cooficiales de España dentro del ámbito de la IA.

Finalmente, tratamos cuestiones tan interesantes (muchas de ellas, sacadas a colación durante el turno de preguntas del público) como la convivencia y la investigación de las lenguas cooficiales de España dentro del ámbito de la IA.

También nos interesamos en qué sesgos³ se encuentran nuestros expertos durante los análisis de datos en sus respectivos proyectos, las posibilidades reales de que estos supongan la discriminación de un colectivo minoritario (por ejemplo, se hizo hincapié en el lenguaje no binario) y, en tal caso, cómo evitarlos gracias a las métricas de fairness.

Una preocupación que surgió varias veces a lo largo de toda la charla y que el público decidió retomar para ahondar en ello fue el uncanny valley. ¿Habían sentido alguna vez esa inquietud enfrentándose a algún tema específico en su trabajo? ¿Qué les parecía esa desconfianza frente a la tecnología cuando se acerca tanto a lo humano que casi parece que acabará por reemplazarnos?

Otro tema sobre el que se incidió y que cabe señalar aquí, porque todos nos lo hemos preguntado en algún momento, es por qué FundéuRAE escogió como expresión del año 2022 inteligencia artificial y por qué no lo había hecho hasta entonces. Pasamos de puntillas, porque ya era tarde y el mayor Tom nos estaba llamando al orden, pero en el tintero de más de una se quedó preguntar por LEIA o el PERTE Nueva economía de la lengua.

Here am I floating far above the Moon

Según el ingeniero Raymond Kurzweil, en 2029 la inteligencia artificial conseguirá superar el test de Turing y alcanzará, por fin, a la inteligencia humana.

Y ahora, ¿qué? ¿Cuál es el futuro de la IA? ¿Hay una hoja de ruta? No estamos del todo seguras de si es cierta la predicción que hizo Stephen Hawking en 2014: «La inteligencia artificial augura el fin de la raza humana». Dejadme que os emplace a 2029, año en que tendrán lugar dos grandes acontecimientos que todos debemos apuntarnos en el calendario. Por un lado, Asetrad cumplirá 26 añitos uniendo, cuidando, formando y defendiendo a traductores, correctores y otros ores que trabajamos con palabras. Por otro lado, y según el ingeniero Raymond Kurzweil, en 2029 la inteligencia artificial conseguirá superar el test de Turing y alcanzará, por fin, a la inteligencia humana. Esperamos poder comprobarlo juntos en un lugar tan maravilloso como el CICCA de Gran Canaria y poder renovar la cita para 36 años después: 2045, año en que se alcanzará la singularidad, es decir, la conexión total del cerebro humano con la IA… ¿o no?

1 Investigación basada en ciencias de la computación que busca crear estructuras computacionales que resuelvan tareas más o menos inteligentes. Manuel Palomar lo definía así: «Inteligencia digital entendida como el conjunto de habilidades y conocimiento digital que una empresa, institución o persona debe tener para afrontar la gran revolución digital que se está produciendo. Definir un nuevo relato donde la tecnología y la información están en el centro, pero deben ir acompañadas de educación, cultura, derecho, ética, empleabilidad, conectividad, accesibilidad, solidaridad, sostenibilidad… directrices clave para afrontar una verdadera transformación social y económica».

2 Modelo entrenado para extraer estadísticas a partir de un corpus y a través del cual adquiere conocimientos del idioma.

3 Sesgo como desviación en un algoritmo que refleja los valores humanos reflejados en el dato.

Judith de Diego

+ artículos

Judit(h) de Diego (Segovia, 1987) es licenciada en Filología Románica y Literatura Comparada, y máster en Tecnologías de la Información para la Sociedad Digital y Data Science. En 2013 creó su asesoría lingüística; desde entonces, gestiona proyectos y equipos. Especializada en edición literaria y académica, también se la puede ver por los andurriales de la docencia (ELE y literatura española en diferentes programas universitarios), la transcripción y la posedición de programas de reconocimiento de voz y el análisis de datos para empresas culturales. Hija de una estanquera y un albañil, tiene dos gatos y es pizzapiñera.

Cookie	Duración	Descripción
cookielawinfo-checbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

‘Language Oddity’: la extrañeza del (lenguaje) humano ante la máquina (que contesta)

Commencing countdown, engines on

Check ignition

You’ve really made the grade

Now it’s time to leave the capsule, if you dare

My spaceship knows which way to go

Here am I floating far above the Moon

Judith de Diego

Último número

Artículos relacionados

Translating professionally on Linux: tips and insights from three practitioners

From translator to data scientist: an interview with Rubén Rodríguez de la Fuente

Local LLMs: ethical, secure and sustainable AI

Preocupaciones éticas y regulatorias del uso de la IA en la traducción profesional

Entrevista a Antoni Oliver, responsable del proyecto MTUOC para el entrenamiento, uso e integración local de la NMT

‘Language Oddity’: la extrañeza del (lenguaje) humano ante la máquina (que contesta)

Commencing countdown, engines on

Check ignition

You’ve really made the grade

Now it’s time to leave the capsule, if you dare

My spaceship knows which way to go

Here am I floating far above the Moon

Judith de Diego

Redes Sociales

Último número

Artículos relacionados

Translating professionally on Linux: tips and insights from three practitioners

From translator to data scientist: an interview with Rubén Rodríguez de la Fuente

Local LLMs: ethical, secure and sustainable AI

Preocupaciones éticas y regulatorias del uso de la IA en la traducción profesional

Entrevista a Antoni Oliver, responsable del proyecto MTUOC para el entrenamiento, uso e integración local de la NMT