En el mito sobre la Torre de Babel, la gente conspiró para construir una ciudad y una torre que llegarían al cielo. Su creador observó: «Y ahora no se les impedirá nada, lo que han imaginado que harían». Según el mito, Dios frustró este esfuerzo al crear diversos idiomas para que ya no pudieran colaborar.
En nuestros tiempos modernos, estamos experimentando un estado de conectividad sin precedentes gracias a la tecnología. Sin embargo, todavía estamos viviendo a la sombra de la Torre de Babel. El lenguaje sigue siendo una barrera en los negocios y el marketing. Aunque los dispositivos tecnológicos se pueden conectar rápida y fácilmente, los humanos de diferentes partes del mundo a menudo no pueden.
Las agencias de traducción intervienen, haciendo que las presentaciones, los contratos, las instrucciones de subcontratación y los anuncios sean comprensibles para todos los destinatarios. Algunas agencias también ofrecen experiencia en «localización». Por ejemplo, si una empresa comercializa en Quebec, los anuncios deben estar en francés quebequense, no en francés europeo. Las compañías adversas al riesgo pueden ser reacias a invertir en estas traducciones. En consecuencia, estas empresas no han logrado una penetración total en el mercado.
Los mercados mundiales están a la espera, pero la traducción de idiomas impulsada por AI (Analisis total) aún no está lista, a pesar de los recientes avances en el procesamiento del lenguaje natural y el análisis de sentimientos. AI todavía tiene dificultades para procesar solicitudes en un idioma, sin las complicaciones adicionales de la traducción. En noviembre de 2016, Google agregó una red neuronal a su herramienta de traducción. Sin embargo, algunas de sus traducciones todavía son extrañas social y gramaticalmente. Hablé con tecnólogos y un profesor de idiomas para averiguar por qué.
«Para crédito de Google, hicieron una mejora bastante masiva que apareció casi de la noche a la mañana. Ya sabes, no lo uso tanto. Diré esto. El lenguaje es difícil «, dijo Michael Housman, director de ciencias de datos en RapportBoost.AI y miembro de la facultad de Singularity University.
Explicó que el escenario ideal para el aprendizaje automático y la inteligencia artificial es algo con reglas fijas y una medida clara de éxito o fracaso. Él nombró al ajedrez como un ejemplo obvio, y notó que las máquinas podían vencer al mejor jugador humano de Go. Esto sucedió más rápido de lo esperado por las reglas muy claras del juego y el conjunto limitado de movimientos.
Housman explicó: «El lenguaje es casi lo opuesto a eso. No hay reglas tan claras y definidas. La conversación puede ir en infinitas direcciones diferentes. Y luego, por supuesto, necesitas datos etiquetados. Necesita decirle a la máquina que lo haga bien o mal «.
Housman señaló que es intrínsecamente difícil asignar estas etiquetas informativas. «Dos traductores ni siquiera acordarán si se tradujo correctamente o no», dijo. «El lenguaje es una especie de salvaje oeste, en términos de datos».
La tecnología de Google ahora puede considerar la totalidad de una oración, en lugar de simplemente traducir palabras individuales. Aún así, los problemas persisten. Le pregunté al Dr. Jorge Majfud, Profesor Asociado de Español, Literatura Latinoamericana y Estudios Internacionales en la Universidad de Jacksonville, para explicar por qué la traducción de idiomas consistentemente precisa hasta ahora ha eludido la IA.
Él respondió: «El problema es que considerar la oración ‘completa’ aún no es suficiente. De la misma manera que el significado de una palabra depende del resto de la oración (más en inglés que en español), el significado de una oración depende del resto del párrafo y del resto del texto, ya que el significado de un texto depende en un contexto más amplio llamado cultura, intenciones del hablante, etc. »
Señaló que el sarcasmo y la ironía solo tienen sentido dentro de este contexto ampliado. Del mismo modo, las expresiones idiomáticas pueden ser problemáticas para las traducciones automáticas.
«La traducción de Google es una buena herramienta si la usas como una herramienta, es decir, no para sustituir el aprendizaje o la comprensión humana», dijo, antes de ofrecer ejemplos de malas traducciones que podrían ocurrir.
«Hace meses, fui a comprar un taladro en Home Depot y leí un letrero debajo de una máquina: ‘Máquina de sierra’. Justo debajo de ella, la traducción al español: ‘La máquina vió’, que significa, ‘La máquina sí lo vio . ‘Vio, no como un sustantivo, sino como un verbo en la forma pretérita’ ‘, explicó.
El Dr. Majfud advirtió: «Debemos ser conscientes de la fragilidad de su ‘interpretación’. Porque traducir es básicamente interpretar, no solo una idea, sino un sentimiento. Sentimientos e ideas humanas que solo los humanos pueden entender, y otras veces ni siquiera nosotros, los humanos, entendemos a otros humanos «.
Señaló que las culturas, el género y hasta la edad pueden poner obstáculos a esta comprensión y también sostuvo que una dependencia excesiva de la tecnología está conduciendo a nuestro declive cultural y político. El Dr. Majfud mencionó que el escritor argentino Julio Cortázar solía referirse a los diccionarios como «cementerios». Sugirió que los traductores automáticos podrían llamarse «zombis».
Erik Cambria es investigador académico de AI y profesor asistente en la Universidad Tecnológica de Nanyang en Singapur. Se enfoca principalmente en el procesamiento del lenguaje natural, que es el núcleo de la traducción de la lengua impulsada por la inteligencia artificial. Al igual que el Dr. Majfud, ve la complejidad y los riesgos asociados. «Hay tantas cosas que inconscientemente hacemos cuando leemos un texto», me dijo. La comprensión de lectura requiere múltiples tareas interrelacionadas, que no se han tenido en cuenta en los intentos anteriores de automatizar la traducción.
Cambria continuó: «El problema más importante con la traducción automática actual es que tendemos a pasar de la forma sintáctica de una oración en el lenguaje de entrada a la forma sintáctica de esa oración en el idioma de destino. Eso no es lo que hacemos los humanos. Primero decodificamos el significado de la oración en el idioma de entrada y luego codificamos ese significado en el idioma de destino «.
Además, existen riesgos culturales relacionados con estas traducciones. El Dr. Ramesh Srinivasan, Director del Laboratorio de Culturas Digitales de la UCLA, dijo que las nuevas herramientas tecnológicas a veces reflejan sesgos subyacentes.
«Suelen existir dos parámetros que dan forma a la forma en que diseñamos los ‘sistemas inteligentes’. Uno son los valores y se pueden decir los sesgos de aquellos que crean los sistemas. Y el segundo es el mundo si se quiere que aprendan «, me dijo. «Si construyes sistemas de inteligencia artificial que reflejen los prejuicios de sus creadores y del mundo en mayor medida, obtienes algunos, ocasionalmente, fallas espectaculares».
El Dr. Srinivasan dijo que las herramientas de traducción deben ser transparentes sobre sus capacidades y limitaciones. Él dijo: «Sabes, la idea de que un solo sistema puede tomar lenguajes que creo que son muy diversos semánticamente y sintácticamente entre sí y afirman unirlos o universalizarlos, o esencialmente hacerlos una especie de entidad singular, es un nombre inapropiado , ¿derecho?»
Mary Cochran, cofundadora de Launching Labs Marketing, ve el lado comercial. Mencionó que las listas en los mercados en línea como Amazon podrían ser traducidas automáticamente y optimizadas para compradores en otros países.
Ella dijo: «Creo que estamos en la punta del iceberg, por así decirlo, con lo que AI puede hacer con el marketing. Y con una mejor traducción y una mayor globalización en todo el mundo, AI no puede evitar generar mercados explosivos «.
David Pring-Mill
David Pring-Mill is a writer and filmmaker.
https://singularityhub.com/2018/03/04/why-hasnt-ai-mastered-language-translation
Comments are closed.