6 años rompiendo las barreras del lenguaje

viernes, 27 de abril de 2012 | 11:10

Labels:

El auge de la web ha hecho que más de dos mil millones de personas en todo el mundo tengan acceso al conocimiento. Con una breve consulta puedes acceder a la página web en un servidor a miles de kilómetros de distancia en un país diferente o leer un texto de alguien que está en la otra punta del mundo. Pero, ¿qué pasa si está redactado en hindi, afrikáans o islandés y tu sólo hablas inglés o viceversa?

En el 2001 Google comenzó a ofrecer un servicio que podía traducir ocho idiomas al inglés y viceversa. Por aquel entonces utilizaba la tecnología más avanzada disponible comercialmente denominada traducción automática (TA). Sin embargo, la calidad no era muy buena y no mejoró mucho en esos primeros años. En 2003, un par de ingenieros de Google decidieron mejorar la calidad e incluir más idiomas y ese fue el momento en el que me involucré en este proyecto.

Por aquel entonces yo trabajaba de investigador en proyectos de la Agencia de Investigación de Proyectos Avanzados de Defensa (DAARPA) buscando un nuevo enfoque a la traducción automática ( aprendiendo de los datos) que parecía ser el futuro y apuntaba a una gran mejora en la calidad de traducción. Recibí entonces una llamada de Google y empecé a trabajar con ellos en proyectos que pudieran funcionar a gran escala. Iniciamos la actualización de nuestro sistema de traducción para competir en el NIST machine translation evaluation, una competición entre diversas compañías e instituciones de investigación para construir una maquina de traducción mejor.

La gran infraestructura informática de Google y su capacidad para procesar ingentes cantidades de datos en Internet nos dio buenos resultados y fue un momento decisivo que subrayaba la eficacia que podía tener un enfoque basado en los datos. Sin embargo, en ese momento, nuestro sistema era demasiado lento como para ofrecer un servicio práctico y nos costaba unas 40 horas y 1.000 ordenadores traducir 1.000 frases. Por ello, nos centramos en mejorar la velocidad y un año más tarde nuestro sistema podía traducir una frase en menos de un segundo y con mejor calidad.

A principios de 2006 lanzamos los primeros idiomas, primero el chino y después el árabe. El 28 de abril de 2006 presentamos nuestro enfoque estadístico de traducción con máquinas, y en los últimos seis años nos hemos centrado sobre todo en la calidad de la traducción y en ampliar el número de idiomas disponibles. Ahora podemos realizar traducciones entre 64 lenguas diferentes, incluyendo muchas que tienen una pequeña presencia en Internet como el bengalí, euskera, swahili, yiddish, o incluso esperanto.

Hoy contamos con más de 200 millones de usuarios únicos al mes activos en translate.google.com (y otros tantos más en diversos sitios en los que puedes usar Translate como Chrome, aplicaciones móviles, YouTube, etc.). Los usuarios, además, también quieren acceder a Google Translate en sus desplazamientos (la barrera del idioma nunca es tan importante como cuando se viaja) y hemos visto que nuestro tráfico en dispositivos móviles se ha multiplicado por cuatro cada año. Además, nuestros usuarios son realmente globales, más del 92% de nuestro tráfico procede de fuera de los Estados Unidos.

Un día cualquiera, traducimos aproximadamente la cantidad de texto que se podría encontrar en un millón de libros; dicho de otro modo: lo que todos los traductores profesionales humanos del mundo producen en un año nuestro sistema lo traduce aproximadamente en un solo día. Sin embargo creemos que no hay quien gane a un traductor humano siendo los expertos en traducción no solo a la hora de  realizar su trabajo sino también a la hora de mejorar la traducción automática.

Vemos un futuro donde cualquier usuario pueda acceder y compartir información independientemente del lenguaje y del lugar en el que se encuentre. Ya proporcionamos traducción de páginas web al instante cuando se navega en Chrome, texto en fotos de móviles, capturas de vídeos de YouTube y de voz-a-voz en el “modo de conversación” de los teléfonos inteligentes. Queremos erradicar la barrera del lenguaje que dificulta la vida a la gente, y estamos impacientes por ver qué nos depararán los próximos seis años.