domingo, 13 de noviembre de 2016

Desarrollan una inteligencia artificial que lee los labios mejor que cualquier humano

Abril del año pasado. Ahmad Hassanat, un investigador de la Inteligencia Artificial, calmaba a sus seguidores en las redes sociales con un comentario: "No se preocupen, chicos, nadie les leerá los labios a escondidas. Al menos no en un futuro cercano".


Hassanat era noticia por haber desarrollado un software que podía deducir lo que murmuraba una persona con un 76% de éxito. Ahora, tan solo un año y medio más tarde, se ha avanzado a pasos agigantados en la precisión con la que la inteligencia artificial es capaz de saber qué estamos diciendo.

Científicos de la Universidad de Oxford han creado un programa que lee los labios con una efectividad del 93,4%, un porcentaje que supera con creces el grado de acierto promedio de las personas más hábiles en este terreno, que solo llega al 52%.




En un animado vídeo con música apacible que puedes ver al final, los investigadores de Oxford nos presentan a Lipnet, la tecnología que entrenaron con vídeos de gente hablando y que ahora, como buena alumna, logra descifrar las palabras y frases exactas que salen por nuestra boca en nueve de cada diez ocasiones.

Leer los labios, como ya explicó Hassanat, es tremendamente difícil: requiere reconocer la secuencia de movimientos de nuestra boca para sacar palabras o frases específicas. El problema radica en que muchos sonidos se corresponden con una misma forma de los labios. Durante el habla, los labios adoptan alrededor de unas 14 formas. Sin embargo, existen unos 50 sonidos diferentes. De allí la complejidad de descifrar el discurso de un individuo sin oírlo.

LipNet se basa en el sistema de "aprendizaje profundo" de DeepMind. Desde que Google creara esta inteligencia artificial dotada de una especie de red neuronal y se hiciera famosa por haber derrotado al campeón mundial del popular juego de mesa Go en diferentes partidas, diversas universidades y empresas quisieron valerse de su potencial para sacar adelante o mejorar proyectos. Entre ellos, perfeccionar una máquina para que lea los labios con una precisión que sobrecoge.

Más allá de los logros desde el punto de vista técnico, la finalidad que se le otorge a esta clase de programas es la cuestión que genera inquietudes. El equipo de la Universidad de Oxford señala que su objetivo para LipNet es que se convierta en un asistente que ayude a personas sordas o con dificultades auditivas en su día a día. Ahmad Hassanat apunta también que esta inteligencia podría aumentar la seguridad de los lugares que instauran sistema de acceso por contraseña. Delante de una cámara, las personas solo tendría que mover los labios con la palabra clave para entrar en vez de introducir una contraseña tecleando números o diciéndola en voz alta.


Sin embargo, buenas intenciones aparte, existen quienes insisten en el lado oscuro de esta tecnología. ¿Vigilarán todas nuestras conversaciones en el futuro gracias a que simples cámaras de seguridad instaladas en la calle serán capaces de saber lo que decimos? ¿Se utilizará este programa para espiar a la gente? ¿Se colarán en nuestras conversaciones más intimas sin que seamos conscientes?

Como nos recuerda el lema de LipNet, Nada es imposible.







Publicar un comentario