En los años cincuentas, el científico computista Alan Turing instituyó lo que sigue siendo la prueba definitiva para la inteligencia artificial: el Test de Turing. Si el juez no puede distinguir entre la máquina y el humano a la hora de realizar el test (que es una conversación entre un humano y una máquina), la máquina habrá superado la prueba. Ya en su época, Turing consideraba que para el 2000, las máquinas podrían hacerle pensar a los humanos que hablaban con otro ser humano 30% de las veces. Google Duplex, una de las facetas del asistente de Google que puede realizar llamadas sin nuestra intervención, todavía no ha pasado la prueba. Una de las metas buscadas por la humanidad es mantener conversaciones naturales con computadoras, tal y como se mantienen de persona a persona. En años recientes, las computadoras han avanzado en su capacidad de comprender y generar discursos naturales, especialmente cuando vemos la aplicación de redes neuronales profundas (como Google voice search o WaveNet); pero sigue siendo frustrante mantener una conversación con una voz computarizada que no comprende las inflexiones de la comunicación oral. Especialmente los sistemas telefónicos automatizados tienen dificultades para reconocer palabras simples y órdenes, no se unen al flujo de la conversación y obligan a la persona a ajustarse al sistema, y no al revés.
Con el anuncio de Google Duplex, es palpable la posibilidad de llevar conversaciones naturales y ejecutar órdenes del “mundo real” telefónicamente. La tecnología está diseñada para cumplir funciones específicas, como agendar cierto tipo de citas; y el sistema ofrece una experiencia conversacional natural, que le permite a su interlocutor hablar normalmente, como hablarían con otra persona, sin tener que adaptarse a una máquina. Duplex funciona dentro de un terreno estrecho que ha permitido la exploración extensiva, entrenando profundamente a la inteligencia artificial. Esto significa que Duplex no puede tener conversaciones de temas generales: cumple una función. Durante la I/O 2018, el CEO de Google Sundar Pichai presentó la IA frente a 7000 personas, y frente a ella, esta misma inteligencia artificial realizó una llamada para agendar un corte de cabello de mujer. La voz de la máquina no se diferencia en nada de una voz humana, e incluso hace pausas antes de responder, alargando palabras como si pensara en lo que va a decir y utilizando trucos verbales como el “ummm”, “mmm-hh” y el “uh”. Es probable que Turing no considerara sistemas basados en voz, claramente las computadoras que hablan tienen dificultades engañando a los humanos. Pocos minutos conversando con tu asistente de voz bastan para descubrir sus limitaciones: discurso entrecortado, pronunciación rígida, tiempos de respuesta demasiado largos (especialmente si están tratando de acceder al servidor en la nube) que hacen olvidar la conversación.. La mayoría de los asistentes con inteligencia artificial pueden manejar dos solicitudes consecutivas y requieren una frase gatilladora como “Alexa”, “Hey Siri” o “Okay Google” (este último está en proceso de eliminación para hacer más sencillas las conversaciones). Google Asistant haciendo la llamada a través de Duplex no tiene este problema.
No hay comentarios:
Publicar un comentario