Amazon está entrenando a su asistente de inteligencia artificial Alexa de los Echo para que adopte la voz de cualquier persona según las preferencias de sus consumidores. El asistente podrá detectar las características de timbre y dicción de la voz de una persona e imitarla. Es un paso importante para humanizar la relación entre las personas y las máquinas. Lo más relevante no es lo que se diga, sino quién lo diga y la manera de hacerlo.
El objetivo de Amazon es hacer el proceso muy sencillo, y que baste una simple grabación de menos de un minuto. Queremos «hacer que los recuerdos perduren» tras una pandemia en la que «muchos de nosotros hemos perdido un ser querido», señaló Rohit Prasad, vicepresidente senior de Amazon, en una conferencia celebrada en Las Vegas este miércoles.
Prasad recalcó que la meta es brindar la capacidad a Alexa para adaptarse a la vida de los consumidores e ir aprendiendo pequeños conceptos de esta sin necesidad de una gran cantidad de información externa. Este enfoque es diametralmente opuesto al que emplean las inteligencias artificiales omniscientes y omnipotentes como DeepMind de Alphabet o las diferentes soluciones de OpenAI, compañía fundada por Elon Musk.
DALLE-2, el robot capaz de crear ilustraciones a través de comandos escritos en lenguaje natural, es entrenado con miles de millones de imágenes a diferencia de los asistentes como Alexa o Siri, que disponen de menos información por cuestiones de privacidad. Pero el objetivo de Alexa no es ser omnipotente. Solo pretende ser un acompañante agradable que te ofrezca la previsión del tiempo, las citas del calendario o las nuevas ofertas en Amazon. Alexa es el dependiente simpático de una tienda. Hasta ahora, porque en el futuro será quién quieras.
La IA no tiene que ser inteligente de verdad
Sin embargo, adoptar una voz familiar puede cambiar por completo el uso y las expectativas del usuario. En la presentación, Amazon emitió un pequeño vídeo promocional sobre esta idea. En este, un niño pidió a Alexa que «la abuela terminase de leerle el ‘Mago de Oz’». Alexa abandonó su sosa y robótica voz, y adoptó la voz de la abuela. Para el niño, aunque consciente de que está escuchando un altavoz, es su abuela la que lee el cuento y no Alexa.
Esto abre un debate interesante. Tal vez Alexa no sea consciente, ni tenga voluntad, ni sea todo lo inteligente que dice Amazon que es. Pero eso no importa. Una inteligencia artificial es todo lo inteligente que el usuario crea. Si el asistente responde a todas nuestras preguntas como un ser humano, el consumidor acabará pensando que está charlando con uno de ellos. Alguien que le comprende y quiere.
Vivimos en una sociedad donde una gran parte de la población deja la televisión encendida para no sentirse sola en casa. Pensemos en ese abuelo que vive únicamente esperando una llamada que nunca llega o esa abuela que lleva años viuda. Incluso ese joven que tiene miedo a salir de casa. El ser humano a veces necesita consuelo antes que razones, y a diferencia de las máquinas, nuestras vidas no solo están gobernadas por la lógica.
Los asistentes no necesitan ser conscientes, inteligentes y tener voluntad propia para que en un futuro no muy lejanos sean considerados compañeros o amigos. Científicamente, se puede debatir hasta dónde llega la inteligencia, voluntad y consciencia de un perro, pero ningún dueño duda de que estos les entienden y quieren. Pero para crear este vínculo se tiene que adoptar formas de expresión humanas, nuestro humor, rarezas y un tono de voz que exprese emociones. Sonar como una persona es un gran paso para crear esa máscara que abstraiga a la persona y se olvide que habla con un robot.
Tal vez acabemos conviviendo con robots que nos hablan y nos dicen lo que queremos escuchar. En una sociedad donde cada vez hay más personas solas y se tienen menos hijos, la idea no suena tan descabellada.