La inteligencia artificial generativa es, sin duda, el acontecimiento más importante de este año en el sector tecnológico. El boom provocado por ChatGPT de OpenAI y otras herramientas de IA generativa ha obligado a moverse más rápido a los gigantes del sector que hasta ahora se centraban en desarrollar sus algoritmos y modelos de lenguaje natural, pero sin aplicarlo en demasiadas funciones de cara al público. Esta semana Amazon ha iniciado el camino hacia una nueva Alexa, su asistente virtual. Este ayudante personal comienza una renovación que le permite ser más intuitiva y comunicativa, dejando atrás los comandos de voz que resultaban tan encorsetados para sus usuarios en España y todo el mundo.
Amazon ha presentado nuevos altavoces Echo Show 8 y Hub, nuevos Fire TV Stick para los televisores y hasta una segunda generación de gafas inteligentes, Echo Frame. Todos con Alexa como punto de unión. Los ha presentado en sus recién estrenadas oficinas en Washington DC, donde EL ESPAÑOL-Omicrono ha podido probar estas novedades y conversar con la Alexa más futurista.
Hasta ahora la comunicación entre usuario y el asistente virtual de Amazon dependía de comandos sencillos y directos, con la información justa y necesaria, pero ¿qué pasa cuándo el usuario no recuerda lo que quiere exactamente? En este caso, solo un familiar o amigo que te conozca bien sabrá adivinar a qué te refieres y ayudarte a conseguirlo, esa es la Alexa que Amazon se ha propuesto desarrollar.
Para conseguirlo, el gigante de las ventas online ha desarrollado Alexa LLM (Large Language Model), un modelo de lenguaje natural como el que utilizan ChatGPT de OpenAI y Bard de Google, también como en el que trabajan en Apple para insuflar más vida a Siri. La diferencia está en la voz, mientras el resto de chatbots que han copado titulares durante todo el año se comunican mediante escritura en aplicaciones o navegadores, Alexa lo hace por voz desde casi cualquier rincón de tu casa.
Las novedades que leerás a continuación tardarán en llegar a todo el mundo, algunas más que otras, pero es el principio de un cambio. La IA generativa se postula como el cambio definitivo que necesitaban los llamados hogares inteligentes, plagados de electrodomésticos conectados. Un futuro prometedor, pero que no está exento de dudas en los que a seguridad y privacidad se refiere y por lo que este medio le ha preguntado a Amazon durante el evento.
Charlando con Alexa
Alexa LLM es capaz de gestionar una cantidad "casi infinita de variaciones y comprender cómo está configurado su hogar específico para activar las API y acciones correctas", asegura Amazon. En vez de pedirle directamente que suba la calefacción, bastará con indicarle al asistente que tienes frío, este es uno de los ejemplos que ha dado la compañía. El control de la casa se complementa con el Echo Hub y la función Map View, un cuadro de mando y un plano del hogar desde el que gestionar, luces, aire acondicionado, hasta la puerta de entrada con la ayuda de Alexa.
Durante su presentación, Dave Limp, vicepresidente senior de dispositivos y servicios de Amazon que dejará la empresa a final de año, ha conversado con el nuevo altavoz Echo Show 8 sobre su equipo de baseball favorito, cuándo jugaban, si sería buena idea organizar una barbacoa para ver con amigos el partido y otros detalles. La charla ha terminado con Alexa redactando una pequeña invitación para la fiesta integrando todos los detalles mencionados en la conversación para que Limp pudiera mandarlo a sus invitados. Esta interacción más fluida es lo que Amazon ha denominado como Let’s chat, que se podría traducir como "Charlemos".
También en el nuevo Echo Show se encuentra una novedad que pone de manifiesto cómo la empresa trata de adaptarse rápidamente a lo que los demás chatbots persiguen. Alexa podrá adquirir personalidades diferentes, convertirse en actriz, e interpretar a Grace Hopper, militar estadounidense que fue pionera en los lenguajes de programación automáticos y que vivió cerca de estas nuevas oficinas de Amazon.
Esta novedad llega a Alexa a través de la aplicación de terceros, Character.ai donde se pueden elegir personajes como Rosalía o Gandalf. Durante la demostración de los productos, los visitantes se acercan al Echo Show a charlar con Hopper sobre la inteligencia artificial. La conversación no es del todo fluida y las respuestas son poco originales, pero sirven como punto de acercamiento a algunos temas que pueden interesar a estudiantes.
Es un truco, una anécdota más de lo que la IA generativa está consiguiendo. Carlos Pérez, director de Alexa Américas, indica a la prensa española allí presente que Amazon pretende que Alexa personalice las respuestas dentro de sus usuarios, conociendo sus gustos, rutina y necesidades, pero no hay intención de que Alexa tenga una personalidad diferente en cada casa.
En el lado más puro del entretenimiento, Alexa se encargará de la torpeza habitual de los humanos a la hora de recordar nombres de actores o películas. Y aquí es donde entra otro de los nuevos productos de la compañía, el mando y dongle del Fire TV Stick 4K Max al que se podrán lanzar peticiones tan ambiguas como "Alexa, ¿cómo se llama la otra serie del actor de Breaking Bad?". También se le podrá pedir que recomiende películas de acción que no se hayan visto antes, por ejemplo. Todo el catálogo de Prime Vídeo y otras plataformas potenciado con esta interacción más inteligente del asistente. Se acabó pasar más tiempo buscando contenido para ver que realmente viendo una serie o película, a menos que el problema sea la indecisión.
Junto a esta novedad, llega otra capacidad generativa de Alexa, ahora capaz de emular a los grandes del pincel. Algunos modelos de Fire TV Stick obtendrán la capacidad de usar el televisor como editor de fotos. Es decir, a través de un editor de imágenes generativa basado en IA, como es Midjourney. Tomando la ciudad de Washington como ejemplo otra vez, Alexa rediseña el entorno del obelisco tan reconocible de esta ciudad. Lo rodea de una plantación de lavanda o cualquier detalle que se le pida.
La calidad de las imágenes generadas no es muy alta, pero desde la empresa prometen dar juego a todo tipo de imágenes, incluso, los recuerdos familiares de las vacaciones y poder darles un aire más artístico para usar de salvapantallas o compartirlo en redes sociales. Esta función se ha presentado solo en Estados Unidos de momento. A España llegan con el nuevo Fire TV Stick 4K Max cientos de obras de arte con calidad de museo en el modo ambiente forma gratuita.
Esta función, sin embargo, no se podrá probar hasta 2024 en Estados Unidos. Y no es la única. Aplicaciones como Splash permitirán crear música directamente desde los dispositivos con Alexa, usando modelos de lenguaje entrenados para la música. Amazon se ha apoyado en su propio desarrollo, pero también en aplicaciones de terceros para llegar más rápido a este nuevo mundo donde la inteligencia artificial es más creativa que nunca.
Esta Alexa más inteligente llegará también a las gafas de Amazon, Echo Frames, que se renuevan con más batería hasta las 6 horas de autonomía, un 40% más que la generación anterior. Con nuevos diseños, estas gafas siguen siendo básicamente unas lentes con auriculares en las patillas. Pero su integración con la Alexa del futuro podría dotarles de más capacidad a parte de pedirle que suba o baje el volumen de los altavoces o te indique que tiempo va a hacer dentro de dos días. Imagina ir por la calle charlando con Alexa para organizar tu agenda de la semana.
Seguridad y Privacidad
La intención de la compañía es recorrer el camino que han emprendido con calma y cuidando los detalles. Las funciones y capacidades de Alexa se irán desplegando poco a poco y surgirán novedades según la empresa comprenda dónde está realmente el valor de esta tecnología para sus usuarios. Esta cautela, se debe a las dificultades de entrenar la tecnología tanto como al reto de asegurarse que es segura para todo el mundo.
Esta nueva interacción más fluida entre los diferentes miembros de la familia y el asistente virtual despierta las mismas dudas sobre privacidad que enfrentaron a los miembros de la Unión Europea con ChatGPT hace meses. Para que Alexa sea más intuitiva y tenga un dominio de la conversación mayor, es necesario seguir entrenando al modelo de lenguaje natural, recabar datos y probar constantemente el modelo.
En este caso, Carlos Pérez asegura a este periódico que Amazon no usará las conversaciones de sus usuarios en casa para entrenar al modelo de IA. Serán los detalles personales los que sí ayudará a personalizar el perfil. Esta nueva revolución depende de que la tecnología acabe conociendo muy en profundidad los gustos de cada perfil, de cada familia, sus rutinas y gustos, mucho más de lo que venían conociendo a los humanos hasta ahora.
También es un riesgo las alucinaciones que la IA generativa suele presentar. Amazon asegura que es uno de sus principales esfuerzos: "nuestros equipos comprueban que no aporte información falsa o que esté actualizada, sabemos que esta tecnología va a estar en el hogar y que es crítico que sea segura", afirma Pérez.
En la presentación, Amazon ha dejado claro con varios vídeos promocionales que los niños son los usuarios que más rápido se acostumbran a hablar con las maquinas y a confiar en ellas. Tampoco indica Amazon de momento, las fuentes de las que se ha servido Alexa para elaborar la respuesta como si hacen chatbots conectados a internet como Bard o Bing.
El resto de empresas han empezado a implementar esta función para aportar más confianza y transparencia ante los usuarios. Tampoco hay que olvidar lo que la generación de imágenes falsas ha provocado para el auge de las fake news, aunque las demostraciones que se han visto en el cuartel general de Amazon han sido inocentes, no queda claro hasta donde se podría llevar ese editor de imágenes.
El gigante de las compras online en occidente ha dado esta semana los primeros pasos para la creación de un hogar inteligente, incluso de una vida en la que todos los humanos vayan siempre acompañados de un asistente que los conozca mejor que sus propias madres. Es un camino complicado donde hay que evitar los pasos en falso para que los posibles malos usos de esta tecnología no deformen el resultado, mientras se elaboran las primeras leyes de inteligencia artificial para regular esta tecnología.