He probado el modo conversacional de la IA de Google: así es 'charlar' con Gemini Live en español
- Ya se puede mantener una conversacional natural con la inteligencia artificial de Google que va a por ChatGPT de OpenAI.
- Más información: La app de tiempo con IA de Google llega a todos sus Pixel antiguos: así es y se descarga.
En septiembre Google anunció la disponibilidad gratuita para todos de Gemini Live, su modo conversacional que compite directamente con el de ChatGPT, justamente cuando se ha anunciado hace sus días su llegada en español. El gigante tecnológico anunció Gemini Live para España, pero no ha sido hasta hace un par de días cuando apareció la notificación en el móvil y así poder probar a charlar con la IA.
El modo conversacional de la IA de Google ha tomado gran importancia debido a la apasionante demostración hecha por OpenAI en el mes de mayo con ChatGPT respondiendo a emociones, soltando carcajadas y con respuestas inmediatas para dar la sensación de que se "conversa".
Una experiencia inaudita que acrecentó el miedo en Google debido al impacto que podía tener el modo conversacional de ChatGPT, así que se prestó rápido a mostrar una demo en el Google I/O justo a la semana de la propia de OpenAI para presentar a Gemini Live. Y es justo en esa carrera en la que se encuentran ambas para ofrecer el mejor modo conversacional posible y los usuarios puedan tener charlas coloquiales con la IA.
Es aquí donde entra la prueba que hemos llevado a cabo en EL ESPAÑOL - El Androide Libre al aparecer Gemini Live como el modo conversacional en la app de Android en un Samsung Galaxy S24 Ultra, por lo que ya está disponible en España.
Lo primero que se hace es seleccionar la voz que utilizará Gemini Live para responder, y son un total de 10 con distintos timbres de voz en español: Vega (brillante y voz más aguda), Orbit (enérgica y voz más grave), Ursa (cercana con tono medio), Capella (serena con voz más aguda), Pegasus (calmada con voz más grave), Nova (cercana con tono medio), Lyra (brillante con la voz más aguda), Eclipse (enérgica con tono medio), Orion (brillante con voz más grave) y Dipper (calmada, voz grave).
Se puede ir pasando de una a otra para escucharlas para así conocer su tono de voz y si apetece que sea una voz más calmada o una enérgica. La verdad que hay una gran variedad de voces a diferencia de ChatGPT con sus cuatro únicas disponibles con su modo avanzado de voz.
Al abrir Gemini, ahora aparece un botón nuevo separado del campo para hacer una consulta a la IA al igual que el micrófono o el de cámara. Al pulsarlo aparece la interfaz de Gemini Live con su color azul oscuro y una animación en azul que aparece justamente situada en la parte inferior para confirmar al usuario que está Gemini en escucha activa.
Justo debajo están los botones de poner en espera, para que deje de estar con el micrófono activo, y el de finalizar con una x y el botón en rojo. A partir de ahora, cualquier cosa que se diga, Gemini Live responderá en consecuencia, y en nuestras pruebas la interacción ha sido bastante satisfactoria, aunque no se acerca a la rapidez con la que puede responder ChatGPT, que en este caso se puede decir que vuela, y una experiencia más 'coloquial' con palabras más 'de calle'.
Toda la conversación dada con Gemini Live está transcrita, así que se puede revisar cualquier respuesta en texto, y aquí entra otro detalle importante de la IA de Google, al estar actualizada al día puede servir para preguntarle por la actualidad y que haga un resumen rápido.
Conversando con Gemini Live
La interacción es sencilla, se puede cortar en todo momento al decir 'parar' y cambiar de tema incluso cuando está respondiendo por si no interesa lo que está diciendo en esos momentos. La conversación es dinámica y si se pregunta por actualidad, al hacer un resumen, siempre pregunta por si queremos que precise por alguno de los temas actuales.
Lo mismo sucede con el tiempo o cualquier otro tema para que se convierta en un modo muy especial cuando se está haciendo cualquier cosa, como podría ser al cocinar. Eso sí, las extensiones todavía no están disponibles en Live, así que no se puede hacer una consulta sobre correos o documentos PDF en Google Drive.
Es verdad que a veces se puede liar, como sucedió cuando se le preguntó por los juegos de Xbox más esperados para el mes de noviembre, y al preguntarla a continuación, bajo contexto, "cuales los de PC", volvió a repetir de nuevo la lista de juegos de la consola de Microsoft. De hecho, tuve que preguntar de forma detenida para que pasara a enumerar los que llegarán a Windows.
¿Y alucina? Podría decirse que a veces. Pregunté por algunas de las informaciones relacionadas con GTA VI, el próximo juego de Rockstar Games que lanzará el año que viene, y después de dar bastante información, comenzó con los rumores, y aquí, como se podría decir, ni se cortó para comentar incluso que se esperan cameos de personajes públicos como Sylvester Stallone o el mismo Michael Jackson.
Sucedió algo similar con la lista de juegos interesantes de PC para noviembre para que uno de los más esperados sea The Legends of Zelda: Echoes of Wisdom, y reconocer que falló al dar este dato. Es la prueba fehaciente de que todavía le queda bastante trabajo a Google para perfilar ciertos detalles al igual que sucede con el chatbot sin el modo conversacional.
Sus puntos fuertes son que responde bastante rápido, , la gran variedad de voces en español con un total de diez, y en el momento que se incluyan las extensiones podrá dar datos de los archivos que se tengan en el ecosistema al igual que hacer resúmenes de correos. Eso sí, no llega a la experiencia 'coloquial' más exquisita de ChatGPT en su modo de voz.
Ahora queda esperar por más actualizaciones y si se mejorará con una conversación más cercana y amena, aunque a su favor tiene que puede integrarlo directamente en Android al igual que en el resto de sus apps y servicio para acceder de inmediato a la IA de Google.
En definitiva, un modo conversacional que invita a 'charlar' con la IA y servirse de una nueva experiencia bastante grata, aunque todavía queda mucho trabajo por delante para ir perfilando esas alucinaciones o que en algún momento se bloquee con ciertas respuestas y las repita.