La apuesta de Google por la IA en los últimos meses ha quedado muy clara. La empresa dirigida por Sundar Pichai se ha dado cuenta de que no puede quedarse atrás en esta nueva carrera tecnológica, porque corre el riesgo de que le pase lo mismo que a Microsoft con los sistemas operativos móviles. Y Satya Nadella ya ha demostrado que, en esta ocasión, no van a equivocarse de nuevo.
De hecho, Google ha sido la que ha creado los sistemas fundacionales de gran parte de los modelos grandes de lenguaje que están desarrollando las principales empresas del mundo. Hasta Apple parece que se meterá en esta carrera en este 2024. Pero la batalla del relato la están ganando claramente Open AI con ChatGPT y empresas como Midjourney, que se han convertido en la referencia en la creación de imágenes, aunque hay alternativas muy buenas como Leonardo AI o Dall-E.
El mayor movimiento de Google ha sido el lanzamiento de Gemini, un modelo de lenguaje muy avanzado con diferentes versiones, que se adaptan a los distintos requerimientos y dispositivos. Su lanzamiento es tan importante que incluso han decidido cambiarle el nombre a Bard, la interfaz de texto que lo usaba, para ponerlo todo bajo una misma marca.
Hasta el mismísimo asistente de Google está amenazado por Gemini. Google ya ha empezado a sustituirlo en algunos mercados, como el estadounidense, pero también en otros países de latinoamérica. A Europa no ha llegado aún por cuestiones de privacidad, pero ya se puede probar instalando el APK, cosa que hemos hecho.
Yo soy un usuario extraordinariamente intensivo del asistente de Google. Tengo en mi casa no menos de 10 altavoces inteligentes con los que interactúo a diario. Poner temporizadores, recordatorios, controlar las luces o encender la TV y cambiar de canal son acciones que ejecuto constantemente. Así pues, he quiero probar cómo es el día a día con Gemini, teniendo en cuenta que algunas de esas acciones nos las podré realizar. Por un lado, porque aún no se puede usar el nuevo asistente para controlar la domótica al 100%, por otro, Gemini no está disponible en altavoces, sólo en smartphones.
Lo que sí puede hacer es sustituir el uso de ChatGPT por voz, algo que he usado en los últimos días y que, como ya conté, es más el sustituto de una conversación con una amigo que el reemplazo de Alexa o del propio asistente de Google. Y por sustituir me refiero al uso y a la conversación, no a que pueda hablar con él, ya que por ahora Gemini no permite esa función.
Instalación de Gemini
La instalación de esta aplicación es sencilla, ya que solo necesitamos el APK directamente descargado de alguna página de confianza. Una vez en el móvil hay que instalarlo de manera manual, y se podrá ejecutar. Eso sí, se requiere un móvil con Android 14.
Una vez instalado será capaz de sustituir al asistente de Google, tanto en el acceso directo como en los gestos de activación. Esto puede ser un problema si se quiere dejar instalado ya que, como vamos a ver, aún no es capaz de hacer todo lo que el asistente sí permite. No obstante, en los ajustes de Gemini se puede cambair de nuevo al sistente de Google sin tener que borrar la aplicación.
Tareas diarias
Lo primero que he querido comprobar es hasta qué punto Gemini es capaz de controlar mi casa y hacer por mí lo mismo que el asistente. Al intentar encender y apagar algunos dispositivos me he encontrado con la sorpresa de que sí que tiene integración con Google Home, pero a un nivel básico. Es decir, es capaz de controlar dispositivos vinculados como luces o calefactores.
Lo que no puede es activar las rutinas, por lo que comandos personalizados como el control del televisor no funcionan. Esto limita bastante el uso diario en mi caso, aunque quizás a otras personas no les moleste. Tampoco es capaz de crear recordatorios que se vinculen con el calendario de Google, algo básico para mí. Sí que es capaz de abrir una aplicación y puede abrir la cámara cuando le pides que haga un selfie, pero no activa el disparador.
Tampoco es capaz de usar Google Maps para calcular una ruta y lanzarla a la aplicación, por lo que es necesario abrir la app si esta es una función que se suela usar. Además de estos inconvenientes, hay tareas que sí están activas en los países en los que se ha activado oficialmente, pero no en España. Otra de las funciones que no tiene disponible es la integración con aplicaciones externas de streaming de música o vídeo, algo que es clave quizás no en el móvil, pero sí en los altavoces, cuando Gemini llegue a ellos.
Gemini y las imágenes
Una de las carencias que se tiene usando Gemini en España es que no se puede usar la creación de imágenes, una función de la que es capaz esta IA pero que está limitada por geolocalización a los países en los que el servicio está presente de forma oficial. Con un VPN y usando el idioma inglés sí que se podría usar.
Lo que sí que se puede es usar la cámara para hacer una foto a algo y realizar una pregunta relacionada. Por ejemplo, se puede hacer una foto a un dispositivo y preguntarle por su nombre. Lo que no se puede es hacer una foto a un personaje famoso y preguntar directamente por su edad. Gemini sigue restringido en el uso de imágenes de personas. Sí que se puede usar la misma estructura para elementos, como hacer una foto de un edificio y preguntar dónde está, o en qué año se construyó.
Eso sí, es curioso cómo pese a entender perfectamente el español y responder en ese idioma normalmente, en ocasiones lanza una respuesta en inglés. En este tipo de cosas es donde se ve que el servicio aún está en beta y que tiene margen de mejora, algo del todo normal.
Otras funciones
Al contrario que otros chatbots, por ahora todas las respuestas de Gemini son en texto, no en audio. Eso sí, se pueden pedir consultas, datos y demás y pedir que lo haga en diversos estilos. Por ejemplo, hemos pedido datos curiosos sobre Sevilla, y luego hemos pedido que se muestren de una forma mucho más seria y, más tarde, de una manera extremadamente informal. En todos los casos lo ha hecho bien.
Donde no ha brillado es en la opción de resolver ecuaciones matemáticas. Incluso las sencillas, aunque las entiende, no acaba de plasmarlas bien a la hora de presentar resultados. Y es raro porque el Modo Deberes de Google Lens sí que permite resolverlas de forma sencilla y muy rápida.
Parece que la integración de Gemini con el resto de funciones del ecosistema de Google aún está verde, motivo por el cual no es buena idea sustituir al asistente, o al menos no siempre. Con todo, se nota mucho el salto de calidad desde el asistente de toda la vida a esta nueva versión potenciada por inteligencia artificial. Si Google no comete ingún error de bulto, Gemini podría convertirse en lo que siempre hemos querido de un asistente de voz, uno que esté en el móvil, pero también en el coche, el reloj, los auriculares, el ordenador y la casa.