Cuando Open AI anunció Chat GPT, que está disponible en España, como un servicio online gratuito puso la primera piedra en una nueva economía en la que la IA tendría mucha relevancia. Empresas como Microsoft o Google tuvieron que responder, dado que ambas estaban invirtiendo considerables cantidades de dinero en inteligencia artificial. Microsoft lo hizo invirtiendo directamente en Open AI. Google lo hizo de otro modo.
Pese a que la empresa dirigida por Sundar Pichai se ha autodefinido como una empresa de IA desde hace años, su excesiva cautela la ha hecho posicionarse como un jugador de segundo nivel en esta carrera. De ahí que en los últimos meses hayamos visto numerosos avances y declaraciones, desde el lanzamiento de Bard, la inteligencia de generación de textos de la empresa, hasta la presentación de Palm2. Pero todos esos movimientos seguían por detrás de sus rivales.
El siguiente paso importante será sin duda Gemini, el sistema multimodal de texto e imagen que será la alternativa real a Chat GPT-4 y en el que incluso está trabajando el cofundador de Google Sergey Brin. Y parece que su anuncio está muy cerca, quizás en el lanzamiento de los Pixel 8 y 8 Pro.
Gemini es multimodal
La principal mejora de Gemini frente a los desarrollos anteriores de Google es que es multimodal. Esto quiere decir que es capaz de entender no sólo texto, sino también imágenes, código de programación... y podrá responder usando esos mismos conceptos. Este salto adelante pondría Google, en teoría, a la altura de ChatGPT y de Microsoft, que está integrando en todos sus servicios esta IA.
Según The Information Google habría dado acceso a su nueva IA a varios desarrolladores para mejorar ciertos detalles, dejando claro que su lanzamiento podría ser en breve. Eso sí, al parecer no es el modelo completo de lenguaje el que han dejado probar, sino una versión de buen tamaño, pero reducida.
De hecho, Google tiene cierta prisa porque necesita revertir el relato de que van detrás en esta carrera. También permite usar la API de esta AI para ser integrada en diferentes aplicaciones y servicios, algo que supondrá una gran fuente de ingresos para Google si busca monetizar instantáneamente su creación.
Por el momento no se sabe si la presentación tendrá lugar en unas semanas o más tarde ni si se presentará como una evolución de Google Bard o como algo mayor, como una integración en Android, lo que podría suponer todo un revulsivo en el actualmente estático sector de los sistemas operativos móviles.