Justo hace un par de días llegó la noticia sobre el retraso de Gemini, el ChatGPT de Google, que presumiblemente su anuncio iba a ser para esta semana, pero parece que en los cuarteles generales de Google se han puesto las pilas para anunciarlo hoy mismo. A diferencia de Bard, su chatbot, Gemini es el modelo de IA más grande que se usará en un gran ranco de servicios del gigante tecnológico.
Este año ChatGPT ha pasado a ser algo común para millones de personas al generar una expectación máxima ante la experiencia que ya otorga y las próximas evoluciones que recibirá para que el resto de gigantes tecnológicos fueran a las prisas para presentar desarrollos, o simplemente el anuncio de una próxima llegada de su alternativa; Amazon ya tiene todo listo para que el año que viene desembarque Alexa con IA generativa.
Gemini es anunciado como un modelo de IA que se usará tanto por desarrolladores como por empresas al igual que por los consumidores finales que podrán disfrutar de su experiencia a través del catálogo de Google. Gemini es el fruto del trabajo colaborativo llevado a cabo por múltiples equipos en Google; entre los que se incluyen a DeepMind y Google Research. Google ha mostrado los tres distintos tamaños o versiones de Gemini:
- Gemini Nano: el modelo más eficiente para ejecutar tareas desde el mismo dispositivo; lo que sería on-device.
- Gemini Pro: el mejor modelo para escalar a una amplia gama de tareas.
- Gemini Ultra: el modelo más potente y de mayor tamaño que se encarga de tareas de mayor complejidad a todos los niveles.
Pero antes de meterse de lleno en las experiencias o en las soluciones donde va a ser la base para una gran variedad de funcionalidades, hay que saber que Gemini es un modelo de IA multimodal capaz de generalizar, comprender, operar y combinar al máximo nivel según el tipo de información con la que juegue; como puede ser texto, imágenes, audio, vídeo y lenguaje de código.
Gemini parte de la base de ser un modelo bien flexible al ser multimodal y con una diferencia clave, ya que hasta ahora este tipo de modelos implicaban un entrenamiento de sus componentes de forma separada para distintas modalidades u objetivos. El problema es que estos modelos tienen dificultades con un razonamiento conceptual y complejo.
He aquí su principal virtud o diferencia clave, y es que se ha diseñado a Gemini para que fuera multimodal de forma nativa, lo que permite que este modelo de IA sea capaz de comprender y razonar de forma ideal frente a todo tipo de entradas. Por ejemplo, el modelo Gemini Ultra es capaz de superar los resultados actuales de última generación en 30 de los 32 puntos de referencia académicos; Google ofrece más información desde este documento técnico.
¿Dónde va a estar disponible Gemini?
Gemini es un lenguaje que será usado por los usuarios comunes, empresas y desarrolladores, así que sus aplicaciones varían enormemente de unos a otros. Google en su anuncio también ha compartido dónde se verá integrado a Gemini. Justamente para consumidores:
- En Bard con una versión optimizada de Gemini Pro: desde hoy mismo en inglés en más de 170 países y regiones; una actualización de las grandes para Bard desde que fuera lanzado este mismo año.
- Gemini en el Pixel 8 Pro: permitirá elevar la experiencia del móvil con funciones como Resumir en la Grabadora y Respuesta Inteligente en Gboard, el teclado de Google.
- Gemini en el buscador de Google, Ads, Chrome, Duet AI y otros servicios para los próximos meses.
Si OpenAI ha golpeado fuerte sobre la mesa al ofrecer a ChatGPT a empresas y desarrolladores (incluso ahora con su suscripción premium se puede crear uno mismo un chatbot propio), el objetivo de Google es presentar otra solución que encaje en las necesidades de empresas y compañías. Así es:
- Desarrolladores y empresas tendrán la capacidad de acceder a Gemini Pro a partir del 13 de diciembre.
- Google AI Studio es la herramienta gratuita web para desarrolladores: permitirá crear prototipos y lanzar apps con clave API.
- Vertex AI es la plataforma de inteligencia artificial para el control de datos y funciones adicionales de Google Cloud para seguridad empresarial, privacidad y gobernanza y cumplimiento de datos.
- Los desarrolladores de Android podrán crear con Gemini Nano, el modelo más eficiente para dispositivos móviles. Aquí entra en juego AICore, la app que hace poco fue lanzada en el Pixel 8 Pro por primera vez, disponible en Android 14 en este dispositivo móvil mencionado.
Finalmente, Gemini Ultra llegará a través del programa de acceso anticipado para desarrolladores, socios y empresas seleccionadas; principalmente para recibir el feedback necesario para mejorar la solución. Bard Advanced, la nueva experiencia de IA de vanguardia, ofrecerá acceso a los mejores modelos y capacidades de Google con el estreno de Gemini Ultra.