No hay ahora mismo un CEO que tenga la capacidad de Satya Nadella para introducir en las mentes de los espectadores lo que significa la inteligencia artificial en cada producto de Microsoft. Si ya sorprendió con las Windows Surface hace dos días con su capacidad innata para la oratoria y para la expresión, hace unas horas anunció una gran ristra de novedades como si de un tsunami digital se tratara.
Si el modo conversacional de GPT-4o dejó inusitados a muchos en la presentación de OpenAI de la semana pasada y Google tuviera a la palabra IA en cada frase pronunciada por sus speakers en el I/O 2024 de hace unos días, Microsoft no iba a ser menos con la introducción de la inteligencia artificial en el extenso catálogo de productos que ofrece a nivel empresarial y de consumo.
Sigue los pasos dados por Google para dibujar nuevas experiencias basadas en la inteligencia artificial a través de los AI Agents, como si fueran una especie de 'minions', o con un asistente que toma las habilidades para la conversación de GPT-4o y así asistir al jugador que da sus primeros pasos en un juego como Minecraft para dejar de lado los tutoriales de toda la vida o esos trucos en cientos de sitios web.
Copilot AI agents fue una de las novedades más llamativas del Microsoft Build 2024. Son como una especie de 'empleados virtuales' que los negocios pueden usar para las tareas más repetitivas y que consumen más tiempo: desde monitorizar correos electrónicos o gestionar tareas automatizadas hasta ayudar a un empleado a iniciarse en sus primeros días en la empresa o en la introducción de datos.
Microsoft, a sabiendas de la respuesta que pueden tener sus AI Agents en el público de a pie, ha aclarado que esta nueva capacidad de Copilot Studio no eliminará puestos de trabajo, solo las partes 'aburridas'; pero el efecto que tendrá una experiencia así supondrá la desaparición de algunos puestos de trabajo centrados justamente en la introducción de datos.
Phi-3 AI, Edge traduciendo vídeos y más
Otra de las importantes novedades fue una versión reducida de los LLMs para usarlo en los dispositivos móviles de forma local: Phi-3 AI. Es un modelo de lenguaje más pequeño, suficientemente compacto para un móvil y con la capacidad de analizar imágenes y leer texto. Desde su blog muestra la importancia de Phi-3 yace en la privacidad y seguridad que puede aportar al procesar la IA desde el dispositivo localmente sin que se tenga que conectar a servidores externos para procesarla. Una visión que comparte Apple para su IA u HONOR con Magic OS 8.0.
Las dos horas de Microsoft Build 2024 dieron para mucho y hay algunas novedades bien llamativas que aparte de ser bien útiles para el entorno profesional y empresarial, también lo son para el usuario final:
- Microsoft Edge ya traduce vídeos de YouTube mientras se ven: traducción en tiempo real con IA para plataformas como YouTube, LinkedIn, Reuters y Coursera. Y sí, ya funciona de español a inglés o viceversa.
- Apps volumétricas para las Meta Quest: Microsoft mostró una vista en 3D de un controlador de la Xbox desde la perspectiva de las Meta Quest 3. Los desarrolladores pueden acceder al previo para crear apps para las gafas de Meta.
- Emojis personalizados para Microsoft Teams: los administradores de las videollamadas pueden seleccionar los emojis que se pueden usar y determinar quienes los pueden añadir.
- Un pequeño y gran PC de 8 pulgadas basado en Snapdragon: un kit para desarrolladores en la forma de un mini PC con el chip Snapdragon X Elite, 32 GB de RAM, 512 GB de memoria SSD y un montón de puertos por 899 dólares; se desconoce si podrá ser comprado por cualquiera.
- El explorador de archivos de Windows con Git: ideal para programadores al integrar Git en el sistema de archivos del explorador y así se puedan mantener el estado del archivo, introducir mensajes o el número de compilación del mismo. E importante: ahora da soporte a la compresión 7-zip y TAR.
Finalmente, y otra de las importantes novedades a nivel de usuario de Windows, según The Verge, es la nueva función avanzada del portapapeles como parte de PowerToys para Windows 11. Lo que hace es convertir el contenido de lo copiado tal como el usuario quiera. Es decir, que al pulsar la tecla de Windows + Mayúsculas + V se podrá elegir entre dar el formato de texto plano, markdown o JSON.
Y lo mejor de todo: se puede usar la inteligencia artificial de OpenAI para otro tipo de capacidades para alterar el texto o realizar un resumen del mismo antes de pegarlo; similar a lo nuevo de Logitech para muchos de sus teclados y ratones para invocar a ChatGPT. Esta novedad ya está disponible en España para su uso, lo único que hay que iniciar sesión con el usuario utilizado para el AIP de OpenAI a nivel de desarrollador (no es el mismo que la suscripción a ChatGPT).