Olvídate de Midjourney: Stable Diffusion, su principal rival para crear imágenes, se actualiza a lo grande
La mejor inteligencia artificial de código abierto para generar imágenes, Stable Difussion, ha lanzado su versión XL y ahora es mucho mejor.
23 junio, 2023 12:19Internet lleva siendo algo mainstream muchos años ya, décadas incluso. Sin embargo, en ese tiempo se ha visto cómo el uso de la misma, las tendencias, han ido cambiando. La era de los blogs dio paso a la era de las redes sociales, y esta empieza su declive (aunque en España redes como Instagram sigan en pleno apogeo) a la par que otra emerge, la era de la inteligencia artificial. Cada vez hay más servicios que usan sistemas de este tipo para ayudar a crear textos, imágenes, ejecutar procesos de forma más rápida...
Aunque ChatGPT ha sido el responsable de dar a conocer este tipo de aplicaciones de forma masiva, las IAs de creación de imágenes no se han quedado atrás, con dos opciones que destacaron en el inicio, Stable Diffusion y Midjourney. Más tarde se han lanzado otras como LeonardoAi o CatBirdAI. El consenso global era que Midjourney era la mejor de todas, pero hace unos meses cambió su política, impidiendo el uso de forma gratuita, ni siquiera de forma limitada.
Ahora la referencia en la creación de imágenes de código abierto, Stable Diffusion, ha lanzado una nueva versión que mejora notablemente la creación de imágenes, y se pone a la par de otras alternativas. La versión actual es la SDXL 0.9, una versión que llevaba en beta desde abril y que es la antesala de la versión 1.0 que llegará en julio.
La nueva versión SDXL ha mejorado notablemente la calidad de las imágenes (aunque en ocasiones cosas como las manos siguen mostrando problemas). Además de esto hemos visto cómo se han posibilitado otras opciones, como la creación de una imagen a partir de otra imagen, el poder reconstruir partes faltantes de una imagen o construir una extensión de una imagen existente.
Cómo se puede probar
Lo mejor de Stable Diffusion es que al ser un sistema de código abierto cualquiera puede usarla en sus proyectos, permitiendo una adopción masiva. Esto se podrá hacer con la API, que estará disponible en los próximos días, pero ya se puede usar en Clipdrop, un servicio gratuito que permite usarla incluso sin registrarte, pero que invita a ello, sin pagar, para poder usarla de forma más cómoda. Eso sí, no es especialmente rápido.
Lo único que hay que hacer es escribir en el cuadro de texto lo que queremos que aparezca en la imagen y, de forma opcional, elegir un estilo. Esto hará que la imagen tenga una estética concreta, desde un look fotorealístico a otro que imite el dibujo e incluso el origami. El resultado serán cuatro imágenes que podremos abrir y generar en mayor calidad si las queremos descargar.
También es posible instalarla en un ordenador para crear imágenes de forma totalmente autónoma. En ese caso es necesario cumplir con ciertos requisitos. Será obligatorio tener un ordenador con sistema operativo Windows 10 u 11, o Linux, 16 GB de RAM, una tarjeta gráfica Nvidia GeForce RTX 20 (equivalente o superior) equipada con un mínimo de 8 GB de VRAM. Los usuarios de Linux también pueden usar una tarjeta AMD compatible con 16 GB de VRAM.
A finales de julio Stability AI, la empresa detrás de Stable Diffusion, ha confirmado la llegada de la versión 1.0, aunque no ha avanzado las mejoras que podría tener. La propia versión beta de SDXL0.9 ha avanzado mucho en los últimos dos meses por lo que dentro de otros dos, cuando se libere la versión 1.0 (posiblemente también en beta) veremos un nuevo gran salto de calidad.