Después de añadir las marcas de agua a DALL-E 3 en febrero, OpenAI ha anunciado otra sorprendente novedad a la generación de imágenes con inteligencia artificial: un editor para modificar al gusto del usuario el prompt generado. De esta manera, se puede decir adiós a estar repitiendo una y otra vez distintos prompts para lograr el resultado deseado.
La generación de imágenes con IA se basa en introducir una serie de palabras a lo que se denomina como prompts. Si el resultado final no es el que se busca, se ha de probar a introducir otras palabras para así afinar en la composición, técnica o estilo del diseño buscado.
Pero ahora todo cambia con el anuncio de OpenAI que incluye un editor de imágenes para así modificar cualquier área. No es que sea algo totalmente nuevo, ya que Photoshop permite marcar un área para que se use la IA de Adobe para describir lo que se quiera generar en la misma.
Lo importante aquí es que ChatGPT puede ayudar a definir las imágenes de DALL-E 3 con un editor de imágenes. Después de que DALL-E 3 haya generado la imagen, se puede usar una herramienta para modificarlas partes deseadas. Justo después se utiliza ChatGPT para 'decirle' que se quiere generar en esa área.
En el ejemplo dado por OpenAI se puede ver la generación de un perro y con el uso de la herramienta se marcan las dos zonas donde irán dos lacitos. Se usa ChatGPT para indicarle que añada lazos al área marcada. Se espera unos segundos, y se generará una nueva imagen con DALL-E 3 con los lacitos.
A diferencia de Photoshop con sus funciones de IA, la edición de imagen o relleno generativo de OpenAI no cuenta con las variantes que sí ofrece la herramienta de Adobe. Es decir, que una vez que añade los lacitos, se podrían usar hasta tres variantes para que alguna encaje mejor.
Eso sí, de momento esta nueva funcionalidad de ChatGPT con DALL-E 3 solamente está disponible a través de la suscripción ChatGPT Plus, y se espera que en algún momento ofrezca más opciones como la posibilidad de cambiar la expresión facial de una persona o borre partes de una imagen generada.