Desde que empezó la revolución de la Inteligencia Artificial generativa, uno de los puntos débiles era la generación de imágenes consistentes con IA. En YouTube pueden encontrarse cientos de tutoriales que enseñan trucos para lograr la consistencia en personajes generados con IA.

Ahora todos esos tutoriales quedaron obsoletos, gracias a una herramienta que me dejó completamente sorprendido: Flux Kontext. En el video que preparé al respecto para mi canal (compartido al final de este texto), muestro cómo esta plataforma puede tomar una imagen cualquiera, ya sea generada con DALL-E, Midjourney o incluso una simple foto sacada con mi webcam, y producir variaciones impresionantemente coherentes del mismo personaje en distintos contextos.

Partí probando con imágenes generadas por otras IAs. Tomé una imagen hecha en DALL-E y le pedí a Flux que generara nuevas perspectivas del mismo personaje. Los resultados fueron muy consistentes. Luego pasé a una imagen compleja de Midjourney y nuevamente, Flux la replicó en distintos escenarios sin perder detalle. Lo más impactante fue ver cómo mantiene rasgos clave del personaje, incluso al cambiar completamente el entorno.

También experimenté con fotos reales. Usé una foto mía, tomada con la cámara de mi computador, y Flux fue capaz de colocarme en escenarios como un auto, una playa o un paisaje nevado. A pesar de la baja calidad de la foto original, la IA logró recrear detalles sorprendentes de mi rostro y mi ropa, integrándome a ambientes que parecían reales.

Imágenes consistentes con IA usando Flux Kontext: Muy bueno, con espacio para mejorar

Eso sí, no todo fue perfecto. Noté que al darle instrucciones en español, los resultados no siempre eran los esperados. Por ejemplo, al pedir “personaje dentro de una nave espacial”, la imagen mostraba al personaje pero sin la nave. En cambio, al traducir la instrucción al inglés, el resultado fue excelente. Esto me hizo pensar que, por ahora, esta herramienta interpreta mucho mejor los comandos en inglés.

Una de mis pruebas favoritas fue con un personaje generado por Midjourney, al que bauticé como el “chancho mutante”. Le pedí a Flux que mostrara al personaje comiendo pizza, andando en skate, abrazando un oso y muchas cosas más. En la mayoría de los casos, la IA logró mantener el estilo, la forma y los detalles del personaje con gran fidelidad.

También probé con otro personaje, una especie de gorila con traje. Le pedí imágenes desde distintos ángulos y fue capaz de mostrarlo de espaldas, en movimiento y en nuevos escenarios. La consistencia del diseño fue impresionante, aunque en una ocasión se activó la moderación de contenido sin razón clara.

La textura, iluminación y composición de las imágenes generadas son otro punto a destacar. En una prueba me vestí digitalmente con un traje futurista y el resultado parecía sacado de una película. Los detalles en la tela, las sombras y la luz daban una apariencia casi fotográfica. Realmente parece magia.

Además, muestro paso a paso cómo ingresar a Flux Playground, aprovechar los créditos gratuitos y configurar los parámetros para obtener imágenes personalizadas. Es un proceso sencillo, y si se hace en inglés, los resultados son muy superiores. En el video también explico cómo controlar el gasto de créditos y maximizar su uso.

Una prueba interesante fue pedir una pintura al óleo de una foto mía. Al pedirlo en español, Flux no lo logró; en inglés, sí lo hizo aunque el resultado fue un poco menos favorecedor. Aun así, fue asombroso ver cómo interpretó el estilo pictórico.

Flux Kontext no es perfecta, pero sin duda es una de las herramientas más avanzadas que he probado para generar imágenes consistentes. Si te interesa el mundo de la IA visual, este video te va a fascinar.

Recommended Posts
0
automatizacion-en-desarrollo-de-softwareia-explicable-y-transparente