Cada vez están más consolidades las capacidades de generación de imágenes con IA, permitiendo a los usuarios crear contenido visual complejo a partir de descripciones textuales. Esta evolución técnica tiene a ChatGPT y Gemini en una competencia directa por ofrecer resultados que combinan precisión técnica, estilo artístico y realismo fotográfico, integrando herramientas que van más allá de la simple creación desde cero.

En términos de accesibilidad, ambos servicios mantienen estructuras de costos similares en sus niveles de suscripción para usuarios individuales. Los planes de pago más baratos, que rondan los ocho dólares mensuales, permiten expandir significativamente la capacidad de generación diaria en comparación con las versiones gratuitas, alcanzando un volumen estimado de entre 20 y 30 imágenes por jornada, dependiendo de la intensidad de uso y la demanda de procesamiento de los servidores.

El desempeño en la creación de estructuras abstractas y complejas revela una paridad técnica considerable entre ambos sistemas al procesar conceptos físicos difíciles. Al ejecutar solicitudes que involucran pigmentos líquidos, gravedades cero y estructuras fractales imposibles, las herramientas demuestran una capacidad avanzada para interpretar descripciones abstractas y traducirlas en composiciones visuales con una alta fidelidad cromática y detalle en las texturas.

Personajes con derechos de autor en imágenes con IA hechas con Gemini y ChatGPT

he-man-en-varios-estilos-ejemplo-de-imagenes-con-ia — He-Man en varios estilos, ejemplo claro de lo que se puede hacer en materia de imágenes con IA

El fotorrealismo es una de las áreas de mayor desarrollo técnico, donde se evalúa la capacidad de renderizar rasgos humanos, vello facial y efectos de iluminación ambiental con precisión quirúrgica. En retratos de sujetos con texturas de piel complejas o condiciones de luz específicas, como la luz dorada de un atardecer, ChatGPT y Gemini logran resultados hiperrealistas que reducen la brecha entre una imagen sintética y una fotografía convencional capturada por una cámara profesional.

En el ámbito de la narrativa visual, la generación de cómics y secuencias de viñetas se presenta como una funcionalidad ya integrada y operativa. Los sistemas permiten estructurar páginas completas a partir de temas generales, gestionando la distribución de cuadros y la coherencia visual básica, lo que facilita la creación de guiones gráficos y conceptos para narraciones gráficas sin necesidad de intervención manual en el dibujo.

El manejo de propiedad intelectual y personajes con derechos de autor presenta matices operativos dependiendo del modelo utilizado a la hora de generar imágenes con IA. Existen variaciones en las restricciones de seguridad que aplica cada plataforma al solicitar personajes icónicos de la cultura popular, como el anime o el cine. Mientras algunos sistemas ofrecen una representación más fiel y detallada de la estética original, otros priorizan una interpretación estilizada o con texturas alternativas para cumplir con sus políticas de contenido.

La manipulación de imágenes existentes representa otra frontera relevante, incluyendo la transformación de fotografías caseras en imágenes de producto de calidad profesional y el uso de herramientas de edición selectiva. Mediante marcadores o pinceles, es posible indicar áreas específicas para añadir o modificar elementos, además de fusionar rasgos faciales reales con entornos generados por IA, con niveles de éxito variables en la preservación de la identidad visual del sujeto original.

Si te interesa el tema de la generación de imágenes con IA, te invito a ver el video que hice al respecto para mi canal de YouTube, donde podrás observar detalladamente las comparaciones visuales descritas previamente y los resultados obtenidos en las pruebas que hice entre ambas plataformas.

IMÁGENES CON IA: UNA COMPARACIÓN ENTRE GEMINI Y CHATGPT

Mario Cuche