OpenAI responde a la generación de imágenes de Google en Gemini con GPT-image-1.5

OpenAI ha actualizado la función de Imágenes de ChatGPT con un nuevo modelo que prioriza la edición precisa, la preservación de detalles y una mayor velocidad de generación.
24 de diciembre, 2025

Uno de los aspectos en los que más y mejor ha profundizado Google en sus soluciones de IA ha sido, según me cuentan algunas personas que conozco dentro del sector, el de la generación, interpretación, reconocimiento y manipulación de las imágenes con Nano Banana, el cual ha integrado en Gemini.

Sin lugar a dudas, uno de los muchos puntos fuertes de este modelo de lenguaje, y que resuelve un problema que hacía tiempo que venía afectando a los modelos de generación de imágenes, ha sido el del tratamiento del texto, lo que facilita utilizar Nano Banana en la producción de cartelería y, en general, cualquier cosa que requiera de texto.

Para contrarrestar la fama que Google está ganando con este modelo entre la comunidad, OpenAI ha anunciado, y ya incluido en ChatGPT y a través de API, una nueva versión de ChatGPT Imágenes, disponible desde el pasado día 16 bajo el nombre GPT-image-1.5.

Esta actualización se centra en dos necesidades habituales cuando se trabaja con generación de imágenes mediante IA: que el sistema entienda mejor lo que se le pide y que, al aplicar cambios, no “rompa” elementos importantes de la imagen original. En términos prácticos, desde OpenAI señalan que el modelo permite partir de cero o editar fotos ya existentes con mayor fiabilidad, y que la generación puede ser hasta cuatro veces más rápida, lo que reduce la fricción cuando hay que iterar varias versiones.

El nuevo modelo está orientado a cambios puntuales que respeten lo que importa en la imagen, manteniendo consistentes aspectos como la iluminación, la composición o la apariencia de las personas. Así, si un equipo necesita ajustar un detalle (por ejemplo, un elemento del fondo o un cambio de estilo) sin alterar el resto, el sistema busca limitarse a lo solicitado y conservar el resto del contenido de forma estable a través de sucesivas ediciones.

En la parte de edición, OpenAI describe que el modelo soporta operaciones como añadir o eliminar elementos y combinar contenidos, con la intención de que el usuario obtenga el cambio deseado sin perder rasgos que hacen reconocible una imagen. A ello se le suma un foco en transformaciones creativas que incorporan texto y diseño, con una propuesta de uso más guiada para explorar estilos y resultados sin depender necesariamente de redactar prompts largos.

Al igual que hacía Nano Banana, la actualización de ChatGPT Imágenes también refuerza el renderizado de texto dentro de las imágenes, con mejoras en precisión incluso en caracteres pequeños y densos. En la práctica, esto afecta a casos de uso donde el texto es parte central del activo visual (como composiciones tipo infografía, piezas de comunicación o maquetas) y donde los fallos de legibilidad suelen inutilizar el resultado.

OpenAI también añade mejoras de calidad adicionales en dimensiones concretas, como la representación de múltiples caras pequeñas y un aspecto más natural en determinadas escenas. En la sección de evaluación y límites, la compañía indica que ha vuelto a probar ejemplos del lanzamiento inicial para medir el rendimiento y que, aunque los resultados han mejorado, no son perfectos. Como referencia adicional, menciona que en un ejemplo con contenido científico siguen apareciendo inexactitudes, si bien el modelo acierta alrededor del 70% y evita recortes prematuros en el gráfico.

Además de actualizar el modelo de generación de imágenes de ChatGPT a esta última versión, OpenAI también ha actualizado la interfaz del chatbot para que incluya un apartado dedicado exclusivamente a imágenes, accesible a través de la barra lateral tanto en la aplicación móvil como en su interfaz web.

Desde la firma destacan que GPT-image-1.5 en la API hereda las mismas mejoras y pone el acento en una preservación más consistente de logotipos y elementos visuales de marca, además de escenarios como la generación de catálogos de producto (variantes, escenas y ángulos) a partir de una única imagen fuente.

En términos de coste, OpenAI indica que las imágenes de entrada y salida son un 20% más baratas en GPT Image 1.5 que en GPT Image 1, con la idea de permitir más iteraciones manteniendo el presupuesto.