GPT Image 1.5
GPT Image 1.5 se basa en GPT Image 1 y mejora la fidelidad visual, la alineación con los prompts y la estabilidad de los resultados en escenas complejas y distintos estilos.
Entrada
Prompt
Sube hasta 16 imágenes (Opcional)



subir
Relación de aspecto
Calidad de salida
Resultado
Ver historial| Modelo y Modalidad | Créditos / Gen | Nuestro precio (USD) | Precio oficial (USD) | DESCUENTO |
|---|---|---|---|---|
gpt image 1.5, t2i, i2i, medium imageOpenAI | 4 per image | $0.0179 | $0.034 | - 47% |
gpt image 1.5, t2i, i2i, high imageOpenAI | 22 per image | $0.0982 | $0.133 | - 26% |
Generación de imágenes de alta calidad y edición precisa con un fuerte control mediante prompts.

Prompt:
Crea una imagen infográfica de [LANDMARK], combinando una fotografía real del lugar con anotaciones técnicas y diagramas superpuestos al estilo de un plano. Incluye el título “[LANDMARK]” en un recuadro con estilo dibujado a mano en una esquina. Añade bocetos en estilo tiza blanca que muestren los elementos clave.
GPT Image 1.5 ofrece generación de imágenes fiable y edición de alta precisión con una sólida comprensión de prompts, diseñada para aplicaciones del mundo real.
Genera imágenes detalladas y visualmente consistentes a partir de prompts de texto, adecuadas para visuales de productos, conceptos creativos y borradores de diseño.
Edita áreas específicas de una imagen mediante instrucciones de texto, manteniendo la composición, la iluminación y la coherencia visual original.
Sigue con precisión prompts complejos, permitiendo resultados controlados en estilos, objetos, diseños y detalles visuales.
Admite tanto la generación de imágenes desde texto como la transformación de imágenes existentes, ofreciendo flujos de trabajo creativos y de edición flexibles.
Mantiene la coherencia visual a lo largo de ediciones e iteraciones, lo que lo hace adecuado para flujos de trabajo de imágenes en múltiples pasos.
Diseñada para una integración sencilla mediante API, con rendimiento estable y resultados predecibles para productos orientados a desarrolladores.
Diseñada para escenarios que requieren control preciso, edición detallada y resultados visuales consistentes.
GPT Image 1.5 es ideal para aplicaciones en las que los usuarios suben imágenes y solicitan cambios específicos mediante lenguaje natural. Ejemplos típicos incluyen cambiar la ropa, ajustar detalles de apariencia, modificar fondos o añadir y eliminar objetos. El modelo sigue instrucciones detalladas mientras conserva los rasgos faciales, la iluminación y la composición, lo que lo hace ideal para herramientas de edición de fotos orientadas al consumidor y plataformas UGC basadas en interacciones por texto.

Para flujos de trabajo que requieren múltiples rondas de edición sobre la misma imagen, GPT Image 1.5 mantiene una fuerte consistencia visual entre iteraciones. Los desarrolladores pueden aplicar instrucciones secuenciales, como refinar estilos, ajustar elementos o corregir detalles, sin empezar desde cero. Esto lo hace adecuado para flujos de trabajo profesionales de imagen, herramientas de diseño y aplicaciones donde la refinación paso a paso es esencial.

GPT Image 1.5 destaca en la generación de imágenes que contienen texto legible y preciso, como etiquetas, componentes de UI, señalización o empaques de productos. Esta capacidad es especialmente valiosa para crear mockups de UI, pantallas de onboarding, banners de marketing y visuales de productos donde la claridad del texto y la precisión del diseño son fundamentales. En comparación con modelos de imagen de propósito general, ofrece una colocación de texto y legibilidad más fiables.

GPT Image 1.5 mejora a GPT Image 1 con mayor resolución, generación más rápida, mayor precisión de edición y una iteración en múltiples pasos más fiable para aplicaciones listas para producción.
| Característica | GPT Image 1 | GPT Image 1.5 |
|---|---|---|
Resolución máxima | 512×512 | 1024×1024 |
Velocidad de generación | ~6–8 s por 512×512 | ~3–4 s por 1024×1024 |
Cumplimiento del prompt | Medio | Alto – sigue con precisión prompts complejos |
Nivel de edición | Ediciones globales básicas | Ediciones locales de alta precisión con soporte por instrucciones |
Iteración en múltiples pasos | Baja consistencia | Alta – conserva estilo, iluminación y composición en múltiples ediciones |
Renderizado de texto en imágenes | Frecuentemente distorsionado | Claro y legible, incluso en escenas complejas |
Tipos de entrada compatibles | Solo texto | Texto + Imagen para ediciones imagen a imagen |
Eficiencia de costos de la API | Moderada | Menor costo por imagen con respuestas más rápidas |
Estabilidad del estilo de salida | Media | Alta – estilo consistente en los resultados |