Mucho ha cambiado en la industria de la IA en los cuatro meses transcurridos desde que OpenAI lanzó ChatGPT Image 1.5. Hemos visto una carrera acalorada para construir herramientas de agentes, un acuerdo sin precedentes con el Pentágono y una interminable decadencia de la IA.
Ahora, OpenAI está de vuelta en el juego de los medios generativos. La compañía anunció el martes que lanzará ChatGPT Images 2, su modelo de imagen de próxima generación.
ChatGPT Image 2 está diseñado para crear diseños con mucho texto, como este anuncio de matcha y una portada de revista falsa.
Puede parecer extraño que OpenAI esté lanzando un nuevo modelo de imagen apenas un mes después de anunciar la discontinuación de su aplicación de video Sora AI, alguna vez viral, para centrarse en la creación de “productos principales” listos para la empresa. Pero por cómo se construyó el nuevo modelo queda claro que OpenAI no se echa atrás en ese objetivo.
ChatGPT Image 2 está diseñado para crear imágenes con mucho texto, incluidas infografías, carteles científicos, guías de estudio y materiales de marketing. Se acabaron los días de los vídeos extraños de Sora y los memes inspirados en Studio Ghibli.
Ahora, la empresa está desarrollando IA que puede realizar lo que llama “trabajo creativo económicamente valioso”.
“La apertura y los casos de uso de la inteligencia visual se han expandido enormemente, y creemos que esto es fundamental para la visión de ChatGPT de desarrollar su propio asistente personal, porque su asistente creativo es una gran parte de quién es usted como persona”, dijo Adele Lee, jefa de producto de ChatGPT Image, a los periodistas en una conferencia de prensa.
(Divulgación: Jeff Davis, la empresa matriz de CNET, presentó una demanda contra OpenAI en abril de 2025, alegando que violó los derechos de autor de Jeff Davis al entrenar y operar sus sistemas de IA).
En estos ejemplos, puede ver lo bueno que es ChatGPT, Figura 2, a la hora de representar texto legible.
OpenAI persigue el sueño de una ventanilla única para todo lo relacionado con la IA, una súper aplicación creada a partir de su plataforma Codex. ChatGPT Images 2 trae la parte creativa de ese rompecabezas.
El nuevo modelo mejora naturalmente la tipografía, la iconografía y la composición para crear imágenes de IA más profesionales. Puede generar texto en varios idiomas. Los modelos de imágenes de IA han tenido grandes dificultades para producir texto legible y realistamente preciso. ChatGPT Images 2 es el mejor modelo de OpenAI hasta el momento. Google mejoró previamente su representación de texto con esto Nano Plátano ProPero incluso los modelos “mejores de los mejores” tienen problemas con la precisión.
ChatGPT Image 2 ahora se está implementando para todos los usuarios. Su límite de generación depende de su plan: cuanto más pague, más imágenes de IA podrá generar.
Los desarrolladores que utilizan la API Modelo A pueden crear imágenes en resoluciones 2K y 4K, aunque estas resoluciones más altas todavía están en versión beta y pueden resultar incómodas. Los usuarios pagos pueden crear imágenes utilizando modelos de pensamiento y razonamiento, que les ayudan a buscar información en la web, compilarla en un diseño legible y verificar su trabajo.
“Modelo de imagen” no parece el término correcto para ChatGPT Images 2, aunque es técnicamente correcto. ChatGPT no captura el magnífico surrealismo de las imágenes de IA como Midjourney, ni ofrece ni de lejos las herramientas de edición de Adobe Firefly.
Pero está dirigido a un grupo de usuarios en el medio del espectro de entusiastas artísticos a mitad de camino y creadores profesionales de Adobe: aquellos que necesitan crear contenido atractivo.
Al igual que el Cloud Design recién lanzado de Anthropic, ChatGPT Image 2 de OpenAI está dirigido a profesionales que trabajan. Los profesores pueden utilizarlo para crear guías de estudio y planes de lecciones ilustrados. Los gerentes de marketing pueden crear publicaciones en redes sociales y recursos visuales.
Puede crear hasta ocho imágenes a partir de un único mensaje, como un informe de tres páginas, manteniendo la coherencia visual en todas ellas.
Puede hacer un informe extenso con la imagen 2 de chatgpt, todas las páginas coincidentes.
Esta es la receta de pastel de lima generada por IA en la segunda mitad. Tenga en cuenta la consistencia visual.
Una desventaja es que si quieres modificar una imagen de IA, aún tienes que recrearla. Con diseños con más texto, es más probable que esto sea necesario, para que puedas ejecutar tus créditos más rápido. OpenAI dice que se ha centrado en mantener un flujo de edición iterativo y basado en indicaciones para que sea fácil de usar.
Los mecanismos de seguridad de OpenAI no han cambiado significativamente desde su último modelo de imagen. Todavía incluye metadatos a través del estándar C2PA, por lo que se puede identificar la fuente de las imágenes de IA. Las imágenes ofensivas e ilegales todavía están prohibidas en la política de OpenAI, una medida importante que las empresas de IA deben implementar de manera efectiva, como lo ejemplifican los recientes deepfakes generados por IA y las imágenes íntimas no consensuadas.











