Il 16 dicembre 2025, OpenAI ha lanciato GPT Image 1.5, il nuovo modello di generazione immagini che promette prestazioni fino a quattro volte più veloci rispetto alla versione precedente (GPT Image 1). A differenza delle generazioni precedenti, dove modificare un dettaglio poteva alterare l’intera composizione, GPT Image 1.5 interviene in modo chirurgico; è possibile aggiungere o rimuovere elementi, cambiare stili e modificare testo all’interno delle immagini, mantenendo coerenza nell’illuminazione, nelle proporzioni e nei volti.


Il modello mostra miglioramenti tangibili anche nel rendering del testo; tradizionale tallone d’Achille dei generatori AI, ora capace di produrre scritte leggibili e integrate in infografiche.
La release arriva in un momento di competizione intensa con Google, che ha recentemente guadagnato attenzione con i modelli Gemini 3 Pro e Nano Banana Pro. Il modello è disponibile globalmente per tutti gli account ChatGPT (anche gratuiti) e attraverso l’API sotto il nome di GPT-Image-1.5.
GPT Image 1.5 : editing selettivo e preservazione dei dettagli
Tra le caratteristiche principali di GPT Image 1.5 spicca una velocità quadruplicata rispetto al modello precedente; un dato particolarmente utile in contesti professionali dove i tempi di risposta incidono sulla produttività.
Ma non è solo questione di velocità; una delle critiche più frequenti al generatore d’immagine GPT Image 1.0 riguardava la difficoltà nel mantenere coerenza visiva durante modifiche successive. GPT Image 1.5 affronta questo problema con un sistema di editing che preserva elementi come illuminazione, composizione e caratteristiche attraverso iterazioni multiple. E sembra riuscirci bene.
Il modello supporta inoltre operazioni di aggiunta, sottrazione, combinazione, fusione e trasposizione di elementi; permette modifiche chirurgiche senza rigenerare l’intera scena. OpenAI raggiunge anche miglioramenti significativi nel rendering del testo. Ora il sistema gestisce caratteri più piccoli e densi con maggiore leggibilità. La capacità di rappresentare numerosi volti in scene affollate è stata ottimizzata, così come la naturalezza generale degli output.
Le trasformazioni creative mantengono l’essenza dell’immagine originale applicando filtri stilistici o modifiche concettuali; questa funzione risulta accessibile anche tramite preset nell’interfaccia, eliminando la necessità di complessi prompt testuali. L’adesione alle istruzioni è migliorata rispetto alla versione precedente; consente composizioni più articolate dove le relazioni tra elementi vengono rispettate.
GPT Image 1.5 : confronto diretto con Nano Banana Pro
La competizione con Google Nano Banana Pro rappresenta il contesto cruciale per comprendere il posizionamento di GPT Image 1.5. Al momento è presto per stabilire un vincitore assoluto; la scelta dipende dalle priorità specifiche. Nano Banana Pro sembra avere un leggero vantaggio nel fotorealismo e nelle iterazioni rapide; caratteristiche apprezzate per risultati visivamente convincenti al primo tentativo.
GPT Image 1.5 invece sembra eccellere nel controllo dettagliato basato su istruzioni testuali e nell’integrazione con l’ecosistema multimodale di ChatGPT. Per ambiti come il marketing, dove coerenza del brand e modifiche iterative sono essenziali, GPT Image 1.5 sembra avere un leggero margine di vantaggio in alcune situazioni. Nano Banano Pro invece eccelle anche nella produzione di infografiche; GPT Image 1.5 sotto questo aspetto sembra essere un pò indietro , qui sotto vediamo un esempio.




Anche se il livello qualitativo si è alzato enormemente, basti pensare ai risultati goffi dei primi modelli di Stable Diffusion o di DALL-E, non siamo ancora a un punto di arrivo ed entrambe le piattaforme continueranno ad aggiornarsi nei prossimi mesi.
Tre modelli alla prova
Abbiamo testato Gemini Banana Pro, GPT-Image-1.5, e Grok Image partendo dall’immagine di un gatto su un tavolo, a cui abbiamo applicato questo prompt ; “Cambia lo sfondo intorno al gatto. Ora il gatto è in spiaggia e dietro di lui si vede il mare al tramonto. Preserva ogni particolare del gatto“. Questa è l’immagine di partenza


E queste tre sono le immagini generate rispettivamente da Gemini Banana Pro, GPT-Image-1.5, e Grok Image.






In questa particolare sfida per noi il vincitore è Gemini Banana Pro; sebbene l’immagine creata da GPT-Image-1.5 ha le tinte migliori, l’immagine con la tavola di legno ci sembra la migliore dal punto di vista della fisica della luce (ombre del sole) e della costruzione geometrica dello spazio.
Nelle generazioni di GPT-Image-1.5 e Grok Image, l’IA ha “incollato” il gatto sulla spiaggia mantenendo la prospettiva della foto originale (dove il gatto era su un tavolo alto). Il piano della spiaggia sembra scivolare via troppo velocemente e la linea dell’acqua risulta innaturalmente vicina; fa sembrare che la coda stia per essere bagnata dalle onde. Manca la giusta profondità di campo.
Con il sole al tramonto (quindi basso all’orizzonte e alle spalle), il corpo del gatto dovrebbe proiettare un’ombra lunga verso la fotocamera. Nella immagine modificata da Gemini Banana Pro e Grok l’ombra è visibile. GPT-Image-1.5 invece non ha generato alcuna ombra.
GPT Image 1.5 : accessibilità API e applicazioni enterprise
I costi tramite API di GPT-Image-1.5 sono stati ridotti del 20% rispetto a GPT Image 1; $5 per milione di token in input e $10 per milione in output per contenuti testuali. Piattaforme come Canva, Figma, Wix e Envato hanno già integrato GPT Image 1.5 per arricchire i flussi di lavoro creativi. La velocità di creazione delle immagini varia secondo il tier dell’account; dal tier gratuito fino al tier 5 con 8 milioni di token al minuto.
In ChatGPT è stata introdotta una nuova sezione laterale dedicata interamente alla creazione e modifica delle immagini; ci sono stili preimpostati, suggerimenti basati su prompt di tendenza e strumenti di editing mirati.
Competizione continua
Il lancio anticipato di GPT Image 1.5, originariamente pianificato per gennaio 2026, rivela la pressione competitiva nel settore. Il CEO Sam Altman avrebbe dichiarato un codice rosso dopo che Gemini 3 e Nano Banana Pro hanno dominato la classifica LMArena. Inoltre OpenAI deve confrontarsi non solo con Google, ma anche con Alibaba (Qwen-Image), Black Forest Labs (Flux.2 open-source) e Grok Image. Tra i grandi attori, per ora solo Anthropic sembra voler restare fuori da questa competizione.
La firma dell’accordo con Disney per integrare oltre 200 personaggi in ChatGPT Images e Sora, prevista per inizio 2026, indica l’ambizione di OpenAI nel mercato dell’intrattenimento e dei contenuti brandizzati. OpenAI ha in piano una roadmap che include editing ancora più granulare e output dettagliati multilingue. La strategia complessiva dell’azienda punta a trasformare ChatGPT da assistente testuale a studio creativo tascabile, capace di gestire sia modifiche pratiche che reimmaginazioni espressive, consolidando la propria posizione nel panorama competitivo dell’intelligenza artificiale generativa.










