OpenAI ha presentato GPT-5.3-Codex, la nuova versione del suo modello per la programmazione, mostrando netti miglioramenti rispetto al precedente GPT-5.2-Codex. Secondo i dati ufficiali, questo modello supera i predecessori in benchmark come SWE-Bench Pro e Terminal-Bench 2.0, operando con una velocità superiore del 25%.
Tale velocità rende le interazioni più fluide tramite CLI, estensioni IDE, interfaccia web e la nuova app desktop per macOS. L’intenzione principale di questo aggiornamento non è limitata alla semplice generazione di codice. Il sistema ambisce a trasformarsi in uno strumento in grado di gestire l’intero ciclo di vita del software, occupandosi di monitoraggio, deployment, stesura di PRD e analisi delle metriche. Questo approccio rende il software un assistente molto più completo per chi lavora nel settore.
Con il nuovo GPT-5.3-Codex OpenAI ha anche implementato uno stack di sicurezza completo chiamato Trusted Access che include capacità di trovare vulnerabilità e prevenire abusi informatici.

I numeri presentati da OpenAI sono significativi: il modello raggiunge il 56,8% su SWE-Bench Pro (contro il 56,4% del predecessore) e un impressionante 77,3% su Terminal-Bench 2.0, con un salto di oltre 13 punti percentuali rispetto a GPT-5.2-Codex. Ancora più rilevante è il miglioramento su OSWorld-Verified, dove il punteggio passa dal 38,2% al 64,7%, indicando capacità decisamente superiori nell’uso pratico del computer attraverso interfaccia visiva. Questi dati, se confermati, posizionerebbero GPT-5.3-Codex come il nuovo punto di riferimento per i modelli agentici dedicati alla programmazione.
Tra le novità più significative spicca il fatto che GPT-5.3-Codex è stato parzialmente costruito con l’aiuto di versioni precedenti di se stesso: i team di ricerca e ingegneria di OpenAI hanno usato il modello per diagnosticare anomalie nei training, gestire deployment e scalare infrastrutture GPU in tempo reale.
Performance tecniche e capacità agentiche
I risultati sui benchmark dimostrano una maggiore competenza nella scrittura di codice e una capacità migliorata di operare come agente autonomo in ambienti desktop. Per chi lavora nello sviluppo, questo implica che il sistema è ora in grado di gestire compiti a lungo termine che richiedono ricerca e utilizzo di strumenti.
Ad esempio, se si richiede la creazione di una landing page, il modello interpreta meglio l’intento sottostante rendendo il prodotto finale più vicino a quanto richiesto per la produzione. Tale precisione riduce la necessità di correzioni manuali e offre un vantaggio tangibile in termini di tempo e qualità del risultato finale.
Se ti stai chiedendo come questa potenza si traduca in vantaggi concreti per il tuo flusso di lavoro quotidiano, la risposta risiede nella modalità di interazione. Il cambiamento lo noterai nell’esperienza d’uso all’interno della nuova app Codex o tramite l’interfaccia web. Invece di attendere passivamente il risultato finale di un compito lungo ore, puoi intervenire in tempo reale, porre domande o correggere la rotta se noti che l’approccio scelto non è ottimale. Questa supervisione interattiva, attivabile nelle impostazioni dell’app alla voce “Follow-up behavior”, trasforma l’IA in un collega con cui discutere attivamente le decisioni tecniche.
Piani di abbonamento e disponibilità
Se desideri integrare questo strumento nella tua routine produttiva, le modalità di accesso e l’attuale struttura dei costi, ricalca in gran parte la strategia premium di OpenAI. GPT-5.3-Codex è attualmente disponibile per tutti gli utenti con piani ChatGPT Plus, Team ed Enterprise, senza costi aggiuntivi rispetto al canone mensile standard, che per i singoli professionisti si attesta sui 23 euro al mese.
In termini di disponibilità, puoi utilizzare il modello attraverso l’app desktop Codex per macOS, l’interfaccia web e le estensioni per IDE. L’accesso tramite API è attualmente limitato a partner selezionati. Se confrontiamo questo posizionamento con i competitor diretti, notiamo una sfida aperta: Anthropic ha lanciato contemporaneamente Claude Opus 4.6, mantenendo una fascia di prezzo simile ma puntando su un ecosistema differente.
Mentre le soluzioni di nicchia per lo sviluppo possono avere costi variabili basati sul consumo di token, la scelta di OpenAI di includere Codex nel pacchetto “Plus” rende il rapporto qualità-prezzo estremamente competitivo per chi già utilizza i servizi dell’azienda.
Un nuovo paradigma di collaborazione uomo-macchina
Siamo entrati in una fase in cui il confine tra scrivere codice e gestire un sistema complesso è diventato estremamente sottile. Dovresti guardare a questo strumento non come a un rimpiazzo per la tua creatività, ma come a un moltiplicatore di produttività capace di gestire gli aspetti più onerosi e ripetitivi del lavoro tecnico, come il debugging dei cluster GPU o l’analisi di migliaia di data point in pochi minuti.
È interessante notare come anche competitor come Anthropic stiano seguendo percorsi simili (vedi Opus 4.6), confermando che il futuro della programmazione sarà sempre più orientato verso agenti capaci di operare sull’intero ambiente desktop.
La sfida per uno sviluppatore non sarà più solo saper scrivere il miglior codice possibile, ma imparare a dirigere efficacemente un team di agenti digitali che possono farlo sotto la sua guida esperta.











