Ieri OpenAI ha ufficialmente lanciato GPT 4.5. Il modello è stato presentato senza tanto clamore in un video breve da alcuni giovanissimi ingegneri di OpenAI. Qualche giorno fa Sam Altman in un post su 𝕏 affermava che provare GPT-4.5 è stato come provare la sensazione di usare un’AGI (“feel the AGI“). Mentre oggi ha dichiarato “È il primo modello che mi dà la sensazione di parlare con una persona“.

L’AGI (Artificial General Intelligence) è un’intelligenza artificiale con capacità cognitive generali simili a quelle umane. A differenza delle AI attuali, un’AGI può ragionare, pianificare, apprendere da esperienze e persino mostrare creatività; avvicinandosi alla flessibilità mentale di un essere umano.
Secondo OpenAI GPT 4.5 non è un AGI, ma ci si avvicina molto; a differenza di altri modelli AI finora utilizzati si potrebbe provare la sensazione di comunicare con un AI emozionale, quasi una “AI umana“. Secondo OpenAI la principale novità di GPT 4.5 non è quindi quella di battere tutti i benchmark precedenti; ma quella di avere un modello AI in grado di esprimersi in un modo più vicino a quello umano.
Il modello GPT 4.5 è disponibile già da ora solo per gli abbonati Pro ($200/mese); sarà esteso anche agli abbonati Plus($20/mese) tra circa una settimana, mentre non arriverà a chi usa la versione gratuita di ChatGTP. Secondo OpenAI questo ritardo è dovuto alle esigenti richieste del modello GPT 4.5 e ad una carenza di GPU per reggere il carico. Sam Altman sempre su 𝕏 ha comunicato che sono in arrivo decine di migliaia di nuove GPU; GPU che saranno in grado di sopperire a questa carenza che avrebbe potuto causare problemi al lancio di GPT 4.5 per gli abbonati pro.
GPT 4.5: miglioramenti nelle prestazioni e nell’affidabilità
GPT 4.5 è considerato da OpenAI un modello sperimentale molto grande e ad alta intensità di calcolo; questo lo rende molto più costoso e per questo non un sostituto diretto di GPT-4o.
GPT-4.5 è stato anche progettato per migliorare la coerenza delle risposte e ridurre il tasso di allucinazioni; un problema comune nei modelli di linguaggio generativo. Il tutto è reso possibile grazie a un sistema di filtraggio migliorato che verifica le informazioni in tempo reale. Questo approccio consente di ottenere risposte più pertinenti e contestualmente appropriate, aumentando la qualità dell’interazione con chi lo utilizza. Questo lo rende uno strumento ancora più potente per chi necessita di risposte precise e articolate in contesti professionali e creativi.
Un elemento chiave di questa evoluzione è l’ottimizzazione della capacità di ragionamento su problemi complessi; come la risoluzione di equazioni matematiche o l’analisi di grandi volumi di dati. Il modello non si limita più a fornire risposte basate su pattern ripetuti; è in grado di riconoscere sfumature e contesti diversificati, migliorando notevolmente l’adattabilità nelle conversazioni avanzate.
La capacità di elaborare informazioni in modo più dettagliato e preciso lo rende uno strumento ideale per applicazioni che richiedono un alto livello di intelligenza contestuale; come la generazione di contenuti, la programmazione assistita e l’analisi dei dati. Inoltre, GPT-4.5 offre una maggiore affidabilità nella verifica delle fonti e nel controllo della coerenza delle informazioni fornite; riduce sensibilmente la probabilità di generare contenuti inesatti. Questo lo rende uno strumento ancora più potente per chi necessita di risposte precise e articolate in contesti professionali e creativi.

GPT 4.5 benchmark
Sebbene il nuovo modello GPT 4.5 sia presentato da OpenAI come un modello molto accurato, sia sul sito ufficiale sia nel video di presentazione, non sono stati presentati gli usuali test di confronto (benchmark) con altri competitors; come Claude Sonnet 3.7, Deepseeker R1, Grok 3, Gemini 2.0 e Mistral.
Open AI si è limitata a mostrare test di prestazione esclusivamente con i suoi modelli proprietari. I test effettuati indicano che il modello offre un incremento di prestazioni fino al 30% rispetto a GPT-4o; soprattutto in compiti che richiedono coerenza testuale e inferenze logiche complesse. In particolare, nei test di SimpleQA, GPT-4.5 ha ottenuto un punteggio del 62,5% in accuratezza delle risposte; supera il suo predecessore di diversi punti percentuali.

Un altro parametro chiave è la riduzione del tasso di allucinazioni; è stato abbattuto al 15% rispetto al 38,2% registrato da GPT-4. Questo significa che il modello genera risposte meno arbitrarie e con una maggiore aderenza ai dati reali. Inoltre, il tempo medio di risposta è stato ottimizzato; con una riduzione della latenza di circa il 20%, rendendolo più efficiente per applicazioni che richiedono interazioni rapide e dinamiche.
Nei test condotti su scrittura creativa e analisi di codice, GPT-4.5 ha dimostrato un miglioramento nella qualità delle proposte generate; una maggiore capacità di seguire istruzioni dettagliate e adattarsi a contesti specifici. Anche la sua capacità di problem-solving è stata ampliata; è più efficace in ambiti come l’automazione dei processi aziendali e la gestione di database complessi.

Disponibilità API e costi
OpenAI ha reso disponibile l’accesso tramite API per gli sviluppatori. Molti sviluppatori ed esperti del settore hanno però già sollevato forti dubbi sul costo elevato del modello e sulla sua effettiva efficienza rispetto alle precedenti versioni. OpenAI ha fissato il prezzo delle API a $75 per milione di token in ingresso e $150 per milione di token in uscita, con una tariffa ridotta di $37,50 per milione di token in cache. Questo ha portato molti a chiedersi se il valore aggiunto offerto dal modello giustifichi il costo, specialmente per le aziende che necessitano di un utilizzo massivo.
GPT-4.5: conclusione
E’ strano l’approccio di OpenAi che ha presentato GPT-4.5 come un modello di ricerca/sperimentale e non come un modello definitivo e sostitutivo di GPT-4o. Sembra quasi che OpenAI abbia accelerato il lancio dietro la pressione di altri competitors in particolare Anthropic con Claude Sonnet 3.7 e xAI con Grok 3, che hanno lanciato due modelli molto innovativi e efficienti.
Un altro punto di discussione riguarda la reale competitività del modello rispetto ad alternative emergenti nel settore. Sebbene GPT-4.5 mostri un affinamento delle capacità di elaborazione del linguaggio naturale, quasi un avvicinamento verso l’AGI, GPT-4.5 sembra non introdurre innovazioni radicali nella struttura dell’intelligenza artificiale, ma rappresenta piuttosto un miglioramento incrementale.
Come accennato in introduzione, la necessità di un’elevata potenza computazionale per il suo funzionamento ha portato OpenAI a dover gestire problemi legati alla disponibilità di GPU. Questo solleva interrogativi sulla scalabilità e sulla sostenibilità a lungo termine dell’infrastruttura necessaria per supportare modelli di questa complessità. Il tempo ci dirà se questo modello sarà vincente per OpenAI.
L’obiettivo di OpenAi è quello di combinare i suoi modelli di linguaggio di grandi dimensioni per creare un modello che in futuro (GPT-5 ?) potrebbe essere etichettato come intelligenza generale artificiale o AGI.