OpenAI ha presentato ufficialmente GPT-4o mini, una versione più compatta ed economica del suo modello linguistico di punta GPT-4o. Questo nuovo modello è destinato a sostituire GPT-3.5 Turbo in ChatGPT, offrendo prestazioni superiori a costi significativamente ridotti.
Caratteristiche principali di GPT-4o mini
GPT-4o mini può essere considerato la versione ridotta di GPT-4o. GPT-4o mini si distingue per diverse caratteristiche innovative. Il modello supporta un contesto di input di 128.000 token, ovvero l’equivalente alla lunghezza di un libro di circa 200 pagine. La sua conoscenza è aggiornata a ottobre 2023.
Come GPT-4o, GPT-4o mini è multimodale; supporta input di testo e immagini tramite API. OpenAI ha annunciato che in futuro il modello sarà in grado di interpretare anche audio e video, oltre a generare immagini.
Un aspetto fondamentale del nuovo modello è il suo costo ridotto quando utilizzato tramite le API di OpenAI. Il modello è prezzato a 15 centesimi per milione di token di input e 60 centesimi per milione di token di output. Ciò rappresenta una riduzione di oltre il 60% rispetto a GPT-3.5 Turbo. In questo modo, l’utilizzo dell’intelligenza artificiale diventa molto più accessibile per progetti su larga scala.
Inoltre, implementa una nuova tecnica chiamata “gerarchia delle istruzioni“. Questa innovazione migliora la capacità di resistere a tentativi di jailbreak, iniezioni di prompt e estrazioni del prompt di sistema. Ciò rende le risposte del modello più affidabili e sicure, specialmente per applicazioni su larga scala.
Prestazioni e benchmark
OpenAI afferma che GPT-4o mini supera le prestazioni di altri modelli di piccole dimensioni in vari benchmark. Il modello ha ottenuto un punteggio dell’82% nel test MMLU (Massive Multitask Language Understanding), che misura la comprensione e il ragionamento su 57 materie accademiche. Questo risultato supera il 77,9% di Gemini Flash e il 73,8% di Claude Haiku.
In ambito matematico e di coding, ha ottenuto risultati notevoli. Nel benchmark MGSM, che valuta il ragionamento matematico, il modello ha raggiunto l’87,0%, superando Gemini Flash (75,5%) e Claude Haiku (71,7%). Nel test HumanEval, che misura le prestazioni di coding, GPT-4o mini ha ottenuto l’87,2%, confrontato con il 71,5% di Gemini Flash e il 75,9% di Claude Haiku.
GPT-4o mini ha mostrato anche buone capacità di ragionamento multimodale. Nel benchmark MMMU, ha ottenuto un punteggio del 59,4%, superando Gemini Flash (56,1%) e Claude Haiku (50,2%). Questi risultati suggeriscono che GPT-4o mini offre un equilibrio interessante tra dimensioni ridotte, costi contenuti e prestazioni elevate.
GPT-4o mini: disponibilità e implementazione
GPT-4o mini è ora disponibile come modello di testo e visione nell’API Assistants, nell’API Chat Completions e nell’API Batch di OpenAI. Gli sviluppatori pagano 15 centesimi per milione di token di input e 60 centesimi per milione di token di output. OpenAI ha annunciato che il fine-tuning per GPT-4o mini sarà disponibile nei prossimi giorni.
Gli utilizzatori Free, Plus e Team possono accedere a GPT-4o mini da subito, in sostituzione di GPT-3.5. Invece, gli utilizzatori Enterprise avranno accesso a partire dalla prossima settimana.
GPT-3.5 rimarrà però disponibile per gli sviluppatori tramite l’API, almeno per il momento. OpenAI ha dichiarato che GPT-3.5 verrà ritirato dall’API in futuro, ma non è stata ancora stabilita una data precisa.
Per quanto riguarda il chatbot ChatGPT gratuito, di default continuerà ad utilizzare GPT-4o. Passerà temporaneamente a GPT-4o mini (invece di GPT-3.5 Turbo) in caso di uso eccessivo.
Sicurezza di GPT-4o mini
OpenAI ha posto grande enfasi sulla sicurezza di GPT-4o mini. Il modello incorpora le stesse misure di sicurezza di GPT-4o, che sono state attentamente valutate attraverso test automatizzati e valutazioni umane. Più di 70 esperti esterni in campi come la psicologia sociale e la disinformazione hanno testato GPT-4o per identificare potenziali rischi, che sono stati affrontati da OpenAI.
La società ha implementato nuove tecniche per migliorare la sicurezza di GPT-4o mini, basate sulle ricerche più recenti. Il metodo della “gerarchia delle istruzioni” è particolarmente importante in questo contesto; aiuta a migliorare la capacità del modello di resistere a tentativi di manipolazione o elusione delle restrizioni incorporate.
Impatto sul mercato e prospettive future
L’introduzione di GPT-4o mini potrebbe avere un impatto significativo sul mercato dell’intelligenza artificiale. La combinazione di prestazioni elevate e costi ridotti rende il modello particolarmente attraente per sviluppatori e aziende.
GPT-4o mini si posiziona come una valida alternativa a modelli come Gemini 1.5 Flash di Google o Claude 3 Haiku di Anthropic. La sua capacità di gestire compiti complessi a costi contenuti potrebbe accelerare l’adozione dell’IA in vari settori, dalla finanza all’assistenza clienti, passando per l’analisi dei dati e la generazione di contenuti.
OpenAI ha dichiarato di voler continuare su questa traiettoria di riduzione dei costi e miglioramento delle capacità dei modelli. L’azienda prevede un futuro in cui i modelli di IA saranno integrati in ogni app e sito web. GPT-4o mini va in questa direzione, rendendo l’intelligenza artificiale più accessibile, affidabile e integrata nelle esperienze digitali quotidiane.