Oggi 6 Giugno Google ha annunciato un aggiornamento del suo modello linguistico più evoluto, Gemini 2.5 Pro 06-05, descritto come il più potente mai rilasciato dall’azienda. Costruito sulle basi della versione presentata a marzo e potenziato sensibilmente con l’update di maggio con la versione I/O Edition 05-06; questo nuovo rilascio in anteprima è già accessibile su AI Studio, Vertex AI e Gemini API. La disponibilità generale sul sito Gemini dovrebbe arrivare entro due settimane. La versione aggiornata si distingue per diverse migliorie in particolare nella formattazione delle risposte, nella coerenza testuale e in una rinnovata creatività espressiva.

Ma come è successo nella versione I/O ci sono anche ulteriori miglioramenti nella capacità di gestire compiti ad alta complessità; il modello eccelle in ambiti come il ragionamento matematico, la codifica avanzata, la sintesi scientifica e l’analisi logica. Tutte attività che richiedono precisione, profondità e adattabilità. E’ un aggiornamento mirato a potenziare strumenti professionali e a offrire soluzioni AI versatili e sostenibili economicamente. Il rapporto tra prestazioni elevate e costo contenuto rappresenta un valore aggiunto evidente per chi opera in contesti aziendali o nello sviluppo software di nuova generazione.
Google ha posto attenzione concreta al feedback ricevuto dalla comunità di sviluppo; le revisioni applicate si riflettono in risposte testuali più fluide, in una formattazione coerente e in una capacità accresciuta di adattarsi a contesti differenziati. Che si tratti di una domanda di cultura generale o della scrittura di uno script per automazione API, il modello riesce ad adeguare il tono, la sintassi e il contenuto.
Gemini 2.5 Pro 06-05 : prestazioni e benchmark
I dati resi noti da Google e da alcune fonti di benchmarking mostrano un miglioramento sostanziale; Gemini 2.5 Pro raggiunge 1470 punti su LMArena (+24 rispetto alla versione precedente) e 1443 su WebDevArena (+35); un salto che lo colloca ancora di più in cima alle classifiche dei modelli AI attuali. Questo risultato lo pone davanti a concorrenti come OpenAI o3, o4-mini, Claude Opus 4, Grok 3 e DeepSeek R1.
Nelle valutazioni di settore più mirate, Gemini 2.5 Pro si distingue su AIME 2025, dove totalizza l’88% in matematica; su GPQA ottiene l’86,4%, mentre su MMMU, pensato per testare il ragionamento visivo, raggiunge l’82%. Sul benchmark LiveCodeBench, pensato per il codice generativo, tocca quota 69%; numeri che certificano una notevole versatilità nei domini STEM (Science, Technology, Engineering, and Mathematics). Il modello Gemini 2.5 Pro è in grado di affrontare efficacemente compiti legati a queste aree, come risolvere problemi di matematica, analizzare dati scientifici, generare codice o supportare processi ingegneristici complessi.

Anche nel trattamento del contesto esteso il modello offre prestazioni elevate. Nel test MRCR v2, concepito per verificare la capacità di mantenere coerenza e rilevanza su lunghi passaggi testuali, Gemini raggiunge il 58% a 128K token; e mantiene il 16,4% a 1 milione di token, una soglia che pochi riescono a superare o raggiungere. La copertura multilingue, infine, resta uno dei capisaldi del modello; con un MMLU globale dell’89,2%, Gemini supera ampiamente la media delle soluzioni concorrenti in contesti non anglofoni.
Nuove funzionalità e miglioramenti mirati
Il progresso più evidente riguarda senza dubbio l’ambito della programmazione. Qui Gemini 2.5 Pro domina benchmark come Aider Polyglot e SWE-bench; indicatori chiave della sua competenza nella scrittura di codice, nella modifica contestuale e nelle capacità agentiche. Risulta efficace nella generazione di funzioni complesse, nella correzione di errori e nell’adattamento semantico dei comandi.

Secondo le dichiarazioni ufficiali di Google, il modello ha ricevuto ottimizzazioni strutturali significative. Queste rendono le risposte più leggibili, logicamente coerenti e meglio allineate ai contesti d’uso; un miglioramento che agevola il debugging e la manutenzione di codice generato.
Particolarmente utile è l’introduzione dei thinking budgets; un sistema che consente agli sviluppatori di gestire in modo flessibile il bilanciamento tra prestazioni e latenza, elemento fondamentale nelle applicazioni su larga scala.
L’efficienza nei compiti tecnici complessi è aumentata; Gemini ora si adatta più rapidamente a linguaggi di programmazione multipli e restituisce output più rifiniti. Questo lo rende uno strumento particolarmente indicato per chi sviluppa in ambienti eterogenei o necessita di testing automatizzato ad alta affidabilità.
Gemini 2.5 Pro 06-05 : conclusioni
Questo terzo aggiornamento di Gemini 2.5 Pro 06-05 offre progressi sostanziali che migliorano l’esperienza pratica in più ambiti di utilizzo. Le prestazioni elevate nei principali benchmark, unite a una coerenza testuale migliorata nel lungo contesto lo rendono uno strumento affidabile anche per applicazioni mission-critical. La gestione intelligente dei costi, grazie all’introduzione dei thinking budgets consente una pianificazione precisa delle risorse in ambienti di produzione.
La disponibilità immediata per gli sviluppatori tramite Gemini API, AI Studio e Vertex AI permetterà di raccogliere ulteriori feedback prima del lancio su vasta scala. L’integrazione graduale nell’app Gemini, prevista per i prossimi giorni, darà anche al grande pubblico un assaggio di queste nuove capacità.