La battaglia per il primato dell’AI nel 2025 è iniziata con grossi colpi di scena. OpenAI con il lancio del modello di ragionamento o3, poi l’exploit del modello cinese Deepseek R1. Google ha eseguito il roll out di Gemini 2.0 Flash Thinking, e anche in Europa Mistral ha lanciato un app (chat conversazionale AI) per Android e iOS e nuovi servizi sul web. Pochi giorni fa poi OpenAi ha dichiarato di lavorare sui modelli AI GPT 4.5 e GPT 5. Ieri 17 febbraio, xAI ha annunciato in un video di presentazione, il nuovo modello AI Grok 3.
Grok 3 è il risultato di un addestramento iniziato lo scorso anno. All’appello manca solo la freccia di Anthropic, ma siamo convinti che ne sentiremo parlare presto.

La potenza di calcolo necessaria per un progetto di tale portata è notevole; xAI ha costruito un enorme data center, xAI Colossus, appositamente per Grok 3. Lo sviluppo è iniziato ad aprile dell’anno precedente; in soli 122 giorni la struttura ha raggiunto la capacità di 100.000 GPU (Nvidia) in funzione sincrona. L’espansione non si è fermata qui; in ulteriori 92 giorni, la capacità è stata raddoppiata a 200.000 GPU.
Tuttavia, il team di xAI ha sottolineato che l’addestramento continua; un processo iterativo e inarrestabile per affinare le capacità del modello.
xAI ha descritto la versione di Grok 3 rilasciata in questa fase come una beta; si tratta di una versione preliminare e non completamente rifinita. La versione definitiva potrebbe essere pronta in “una settimana“, come dichiarato dallo stesso Elon Musk.
Grok 3 alla Prova
Durante la presentazione su 𝕏, il team di xAI ha esaltato le capacità di Grok 3 in diversi settori chiave; come la scienza, la matematica e la programmazione, confrontandolo direttamente con modelli concorrenti come quelli di OpenAI, Gemini e Deepseek.

L’azienda dichiara che Grok 3 è stato sviluppato con una potenza di calcolo dieci volte superiore rispetto al suo predecessore, Grok 2. Musk, durante la presentazione, ha addirittura alzato la posta, suggerendo una cifra più vicina a quindici volte. Le dimostrazioni pratiche di Grok 3 sono state descritte come “notevoli, se non rivoluzionarie“.
Per testare le capacità di programmazione del modello, il team ha chiesto a Grok 3 di ideare un gioco che combinasse elementi di Tetris e Bejeweled. Dopo alcuni secondi, il servizio ha generato un gioco funzionante che integrava effettivamente le caratteristiche distintive di entrambi i titoli. Questo dimostra la capacità di Grok 3 non solo di comprendere richieste complesse; ma anche di tradurle in risultati concreti e giocabili.
E’ stato chiesto a Grok 3 di calcolare una traiettoria per una missione di andata e ritorno su Marte. Grok 3 ha risposto generando un piano di missione completo, corredato di animazioni illustrative.
Capacità di ragionamento
Grok 3 si distingue per diverse innovazioni rispetto ai modelli precedenti. Una delle principali migliorie è il suo processo di ragionamento avanzato (chiamato da xAI Big Brain), progettato per suddividere domande complesse in sotto-task e garantire risposte più accurate.
Non è una novità; abbiamo già visto questi cosiddetti modelli di ragionamento con OpenAI o1 e o3, Gemini Flash thinking e DeepSeek R1. Quando il modello sarà disponibile a tutti si potrà vedere se il modello di ragionamento di Grok 3 è superiore a quanto si è visto finora. Un altro punto di forza mostrato è la sua capacità di generare codice e analizzare dati scientifici con maggiore precisione.
Benchmark
Uno degli aspetti più attesi di Grok 3 riguarda le sue prestazioni rispetto ai principali concorrenti nel settore dell’intelligenza artificiale. xAI ha diffuso benchmark che mostrano come Grok superi GPT-4o di OpenAI e Gemini 2.0 di Google in test specifici legati a matematica avanzata, codifica e risoluzione di problemi scientifici complessi.
In particolare, Grok ha ottenuto risultati superiori in benchmark come AIME (test matematici avanzati) e GPQA (domande di fisica, biologia e chimica a livello di dottorato). Inoltre, nei test della piattaforma Chatbot Arena, che confrontano AI in base al giudizio umano, Grok 3 si è posizionato tra i migliori modelli attualmente disponibili.

Sebbene i risultati sono da prendere con cautela, le capacità di calcolo migliorate e le nuove funzioni come Big Brain e DeepSearch sembrano offrire un vantaggio competitivo che potrebbe renderlo una valida alternativa ai modelli più affermati.
Grok 3: prezzi e disponibilità

L’accesso a Grok 3 non sarà economico. Il modello sarà riservato agli abbonati Premium+ di X, il cui prezzo è recentemente aumentato fino a 40 dollari al mese. Questo rappresenta quasi il doppio rispetto al prezzo precedente di 22 dollari mensili.
Inoltre, xAI ha introdotto una nuova opzione chiamata SuperGrok, che offrirà funzionalità aggiuntive come interrogazioni avanzate di DeepSearch e generazione illimitata di immagini.
Il costo di SuperGrok non è stato ancora ufficializzato, ma le prime indiscrezioni suggeriscono un prezzo intorno ai 30 dollari mensili, senza contare l’abbonamento Premium+ già necessario per accedere al servizio. Un offerta simile alla versione Pro di OpenAI, che però ha un costo decisamente più elevato ($200/mese).
Oltre a Premium+, X offre due piani alternativi: Basic e Premium con funzionalità ridotte. Tuttavia, per chi desidera sfruttare le capacità avanzate di Grok 3, l’unica opzione rimane quella più costosa.
Le funzionalità future in programma per Grok 3 includono l’integrazione dei modelli nell’API aziendale xAI e l’implementazione della memoria nelle conversazioni. Queste aggiunte mirano a rendere Grok 3 più versatile e utile in contesti professionali e interazioni complesse. Grok3 includerà anche modalità di ricerca avanzate su internet (in modo simile a Deep research di OpenAI).
Grok 3: conclusione
Grok 3 segna un ulteriore miglioramento nell’evoluzione dei modelli AI; miglioramenti in termini di capacità di calcolo e precisione nelle risposte. Tuttavia, il prezzo elevato dell’abbonamento rischia di limitarne la diffusione a un pubblico ristretto, rendendolo un servizio destinato principalmente a professionisti più che al grande pubblico. Resta da vedere se le innovazioni introdotte da Grok 3 saranno sufficienti per renderlo un’alternativa concreta ai modelli di OpenAI e Gemini.