Anthropic ha presentato poche ore fa Claude Sonnet 5, il nuovo modello della sua linea di fascia intermedia, posizionato tra il più leggero Haiku e il più potente Opus 4.8.
Si tratta della generazione che eredita un ruolo storico particolare, perché erano stati i modelli Sonnet 3.5, 3.6 e 3.7 a introdurre agli sviluppatori le prime capacità agentiche di Claude, prima che i miglioramenti più evidenti su pianificazione, uso di strumenti e autonomia si spostassero soprattutto sulla linea Opus.
Con questo lancio, Anthropic prova a colmare quel divario. Rispetto al predecessore Sonnet 4.6, uscito a febbraio, l’azienda dichiara progressi netti su ragionamento, uso di strumenti, scrittura di codice e lavoro di conoscenza, avvicinando le prestazioni a quelle di Opus 4.8 ma mantenendo un costo molto più contenuto.
Il lancio arriva mentre anche OpenAI, con GPT-5.6 Sol, e Google, con Gemini 3.5 Flash, spingono nella stessa direzione. È un segnale abbastanza chiaro che l’agentic AI (la capacità di un modello AI di comportarsi come un agente autonomo, e non solo come un sistema che risponde solo a singole domande) non è più una funzione riservata ai modelli più costosi, ma lo standard atteso a ogni fascia di prezzo.
Sonnet 5 è pensato soprattutto per chi sviluppa software e per i team che costruiscono agenti, automazioni e flussi di lavoro complessi su più passaggi. Il compromesso che punta a offrire è un equilibrio tra qualità del risultato e costo, per le attività lunghe e ripetitive.
Effort variabile e un nuovo tokenizer
La novità più visibile è l’adaptive thinking, attiva di default. A differenza di Sonnet 4.6, dove il ragionamento esteso andava attivato manualmente, qui il modello decide da sé quanto tempo dedicare a riflettere prima di rispondere.
Il tutto è regolabile tramite un parametro di effort, che permette di bilanciare costo e qualità in base al task. Anthropic ha infatti rimosso la possibilità di impostare un budget di token fisso per il ragionamento, così come quella di modificare temperature, top_p e top_k.
Sono scelte che spingono chi sviluppa a guidare il comportamento del modello tramite il prompt di sistema, piuttosto che tramite parametri di campionamento manuali. Inoltre, Sonnet 5 può rivedere il proprio piano a metà di un task lungo, invece di restare ancorato alla strategia impostata all’inizio.
È un comportamento utile nei flussi agentici, dove la direzione del lavoro si affina strada facendo, man mano che il modello raccoglie informazioni. Un’altra novità tecnica riguarda il tokenizer, sostituito con uno nuovo dello stesso tipo già introdotto con Opus 4.7. A parità di testo, produce circa il 30% di token in più. È un dettaglio da tenere presente se lavori con budget di token stretti.
Benchmark: coding, ricerca autonoma e computer use
Sui benchmark diffusi da Anthropic, Sonnet 5 mostra miglioramenti consistenti rispetto a Sonnet 4.6 su quasi tutti i fronti agentici. Su SWE-bench Pro il punteggio sale al 63,2% contro il 58,1% del predecessore, restando comunque dietro al 69,2% di Opus 4.8.
Su Terminal-Bench 2.1, che misura le capacità in ambienti a riga di comando, il salto è più marcato, con l’80,4% contro il 67% di Sonnet 4.6. Anche su BrowseComp, il test che valuta la capacità di trovare informazioni difficili sul web, Sonnet 5 arriva all’84,7% in configurazione a singolo agente, 86,6% con più agenti in parallelo, ben oltre il 76,2% del modello precedente.

Su Humanity’s Last Exam, il punteggio con strumenti sale dal 46,8% al 57,4%, superando persino Opus 4.8 su questo specifico test di conoscenza generale.
Tuttavia, sul fronte della sicurezza informatica il quadro si ribalta. Anthropic dichiara esplicitamente che Sonnet 5 ha capacità cyber molto più limitate rispetto ai modelli Opus, e nei test di sviluppo di exploit condotti con Mozilla su Firefox non è mai riuscito a produrre un attacco funzionante, solo qualche successo parziale.
Il modello mostra anche tassi più bassi di allucinazioni e di comportamento compiacente rispetto a Sonnet 4.6, insieme a una maggiore resistenza ai tentativi di prompt injection, anche se con qualche rifiuto di troppo su richieste legittime.
Prezzi, disponibilità e concorrenza
Da martedì, Claude Sonnet 5 è il modello predefinito per i piani Free e Pro di Anthropic, ed è disponibile anche su Max, Team ed Enterprise, oltre che su Claude Code e sulla Claude Platform con l’identificativo claude-sonnet-5.
Il prezzo di lancio è di 2 dollari per milione di token in input e 10 dollari per milione in output, promozione valida fino al 31 agosto 2026. Da settembre la tariffa passerà a 3 dollari in input e 15 in output (prezzo attuale di Claude Sonnet 4.6).
| Modello | Input (per 1M token) | Output (per 1M token) |
|---|---|---|
| DeepSeek-V4 Flash | $0.07 | $0.42 |
| DeepSeek-V4 Pro | $0.435 | $0.87 |
| MiniMax M2.5 | $0.15 | $1.20 |
| Qwen3.6 Plus | $0.32 | $1.95 |
| Kimi K2.6 | $0.60 | $2.80 |
| Grok 4.3 (xAI) | $1.25 | $2.50 |
| GLM-5.1 (Z.ai) | $0.95 | $3.15 |
| Qwen3.7 Max | $2.50 | $7.50 |
| Gemini 3.5 Flash | $1.50 | $9.00 |
| Gemini 3.1 Pro (Google) | $2.00 | $12.00 |
| GPT-5.4 | $2.50 | $15.00 |
| Claude Sonnet 5 | $3.00 | $15.00 |
| Claude Opus 4.8 | $5.00 | $25.00 |
| GPT-5.5 | $5.00 | $30.00 |
| GPT-5.4 Pro | $30.00 | $180.00 |
| GPT-5.5 Pro | $30.00 | $180.00 |
Di conseguenza, dato che il nuovo tokenizer produce più token a parità di testo, il costo effettivo per richiesta resta grosso modo invariato rispetto a Sonnet 4.6, nonostante la tariffa nominale sia identica.
Rispetto alla concorrenza diretta, il posizionamento è aggressivo. Sonnet 5 costa meno di Opus 4.8, di GPT-5.5 di OpenAI e di Gemini 3.1 Pro di Google, pur restando più caro di Gemini 3.5 Flash, che rimane l’opzione più economica tra i modelli di fascia comparabile.
Il modello è disponibile anche tramite OpenRouter, Amazon Bedrock, Claude Platform on AWS, Google Cloud e, in anteprima, Microsoft Foundry, con supporto alla ritenzione zero dei dati per le organizzazioni che ne hanno bisogno.
A tal proposito, se stai valutando se convenga passare da Opus 4.8 a Sonnet 5 per risparmiare, vale la pena testare entrambi sui tuoi task specifici prima di decidere. La stessa Anthropic consiglia di regolare il livello di effort per trovare il punto di equilibrio tra costo e qualità.
Una scelta valida per chi costruisce agenti e automazioni
Claude Sonnet 5 conferma una tendenza nel settore; l’agentic AI, cioè la capacità di pianificare, usare strumenti e portare a termine compiti complessi senza supervisione costante, è diventata la base attesa a ogni fascia di prezzo. La vera competizione si gioca su quanto costa ottenerla e quanto è affidabile senza controllo umano.
Per chi scrive codice, costruisce automazioni o gestisce flussi di lavoro agentici su più passaggi, Sonnet 5 è un buon aggiornamento rispetto a Sonnet 4.6, con un compromesso equilibrato tra qualità e costo. Non elimina però il divario con Opus 4.8 sui compiti più complessi, né su alcuni aspetti di sicurezza informatica.
Chi lavora soprattutto su revisione del codice, o su modifiche piccole e frequenti, potrebbe invece notare che il modello è più lento e più prolisso del predecessore, e che in quel contesto specifico la qualità non è sempre superiore.
Nel complesso, però, resta una scelta sensata per chi vuole spostare più lavoro su agenti senza passare al listino più caro di Opus, ed è un buon punto di partenza per chi si affaccia solo ora alla programmazione con agenti AI.













