Anthropic ha annunciato ieri un aggiornamento per Claude Sonnet 4. La finestra di contesto ora supporta 1 milione di token nella versione API. Questa espansione, cinque volte superiore al limite precedente di 200.000 token, consente di gestire interi codebase da oltre 75.000 linee di codice o centinaia di documenti in un’unica richiesta.
Il potenziale va dalla sintesi di documenti complessi alla creazione di agenti AI capaci di mantenere la coerenza su centinaia di chiamate a strumenti. La disponibilità riguarda i clienti API di Tier 4 e con limiti personalizzati; oltre che l’integrazione con Amazon Bedrock. E’ previsto anche l’arrivo su Google Cloud Vertex a breve.

Claude Sonnet 4: capacità tecniche e casi d’uso concreti con 1M token
L’ampliamento del contesto apre scenari operativi più ampi e raffinati. Con Claude Sonnet 4 ora è possibile eseguire analisi di codice su larga scala, includendo file sorgente, test, documentazione e dipendenze in un’unica sessione. Quindi, il modello può cogliere relazioni trasversali e ottimizzare l’architettura complessiva del progetto.
La sintesi di documenti diventa più efficiente; si possono elaborare contemporaneamente contratti legali, articoli scientifici o specifiche tecniche, individuando connessioni che prima richiedevano segmentazioni e passaggi multipli.
Per gli sviluppatori di agenti AI, la capacità estesa consente di mantenere la coerenza contestuale in flussi complessi e multi-step; si possono integrare API, definizioni di strumenti e cronologie di interazione senza perdita di informazioni. Le testimonianze di aziende come Bolt.new e iGent AI confermano benefici concreti; maggiore autonomia nei flussi di lavoro e precisione nelle operazioni su progetti reali.
“Claude Sonnet 4 rimane il nostro modello di riferimento per i flussi di lavoro di generazione del codice, superando costantemente altri modelli leader in produzione. Con la finestra di contesto di 1 milione, gli sviluppatori possono ora lavorare su progetti significativamente più grandi, mantenendo l’elevata precisione di cui abbiamo bisogno per la codifica nel mondo reale“, ha affermato Eric Simons, CEO e co-fondatore di Bolt.new.
Confronto con altri modelli
Sul piano competitivo, l’aggiornamento posiziona Claude Sonnet 4 in diretta concorrenza con modelli come Gemini 2.5 Pro di Google, che offre 2 milioni di token; e superiore a GPT-5 di OpenAI, limitato a 400.000 token di contesto.
Sebbene alcuni concorrenti abbiano numeri più alti, il focus di Anthropic è sulla cosiddetta “effective context window”; ossia la capacità reale del modello di comprendere e utilizzare in modo coerente le informazioni fornite. Ciò risponde a una sfida nota: i modelli con finestre enormi tendono a perdere coerenza nelle interazioni molto lunghe.
Anthropic invece vuole garantire una qualità costante anche con input massivi; punta su applicazioni reali come lo sviluppo software e la gestione di dati strutturati. Anche la strategia commerciale differisce da OpenAI. Mentre quest’ultima concentra i ricavi sugli abbonamenti consumer, Anthropic punta al mercato enterprise tramite API.
Claude Sonnet 4 da 1M token: prezzi e accessibilità

Il nuovo limite di contesto comporta un adeguamento anche dei prezzi. Per prompt superiori ai 200.000 token, il costo raddoppia a 6 dollari per milione di token in input e aumenta del 50% per l’output.
Tuttavia, Anthropic propone soluzioni per ottimizzare la spesa; per esempio, il prompt caching per ridurre latenza e costi, e il batch processing che può tagliare fino al 50% della spesa. Attualmente, la funzione è disponibile solo via API. Ma l’azienda ha dichiarato l’intenzione di portarla anche sulle applicazioni web e mobile di Claude. Le prospettive future includono anche una possibile estensione a Claude Opus 4.1, sebbene non siano state fornite tempistiche precise.