Claude Opus 4.7: il modello Anthropic che ridefinisce il lavoro agentico

Anthropic ha rilasciato da poche ore Claude Opus 4.7, il suo modello più capace attualmente disponibile al pubblico, posizionandolo come il punto di riferimento della famiglia Claude 4 per tutto ciò che riguarda il lavoro autonomo, prolungato e ad alta complessità.

All’interno della gamma, Opus occupa storicamente il gradino più alto in termini di intelligenza e profondità di ragionamento, con Sonnet che copre il punto di equilibrio tra costo e capacità e Haiku il segmento veloce ed economico. Opus 4.7 segue questa filosofia portandola alle sue conseguenze pratiche: non è pensato per le domande rapide, ma per i compiti che richiedono maggiore autonomia, attenzione ai dettagli e la capacità di verificare i propri output prima di restituirli.

Rispetto al predecessore Opus 4.6, il salto è apprezzabile soprattutto nell’ingegneria del software avanzata, nella visione ad alta risoluzione e nel ragionamento su documenti complessi. Il modello si rivolge a sviluppatori, team di prodotto, analisti e aziende che costruiscono agenti su compiti ad alto valore.

Anthropic stessa lo descrive come meno capace del proprio Claude Mythos Preview — un modello al momento ad accesso limitato — ma più performante di Opus 4.6 sull’ampio spettro dei benchmark.

Opus 4.7: architettura e novità tecniche

Opus 4.7 introduce un tokenizer completamente rinnovato, che migliora le prestazioni su un’ampia varietà di task ma può aumentare il conteggio dei token tra il 10% e il 35% rispetto ai modelli precedenti — un dettaglio da tenere presente se si lavora con l’API e si vuole gestire i costi con precisione.

La finestra di contesto resta di 1 milione di token, senza sovrapprezzo per i contesti lunghi. Sul fronte del ragionamento, il modello abbandona il vecchio sistema di “extended thinking” con budget fissi a favore del “pensiero adattivo” (adaptive thinking), che il modello attiva autonomamente in base alla difficoltà del compito: in test interni Anthropic ha verificato che questo approccio supera il precedente metodo.

Debuttano anche i task budget, un meccanismo che consente di indicare al modello quanti token ha a disposizione per completare un intero ciclo agente — utile quando si vuole bilanciare qualità e costo su workflow automatizzati.

Sul fronte visivo, Opus 4.7 è il primo modello Claude a supportare immagini ad alta risoluzione: il limite passa da 1.568 pixel lato lungo a 2.576 pixel, circa 3,75 megapixel, più che triplicando la superficie visiva analizzabile. Questo si traduce in maggiori capacità per chi lavora con screenshot densi, diagrammi tecnici o interfacce visive complesse.

Benchmark e performance di Opus 4.7

I risultati dei test rilasciati da Anthropic mostrano miglioramenti trasversali rispetto a Opus 4.6. Nell’ambito della visione per computer, XBOW ha registrato un punteggio del 98,5% sul proprio benchmark di acuità visiva contro il 54,5% di Opus 4.6 — un balzo che, secondo il team, sblocca un’intera categoria di lavoro prima inaccessibile.

Per i task di analisi documentale enterprise, Databricks ha misurato il 21% di errori in meno rispetto al predecessore su OfficeQA Pro. Nei workflow agente prolungati, Factory ha riportato un incremento del 10-15% nel tasso di completamento dei task, con meno errori di tool e maggiore affidabilità nelle fasi di validazione.

Sul fronte della revisione del codice, Qodo ha osservato capacità di rilevazione sui PR più complessi che modelli precedenti non riuscivano a gestire, con velocità paragonabile a GPT-5.4 xhigh.

Il benchmark Bolt ha riportato fino al 10% di miglioramento nelle sessioni di costruzione app di lunga durata. Anthropic segnala anche progressi nei benchmark economici come GDPval-AA — una valutazione di terze parti sul lavoro cognitivo di valore nei settori finanza, legale e knowledge work in senso lato — e sul Finance Agent Evaluation. Il profilo di sicurezza rimane sostanzialmente allineato a Opus 4.6, con miglioramenti in onestà e resistenza agli attacchi di prompt injection, ma qualche debolezza marginale in altri ambiti specifici.

Prezzi, disponibilità e posizionamento competitivo

Opus 4.7 è disponibile da oggi su tutti i prodotti Claude, attraverso l’API Anthropic con l’identificativo claude-opus-4-7, e sulle principali piattaforme cloud: Amazon Bedrock, Google Cloud Vertex AI e Microsoft Foundry. Il prezzo rimane invariato rispetto a Opus 4.6: 5 dollari per milione di token in input e 25 dollari per milione di token in output.

Modello	Input (per 1M token)	Output (per 1M token)
DeepSeek-V3.2	$0.07	$0.42
Grok 4.1 Fast (xAI)	$0.20	$0.50
MiniMax M2.5	$0.15	$1.20
MiniMax M2.5-Lightning	$0.30	$2.40
Qwen3.5 397B A17B	$0.60	$3.60
Qwen3.5 Plus	$0.40	$2.40
Kimi K2.5	$0.60	$3.00
GLM-5.1 (Z.ai)	$0.95	$3.15
Grok 4.2 (xAI)	$2.00	$6.00
Gemini 3.1 Pro (Google)	$2.00	$12.00
GPT-5.4	$2.50	$15.00
Claude Sonnet 4.6 (Anthropic)	$3.00	$15.00
Claude Opus 4.6 (Anthropic)	$5.00	$25.00
Claude Opus 4.7 (Anthropic)	$5.00	$25.00
GPT-5.4 Pro	$30.00	$180.00

Considerando che il nuovo tokenizer può consumare fino al 35% di token in più rispetto al predecessore, il costo effettivo per workload potrebbe essere superiore nella pratica — vale la pena verificarlo sui propri casi d’uso prima di pianificare il budget. Nel panorama competitivo, Opus 4.7 si colloca nella fascia premium dei modelli frontier, quella dove si gioca la partita con GPT-5.4 di OpenAI e Gemini Ultra di Google.

Anthropic ha implementato su Opus 4.7 nuove salvaguardie per le capacità di cybersecurity, bloccando automaticamente richieste che rientrano in usi vietati o ad alto rischio. I professionisti della sicurezza che necessitano di queste funzioni per penetration testing o ricerca sulle vulnerabilità possono aderire al nuovo Cyber Verification Program.

Opus 4.7: chi dovrebbe usarlo

Claude Opus 4.7 è un aggiornamento solido e senza regressioni rilevanti, con un profilo di miglioramento che emerge chiaramente nei contesti dove il modello deve lavorare in autonomia per periodi prolungati, gestire compiti di codice complessi o interpretare contenuti visivi ad alta densità di informazione.

Se il tuo lavoro coinvolge la costruzione di agenti AI, l’automazione di workflow di ingegneria o l’analisi di documenti aziendali strutturati, il salto da Opus 4.6 sarà concreto e misurabile. Se invece cerchi un modello per task conversazionali o generativi meno intensivi, Claude Sonnet 4.6 ancora offre un rapporto prestazioni/costo più favorevole.

Per chi sviluppa su API, la migrazione richiede qualche attenzione — in particolare la rimozione del vecchio sistema di extended thinking — ma la documentazione ufficiale copre le modifiche necessarie in modo esaustivo.

Ultimi Articoli

Claude Opus 4.7: il modello Anthropic che ridefinisce il lavoro agentico

Opus 4.7: architettura e novità tecniche

Benchmark e performance di Opus 4.7

Prezzi, disponibilità e posizionamento competitivo

Opus 4.7: chi dovrebbe usarlo