Continua la battaglia al primato del modello AI. Oggi è il turno di Anthropic che ha lanciato Claude 3.7 Sonnet, un modello AI che introduce un concetto inedito: il ragionamento ibrido. Alcuni degli attuali modelli AI in circolazione offrono due modalità operative; un modello AI di chat conversazionale per risposte rapide (ad esempio ChatGPT 4o) e un modello di AI di ragionamento (ad esempio il modello o1 o o3 di OpenAi, DeepSeek R1, Gemini Flash Thinking) .

A differenza di questo approccio che si concentra quindi sulla scelta di una singola modalità operativa, Claude 3.7 Sonnet integra nello stesso tempo risposte rapide e riflessioni approfondite all’interno di un singolo modello AI. Questa caratteristica consente di bilanciare velocità e qualità della risposta in base alle esigenze specifiche; uno strumento versatile per diversi ambiti applicativi, dalla programmazione all’assistenza.
L’accesso al modello Claude Sonnet 3.7 è disponibile su tutte le piattaforme Claude; inclusi i piani Free (con limitazioni di utilizzo), Pro, Team ed Enterprise, oltre che tramite API e servizi cloud come Amazon Bedrock e Google Cloud Vertex AI. Tuttavia, la modalità di ragionamento esteso di Sonnet 3.7 è riservata esclusivamente ai livelli a pagamento.
Perché è un modello ibrido?
Il concetto di modello ibrido va oltre la semplice combinazione di velocità e ragionamento. Claude 3.7 Sonnet è progettato per simulare il modo in cui il cervello umano alterna tra riflessione rapida e analisi approfondita. Il modello funziona su due modalità principali:
- Modalità standard. Fornisce risposte immediate, ideali per conversazioni fluide e interazioni rapide.
- Modalità di pensiero esteso. La modalità “extended thinking” permette a Claude di ragionare più a lungo su problemi complessi, generando una serie di token prima di fornire la risposta finale. Migliora la qualità nei compiti più complessi come matematica avanzata, coding e risoluzione di problemi tecnici.
La modalità ibrida lo rende particolarmente efficace nei compiti di coding; compiti in cui un’analisi più profonda porta a soluzioni più accurate e prive di errori. Mentre in altre situazioni può rispondere in modo molto più veloce in quanto non è necessaria un’analisi approfondita del problema.
Questa flessibilità è possibile grazie a un’integrazione nativa del ragionamento all’interno del modello; evita la necessità di soluzioni separate per compiti diversi. Per gli sviluppatori che utilizzano l’API, è anche possibile impostare un limite al numero di token di ragionamento; ottimizzando così il rapporto tra velocità, costo e qualità della risposta.
Addrestramento di Claude 3.7 Sonnet
Il modello Claude 3.7 Sonnet è stato addestrato utilizzando una combinazione di dati pubblici e privati disponibili fino a novembre 2024; inclusi dati forniti da servizi di etichettatura e collaboratori pagati, oltre a dati generati internamente.
I “servizi di etichettatura” sono aziende o piattaforme che forniscono dati annotati o etichettati utilizzati per addestrare modelli di intelligenza artificiale e machine learning. Questi servizi impiegano lavoratori, spesso chiamati “etichettatori” o “annotatori”; manualmente assegnano etichette o categorie a vari tipi di dati, come immagini, testi, audio o video. Ad esempio, un etichettatore potrebbe indicare se un’immagine contiene un gatto o un cane. Questo processo è fondamentale per creare dataset di alta qualità; dati che i modelli di AI possono utilizzare per imparare a riconoscere pattern e fare previsioni accurate.
Sono state impiegate diverse tecniche di pulizia e filtraggio dei dati per garantire la qualità dei dati utilizzati. L’addestramento si è concentrato su principi di utilità, sicurezza e onestà, utilizzando anche tecniche di feedback umano. Dopo l’addestramento, il modello è stato sottoposto a valutazioni di sicurezza per monitorare eventuali usi dannosi.
Benchmark e prestazioni di Claude 3.7 Sonnet
I test condotti su Claude 3.7 Sonnet evidenziano miglioramenti rispetto ai modelli precedenti e ai concorrenti. Secondo i benchmark indipendenti:
- SWE-bench Verified: Claude 3.7 Sonnet ottiene risultati superiori nel risolvere problemi software complessi rispetto ai modelli OpenAI o1 e o3-mini. I test hanno dimostrato che il modello gestisce meglio la comprensione e la risoluzione di bug; con una maggiore precisione nell’identificare errori e proporre soluzioni efficaci.
- TAU-bench: dimostra eccellenza nell’esecuzione di compiti complessi con interazioni realistiche, supera i modelli concorrenti. I test su simulazioni pratiche mostrano che Claude 3.7 Sonnet è in grado di prendere decisioni più accurate rispetto ai suoi rivali in ambienti ad alto livello di incertezza.
- Coding performance: secondo test di aziende come Cursor, Cognition e Vercel, Claude 3.7 Sonnet è il migliore della categoria nella gestione di codice complesso e aggiornamenti full-stack. È in grado di interpretare architetture di software articolate, proporre miglioramenti strutturali e scrivere codice più efficiente rispetto ai modelli concorrenti.
- Efficienza operativa: Il modello permette di bilanciare costo e qualità della risposta grazie alla gestione flessibile del tempo di ragionamento. Il controllo del budget di elaborazione consente agli sviluppatori di ottimizzare il tempo di calcolo; al fine di ottenere il miglior rapporto tra rapidità e accuratezza.
Inoltre, test condotti su dataset di competizioni matematiche e scientifiche evidenziano un netto miglioramento rispetto alle versioni precedenti. Claude 3.7 Sonnet eccelle nella risoluzione di problemi complessi di fisica computazionale e ottimizzazione; dimostra un livello di astrazione e logica superiore alla media del settore.

Questi risultati mostrano e confermano che Claude 3.7 Sonnet non è solo un’evoluzione rispetto alla versione precedente Claude 3.5 Sonnet; e anche una valida alternativa ai principali modelli di intelligenza artificiale attualmente disponibili sul mercato.
Costi e disponibilità
Claude 3.7 Sonnet è disponibile su diverse piattaforme, incluse le offerte Free, Pro, Team ed Enterprise di Anthropic. Per chi desidera sfruttare il modello in ambienti aziendali, è disponibile anche tramite Anthropic API, Amazon Bedrock e Google Cloud Vertex AI.
I costi del modello variano in base alla tipologia di utilizzo. L’accesso base al modello è gratuito, ma la modalità di pensiero esteso è riservata ai livelli a pagamento. Per gli sviluppatori che operano con l’API, il costo è di 3 dollari per milione di token in input e 15 dollari per milione di token in output; una struttura tariffaria che include anche i token di ragionamento nel calcolo complessivo. Questa politica dei prezzi lo rende competitivo; soprattutto rispetto a soluzioni alternative come OpenAI che richiede costi aggiuntivi per funzionalità avanzate di ragionamento.
Grazie a questa flessibilità, Claude 3.7 Sonnet si rivela adatto sia a sviluppatori indipendenti che a grandi aziende alla ricerca di una soluzione AI avanzata; con la possibilità di gestire il proprio budget computazionale in modo più efficiente.
Conclusione
Claude 3.7 Sonnet rispetto ai competitori, offre una gestione più raffinata del tempo di elaborazione, è uno strumento efficace per chi necessita di soluzioni AI più adattabili. E’ anche un modo efficiente per risparmiare risorse. L’introduzione di un modello ibrido è una novità nel settore; il futuro dell’intelligenza artificiale potrebbe non essere in modelli specializzati, ma in modelli in grado di adattarsi dinamicamente alle esigenze del contesto.
Con questo approccio, Anthropic posiziona Claude 3.7 Sonnet come una delle soluzioni più avanzate per chi cerca un’intelligenza artificiale capace di pensare in modo più simile a quello umano.