Claude Sonnet 3.5 (new): l'IA diventa potente e accessibile

Anthropic ha appena alzato l’asticella nel campo dell’intelligenza artificiale. Il 22 ottobre 2024 l’azienda ha presentato due nuovi modelli; una versione aggiornata di Claude Sonnet 3.5 sotto il nome di Claude Sonnet 3.5 (new) o anche Claude Sonnet 3.5 V.2 e un nuovo modello Claude Haiku 3.5. Le prime impressioni sono entusiastiche con miglioramenti tangibili nelle interazioni quotidiane. Il nuovo Sonnet dimostra una comprensione più profonda e risposte più precise.

Haiku si propone come alternativa economica ma potente. La novità sta nell’approccio: Anthropic ha creato modelli che combinano efficienza e accessibilità. Le prestazioni sono migliorate in modo sostanziale e la capacità di ragionamento hanno fatto un salto qualitativo.

Ricordo che i modelli di Anthropic sono essenzialmente tre (in modo simile a Gemini), divisi in base alle loro dimensioni. Il modello più grande (ma meno veloce) Claude Opus è ancora fermo alla version 3.0. Il modello di medie dimensioni Claude Sonnet 3.5 ora aggiornato alla versione Claude Sonnet 3.5 (new); rappresenta l’equilibrio tra intelligenza e prestazioni. Infine il modello di piccole dimensioni Haiku ora aggiornato alla versione 3.5; un modello creato per essere veloce nelle risposte.

Claude Sonnet 3.5 (new) prestazioni superiori

Il nuovo Sonnet 3.5 (new) rappresenta un’evoluzione sostanziale rispetto alla versione precedente. I benchmark mostrano miglioramenti in vari ambiti. La capacità di coding è aumentata notevolmente; il modello ha raggiunto il 49% su SWE-bench Verified. Le prestazioni su TAU-bench sono cresciute dal 62,6% al 69,2% nel settore retail. Su Reddit, numerosi programmatori riferiscono una maggiore accuratezza nelle risposte. La qualità del codice generato da Sonnet 3.5 (new) è migliorata sensibilmente. Il modello dimostra una comprensione più profonda dei requisiti tecnici. La capacità di debugging è più raffinata e precisa. Le risposte sono più coerenti e contestualizzate.

Il modello mantiene gli stessi costi e velocità della versione precedente; questo aspetto lo rende particolarmente interessante per le implementazioni aziendali. GitLab ha riscontrato un miglioramento fino al 10% nelle attività DevSecOps; The Browser Company ha confermato prestazioni superiori rispetto a qualsiasi altro modello testato. Il nuovo Sonnet 3.5 (new) eccelle particolarmente nella modifica e revisione del codice esistente e si nota inoltre una riduzione delle allucinazioni IA.

Sonnet 3.5 (new) è già disponibile per tutti dal sito di Claude, in versione gratuita (uso limitato) o in abbonamento. Sempre a partire da oggi, gli sviluppatori possono utilizzare Sonnet 3.5 (new) sull’API Anthropic, Amazon Bedrock e Vertex AI di Google Cloud.

Beta pubblica di “Computer Use”

Anthropic ha inoltre presentato una nuova funzionalità per certi versi rivoluzionaria, in beta pubblica; “Computer Use“. “Computer use” è già disponibile oggi sull’API; gli sviluppatori possono indirizzare Claude a utilizzare i computer come fanno le persone: Claude può guardare lo schermo, spostare un cursore, fare clic sui pulsanti e digitare testo. Claude 3.5 Sonnet è il primo modello di intelligenza artificiale di frontiera a offrire l’uso del computer in versione beta pubblica. In questa fase, è ancora sperimentale, e soggetto a errori. Anthropic ha rilasciato in anticipo “Computer use” per ricevere feedback dagli sviluppatori e migliorarlo nel tempo.

OpenAI durante una dimostrazione di ChatGPT voice model in occasione dell’OpenAI Spring Update, aveva dimostrato qualcosa di simile a “Computer Use”; ma ad oggi ancora non ha reso pubblica questa funzionalità.

Claude 3.5 Haiku: prestazioni e accessibilità

Haiku 3.5 rappresenta una svolta nel rapporto qualità-prezzo. Nonostante le dimensioni ridotte, il modello offre prestazioni paragonabili a Claude 3 Opus mantenendo costi contenuti. La velocità di elaborazione rimane elevata nonostante i miglioramenti; su SWE-bench Verified, Haiku raggiunge un impressionante 40,6%.

Haiku 3.5 supera le aspettative in compiti specifici e brilla particolarmente nell’estrazione dati e nella sintesi. La capacità di gestire grandi volumi di informazioni è notevole mentre la velocità di risposta rimane un punto di forza distintivo. Anthropic ha annunciato che Haiku sarà disponibile entro fine ottobre 2024.

Haiku 3.5 sarà disponibile attraverso l’API proprietaria; le integrazioni includeranno Amazon Bedrock e Google Cloud Vertex AI.

Sonnet 3.5 (new): conclusioni

L’introduzione di Claude Sonnet 3.5 (new) e Haiku stabilisce nuovi standard di eccellenza nel settore IA, mentre Haiku democratizza l’accesso a capacità avanzate di IA. Il futuro dell’intelligenza artificiale appare più accessibile e potente.

Anthropic rimane all’avanguardia dell’innovazione nel campo dell’intelligenza artificiale, un serio concorrente per Gemini e OpenAI. Con Sonnet 3.5 e Haiku 3.5, Anthropic ha dimostrato ancora una volta il suo impegno nel far progredire i confini di ciò che è possibile con l’IA.

L’approccio di Anthropic alla sicurezza rimane rigoroso; i test pre-deployment confermano l’affidabilità dei modelli. Le applicazioni pratiche sono numerose; i settori di utilizzo spaziano dallo sviluppo software all’automazione aziendale. Il futuro dell’IA appare promettente, questi modelli aprono nuove possibilità di innovazione.

Nel frattempo attendiamo le prossime novità. C’è molta attesa per il nuovo modello Grok 3.0 (su cui Elon Musk ha investito moltissimo) e la nuova versione di Claude Opus ancora ferma a 3.0.

Ultimi Articoli

Anthropic ridefinisce gli standard con Claude Sonnet 3.5 (new) e “Computer use”

Claude Sonnet 3.5 (new) prestazioni superiori

Beta pubblica di “Computer Use”

Claude 3.5 Haiku: prestazioni e accessibilità

Sonnet 3.5 (new): conclusioni