Close Menu
    Ultimi Articoli
    XRING O1

    Il debutto di Xiaomi nell’arena dei chip: nasce XRING O1

    23/05/2025
    Huawei Watch 5

    Huawei Watch 5, design elegante con sensore X-TAP e supporto eSIM

    23/05/2025
    Android 16 QPR1 Beta

    Android 16 QPR1 Beta 1 porta Material 3 Expressive

    23/05/2025
    Bose SoundLink Flex 2

    Bose SoundLink Flex 2: audio bilanciato e design robusto

    23/05/2025
    Gigapocalypse

    Gigapocalypse in regalo su Epic Games

    23/05/2025
    sifu

    Sifu è in regalo su Epic Games

    23/05/202515 Views
    Deliver At All Costs

    Deliver At All Costs in regalo su Epic Games

    22/05/2025
    Galaxy A26 5G

    Galaxy A26 5G, uno smartphone robusto, ben bilanciato e duraturo della Samsung

    22/05/2025
    sabato, Maggio 24
    Trending
    • Il debutto di Xiaomi nell’arena dei chip: nasce XRING O1
    • Claude 4 vs la concorrenza: performance, funzionalità e costi
    • Huawei Watch 5, design elegante con sensore X-TAP e supporto eSIM
    • Android 16 QPR1 Beta 1 porta Material 3 Expressive
    • Bose SoundLink Flex 2: audio bilanciato e design robusto
    • Gigapocalypse in regalo su Epic Games
    • Sifu è in regalo su Epic Games
    • Deliver At All Costs in regalo su Epic Games
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      Beelink ME Mini

      Beelink ME Mini, una scelta intelligente per il tuo storage

      13/05/2025
      GMKtec NucBox G9

      GMKTec NucBox G9, un mini pc pensato per un uso NAS

      10/05/2025
      Acemagic K1

      Acemagic K1 mini PC, potenza e risparmio energetico

      28/04/2025
      beelink ser9

      Beelink SER9: potenza, eleganza e compattezza nel nuovo Mini PC con AMD Strix Point

      26/04/2025
      ExpertBook P5

      Asus ExpertBook P5, un laptop per professionisti

      11/05/2025
      ASUS ProArt P16 H7606

      ASUS ProArt P16 H7606, potenza e versatilità per produttività e gaming

      10/05/2025
      Acemagic AX15

      ACEMAGIC AX15-N150: un laptop a 350 euro con 16GB di RAM e pannello IPS !

      04/05/2025

      Samsung Galaxy Book4 Pro 360, un elegante tuttofare

      29/04/2025

      Samsung Odyssey OLED G6: monitor QHD 500Hz per gamer esigenti

      21/05/2025
      ASUS ROG Swift PG32UCDP

      ASUS ROG Swift PG32UCDP: monitor 4k OLED dual-mode per gamer esigenti

      16/05/2025
      AW3225QF

      Alienware AW3225QF, monitor 4K QD-OLED di terza Gen per PC e console

      05/05/2025
      Gigabyte AORUS FI32Q X

      Gigabyte AORUS FI32Q X: un best buy per il QHD a 32 pollici

      28/04/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.1

      13/11/2024
      Corsair M55

      Mouse Corsair M55 e M55 Wireless: performance top a prezzi accessibili

      19/05/2025
      Logitech G309

      Logitech G309: mouse gaming wireless versatile e potente

      17/05/2025
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      14/04/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      29/03/2025
      amd udna

      UDNA 5, la nuova identità di AMD nel ray tracing: un cambio di rotta molto atteso

      06/05/2025
      RX 9070 XT

      La GPU Radeon RX 9070 XT va a ruba, successo di vendite per AMD

      25/03/2025
      Radeon 8060S

      La Radeon 8060S nelle APU AMD Strix Halo sarà una nuova frontiera per laptop e mini pc

      19/02/2025
      fsr4

      In arrivo l’upscaling con AMD FSR 4, ma solo per GPU RDNA 4

      11/01/2025
      Microsoft passkey

      Microsoft: nuovi account senza password e con passkey di default

      02/05/2025
      windows

      Fine supporto Windows 10: cosa scegliere tra Windows 11 e Linux

      09/01/2025
      Windows 11

      Aggiornamenti bloccati per un bug nei supporti Windows 11

      27/12/2024
      ChatGPT su Windows

      ChatGPT arriva su Windows, come utilizzare l’app su desktop

      18/11/2024
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Z790 Project Zero Plus

      La motherboard Z790 Project Zero Plus porta le DDR5 CAMM2 sui PC desktop

      24/05/2024
      B650M Project Zero

      MSI presenta la B650M Project Zero

      08/08/2023
      Nuove motheboards Intel Z790 MAX

      Computex 2023 : nuove motherboards da MSI

      31/05/2023
      G915 Lightspeed TKL

      Logitech G915 X LIGHTSPEED TKL: tastiera multiuso con profilo premium

      12/05/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      27/03/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      17/03/2025
      Keychron Q1 HE: tastiera meccanica

      Keychron Q1 HE: tastiera meccanica con switch magnetici Hall Effect

      02/02/2025

      Samsung Odyssey OLED G6: monitor QHD 500Hz per gamer esigenti

      21/05/2025
      TP-Link WiFi 7 Deco BE85

      TP-Link WiFi 7 Deco BE85, router WiFi 7

      21/05/2025
      microsoft

      Microsoft rende open source WSL e l’editor CLI Edit in Rust

      20/05/2025
      Corsair M55

      Mouse Corsair M55 e M55 Wireless: performance top a prezzi accessibili

      19/05/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      alimenti ultra-processati

      Alimenti ultra-processati collegati a 32 effetti negativi sulla salute

      28/05/2024
      Google I/O 2025

      Google I/O 2025: come seguirlo e cosa aspettarsi

      20/05/2025
      Pwn2Own

      Pwn2Own Berlin 2025: exploit su AI, Docker, Windows e Linux

      16/05/2025
      WWDC 2025

      WWDC 2025: si alza il sipario il 9 Giugno

      26/03/2025
      startship

      SpaceX Starship Flight 7, un successo a metà.

      17/01/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      21/03/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025
      belkin

      Belkin Power Bank da 5.000 mAh compatibile con MagSafe e Qi2

      03/11/2024
      Huawei Watch 5

      Huawei Watch 5, design elegante con sensore X-TAP e supporto eSIM

      23/05/2025

      Huawei Watch Fit 4 Pro, smartwatch fitness con 10 giorni di autonomia

      19/05/2025
      Amazfit Active 2

      Amazfit Active 2, uno dei migliori smartwatch budget

      11/05/2025
      Huawei Watch Fit SE

      Huawei Watch Fit SE: 100+ modalità di allenamento per ogni sportivo

      09/05/2025
      WiiM Mini

      WiiM Mini: lo streamer Hi-Res economico che sorprende

      16/05/2025
      motorola moto tag

      Motorola Moto Tag, Android tracker con Bluetooth e UWB

      15/05/2025
      Sonnet Echo 13 Thunderbolt 5

      Più porte, più potenza, più velocità: scopri il dock Sonnet Echo 13 Thunderbolt 5 SSD

      14/05/2025
      GameSir X5 Lite

      GameSir X5 Lite: controller per iOS e Android

      12/05/2025
      Bose SoundLink Flex 2

      Bose SoundLink Flex 2: audio bilanciato e design robusto

      23/05/2025
      Marshall Emberton III

      Marshall Emberton III: il re portatile del suono rock

      21/05/2025
      JBL Clip 5

      JBL Clip 5, lo speaker Bluetooth ultra-portatile e suono potente

      14/05/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      12/04/2025
      Claude 4

      Claude 4 vs la concorrenza: performance, funzionalità e costi

      23/05/2025
      Gemini Diffusion

      Gemini Diffusion: cos’è e perché è diverso dagli altri LLM

      22/05/2025
      AI Mode

      Google AI Mode: come cambia la ricerca e l’esperienza web

      22/05/2025
      Google Meet

      Google Meet porta la traduzione vocale live

      22/05/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      12/04/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      moduli Go

      Moduli Go cancellano dischi Linux in un lampo

      06/05/2025
      One UI 8.0

      One UI 8.0: la nuova interfaccia Samsung su Android 16, tutte le novità in cantiere

      30/04/2025

      SuperCard X: nuova minaccia contactless in rapida espansione

      22/04/2025

      Verifica su Bluesky: arrivano i badge blu

      22/04/2025
      Claude 4

      Claude 4 vs la concorrenza: performance, funzionalità e costi

      23/05/2025
      Bose SoundLink Flex 2

      Bose SoundLink Flex 2: audio bilanciato e design robusto

      23/05/2025
      Galaxy A26 5G

      Galaxy A26 5G, uno smartphone robusto, ben bilanciato e duraturo della Samsung

      22/05/2025
      Gemini Diffusion

      Gemini Diffusion: cos’è e perché è diverso dagli altri LLM

      22/05/2025
    • Mobiles
      1. Smartphones
      2. View All
      Galaxy A26 5G

      Galaxy A26 5G, uno smartphone robusto, ben bilanciato e duraturo della Samsung

      22/05/2025
      Moondrop MIAD01

      Moondrop MIAD01: il primo smartphone progettato per audiofili

      22/05/2025

      Nubia Music 2 uno smartphone per chi ama la musica

      21/05/2025
      Moto G34 5G

      Motorola Moto G34 5G: il 5G a 100 euro!

      20/05/2025
      XRING O1

      Il debutto di Xiaomi nell’arena dei chip: nasce XRING O1

      23/05/2025
      Android 16 QPR1 Beta

      Android 16 QPR1 Beta 1 porta Material 3 Expressive

      23/05/2025

      Redmi Pad Pro tra studio, gaming e intrattenimento: promosso

      21/05/2025
      Honor 200 Pro

      Honor 200 Pro: il re della fotografia mobile

      18/05/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      Soundcore Space One Pro

      Soundcore Space One Pro cuffie wireless con 60 ore di autonomia

      20/05/2025
      nothing ear (a)

      Nothing Ear (a): auricolari in-ear TWS con ANC e integrazione con ChatGPT

      20/05/2025

      SteelSeries Arctis GameBuds: il suono perfetto per i gamer in movimento

      18/05/2025
      Sennheiser HD 505

      Sennheiser HD 505: cuffie open-back per audiofili a prezzo accessibile

      18/05/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      19/03/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      iFi go bar

      Ascolta audio ad alta fedeltà sul tuo Iphone con l’amp/DAC Hi-Res portatile iFi GO bar.

      03/08/2024
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      19/03/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      Credits Technics : amplificatore digitale SE-R1

      Come ascoltare musica allo stereo con la qualità più alta possibile

      06/05/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Soundcore Space One Pro

      Soundcore Space One Pro cuffie wireless con 60 ore di autonomia

      20/05/2025
      nothing ear (a)

      Nothing Ear (a): auricolari in-ear TWS con ANC e integrazione con ChatGPT

      20/05/2025

      SteelSeries Arctis GameBuds: il suono perfetto per i gamer in movimento

      18/05/2025
      Sennheiser HD 505

      Sennheiser HD 505: cuffie open-back per audiofili a prezzo accessibile

      18/05/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Solana

      Visa punta sulla blockchain Solana: i motivi della partnership

      18/09/2023
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      BYD

      BYD e Tesla: sfida per il primato nel mercato EV

      03/01/2025
      batterie 4680

      Panasonic sfida il mercato EV con le batterie 4680: cosa cambia?

      09/09/2024
      Gigapocalypse

      Gigapocalypse in regalo su Epic Games

      23/05/2025
      sifu

      Sifu è in regalo su Epic Games

      23/05/2025
      Deliver At All Costs

      Deliver At All Costs in regalo su Epic Games

      22/05/2025

      RoadCraft migliora SnowRunner e punta ad essere uno dei migliori simulatori del 2025

      20/05/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      TAO Osservatorio Atacama dell'Università di Tokyo

      TAO: il telescopio più alto del mondo è pronto a scrutare il cosmo dal deserto cileno di Atacama

      03/05/2024
      declino cognitivo

      La sfida di trovare le parole giuste: un primo segnale di declino cognitivo?

      17/03/2024
      he Wonderfully Weird World of Gumball

      Hulu annuncia il ritorno della serie surreale di Gumball

      20/05/2025

      Papa Leone XIV e l’IA: il significato del suo nome

      12/05/2025
      Google 100 Zeros

      Google entra nel cinema con il progetto 100 Zeros

      06/05/2025
      devil may cry netflix

      Devil May Cry: l’attesa serie anime di Netflix arriva il 3 Aprile

      02/04/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»Claude 4 vs la concorrenza: performance, funzionalità e costi
    Intelligenza artificiale

    Claude 4 vs la concorrenza: performance, funzionalità e costi

    Anthropic porta Claude 4 al livello successivo: agenti intelligenti in grado di scrivere codice, conservare contesto e rispondere con logica.
    GrazianoGraziano23/05/2025Updated:23/05/202508 Mins Read
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    Claude 4
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    Anthropic ha svelato ieri la nuova generazione dei suoi modelli linguistici, Claude 4: Claude Opus 4 e Claude Sonnet 4. Entrambi portano con sé un’evoluzione nel paradigma dell’intelligenza artificiale generativa. Questi sistemi sono stati progettati per affrontare compiti articolati, mantenendo coerenza e tenuta del contesto per periodi prolungati. Claude Opus 4 si posiziona come il vertice dell’offerta Anthropic; è concepito per governare task complessi che richiedono stabilità cognitiva e continuità nel ragionamento IA.

    Claude 4

    Claude Sonnet 4, invece, rappresenta una versione più snella; conserva però caratteristiche avanzate che lo rendono idoneo a contesti meno specialistici ma non per questo meno esigenti. La loro uscita è stata coordinata su più fronti: Anthropic API, Amazon Bedrock, Google Cloud Vertex AI.

    Per ora non è previsto il modello minore Claude Haiku 4. Curiosità: con la serie Claude 3.5 è mancato all’appello Claude Opus, mentre erano presenti i fratelli minori Sonnet e Haiku. Con la serie Claude 4 è ritornato Claude Opus ma questa volta manca il piccolo Haiku.

    Al lancio di questa distribuzione si aggiungono funzionalità di nuova generazione, come la modalità di pensiero esteso, il supporto alla memoria persistente e l’integrazione con strumenti di sviluppo professionale. Con questa release, Anthropic si propone di consolidare la sua posizione nel mercato degli LLM offrendo modelli che non si limitano a rispondere, ma ragionano, memorizzano e cooperano.

    Claude 4: capacità di codifica e reasoning

    Secondo i dati riportati da Anthropic, Claude Opus 4 ha ottenuto un punteggio del 72,5% su SWE-bench e ha superato modelli consolidati come GPT-4.1 e Gemini 2.5 Pro.

    Ma il dato più eclatante riguarda la sua autonomia operativa; durante test effettuati da Rakuten, ha mantenuto coerenza per oltre sette ore consecutive riuscendo a gestire un intero progetto open-source in modo fluido. Questa performance indica una resistenza inedita per un modello linguistico; permette di sostenere attività continuative senza interruzioni di contesto.

    Claude Sonnet 4, pur con un’impostazione meno ambiziosa, mostra miglioramenti tangibili rispetto alla versione 3.7. L’aderenza alle istruzioni ricevute è ora più rigorosa e il supporto alla memoria contestuale è stato rafforzato. Questo risulta particolarmente efficace quando i modelli ricevono accesso a file locali; la stabilità nella gestione dei task ne beneficia notevolmente. La combinazione di queste qualità rende entrambi i modelli strumenti ideali per scenari in cui precisione, affidabilità e continuità risultano indispensabili.

    Le allucinazioni IA e le imprecisioni nelle risposte dei modelli di intelligenza artificiale sono un problema noto. Con Claude 4, Anthropic ha lavorato molto per limitare il problema. Rispetto ai precedenti modelli, Claude 4 dimostra un miglioramento nell’accuratezza delle risposte su domande complesse, riducendo anche la generazione di risposte sbagliate.

    Claude Code e tool di sviluppo

    Con il rilascio generale di Claude Code, i modelli Claude si affermano come partner affidabili nello sviluppo software moderno. Il sistema si integra perfettamente con strumenti come GitHub Actions, VS Code e JetBrains; consente modifiche contestuali direttamente nel codice sorgente.

    Questo approccio semplifica il ciclo di feedback tra progettazione e revisione; rende il processo più fluido e meno soggetto a errori manuali. Claude Opus 4, in particolare, mantiene coerenza tra file multipli, migliora la struttura complessiva del codice e riduce l’intervento umano in fase di debugging. Questa coerenza è essenziale nei progetti su larga scala; previene disallineamenti logici tra moduli distinti.

    In contesti aziendali, tali capacità si traducono in un’accelerazione dei cicli di sviluppo; aumentano la precisione nella localizzazione dei bug e ottimizzano le risorse coinvolte. Inoltre, la qualità del codice prodotto beneficia della supervisione ovvero ogni modifica viene valutata nel contesto dell’intero progetto.

    La chat conversazionale di Claude

    Claude 4: modalità di pensiero esteso e reasoning multimodale

    Una delle innovazioni più avanzate introdotte da Claude 4 è la “modalità di pensiero esteso“; consente al modello di alternare tra riflessione autonoma e utilizzo di strumenti esterni come il web search. Questo approccio iterativo aumenta la precisione delle risposte e riproduce un processo analitico simile a quello umano; pensare, cercare, analizzare, sintetizzare.

    Il modello non si limita a generare testi; costruisce una catena di ragionamenti che migliora il risultato finale. Inoltre, Claude 4 integra i “thinking summaries“, brevi sintesi del processo logico, generate automaticamente che aiutano a comprendere come il modello è arrivato a una determinata conclusione.

    Questa funzione migliora la tracciabilità delle decisioni nei flussi di lavoro complessi. L’introduzione di questi strumenti rafforza il ruolo dell’IA come supporto cognitivo avanzato; rende possibile una collaborazione più trasparente, verificabile e integrata nei contesti organizzativi.

    Memoria persistente e gestione del contesto nei task lunghi

    Una delle difficoltà più comuni nei modelli precedenti era mantenere la coerenza su task distribuiti nel tempo; la perdita del contesto interrompeva spesso il filo logico. Claude Opus 4, grazie alla funzione di “memory file“, riesce a registrare informazioni fondamentali; le utilizza successivamente nei progetti.

    Questa capacità risulta particolarmente utile in ambienti dove i task si sviluppano in sessioni separate; consente di mantenere un filo conduttore tra attività diverse. L’efficacia di questo approccio è già stata dimostrata in contesti sia ludici che professionali. Il modello può affrontare flussi narrativi e progettuali mantenendo continuità; una qualità importante per chi lavora su progetti a lungo termine o cicli iterativi.

    Claude 4: Benchmark e prestazioni

    Claude Opus 4 guida il settore anche sul fronte dei benchmark pubblici. Oltre al già citato SWE-bench dove ha raggiunto il 72,5%, eccelle anche su Terminal-bench; segna un 43,2% che lo posiziona al vertice delle classifiche globali. I test eseguiti da aziende come Rakuten e Block hanno confermato la sua capacità di gestire compiti complessi per ore senza cali di qualità; in uno scenario pratico, Opus 4 ha completato in autonomia una sessione di refactoring open source durata sette ore.

    Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.

    Claude Opus 4 is our most powerful model yet, and the world’s best coding model.

    Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9

    — Anthropic (@AnthropicAI) May 22, 2025

    Questo risultato indica un aspetto determinante per le applicazioni in ambito enterprise. Claude Sonnet 4, sebbene progettato con un focus maggiore sull’efficienza, ha registrato un notevole 72,7% su SWE-bench; supera così il punteggio del suo predecessore 3.7. La combinazione tra precisione e leggerezza lo rende ideale per task ripetitivi ma critici; garantisce prestazioni affidabili anche in condizioni di carico sostenuto.

    L’introduzione di Claude 4 avviene in un panorama IA sempre più affollato e competitivo. OpenAI ha recentemente aggiornato la sua famiglia GPT con GPT-4.1 e la sua serie o (o3 e o4). Google continua a spingere con Gemini 2.5 Pro e la sua capacità sperimentale Deep Think. Meta ha rilasciato Llama 4, con capacità multimodali e una finestra di contesto di 10 milioni di token. Anthropic, con Claude 4, ora rivendica una leadership soprattutto nelle prestazioni sostenute e nelle applicazioni di coding.

    Disponibilità, costi e limiti di utilizzo

    Claude Opus 4 e Sonnet 4 sono attualmente disponibili tramite molteplici canali cloud, tra cui Anthropic API, GitHUB, Amazon Bedrock e Google Cloud Vertex AI; ciò garantisce un’accessibilità ampia e capillare. La piena disponibilità delle funzionalità dipende però dalla tipologia di piano attivo.

    Cluade Opus 4 è riservato agli abbonamenti a pagamento (Pro, Max, Team, Enterprise). Claude Sonnet 4, invece, è fruibile anche con l’account gratuito, pur con alcune limitazioni operative. I costi per Opus 4 variano da 15 a 75 dollari per milione di token processati (input e output inclusi); Sonnet 4 ha una fascia di prezzo compresa tra 3 e 15 dollari.

    Non tutto è migliorato in Claude 4; la finestra di contesto è rimasta a 200k, molto piccola se paragonata con le finestre di contesto di Gemini 2.5 Pro (1MB) e LLama 4 (10 MB). Claude 4 inoltre è inferiore in ambiti come il riconoscimento visivo rispetto a Gemini 2.5. C’è già chi ritiene che Claude 4 sia troppo orientato agli sviluppatori e al coding, trascurando funzionalità multimodali o di contesto più ampio che potrebbero attrarre un pubblico più generale.

    Un altro problema ricorrente è il limite di prompt (ad esempio, ogni 8 ore), che frustra molti utenti, specialmente per progetti complessi che richiedono molte interazioni. Sembra anche che Claude 4 sia eccessivamente restrittivo, con guardrail che bloccano anche richieste innocue, soprattutto in ambiti come la sicurezza informatica o la scrittura creativa. Questo lo rende meno versatile rispetto a ChatGPT in alcuni contesti.

    Critiche a parte, Anthropic sta anche rilasciando quattro nuove funzionalità sull’API Anthropic che consentiranno agli sviluppatori di creare agenti di intelligenza artificiale più potenti; lo strumento di esecuzione del codice, il connettore MCP, l’API File e la possibilità di memorizzare nella cache i prompt per un massimo di un’ora.

    Conclusione: Claude Opus 4 e Sonnet 4

    La quarta generazione dei modelli Claude ridefinisce profondamente il ruolo dell’IA nella produttività e nella gestione di compiti ad alta complessità. La capacità di Opus 4 di lavorare autonomamente per ore su compiti complessi, mantenendo contesto e concentrazione, lo trasforma da uno strumento di risposta rapida a un vero collaboratore digitale per progetti di lunga durata.

    Sonnet 4 invece, offre un equilibrio ottimale tra prestazioni avanzate e accessibilità economica. Le innovazioni architetturali, come il ragionamento ibrido e la memoria persistente, sono fondamentali per questa nuova generazione di IA.

    Entrambi i modelli possono utilizzare strumenti in parallelo, seguire le istruzioni in modo più preciso e, quando gli sviluppatori hanno accesso ai file locali, dimostrano capacità di memoria significativamente migliorate per mantenere la continuità e la conoscenza nel tempo.

    Mentre la competizione nel settore si intensifica, Anthropic con Claude 4 si distingue per la sua focalizzazione su prestazioni sostenute, affidabilità e una profonda integrazione negli strumenti di sviluppo.

    AI API blog Claude claude4 gemini haiku ia LLM news OpenAI opus picks ragionamento search sonnet tech tecnologia
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleHuawei Watch 5, design elegante con sensore X-TAP e supporto eSIM
    Next Article Il debutto di Xiaomi nell’arena dei chip: nasce XRING O1
    Graziano
    • Website

    Reporter e recensore presso Gomoot, mi occupo di riportare notizie riguardanti la tecnologia. Ho cominciato con C64, Amiga, fino al 486; ora seguo con passione la tecnologia attuale e adoro in particolare i desktop SFF e i mini pc. Appassionato di informatica e linguaggi di programmazione nel tempo libero amo praticare trekking e stare all'aperto.

    Articoli collegati

    Gemini Diffusion
    Intelligenza artificiale

    Gemini Diffusion: cos’è e perché è diverso dagli altri LLM

    22/05/202520 Views
    AI Mode
    Intelligenza artificiale

    Google AI Mode: come cambia la ricerca e l’esperienza web

    22/05/2025
    Google Meet
    Intelligenza artificiale

    Google Meet porta la traduzione vocale live

    22/05/2025
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    XRING O1

    Il debutto di Xiaomi nell’arena dei chip: nasce XRING O1

    23/05/2025
    Huawei Watch 5

    Huawei Watch 5, design elegante con sensore X-TAP e supporto eSIM

    23/05/2025
    Android 16 QPR1 Beta

    Android 16 QPR1 Beta 1 porta Material 3 Expressive

    23/05/2025
    Bose SoundLink Flex 2

    Bose SoundLink Flex 2: audio bilanciato e design robusto

    23/05/2025
    Gigapocalypse

    Gigapocalypse in regalo su Epic Games

    23/05/2025
    sifu

    Sifu è in regalo su Epic Games

    23/05/202515 Views
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login below or Register Now.

    Continua con Google
    Lost password?

    Register Now!

    Already registered? Login.

    Continua con Google

    A password will be e-mailed to you.