Close Menu
    Ultimi Articoli
    Claude Opus 4.5

    Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori

    25/11/2025
    Honor Watch 4

    Honor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva

    25/11/202541 Views

    Samsung Galaxy Tab S10 Lite, un tablet mid-range versatile e completo

    25/11/202523 Views

    CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro

    24/11/202537 Views

    Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2

    24/11/2025
    Epomaker HE75 Mag

    Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

    23/11/2025
    Galaxy Fit3

    Galaxy Fit3: una smartband completa per il tuo benessere quotidiano

    22/11/202519 Views
    Honor 400 Pro

    Honor 400 Pro: hardware da top di gamma con aggiornamenti fino al 2031

    22/11/202528 Views
    martedì, Novembre 25
    Trending
    • Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    • ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD
    • Honor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva
    • Samsung Galaxy Tab S10 Lite, un tablet mid-range versatile e completo
    • CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro
    • Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2
    • Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco
    • Galaxy Fit3: una smartband completa per il tuo benessere quotidiano
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All

      Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2

      24/11/2025
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      11/11/2025
      GMKtec NucBox K10

      GMKtec NucBox K10: mini PC Intel i9 per produttività e multimedia

      04/11/2025

      GTBox T1: il mini PC che si traveste da altoparlante Bluetooth

      31/10/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025
      Lenovo Yoga Slim 7

      Potenza e autonomia si muovono insieme sul Lenovo Yoga Slim 7

      26/09/2025
      Dell Inspiron 16

      Dell Inspiron 16 5645: un notebook elegante, potente e versatile al prezzo giusto

      27/07/2025
      Acer Aspire 3 A315-44P

      Acer Aspire 3 A315-44P: Potenza e versatilità a buon prezzo

      25/07/2025

      BenQ ZOWIE XL2586X+, il monitor da 600Hz per esports

      07/11/2025
      PG27FFX2A

      ASRock PG27FFX2A 520Hz: zero lag, massima reattività, pura precisione

      15/09/2025
      ASUS ROG Strix XG32UCWMG

      ASUS ROG Strix XG32UCWMG : nuovo punto di riferimento per il gaming di fascia alta

      10/09/2025
      BenQ MA320U

      BenQ MA320U, monitor 4K ideale per Mac

      01/08/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.2

      13/11/2024
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      02/10/2025
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      19/07/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      HBM4E

      Samsung con HBM4E punta a 3.25TB/s entro il 2027, oltre le specifiche JEDEC

      15/10/2025
      OpenAI AMD

      AMD e OpenAI: alleanza strategica da miliardi di dollari

      06/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      nvidia intel

      Nvidia investe e collabora con Intel: nuove APU Intel x86 RTX e CPU x86 nei cloud Nvidia

      19/09/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025
      Copilot

      Windows 11 si trasforma con Copilot Voice, Vision e Actions

      17/10/2025
      Windows 11 25H2

      Microsoft rilascia Windows 11 25H2 con focus sulla sicurezza

      01/10/2025
      Microsoft store

      Microsoft Store è ora gratuito per sviluppatori individuali

      11/09/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      10/08/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      24/09/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025

      Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2

      24/11/2025
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025

      Snapdragon X2 Elite: compatibilità gaming Windows al 90%

      21/11/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024

      GPT-4 supera gli analisti finanziari nella previsione degli utili aziendali

      28/05/2024
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      Starship Flight 10

      SpaceX Starship Flight 10: il ritorno del gigante spaziale

      27/08/2025
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      26/09/2025
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Xiaomi Power Bank da 165W: ricarica ultra-rapida e design compatto

      10/04/2025
      Honor Watch 4

      Honor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva

      25/11/2025

      CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro

      24/11/2025
      Xiaomi Watch S4 47 mm

      Xiaomi Watch S4 47 mm, uno degli smartwatch più personalizzabili sul mercato

      17/11/2025

      Watch Ultra 3, il miglior smartwatch Apple per outdoor

      28/10/2025
      Hue Bridge Pro

      Philips Hue Bridge Pro: novità e prestazioni del nuovo hub smart

      19/11/2025
      Gamesir G7 Pro

      GameSir G7 Pro: precisione e versatilità per il gaming

      08/09/2025

      Kindle Colorsoft 16 GB perfetto per manga, fumetti e riviste, ora in offerta su Amazon

      27/08/2025
      8BitDo Ultimate 2C Controller

      8BitDo Ultimate 2C Wireless Controller, il migliore sotto i 50 euro

      10/08/2025

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      19/09/2025
      Ultimate Ears EVERBOOM

      Ultimate Ears Everboom: audio a 360 gradi, design solido e 20 ore di autonomia

      09/08/2025
      EarFun Uboom L

      EarFun UBoom L, l’altoparlante economico, pratico e di qualità

      27/07/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      Claude Opus 4.5

      Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori

      25/11/2025
      AMD

      ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD

      25/11/2025
      antica roma generata con Nano Banana Pro

      Nano Banana Pro, il nuovo modello generativo di immagini di Google

      21/11/2025
      Gemini 3 Pro Preview

      Gemini 3 Pro Preview: il nuovo modello Google arriva su AI Studio

      18/11/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      25/07/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      WhatsApp introduce le chiavi di accesso per backup sicuri

      30/10/2025
      servo motore rendering

      Servo: il nuovo motore di navigazione scritto in Rust

      21/10/2025

      Google Search cambia: ora puoi nascondere gli annunci, ma solo dopo averli visti

      14/10/2025
      Epic Games

      Con iOS 18.6 installare Epic Games Store su iPhone è più semplice

      01/10/2025
      Claude Opus 4.5

      Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori

      25/11/2025
      AMD

      ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD

      25/11/2025
      Galaxy Fit3

      Galaxy Fit3: una smartband completa per il tuo benessere quotidiano

      22/11/2025
      Honor 400 Pro

      Honor 400 Pro: hardware da top di gamma con aggiornamenti fino al 2031

      22/11/2025
    • Mobiles
      1. Smartphones
      2. View All
      Honor 400 Pro

      Honor 400 Pro: hardware da top di gamma con aggiornamenti fino al 2031

      22/11/2025

      Motorola Razr 60: il migliore pieghevole entry-level

      11/11/2025

      Motorola Edge 70 lo smartphone ultra-sottile che sfida Samsung e Apple

      04/11/2025

      Galaxy S25 FE: il flagship mascherato che Samsung non voleva creare

      31/10/2025

      Samsung Galaxy Tab S10 Lite, un tablet mid-range versatile e completo

      25/11/2025

      Apple sta espandendo la connettività satellitare su iPhone

      10/11/2025
      Android

      Vulnerabilità Android 0-Click: CVE-2025-48593

      04/11/2025
      OPPO Pad SE

      OPPO Pad SE: tablet economico con autonomia record e corpo in alluminio

      04/11/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      Space Travel 2 Ultra

      Moondrop Space Travel 2 Ultra : TWS economici con driver planare, LDAC e ANC

      12/11/2025
      Moondrop Pill

      Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole

      11/11/2025

      Baseus BH1 Lite, con Bluetooth 6.0 e 80 ore di autonomia, un alleato quotidiano

      06/11/2025

      OPPO Enco Air4, auricolari economici per sport, lavoro e intrattenimento

      03/11/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      18/08/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Space Travel 2 Ultra

      Moondrop Space Travel 2 Ultra : TWS economici con driver planare, LDAC e ANC

      12/11/2025
      Moondrop Pill

      Moondrop Pill: auricolari a clip OWS dal design fuori dagli schemi e suono piacevole

      11/11/2025

      Baseus BH1 Lite, con Bluetooth 6.0 e 80 ore di autonomia, un alleato quotidiano

      06/11/2025

      OPPO Enco Air4, auricolari economici per sport, lavoro e intrattenimento

      03/11/2025
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      microvast

      Microvast: l’innovazione nelle batterie allo stato solido

      13/01/2025
      RedMagic Astra

      RedMagic Astra : un tablet compatto da battaglia per gamer nomadi

      21/11/2025
      zoeti

      Zoeti in regalo su Epic Games

      20/11/2025
      Godzilla Voxel Wars

      Godzilla Voxel Wars in regalo su Epic Games

      20/11/2025
      Anno 117: Pax Romana

      Anno 117: Pax Romana ti farà sentire un vero governatore romano

      19/11/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      Skechers

      Skechers GO RUN Elevate 2.0, scarpe per bambini con AirTag

      21/11/2025
      hallowen 2025

      Halloween 2025: la nostra selezione di film horror da vedere

      30/10/2025
      A House of Dynamite

      A House of Dynamite: il thriller di Kathryn Bigelow che divide e inquieta

      28/10/2025
      digiuno

      Il digiuno come strategia per rigenerare il sangue e rallentare l’invecchiamento

      27/10/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD
    Intelligenza artificiale

    ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD

    AMD colma il gap infrastrutturale accumulato da CUDA di Nvidia: ROCm e MI300X hanno raggiunto la maturità tre anni dopo ChatGPT e sono ora un'alternativa valida a NVIDIA
    GrazianoGraziano25/11/202508 Mins Read
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    AMD
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    AMD ha raggiunto un traguardo importante con ZAYA1-base di Zyphra, il primo modello linguistico Mixture-of-Experts (MoE) addestrato completamente su ecosistema e hardware AMD. La realizzazione di questo modello AI conferma che la piattaforma AMD, composta da GPU Instinct MI300X e schede di rete Pensando Pollara 400, rappresenta oggi un’alternativa concreta e competitiva per l’addestramento di modelli AI di frontiera.

    AMD

    Per competere efficacemente nel mercato dell’intelligenza artificiale, non è sufficiente vendere GPU performanti per inferenza; serve un ecosistema software completo paragonabile a CUDA di NVIDIA, che dal suo lancio nel 2006 ha dominato il settore creando una piattaforma integrata di librerie, compilatori e strumenti di sviluppo. Quando OpenAI rilasciò ChatGPT nel novembre 2022, i modelli GPT sottostanti erano stati addestrati interamente su infrastruttura NVIDIA sfruttando CUDA e le GPU A100; il risultato di anni di ottimizzazioni e maturità dell’ecosistema software NVIDIA.

    AMD ha quindi accumulato un ritardo tecnologico significativo proprio su questo fronte infrastrutturale; nonostante le GPU RDNA e CDNA offrissero caratteristiche hardware competitive. Mancava uno stack software robusto necessario per il training distribuito su larga scala; librerie di comunicazione, kernel ottimizzati e framework di alto livello pienamente integrati.

    Acquisizioni strategiche e maturità ROCm: AMD recupera quindici anni di vantaggio CUDA Nvidia

    AMD non è stata a guardare ed ha investito molto per colmare questo gap; ricordiamo per esempio l’acquisizione di nod.ai (un’azienda specializzata nei sistemi di Intelligenza Artificiale e Machine Learning) e di ZTSytem (fornitore di infrastrutture per il cloud computing e l’intelligenza artificiale).

    L’addestramento completo del modello ZAYA1-base dimostra ora che AMD ha finalmente colmato questa distanza; attraverso ROCm, RCCL, HIP e l’integrazione con PyTorch. AMD ha raggiunto quella maturità sistemica che va oltre le specifiche hardware. Il risultato ottenuto da Zyphra conferma che l’infrastruttura è ora sufficientemente solida per supportare carichi di lavoro di frontiera.

    Questo traguardo arriva quasi tre anni dopo il debutto pubblico di ChatGPT; periodo durante il quale NVIDIA ha consolidato ulteriormente il dominio grazie a Hopper, NVLink e software stack sempre più raffinati. AMD recupera quindi un gap accumulato in oltre quindici anni di evoluzione CUDA; la dimostrazione pratica con ZAYA1-base indica che la piattaforma MI300X con Pollara e ROCm rappresenta finalmente un’alternativa credibile per chi cerca diversificazione tecnologica senza compromettere prestazioni o stabilità.

    AMD e il progetto di Zyphra

    Il progetto nasce dalla collaborazione tra Zyphra, AMD e IBM Cloud; combina 128 nodi di calcolo per un totale di 750 PFLOPs di potenza computazionale massima raggiungibile. Il modello ZAYA1-base conta 760 milioni di parametri attivi e 8,3 miliardi totali; ha prestazioni paragonabili a modelli densi come Qwen3-4B nonostante l’architettura più leggera.

    L’addestramento è stato documentato sotto ogni aspetto tecnico e fornisce linee guida pratiche per chi intende utilizzare lo stack AMD in produzione; una dimostrazione che ROCm e i relativi strumenti software sono pronti per carichi di lavoro complessi e prolungati.

    Tutta la documentazione ufficiale del training Zypra su infrastruttura AMD è disponibile qui.

    Architettura Hardware: GPU MI300X e rete Pensando Pollara

    Ogni nodo di calcolo del cluster Zyphra integra otto GPU MI300X connesse tramite InfinityFabric, con 2 TB di memoria DDR5 e doppio socket Intel Xeon Platinum 8570. La capacità di memoria HBM delle MI300X, pari a 192 GB per GPU, ha permesso di adottare una strategia semplificata basata principalmente su data-parallelism con l’ottimizzatore distribuito ZeRO-1.

    Questa configurazione semplifica il codice e aumenta l’efficienza complessiva. L’architettura di rete utilizza una struttura rails-only con interruttori organizzati su due livelli; un compromesso tra costi di realizzazione e velocità di comunicazione rispetto a soluzioni più elaborate.

    Ogni GPU ha una propria scheda di rete Pollara da 400Gbps, che raggiunge complessivamente 3,2 Tbps di capacità per nodo; avere collegamenti dedicati riduce i rallentamenti e facilita il trasferimento diretto dei dati tra le schede grafiche. Il cluster mantiene separate le reti usate per l’addestramento del modello da quelle dedicate alla gestione dei file e dei salvataggi; questo evita che il caricamento dei dati disturbi le comunicazioni essenziali tra le GPU.

    Zyphra ha condotto i primi test approfonditi sulle schede Pollara; ha misurato tutte le operazioni di comunicazione fondamentali con diverse quantità di informazioni e numeri di GPU e ottenuto informazioni pratiche per calibrare al meglio i trasferimenti di dati durante l’addestramento.

    Ottimizzazioni software: Kernel HIP e Stack ROCm

    L’addestramento del modello ZAYA1-base ha richiesto la creazione di componenti software personalizzati scritti in HIP per ottenere velocità competitive. HIP (Heterogeneous-Compute Interface for Portability) è un linguaggio di programmazione e un’interfaccia sviluppata da AMD per scrivere codice che gira su GPU. Funziona in modo simile a CUDA di NVIDIA, ma con una differenza importante; il codice scritto in HIP può essere compilato per funzionare sia su GPU AMD che su GPU NVIDIA. Essenzialmente, HIP permette agli sviluppatori di scrivere kernel (piccoli programmi che vengono eseguiti direttamente sulla GPU per operazioni ad alte prestazioni); in un linguaggio simile al C++.

    L’ottimizzatore Muon, che gestisce certi parametri del modello, richiede calcoli molto intensi attraverso un particolare metodo matematico; Zyphra ha realizzato componenti combinati che aggiornano contemporaneamente diverse informazioni, riducendo enormemente l’uso della memoria. Un componente specializzato per moltiplicare matrici simmetriche elimina circa metà dei calcoli necessari e dimezza le scritture in memoria per determinate porzioni; questo rende l’intero processo molto più efficiente in termini di trasferimento dati e riduce sensibilmente il tempo richiesto dall’ottimizzatore.

    Per le operazioni di normalizzazione dei layer, il team ha creato un componente unificato che esegue somma, calcolo delle statistiche, normalizzazione e trasformazione in un’unica operazione; supera le prestazioni ottenibili con semplici adattamenti dell’implementazione Transformer Engine di NVIDIA. L’integrazione con gli strumenti dello stack AMD, come Primus, AITER e RCCL, ha completato la piattaforma software; la calibrazione tramite PyTorch TunableOp, TransformerEngine ROCm e HIPBLASLt-bench ha generato tabelle di riferimento che associano le dimensioni delle operazioni matematiche agli algoritmi più veloci disponibili nelle librerie rocBLAS e hipBLASlt.

    Tutto questo tradotto in parole per non esperti significa maggiore efficienza, più semplicità e costi ridotti durante l’addestramento di un modello AI.

    Architettura ZAYA1: CCA, ZAYA1 router e residual scaling

    Il modello ZAYA1-base introduce tre innovazioni architetturali che migliorano l’efficienza dei modelli MoE. La Compressed Convolutional Attention (CCA) riduce drasticamente i requisiti computazionali comprimendo la KV-cache fino a 8x. Il ZAYA1 router sostituisce il gate lineare standard con una MLP compatta che integra Exponential Depth Averaging; promuove la specializzazione degli esperti e consente addestramento stabile con top-k pari a 1 senza esperti residui. Il residual scaling applica bias e coefficienti di gating appresi per controllare il flusso informativo con overhead trascurabile; ottiene gli stessi benefici dello schema di gating attentivo di Qwen a costi inferiori.

    Prestazioni di Zaya1

    Durante questa fase, l’obiettivo primario di Zyphra non era creare il modello AI più performante in assoluto; lo scopo era dimostrare che è possibile addestrare un modello linguistico altamente competitivo utilizzando interamente l’infrastruttura AMD. Il focus era validare la maturità dell’intero ecosistema hardware e software; dalle GPU MI300X alle schede di rete Pensando Pollara, dallo stack ROCm ai kernel HIP personalizzati. Una prova che questa piattaforma può sostenere carichi di lavoro di training su larga scala con prestazioni paragonabili o superiori a quelle ottenute con l’infrastruttura NVIDIA dominante.

    zaya1

    ZAYA1-base rappresenta quindi una proof of concept strategica; il modello raggiunge risultati competitivi superiori a Llama-3-8B e vicini a Qwen3-4B. Le sue prestazioni sono notevoli considerando i suoi solo 760 milioni di parametri attivi. Nei benchmark generali come MMLU (67,01%) e MMLU-Pro (40,43%), il modello supera Llama-3-8B e OLMoE-1b-7b; si avvicina a Qwen3-4B nonostante quest’ultimo abbia oltre quattro volte più parametri attivi.

    Nelle valutazioni matematiche avanzate (MATH-hard con 54,15% exact-match) e coding (MBPP+ con 75,40% pass@1), ZAYA1-base eccede persino Gemma3-12b-pt; un modello con molti più parametri totali.

    Anche la versione del modello ottimizzata per il ragionamento ha mostrato risultati soddisfacenti nei test avanzati; si avvicina a modelli di punta come Qwen3-4B-Thinking ancora prima delle fasi di perfezionamento successive; sono margini di miglioramento notevoli.

    AMD è pronta per il training di modelli di frontiera

    L’addestramento completo di ZAYA1-base conferma che l’ecosistema AMD ha raggiunto la maturità necessaria per competere nell’addestramento di modelli linguistici su larga scala.

    Le prestazioni competitive di ZAYA1-base, ottenute con un’architettura innovativa che combina CCA, router avanzato e residual scaling, dimostrano che è possibile ottenere risultati all’avanguardia anche su piattaforme alternative a NVIDIA; l’efficienza nell’addestramento a lungo contesto (fino a 32k token) e la forte compressione della KV-cache rendono il modello adatto anche a GPU consumer di fascia bassa e per l’inferenza locale. Zyphra, AMD e IBM Cloud hanno aperto nuove opportunità per il settore AI.

    amd Zyphra
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleHonor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva
    Next Article Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Avatar photo
    Graziano
    • Website

    Giornalista e recensore tech per Gomoot. Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono: i film, il trekking, la bici e la corsa. Ma non disdegno mai una buona sessione di gaming 🎮 o programmazione – è il mio modo per ricaricarmi !

    Articoli collegati

    Claude Opus 4.5
    Intelligenza artificiale

    Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori

    25/11/2025
    antica roma generata con Nano Banana Pro
    Intelligenza artificiale

    Nano Banana Pro, il nuovo modello generativo di immagini di Google

    21/11/2025
    Gemini 3 Pro Preview
    Intelligenza artificiale

    Gemini 3 Pro Preview: il nuovo modello Google arriva su AI Studio

    18/11/2025
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    Claude Opus 4.5

    Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori

    25/11/2025
    Honor Watch 4

    Honor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva

    25/11/202541 Views

    Samsung Galaxy Tab S10 Lite, un tablet mid-range versatile e completo

    25/11/202523 Views

    CMF Watch 3 Pro, lo smartwatch con ChatGPT integrato a meno di 100 euro

    24/11/202537 Views

    Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2

    24/11/2025
    Epomaker HE75 Mag

    Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

    23/11/2025
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2025 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login to your account below.

    Continua con Google

    Lost password?