Close Menu
    Ultimi Articoli

    Honor Magic 7 Pro progettato per offrire il massimo in ogni contesto

    11/01/202672 Views
    OnePlus 12R 5G

    OnePlus 12R 5G: un best buy per chi vuole il Wi-Fi 7

    11/01/2026189 Views
    Asus ROG Swift PG27AQDP

    Asus ROG Swift PG27AQDP: il monitor OLED da 480Hz che ridefinisce il gaming

    11/01/202631 Views
    Poco X7 Pro

    Poco X7 Pro: uno smartphone economico con prestazioni sorprendenti

    10/01/202679 Views
    Sennheiser HD 599

    Sennheiser HD 599: la fedeltà audio incontra il comfort

    10/01/2026114 Views

    Samsung Galaxy A56 un mid-range con IA e supporto fino al 2031

    10/01/202625 Views

    JBL Xtreme 3, altoparlante potente e impermeabile

    09/01/2026
    Hyundai Motor Group robotics

    Hyundai Motor Group lancia il chip Edge Brain e punta sulla physical AI

    09/01/2026
    lunedì, Gennaio 12
    Trending
    • Honor Magic 7 Pro progettato per offrire il massimo in ogni contesto
    • OnePlus 12R 5G: un best buy per chi vuole il Wi-Fi 7
    • Asus ROG Swift PG27AQDP: il monitor OLED da 480Hz che ridefinisce il gaming
    • Poco X7 Pro: uno smartphone economico con prestazioni sorprendenti
    • Sennheiser HD 599: la fedeltà audio incontra il comfort
    • Samsung Galaxy A56 un mid-range con IA e supporto fino al 2031
    • JBL Xtreme 3, altoparlante potente e impermeabile
    • Hyundai Motor Group lancia il chip Edge Brain e punta sulla physical AI
    Login
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      09/01/2026
      GMKtec NucBox K11

      GMKtec NucBox K11, una soluzione completa per produttività e intrattenimento

      20/12/2025

      Minisforum X1 Lite-255: un mini pc con Ryzen 7 255 e Oculink su M.2

      24/11/2025
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      11/11/2025
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025
      Lenovo Yoga Slim 7

      Potenza e autonomia si muovono insieme sul Lenovo Yoga Slim 7

      26/09/2025
      Dell Inspiron 16

      Dell Inspiron 16 5645: un notebook elegante, potente e versatile al prezzo giusto

      27/07/2025
      Asus ROG Swift PG27AQDP

      Asus ROG Swift PG27AQDP: il monitor OLED da 480Hz che ridefinisce il gaming

      11/01/2026
      LG UltraGear 27GX790A

      LG UltraGear 27GX790A: il monitor per gaming eSport

      08/01/2026
      Asus VA279QG

      ASUS VA279QG, monitor 27″ per lavoro, svago e gaming

      31/12/2025
      KTC H32S25E

      KTC H32S25E: monitor curvo 32” QHD per il gaming, alte prestazioni e prezzo contenuto

      28/12/2025
      Bluetooth 6.1

      Bluetooth 6.1: più privacy e autonomia per i dispositivi wireless

      12/05/2025
      ASUS ProArt Z790

      Evoluzione del bus di sistema PCIe fino al PCIe 7

      16/04/2025
      USB

      USB : l’evoluzione di Universal Serial Bus dagli anni 90 ad oggi

      02/02/2025
      bluetooth

      L’evoluzione del Bluetooth: un viaggio attraverso le versioni fino al 6.2

      13/11/2024
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      Scimitar Elite Wireless SE

      Corsair Scimitar Elite Wireless SE: un mouse pensato per chi ha bisogno di controllare tutto

      04/06/2025
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      HBM4E

      Samsung con HBM4E punta a 3.25TB/s entro il 2027, oltre le specifiche JEDEC

      15/10/2025
      OpenAI AMD

      AMD e OpenAI: alleanza strategica da miliardi di dollari

      06/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      windows 11

      Windows 11 : nuove strategie di resilienza e strumenti di ripristino

      19/11/2025
      Copilot

      Windows 11 si trasforma con Copilot Voice, Vision e Actions

      17/10/2025
      Windows 11 25H2

      Microsoft rilascia Windows 11 25H2 con focus sulla sicurezza

      01/10/2025
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      10/08/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025
      CVN Z790D5

      Colorful presenta la nuova mobo gaming CVN Z790D5 ARK FROZEN

      22/08/2024
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      24/09/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      Logitech G515 TKL

      Logitech G515: tastiera gaming TKL sottile e versatile a prezzo accessibile

      04/06/2025
      Asus ROG Swift PG27AQDP

      Asus ROG Swift PG27AQDP: il monitor OLED da 480Hz che ridefinisce il gaming

      11/01/2026
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      09/01/2026
      LG UltraGear 27GX790A

      LG UltraGear 27GX790A: il monitor per gaming eSport

      08/01/2026
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      Starship Flight 10

      SpaceX Starship Flight 10: il ritorno del gigante spaziale

      27/08/2025
      Made by Google 2025

      Tutto pronto per il Made by Google 2025: il 20 agosto debutta la nuova generazione Pixel

      18/08/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      28/11/2025

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      26/09/2025
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025
      Redmi Watch 5 Active

      Redmi Watch 5 Active: lo smartwatch economico di Xiaomi

      04/01/2026
      Amazfit T-Rex 3

      Amazfit T-Rex 3: lo smartwatch robusto ed economico

      03/01/2026
      Amazfit Bip 6

      Amazfit Bip 6: autonomia, salute e sport a basso prezzo

      01/01/2026

      Amazfit Active Max, lo smartwatch sportivo di fascia media

      30/12/2025
      GameSir G8 Galileo

      GameSir G8 Galileo, una console gaming per Android e iPhone ora al prezzo più basso di sempre

      04/01/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Chipolo Pop

      Chipolo Pop, il miglior tracker Bluetooth compatibile con Find My e Find Hub

      28/12/2025
      MiLi MiTag Go

      MiLi MiTag Go: il tracker Android con privacy garantita

      27/12/2025

      JBL Xtreme 3, altoparlante potente e impermeabile

      09/01/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Beats Pill

      Beats Pill (2024): altoparlante Bluetooth compatto e resistente

      25/12/2025

      JBL Flip 7, lo speaker Bluetooth portatile solido e versatile

      25/12/2025
      sleepFM

      Il modello AI SleepFM interpreta il sonno e predice le malattie

      07/01/2026
      meta manus

      Meta acquisisce la startup Manus per 2 miliardi di dollari

      31/12/2025
      nitrogen

      NitroGen: il modello AI per il gaming costruito dai video degli streamer

      29/12/2025
      mu language model

      Mu, un motore AI per gestire le impostazioni di Windows 11

      27/12/2025
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      31/12/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024

      GStreamer 1.26.10 migliora Flac, Opus, Matroska e streaming adattativo

      29/12/2025
      OpenShot 3.4

      OpenShot 3.4: prestazioni migliorate e nuovi strumenti creativi per l’editing video

      16/12/2025

      Google lancia Emergency Live Video per chiamate d’emergenza

      11/12/2025
      HDMI 2.1

      HDMI 2.1 sulla Steam Machine esiste ma è nascosto

      08/12/2025

      Honor Magic 7 Pro progettato per offrire il massimo in ogni contesto

      11/01/2026
      OnePlus 12R 5G

      OnePlus 12R 5G: un best buy per chi vuole il Wi-Fi 7

      11/01/2026
      Poco X7 Pro

      Poco X7 Pro: uno smartphone economico con prestazioni sorprendenti

      10/01/2026

      Samsung Galaxy A56 un mid-range con IA e supporto fino al 2031

      10/01/2026
    • Mobiles
      1. Smartphones
      2. View All

      Honor Magic 7 Pro progettato per offrire il massimo in ogni contesto

      11/01/2026
      OnePlus 12R 5G

      OnePlus 12R 5G: un best buy per chi vuole il Wi-Fi 7

      11/01/2026
      Poco X7 Pro

      Poco X7 Pro: uno smartphone economico con prestazioni sorprendenti

      10/01/2026

      Samsung Galaxy A56 un mid-range con IA e supporto fino al 2031

      10/01/2026
      Galaxy Tab A11+

      Samsung Galaxy Tab A11+: finalmente la serie A permette il gaming

      05/01/2026
      DOOGEE Tab E3 Max

      DOOGEE Tab E3 Max: un maxi-tablet pensato per multimedia e intrattenimento

      01/01/2026
      KOBO Clara Colour

      Kobo Clara Colour: eReader 6″ a colori per le tue letture estive, con Wi-Fi e audio

      29/12/2025
      Exynos 2600

      Samsung Exynos 2600: il primo processore mobile a 2nm è ufficiale

      19/12/2025
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All
      Sennheiser HD 599

      Sennheiser HD 599: la fedeltà audio incontra il comfort

      10/01/2026
      Soundcore P41i

      Anker Soundcore P41i, auricolari Bluetooth che ricaricano il telefono

      08/01/2026
      Moondrop Space Travel

      Moondrop Space Travel, auricolari TWS con ANC e buon suono a meno di 50 euro

      03/01/2026
      EarFun Wave Pro

      EarFun Wave Pro, cuffie over-ear wireless

      01/01/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      DAC ADI-2 DAC FS

      Cosa è un DAC audio

      26/10/2024
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024
      Sennheiser HD 599

      Sennheiser HD 599: la fedeltà audio incontra il comfort

      10/01/2026
      Soundcore P41i

      Anker Soundcore P41i, auricolari Bluetooth che ricaricano il telefono

      08/01/2026
      Moondrop Space Travel

      Moondrop Space Travel, auricolari TWS con ANC e buon suono a meno di 50 euro

      03/01/2026
      EarFun Wave Pro

      EarFun Wave Pro, cuffie over-ear wireless

      01/01/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Geely Xingyuan

      Auto elettriche: settembre 2025 segna un record con 2,1 milioni di unità vendute

      15/10/2025
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Volkswagen ID.1

      Volkswagen ID.1: l’auto elettrica da 20000 euro arriva nel 2027

      05/02/2025
      HyperX Cloud III

      HyperX Cloud III: comfort superiore e qualità audio a meno di 100 euro

      04/01/2026
      GOG

      GOG lascia CD PROJEKT: Michał Kiciński riporta la piattaforma DRM-free alle sue radici indie

      30/12/2025
      Bloodstained: Ritual of the Night

      Bloodstained: Ritual of the Night in regalo su Epic Games

      23/12/2025
      paradise killer

      Paradise Killer in regalo su Epic Games

      22/12/2025
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      AlphaFold 3 di Google DeepMind

      AlphaFold 3 di Google DeepMind

      08/05/2024
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Skechers

      Skechers GO RUN Elevate 2.0, scarpe per bambini con AirTag

      21/11/2025
      hallowen 2025

      Halloween 2025: la nostra selezione di film horror da vedere

      30/10/2025
      A House of Dynamite

      A House of Dynamite: il thriller di Kathryn Bigelow che divide e inquieta

      28/10/2025
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD
    Intelligenza artificiale

    ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD

    AMD colma il gap infrastrutturale accumulato da CUDA di Nvidia: ROCm e MI300X hanno raggiunto la maturità tre anni dopo ChatGPT e sono ora un'alternativa valida a NVIDIA
    GrazianoGraziano25/11/202508 Mins Read
    Share Twitter Facebook Pinterest Reddit Telegram WhatsApp Email
    AMD
    Share
    Facebook Twitter Pinterest Reddit Telegram WhatsApp Email Threads

    AMD ha raggiunto un traguardo importante con ZAYA1-base di Zyphra, il primo modello linguistico Mixture-of-Experts (MoE) addestrato completamente su ecosistema e hardware AMD. La realizzazione di questo modello AI conferma che la piattaforma AMD, composta da GPU Instinct MI300X e schede di rete Pensando Pollara 400, rappresenta oggi un’alternativa concreta e competitiva per l’addestramento di modelli AI di frontiera.

    AMD

    Per competere efficacemente nel mercato dell’intelligenza artificiale, non è sufficiente vendere GPU performanti per inferenza; serve un ecosistema software completo paragonabile a CUDA di NVIDIA, che dal suo lancio nel 2006 ha dominato il settore creando una piattaforma integrata di librerie, compilatori e strumenti di sviluppo. Quando OpenAI rilasciò ChatGPT nel novembre 2022, i modelli GPT sottostanti erano stati addestrati interamente su infrastruttura NVIDIA sfruttando CUDA e le GPU A100; il risultato di anni di ottimizzazioni e maturità dell’ecosistema software NVIDIA.

    AMD ha quindi accumulato un ritardo tecnologico significativo proprio su questo fronte infrastrutturale; nonostante le GPU RDNA e CDNA offrissero caratteristiche hardware competitive. Mancava uno stack software robusto necessario per il training distribuito su larga scala; librerie di comunicazione, kernel ottimizzati e framework di alto livello pienamente integrati.

    Acquisizioni strategiche e maturità ROCm: AMD recupera quindici anni di vantaggio CUDA Nvidia

    AMD non è stata a guardare ed ha investito molto per colmare questo gap; ricordiamo per esempio l’acquisizione di nod.ai (un’azienda specializzata nei sistemi di Intelligenza Artificiale e Machine Learning) e di ZTSytem (fornitore di infrastrutture per il cloud computing e l’intelligenza artificiale).

    L’addestramento completo del modello ZAYA1-base dimostra ora che AMD ha finalmente colmato questa distanza; attraverso ROCm, RCCL, HIP e l’integrazione con PyTorch. AMD ha raggiunto quella maturità sistemica che va oltre le specifiche hardware. Il risultato ottenuto da Zyphra conferma che l’infrastruttura è ora sufficientemente solida per supportare carichi di lavoro di frontiera.

    Questo traguardo arriva quasi tre anni dopo il debutto pubblico di ChatGPT; periodo durante il quale NVIDIA ha consolidato ulteriormente il dominio grazie a Hopper, NVLink e software stack sempre più raffinati. AMD recupera quindi un gap accumulato in oltre quindici anni di evoluzione CUDA; la dimostrazione pratica con ZAYA1-base indica che la piattaforma MI300X con Pollara e ROCm rappresenta finalmente un’alternativa credibile per chi cerca diversificazione tecnologica senza compromettere prestazioni o stabilità.

    AMD e il progetto di Zyphra

    Il progetto nasce dalla collaborazione tra Zyphra, AMD e IBM Cloud; combina 128 nodi di calcolo per un totale di 750 PFLOPs di potenza computazionale massima raggiungibile. Il modello ZAYA1-base conta 760 milioni di parametri attivi e 8,3 miliardi totali; ha prestazioni paragonabili a modelli densi come Qwen3-4B nonostante l’architettura più leggera.

    L’addestramento è stato documentato sotto ogni aspetto tecnico e fornisce linee guida pratiche per chi intende utilizzare lo stack AMD in produzione; una dimostrazione che ROCm e i relativi strumenti software sono pronti per carichi di lavoro complessi e prolungati.

    Tutta la documentazione ufficiale del training Zypra su infrastruttura AMD è disponibile qui.

    Architettura Hardware: GPU MI300X e rete Pensando Pollara

    Ogni nodo di calcolo del cluster Zyphra integra otto GPU MI300X connesse tramite InfinityFabric, con 2 TB di memoria DDR5 e doppio socket Intel Xeon Platinum 8570. La capacità di memoria HBM delle MI300X, pari a 192 GB per GPU, ha permesso di adottare una strategia semplificata basata principalmente su data-parallelism con l’ottimizzatore distribuito ZeRO-1.

    Questa configurazione semplifica il codice e aumenta l’efficienza complessiva. L’architettura di rete utilizza una struttura rails-only con interruttori organizzati su due livelli; un compromesso tra costi di realizzazione e velocità di comunicazione rispetto a soluzioni più elaborate.

    Ogni GPU ha una propria scheda di rete Pollara da 400Gbps, che raggiunge complessivamente 3,2 Tbps di capacità per nodo; avere collegamenti dedicati riduce i rallentamenti e facilita il trasferimento diretto dei dati tra le schede grafiche. Il cluster mantiene separate le reti usate per l’addestramento del modello da quelle dedicate alla gestione dei file e dei salvataggi; questo evita che il caricamento dei dati disturbi le comunicazioni essenziali tra le GPU.

    Zyphra ha condotto i primi test approfonditi sulle schede Pollara; ha misurato tutte le operazioni di comunicazione fondamentali con diverse quantità di informazioni e numeri di GPU e ottenuto informazioni pratiche per calibrare al meglio i trasferimenti di dati durante l’addestramento.

    Ottimizzazioni software: Kernel HIP e Stack ROCm

    L’addestramento del modello ZAYA1-base ha richiesto la creazione di componenti software personalizzati scritti in HIP per ottenere velocità competitive. HIP (Heterogeneous-Compute Interface for Portability) è un linguaggio di programmazione e un’interfaccia sviluppata da AMD per scrivere codice che gira su GPU. Funziona in modo simile a CUDA di NVIDIA, ma con una differenza importante; il codice scritto in HIP può essere compilato per funzionare sia su GPU AMD che su GPU NVIDIA. Essenzialmente, HIP permette agli sviluppatori di scrivere kernel (piccoli programmi che vengono eseguiti direttamente sulla GPU per operazioni ad alte prestazioni); in un linguaggio simile al C++.

    L’ottimizzatore Muon, che gestisce certi parametri del modello, richiede calcoli molto intensi attraverso un particolare metodo matematico; Zyphra ha realizzato componenti combinati che aggiornano contemporaneamente diverse informazioni, riducendo enormemente l’uso della memoria. Un componente specializzato per moltiplicare matrici simmetriche elimina circa metà dei calcoli necessari e dimezza le scritture in memoria per determinate porzioni; questo rende l’intero processo molto più efficiente in termini di trasferimento dati e riduce sensibilmente il tempo richiesto dall’ottimizzatore.

    Per le operazioni di normalizzazione dei layer, il team ha creato un componente unificato che esegue somma, calcolo delle statistiche, normalizzazione e trasformazione in un’unica operazione; supera le prestazioni ottenibili con semplici adattamenti dell’implementazione Transformer Engine di NVIDIA. L’integrazione con gli strumenti dello stack AMD, come Primus, AITER e RCCL, ha completato la piattaforma software; la calibrazione tramite PyTorch TunableOp, TransformerEngine ROCm e HIPBLASLt-bench ha generato tabelle di riferimento che associano le dimensioni delle operazioni matematiche agli algoritmi più veloci disponibili nelle librerie rocBLAS e hipBLASlt.

    Tutto questo tradotto in parole per non esperti significa maggiore efficienza, più semplicità e costi ridotti durante l’addestramento di un modello AI.

    Architettura ZAYA1: CCA, ZAYA1 router e residual scaling

    Il modello ZAYA1-base introduce tre innovazioni architetturali che migliorano l’efficienza dei modelli MoE. La Compressed Convolutional Attention (CCA) riduce drasticamente i requisiti computazionali comprimendo la KV-cache fino a 8x. Il ZAYA1 router sostituisce il gate lineare standard con una MLP compatta che integra Exponential Depth Averaging; promuove la specializzazione degli esperti e consente addestramento stabile con top-k pari a 1 senza esperti residui. Il residual scaling applica bias e coefficienti di gating appresi per controllare il flusso informativo con overhead trascurabile; ottiene gli stessi benefici dello schema di gating attentivo di Qwen a costi inferiori.

    Prestazioni di Zaya1

    Durante questa fase, l’obiettivo primario di Zyphra non era creare il modello AI più performante in assoluto; lo scopo era dimostrare che è possibile addestrare un modello linguistico altamente competitivo utilizzando interamente l’infrastruttura AMD. Il focus era validare la maturità dell’intero ecosistema hardware e software; dalle GPU MI300X alle schede di rete Pensando Pollara, dallo stack ROCm ai kernel HIP personalizzati. Una prova che questa piattaforma può sostenere carichi di lavoro di training su larga scala con prestazioni paragonabili o superiori a quelle ottenute con l’infrastruttura NVIDIA dominante.

    zaya1

    ZAYA1-base rappresenta quindi una proof of concept strategica; il modello raggiunge risultati competitivi superiori a Llama-3-8B e vicini a Qwen3-4B. Le sue prestazioni sono notevoli considerando i suoi solo 760 milioni di parametri attivi. Nei benchmark generali come MMLU (67,01%) e MMLU-Pro (40,43%), il modello supera Llama-3-8B e OLMoE-1b-7b; si avvicina a Qwen3-4B nonostante quest’ultimo abbia oltre quattro volte più parametri attivi.

    Nelle valutazioni matematiche avanzate (MATH-hard con 54,15% exact-match) e coding (MBPP+ con 75,40% pass@1), ZAYA1-base eccede persino Gemma3-12b-pt; un modello con molti più parametri totali.

    Anche la versione del modello ottimizzata per il ragionamento ha mostrato risultati soddisfacenti nei test avanzati; si avvicina a modelli di punta come Qwen3-4B-Thinking ancora prima delle fasi di perfezionamento successive; sono margini di miglioramento notevoli.

    AMD è pronta per il training di modelli di frontiera

    L’addestramento completo di ZAYA1-base conferma che l’ecosistema AMD ha raggiunto la maturità necessaria per competere nell’addestramento di modelli linguistici su larga scala.

    Le prestazioni competitive di ZAYA1-base, ottenute con un’architettura innovativa che combina CCA, router avanzato e residual scaling, dimostrano che è possibile ottenere risultati all’avanguardia anche su piattaforme alternative a NVIDIA; l’efficienza nell’addestramento a lungo contesto (fino a 32k token) e la forte compressione della KV-cache rendono il modello adatto anche a GPU consumer di fascia bassa e per l’inferenza locale. Zyphra, AMD e IBM Cloud hanno aperto nuove opportunità per il settore AI.

    amd Zyphra
    Seguici su X (Twitter) Seguici su Bluesky Seguici su WhatsApp
    Share. Facebook Twitter Pinterest
    Previous ArticleHonor Watch 4, lo smartwatch per tutti i giorni, con anima sportiva
    Next Article Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Avatar photo
    Graziano
    • Website

    Giornalista e recensore tech per Gomoot. Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono: i film, il trekking, la bici e la corsa. Ma non disdegno mai una buona sessione di gaming 🎮 o programmazione – è il mio modo per ricaricarmi !

    Articoli collegati

    sleepFM
    Intelligenza artificiale

    Il modello AI SleepFM interpreta il sonno e predice le malattie

    07/01/2026
    meta manus
    Intelligenza artificiale

    Meta acquisisce la startup Manus per 2 miliardi di dollari

    31/12/2025
    nitrogen
    Intelligenza artificiale

    NitroGen: il modello AI per il gaming costruito dai video degli streamer

    29/12/202523 Views
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli

    Honor Magic 7 Pro progettato per offrire il massimo in ogni contesto

    11/01/202672 Views
    OnePlus 12R 5G

    OnePlus 12R 5G: un best buy per chi vuole il Wi-Fi 7

    11/01/2026189 Views
    Asus ROG Swift PG27AQDP

    Asus ROG Swift PG27AQDP: il monitor OLED da 480Hz che ridefinisce il gaming

    11/01/202631 Views
    Poco X7 Pro

    Poco X7 Pro: uno smartphone economico con prestazioni sorprendenti

    10/01/202679 Views
    Sennheiser HD 599

    Sennheiser HD 599: la fedeltà audio incontra il comfort

    10/01/2026114 Views

    Samsung Galaxy A56 un mid-range con IA e supporto fino al 2031

    10/01/202625 Views
    Gomoot : tecnologia e lifestyle
    Mastodon WhatsApp X (Twitter) Instagram Threads
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.

    Sign In or Register

    Welcome Back!

    Login to your account below.

    Continua con Google

    Lost password?