Close Menu
Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Ultimi Articoli
    Ladybird

    Ladybird e la sicurezza open source nell’era dell’AI

    05/06/2026
    Fish shell

    Fish 4.7: una shell a cui non manca (quasi) niente

    05/06/2026
    Songs of conquest

    Songs of Conquest: un genere che torna a respirare

    04/06/2026
    Warp

    Warp: il terminale che si è reinventato come ambiente di sviluppo agente

    04/06/202616 Views
    netbird

    NetBird: come costruire una rete privata senza dipendere dal cloud

    03/06/202625 Views

    Qwant diventa il motore di ricerca predefinito al Parlamento Europeo

    03/06/202620 Views

    Xiaomi Smart Band 10 Pro, la migliore smartband economica del 2026, ora sotto i 100 euro

    03/06/2026

    Amazfit Bip Max, lo smartwatch con GPS a meno di 100 euro

    02/06/2026
    sabato 6 Giugno 2026
    X (Twitter) Threads Mastodon Bluesky WhatsApp
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    • Home
    • Computer
      1. MINI PC
      2. Laptop
      3. Monitor
      4. Teoria
      5. Mouse
      6. GPU
      7. Windows
      8. Motherboard
      9. Tastiere
      10. View All
      NiPoGi E3B

      Mini PC NiPoGi E3B con Ryzen 7 5700U: potenza compatta ad un prezzo aggressivo

      26/03/2026

      GEEKOM A5: mini pc con buone prestazioni grazie all’AMD Ryzen 7 5800H

      26/03/2026
      Geekom A8

      Recensione Geekom A8: il mini PC AMD che non ti aspetti

      11/03/2026
      ACEMAGICIAN S3A

      ACEMAGICIAN S3A: un mini pc per il gaming ma non solo

      09/03/2026
      MacBook Neo

      MacBook Neo, il portatile entry-level di Apple

      30/03/2026
      Galaxy Book5 Pro

      Il Samsung Galaxy Book5 Pro sfida il MacBook su qualità e autonomia

      18/03/2026
      Lenovo Chromebook Duet 11

      Lenovo Chromebook Duet 11, un versatile 2-in-1 con 10 anni di aggiornamenti

      24/12/2025
      Legion 5 15IRX10

      Lenovo Legion 5 15IRX10, potenza da workstation e versatilità gaming

      13/10/2025

      ASUS ROG Strix XG27AQNGV, il monitor per i competitive gamer

      05/05/2026

      Philips Evnia 27M2N6501L: il miglior monitor QD-OLED sotto i 500 euro per gaming e color grading

      14/04/2026

      MSI Modern MD272UPSW, il monitor 4K che è anche Smart TV

      13/04/2026
      ASRock Phantom Gaming PGO32UFS

      ASRock Phantom Gaming PGO32UFS: il primo OLED di ASRock punta in alto

      07/04/2026
      Immich

      Immich: accelerazione GPU, ricerca CLIP multilingua e External Library

      09/05/2026
      uv astral

      Il tooling Python è sempre stato un disastro. uv risolve tutto in un colpo solo

      04/05/2026

      Mise-en-place sta cambiando il modo di gestire gli ambienti di sviluppo

      01/05/2026
      Powertoys

      Microsoft PowerToys: una suite senza pretese che risolve problemi reali

      30/04/2026

      Logitech G Pro X2 Superstrike, il mouse con tecnologia HITS per click più veloci

      10/02/2026
      Mouse NZXT Lift 2

      Mouse NZXT Lift 2, mouse filare ultraleggero e preciso

      21/12/2025
      MX Master 4

      Logitech MX Master 4, feedback aptico e design migliorato

      20/12/2025
      Burst II Air

      Turtle Beach Burst II Air wireless, un mouse gaming di soli 47 gr!

      15/06/2025
      MatX

      MatX raccoglie 500 milioni di dollari per sfidare Nvidia

      25/02/2026
      nvidia rtx 5090 ti

      Nvidia prepara una RTX 5090 “estrema” per il 2026

      09/02/2026
      dlss45 MFG 6× nvidia

      NVIDIA dynamic MFG e MFG 6×: più intelligenza per i frame generati

      06/02/2026
      OptiScaler

      OptiScaler, cos’è e come attivarlo nei giochi

      03/01/2026
      winget configuration

      WinGet Configuration configura Windows da zero con un solo comando

      02/06/2026
      Windhawk

      Windhawk: il marketplace di mod che modella Windows 11 a tuo piacere

      28/05/2026
      secure boot

      Secure Boot in scadenza: cosa succede ai PC dopo il 27 giugno 2026

      06/05/2026
      pannello di controllo windows 11

      Microsoft accelera l’abbandono del Pannello di controllo su Windows 11

      09/04/2026

      Arduino UNO Q raddoppia RAM e storage

      23/01/2026
      ROG Strix B860-A Gaming

      Asus ROG Strix B860-A Gaming WiFi, motherboard per build ad alte prestazioni.

      17/01/2026
      pcie 250watt

      Asus alimenta una RTX 5060 Ti da 250 W su uno slot PCIe potenziato

      23/09/2025
      MSI MAG Z890 Tomahawk WiFi

      MSI MAG Z890 Tomahawk WiFi: scheda madre top per Intel Ultra

      12/06/2025

      Light Mount di be quiet! porta il silenzio nel gaming

      04/02/2026
      Signature Slim Solar+ K980

      Logitech Signature Slim Solar+ K980: la tastiera che si ricarica con la luce

      22/01/2026
      Epomaker HE75 Mag

      Tastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco

      23/11/2025
      Keys-To-Go 2

      Logitech Keys-To-Go 2: tastiera wireless per laptop, tablet e smartphone

      14/06/2025
      winget configuration

      WinGet Configuration configura Windows da zero con un solo comando

      02/06/2026
      Windhawk

      Windhawk: il marketplace di mod che modella Windows 11 a tuo piacere

      28/05/2026

      Firefox Nova: Mozilla ufficializza il redesign

      22/05/2026

      Vivaldi 8.0 cambia l’interfaccia del browser

      21/05/2026
    • Tech
      1. Curiosità
      2. Eventi
      3. memory cards
      4. Powerbank
      5. Smartwatch
      6. Gadgets
      7. Bluetooth speakers
      8. Intelligenza artificiale
      9. Offerte
      10. Software
      11. View All

      Starlink abbassa i satelliti per sicurezza orbitale

      02/01/2026

      Con Nano Banana, Gemini supera ChatGPT tra le app AI

      17/09/2025
      grotta lunare

      Scoperta una grotta lunare sotterranea

      16/07/2024
      Oleg Kononenko

      Oleg Kononenko: 1000 giorni nello spazio

      05/06/2024
      Google I/O 2026

      La conferenza Google I/O 2026 sarà a maggio

      18/02/2026

      NASA rinvia Artemis II per perdite di idrogeno

      03/02/2026
      BYD YangWang U9 Extreme

      BYD YangWang U9 Extreme: il nuovo re della velocità tra le auto di serie

      24/09/2025
      Awe Dropping Apple

      Awe Dropping del 9 settembre 2025, Apple svela il suo futuro

      09/09/2025
      SSD Crucial P310 2TB

      Crucial P310 2TB SSD NVMe: storage ad alta velocità a un ottimo prezzo

      08/06/2025
      V-NAND QLC Samsung

      Il futuro dello storage è pronto: Samsung svela la V-NAND QLC da 1 Tb

      12/09/2024
      microSD SD Express

      Samsung presenta la prima microSD SD Express

      07/03/2024

      ADATA lancia il primo SSD esterno USB4 SE920

      31/10/2023
      power bank

      Power Bank cablati e wireless Qi2 : guida all’acquisto

      03/03/2026

      Anker Nano Power Bank 5K, il caricatore più sottile con MagSafe e Qi2

      22/01/2026
      Sharge ICEMAG 2

      Sharge ICEMAG 2: power bank Qi2 15W con raffreddamento attivo

      12/05/2025
      Baseus Nomos

      Baseus Nomos Power Bank: ricarica wireless veloce e sicura

      11/05/2025

      Amazfit Bip Max, lo smartwatch con GPS a meno di 100 euro

      02/06/2026

      Huawei Watch Fit 5 Pro: design e sensori da fascia alta in un formato ultrasottile

      08/05/2026

      Watch GT Runner 2 è il running watch più completo di Huawei

      30/03/2026

      WhatsApp arriva sugli smartwatch Garmin

      17/03/2026

      WiiM Sound Lite: speaker Wi-Fi perfetto per l’audio domestico

      11/05/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026

      Xiaomi Smart Tag offre Find My e Find Hub in un solo tracker

      12/03/2026
      Hollyland Lark A1

      Hollyland Lark A1: uno dei migliori microfoni lavalier per smartphone e vlogging

      03/03/2026

      JBL Xtreme 3, altoparlante potente e impermeabile

      19/05/2026

      JBL Boombox 4: speaker Bluetooth con AI e USB-C lossless

      18/05/2026
      JBL Clip 5

      JBL Clip 5, lo speaker Bluetooth ultra-portatile e suono potente

      16/05/2026
      Marshall Emberton III

      Marshall Emberton III: il re portatile del suono rock

      15/05/2026
      Claude Opus 4.8

      Claude Opus 4.8: il nuovo modello di Anthropic punta sull’affidabilità

      29/05/2026
      Qwen3.7-Max

      Qwen3.7-Max: nuovo modello agente di Alibaba con 1M token

      22/05/2026
      Gemini Omni

      Gemini Omni Flash: il nuovo modello video di Google

      21/05/2026
      gemini 3.5 flash

      Gemini 3.5 Flash: il modello veloce di Google che batte il flagship Gemini 3.1 Pro

      20/05/2026
      Ultimate Ear Wonderboom 3

      Ultimate Ears WONDERBOOM 3: suono di qualità a un prezzo accessibile

      24/03/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      nubia z60 ultra

      Offerte Black Friday Nubia: telefoni premium a prezzi convenienti

      22/11/2024
      Scream Fest 2024

      Steam Scream Fest 2024: sconti horror per Halloween

      29/10/2024
      Ladybird

      Ladybird e la sicurezza open source nell’era dell’AI

      05/06/2026
      Fish shell

      Fish 4.7: una shell a cui non manca (quasi) niente

      05/06/2026
      Warp

      Warp: il terminale che si è reinventato come ambiente di sviluppo agente

      04/06/2026
      netbird

      NetBird: come costruire una rete privata senza dipendere dal cloud

      03/06/2026

      Xiaomi Smart Band 10 Pro, la migliore smartband economica del 2026, ora sotto i 100 euro

      03/06/2026

      Xiaomi 17T porta il teleobiettivo Leica 5x nella fascia media

      02/06/2026
      Claude Opus 4.8

      Claude Opus 4.8: il nuovo modello di Anthropic punta sull’affidabilità

      29/05/2026
      starship v3 IFT-12

      Starship V3 al debutto: l’upper stage convince, il booster lascia lavoro da fare

      23/05/2026
    • Mobiles
      1. Smartphones
      2. View All

      Xiaomi 17T porta il teleobiettivo Leica 5x nella fascia media

      02/06/2026
      POCO M8 5G

      Il POCO M8 5G con display AMOLED da 3200 nits cambia le aspettative sulla fascia entry

      10/04/2026

      OPPO Reno13 Pro, il mid-range con ambizioni da flagship

      01/04/2026

      Samsung Galaxy A57 5G: il mid-range sottile, solido e duraturo

      27/03/2026

      Note A1 NXTPAPER di TCL, un blocco note digitale per studenti e professionisti

      28/04/2026

      TCL NXTPAPER 14 è il tablet che fa riposare gli occhi

      24/04/2026
      Galaxy Tab S10 FE

      Da Samsung due valide alternative all’ iPad, Galaxy Tab S10 FE e S10 FE+

      10/03/2026
      OPPO Pad SE

      OPPO Pad SE: tablet economico con autonomia record e corpo in alluminio

      09/03/2026
    • Musica
      1. Cuffie
      2. DAC
      3. hi-fi
      4. Teoria
      5. View All

      Sony INZONE H6 Air, la prima cuffia gaming open-back di Sony

      04/05/2026

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026

      SoundPEATS Air6 HS, auricolari semi-in-ear economici con LDAC

      23/04/2026

      Apple AirPods Max 2: sei anni di attesa per un aggiornamento che (quasi) vale il prezzo

      15/04/2026
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      FiiO BTR15

      FiiO BTR15: DAC Bluetooth al prezzo più basso di sempre

      17/05/2025
      Eversolo Play

      Eversolo Play: il tuttofare hi-fi per chi vuole meno cavi e più musica

      03/12/2025
      Pioneer VSA-LX805

      Pioneer VSA-LX805, un riferimento per i ricevitori AV high-end

      08/06/2025
      Focal Aria 926

      Componenti per un ottimo impianto stereo

      31/07/2024

      Garmin acquista JL Audio

      16/08/2023
      truffa phishing zalando

      Truffa phishing: in regalo la gift card Zalando da 150€

      06/12/2024
      sim ed esim

      Differenza tra SIM fisica ed eSIM: vantaggi e sicurezza

      02/11/2024

      Malware: cosa sono e come difendersi

      19/10/2024
      crittografia a cosa serve

      Crittografia, come funziona e perchè dobbiamo utilizzarla

      16/10/2024

      Sony INZONE H6 Air, la prima cuffia gaming open-back di Sony

      04/05/2026
      Truthear KeyX

      Truthear KeyX, un DAC dongle che vale ogni centesimo

      28/04/2026

      JBL Sense Pro: la formula open-ear che convince

      27/04/2026

      SoundPEATS Air6 HS, auricolari semi-in-ear economici con LDAC

      23/04/2026
    • Lifestyle
      1. Criptovalute
      2. EV
      3. Gaming
      4. Trekking
      5. Scienze
      6. View All
      Alpha Arena : trading ai bot

      Alpha Arena : sfida tra modelli AI nel trading di criptovalute

      20/10/2025
      Coinbase

      Coinbase colpita da attacco informatico e minaccia di riscatto

      15/05/2025
      coinbase

      Coinbase : acquisti cripto tramite Apple Pay

      03/12/2024
      criptovalute

      Criptovalute: cosa sono e come funzionano le monete virtuali

      19/10/2024
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
      CATL sodium ion

      CATL annuncia la produzione di massa delle batterie agli ioni di sodio nel 2026

      30/12/2025
      Songs of conquest

      Songs of Conquest: un genere che torna a respirare

      04/06/2026
      Calico recensione pc

      Calico, benvenuti a Heart Village

      28/05/2026
      Down in Bermuda

      Down in Bermuda: un puzzle adventure di Yak & Co tra sfere di luce e isole esotiche

      21/05/2026
      Sunderfolk

      Sunderfolk è un boardgame digitale per una serata in compagnia

      14/05/2026
      Samsung Galaxy Watch 5

      Samsung Galaxy Watch 5 in offerta

      03/01/2025
      8a Scarpinata della Teverina

      A spasso per i sentieri: 8a Scarpinata della Teverina

      14/05/2024
      Valli e Calanchi

      A spasso per i sentieri: 1a Valli e Calanchi

      27/09/2023
      Maternum Marathon 2023

      A spasso per i sentieri: la 2a edizione di Maternum Marathon

      13/06/2023
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      urano

      Le lune esterne di Urano Titania e Oberon, sono scure sul lato anteriore.

      19/06/2025
      Muon g-2

      L’anomalia Muon g-2 segue le leggi del Modello Standard

      13/06/2025
      Neuroplatform finalspark

      Neuroplatform, piattaforma online alimentata dal primo processore biologico al mondo

      27/05/2024
      CATL e HyperStrong

      CATL e HyperStrong: l’accordo da 60 GWh che porta le batterie al sodio nell’era industriale

      29/04/2026
      Il caffè riscrive il microbioma intestinale

      Il caffè riscrive il microbioma intestinale, e con esso umore, memoria e cognizione

      23/04/2026
      tesla

      Tesla dice addio a Model S e Model X ma accelera sugli EV autonomi e i robot umanoidi

      29/01/2026
      Volvo EX60

      Volvo EX60: la sfida scandinava al dominio tedesco degli elettrici premium

      22/01/2026
    Gomoot : tecnologia e lifestyleGomoot : tecnologia e lifestyle
    Home»Tech»Intelligenza artificiale»ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD
    Intelligenza artificiale

    ZAYA1: il primo modello AI su larga scala addestrato solo su infrastruttura AMD

    AMD colma il gap infrastrutturale accumulato da CUDA di Nvidia: ROCm e MI300X hanno raggiunto la maturità tre anni dopo ChatGPT e sono ora un'alternativa valida a NVIDIA
    GrazianoGraziano25/11/2025
    Share Twitter WhatsApp Bluesky Threads
    AMD

    AMD ha raggiunto un traguardo importante con ZAYA1-base di Zyphra, il primo modello linguistico Mixture-of-Experts (MoE) addestrato completamente su ecosistema e hardware AMD. La realizzazione di questo modello AI conferma che la piattaforma AMD, composta da GPU Instinct MI300X e schede di rete Pensando Pollara 400, rappresenta oggi un’alternativa concreta e competitiva per l’addestramento di modelli AI di frontiera.

    AMD

    Per competere efficacemente nel mercato dell’intelligenza artificiale, non è sufficiente vendere GPU performanti per inferenza; serve un ecosistema software completo paragonabile a CUDA di NVIDIA, che dal suo lancio nel 2006 ha dominato il settore creando una piattaforma integrata di librerie, compilatori e strumenti di sviluppo. Quando OpenAI rilasciò ChatGPT nel novembre 2022, i modelli GPT sottostanti erano stati addestrati interamente su infrastruttura NVIDIA sfruttando CUDA e le GPU A100; il risultato di anni di ottimizzazioni e maturità dell’ecosistema software NVIDIA.

    AMD ha quindi accumulato un ritardo tecnologico significativo proprio su questo fronte infrastrutturale; nonostante le GPU RDNA e CDNA offrissero caratteristiche hardware competitive. Mancava uno stack software robusto necessario per il training distribuito su larga scala; librerie di comunicazione, kernel ottimizzati e framework di alto livello pienamente integrati.

    Acquisizioni strategiche e maturità ROCm: AMD recupera quindici anni di vantaggio CUDA Nvidia

    AMD non è stata a guardare ed ha investito molto per colmare questo gap; ricordiamo per esempio l’acquisizione di nod.ai (un’azienda specializzata nei sistemi di Intelligenza Artificiale e Machine Learning) e di ZTSytem (fornitore di infrastrutture per il cloud computing e l’intelligenza artificiale).

    L’addestramento completo del modello ZAYA1-base dimostra ora che AMD ha finalmente colmato questa distanza; attraverso ROCm, RCCL, HIP e l’integrazione con PyTorch. AMD ha raggiunto quella maturità sistemica che va oltre le specifiche hardware. Il risultato ottenuto da Zyphra conferma che l’infrastruttura è ora sufficientemente solida per supportare carichi di lavoro di frontiera.

    Questo traguardo arriva quasi tre anni dopo il debutto pubblico di ChatGPT; periodo durante il quale NVIDIA ha consolidato ulteriormente il dominio grazie a Hopper, NVLink e software stack sempre più raffinati. AMD recupera quindi un gap accumulato in oltre quindici anni di evoluzione CUDA; la dimostrazione pratica con ZAYA1-base indica che la piattaforma MI300X con Pollara e ROCm rappresenta finalmente un’alternativa credibile per chi cerca diversificazione tecnologica senza compromettere prestazioni o stabilità.

    AMD e il progetto di Zyphra

    Il progetto nasce dalla collaborazione tra Zyphra, AMD e IBM Cloud; combina 128 nodi di calcolo per un totale di 750 PFLOPs di potenza computazionale massima raggiungibile. Il modello ZAYA1-base conta 760 milioni di parametri attivi e 8,3 miliardi totali; ha prestazioni paragonabili a modelli densi come Qwen3-4B nonostante l’architettura più leggera.

    L’addestramento è stato documentato sotto ogni aspetto tecnico e fornisce linee guida pratiche per chi intende utilizzare lo stack AMD in produzione; una dimostrazione che ROCm e i relativi strumenti software sono pronti per carichi di lavoro complessi e prolungati.

    Tutta la documentazione ufficiale del training Zypra su infrastruttura AMD è disponibile qui.

    Architettura Hardware: GPU MI300X e rete Pensando Pollara

    Ogni nodo di calcolo del cluster Zyphra integra otto GPU MI300X connesse tramite InfinityFabric, con 2 TB di memoria DDR5 e doppio socket Intel Xeon Platinum 8570. La capacità di memoria HBM delle MI300X, pari a 192 GB per GPU, ha permesso di adottare una strategia semplificata basata principalmente su data-parallelism con l’ottimizzatore distribuito ZeRO-1.

    Questa configurazione semplifica il codice e aumenta l’efficienza complessiva. L’architettura di rete utilizza una struttura rails-only con interruttori organizzati su due livelli; un compromesso tra costi di realizzazione e velocità di comunicazione rispetto a soluzioni più elaborate.

    Ogni GPU ha una propria scheda di rete Pollara da 400Gbps, che raggiunge complessivamente 3,2 Tbps di capacità per nodo; avere collegamenti dedicati riduce i rallentamenti e facilita il trasferimento diretto dei dati tra le schede grafiche. Il cluster mantiene separate le reti usate per l’addestramento del modello da quelle dedicate alla gestione dei file e dei salvataggi; questo evita che il caricamento dei dati disturbi le comunicazioni essenziali tra le GPU.

    Zyphra ha condotto i primi test approfonditi sulle schede Pollara; ha misurato tutte le operazioni di comunicazione fondamentali con diverse quantità di informazioni e numeri di GPU e ottenuto informazioni pratiche per calibrare al meglio i trasferimenti di dati durante l’addestramento.

    Ottimizzazioni software: Kernel HIP e Stack ROCm

    L’addestramento del modello ZAYA1-base ha richiesto la creazione di componenti software personalizzati scritti in HIP per ottenere velocità competitive. HIP (Heterogeneous-Compute Interface for Portability) è un linguaggio di programmazione e un’interfaccia sviluppata da AMD per scrivere codice che gira su GPU. Funziona in modo simile a CUDA di NVIDIA, ma con una differenza importante; il codice scritto in HIP può essere compilato per funzionare sia su GPU AMD che su GPU NVIDIA. Essenzialmente, HIP permette agli sviluppatori di scrivere kernel (piccoli programmi che vengono eseguiti direttamente sulla GPU per operazioni ad alte prestazioni); in un linguaggio simile al C++.

    L’ottimizzatore Muon, che gestisce certi parametri del modello, richiede calcoli molto intensi attraverso un particolare metodo matematico; Zyphra ha realizzato componenti combinati che aggiornano contemporaneamente diverse informazioni, riducendo enormemente l’uso della memoria. Un componente specializzato per moltiplicare matrici simmetriche elimina circa metà dei calcoli necessari e dimezza le scritture in memoria per determinate porzioni; questo rende l’intero processo molto più efficiente in termini di trasferimento dati e riduce sensibilmente il tempo richiesto dall’ottimizzatore.

    Per le operazioni di normalizzazione dei layer, il team ha creato un componente unificato che esegue somma, calcolo delle statistiche, normalizzazione e trasformazione in un’unica operazione; supera le prestazioni ottenibili con semplici adattamenti dell’implementazione Transformer Engine di NVIDIA. L’integrazione con gli strumenti dello stack AMD, come Primus, AITER e RCCL, ha completato la piattaforma software; la calibrazione tramite PyTorch TunableOp, TransformerEngine ROCm e HIPBLASLt-bench ha generato tabelle di riferimento che associano le dimensioni delle operazioni matematiche agli algoritmi più veloci disponibili nelle librerie rocBLAS e hipBLASlt.

    Tutto questo tradotto in parole per non esperti significa maggiore efficienza, più semplicità e costi ridotti durante l’addestramento di un modello AI.

    Architettura ZAYA1: CCA, ZAYA1 router e residual scaling

    Il modello ZAYA1-base introduce tre innovazioni architetturali che migliorano l’efficienza dei modelli MoE. La Compressed Convolutional Attention (CCA) riduce drasticamente i requisiti computazionali comprimendo la KV-cache fino a 8x. Il ZAYA1 router sostituisce il gate lineare standard con una MLP compatta che integra Exponential Depth Averaging; promuove la specializzazione degli esperti e consente addestramento stabile con top-k pari a 1 senza esperti residui. Il residual scaling applica bias e coefficienti di gating appresi per controllare il flusso informativo con overhead trascurabile; ottiene gli stessi benefici dello schema di gating attentivo di Qwen a costi inferiori.

    Prestazioni di Zaya1

    Durante questa fase, l’obiettivo primario di Zyphra non era creare il modello AI più performante in assoluto; lo scopo era dimostrare che è possibile addestrare un modello linguistico altamente competitivo utilizzando interamente l’infrastruttura AMD. Il focus era validare la maturità dell’intero ecosistema hardware e software; dalle GPU MI300X alle schede di rete Pensando Pollara, dallo stack ROCm ai kernel HIP personalizzati. Una prova che questa piattaforma può sostenere carichi di lavoro di training su larga scala con prestazioni paragonabili o superiori a quelle ottenute con l’infrastruttura NVIDIA dominante.

    zaya1

    ZAYA1-base rappresenta quindi una proof of concept strategica; il modello raggiunge risultati competitivi superiori a Llama-3-8B e vicini a Qwen3-4B. Le sue prestazioni sono notevoli considerando i suoi solo 760 milioni di parametri attivi. Nei benchmark generali come MMLU (67,01%) e MMLU-Pro (40,43%), il modello supera Llama-3-8B e OLMoE-1b-7b; si avvicina a Qwen3-4B nonostante quest’ultimo abbia oltre quattro volte più parametri attivi.

    Nelle valutazioni matematiche avanzate (MATH-hard con 54,15% exact-match) e coding (MBPP+ con 75,40% pass@1), ZAYA1-base eccede persino Gemma3-12b-pt; un modello con molti più parametri totali.

    Anche la versione del modello ottimizzata per il ragionamento ha mostrato risultati soddisfacenti nei test avanzati; si avvicina a modelli di punta come Qwen3-4B-Thinking ancora prima delle fasi di perfezionamento successive; sono margini di miglioramento notevoli.

    AMD è pronta per il training di modelli di frontiera

    L’addestramento completo di ZAYA1-base conferma che l’ecosistema AMD ha raggiunto la maturità necessaria per competere nell’addestramento di modelli linguistici su larga scala.

    Le prestazioni competitive di ZAYA1-base, ottenute con un’architettura innovativa che combina CCA, router avanzato e residual scaling, dimostrano che è possibile ottenere risultati all’avanguardia anche su piattaforme alternative a NVIDIA; l’efficienza nell’addestramento a lungo contesto (fino a 32k token) e la forte compressione della KV-cache rendono il modello adatto anche a GPU consumer di fascia bassa e per l’inferenza locale. Zyphra, AMD e IBM Cloud hanno aperto nuove opportunità per il settore AI.

    amd Zyphra
    Previous ArticleTastiera magnetica Epomaker HE75 Mag: la scelta giusta per chi pretende il massimo spendendo poco
    Next Article Anthropic lancia Claude Opus 4.5 e tre nuove funzionalità per sviluppatori
    Avatar photo
    Graziano
    • Website

    Ho visto l'informatica nascere con il C64 e oggi seguo con lo stesso entusiasmo l'evoluzione verso mini PC e desktop SFF. Fuori dal lavoro, le mie passioni sono i film, il trekking, la bici e la corsa. Ma non disdegno una sessione di gaming o programmazione!

    Articoli collegati

    Claude Opus 4.8
    Intelligenza artificiale

    Claude Opus 4.8: il nuovo modello di Anthropic punta sull’affidabilità

    29/05/2026
    Qwen3.7-Max
    Intelligenza artificiale

    Qwen3.7-Max: nuovo modello agente di Alibaba con 1M token

    22/05/202640 Views
    Gemini Omni
    Intelligenza artificiale

    Gemini Omni Flash: il nuovo modello video di Google

    21/05/202615 Views
    Add A Comment
    Leave A Reply Cancel Reply

    Ultimi articoli
    Ladybird

    Ladybird e la sicurezza open source nell’era dell’AI

    05/06/2026
    Fish shell

    Fish 4.7: una shell a cui non manca (quasi) niente

    05/06/2026
    Songs of conquest

    Songs of Conquest: un genere che torna a respirare

    04/06/2026
    Warp

    Warp: il terminale che si è reinventato come ambiente di sviluppo agente

    04/06/202616 Views
    netbird

    NetBird: come costruire una rete privata senza dipendere dal cloud

    03/06/202625 Views

    Qwant diventa il motore di ricerca predefinito al Parlamento Europeo

    03/06/202620 Views
    Gomoot : tecnologia e lifestyle
    X (Twitter) Bluesky WhatsApp Threads Mastodon
    • Home
    • Tech
    • Mobiles
    • Contatti
    • Privacy
    • ABOUT
    © 2026 GOMOOT.COM

    Type above and press Enter to search. Press Esc to cancel.