RTX Spark, il superchip NVIDIA con memoria unificata che porta gli agenti AI in locale dentro i PC Windows su Arm

NVIDIA ha scelto il palco del GTC Taipei, alla vigilia del COMPUTEX 2026, per annunciare RTX Spark, un superchip Arm pensato per i PC Windows. Le GPU GeForce sono dentro i nostri portatili da anni, ma stavolta la novità è un’altra. NVIDIA non fornisce solo la scheda grafica, ma l’intero processore, CPU Arm compresa, facendo scendere in un laptop di consumo lo stesso silicio di classe data center che muove le sue macchine per l’AI.

Sotto il cofano si trovano una GPU Blackwell con 6.144 core CUDA, una CPU Grace a 20 core progettata insieme a MediaTek, fino a 128 GB di memoria unificata e un petaflop di calcolo AI in formato FP4. Numeri che, sulla carta, collocano il chip nella fascia di una RTX 5070 da notebook, ma in un formato molto diverso.

NVIDIA non ha presentato RTX Spark come il PC che fa girare meglio le applicazioni di sempre, ma come la base per una nuova generazione di macchine in cui gli agenti AI lavorano in locale, accanto a chi le usa, sul dispositivo di tutti i giorni.

I primi laptop e desktop arriveranno in autunno da ASUS, Dell, HP, Lenovo, Microsoft Surface e MSI, con Acer e Gigabyte a seguire. Vale la pena capire cosa c’è di solido dietro l’annuncio, perché qui si intrecciano tre storie diverse, ovvero il ritorno di Windows su Arm, l’ingresso di NVIDIA nel mercato PC dal lato del processore e la scommessa che gli agenti AI diventino la funzione principale del sistema operativo come lo è stata l’introduzione di internet tra il 1995 e il 1998 (periodo segnato dal passaggio da Windows 3.x a Windows 95).

RTX Spark ha lo stesso silicio del DGX Spark

Partiamo dall’hardware, perché è la parte su cui ci sono meno dubbi. RTX Spark, mostrato sul palco con il nome in codice N1X, è un SoC da circa 70 miliardi di transistor prodotto da TSMC a 3 nanometri, e fonde due chiplet in un unico pacchetto.

Da un lato c’è una GPU Blackwell con 6.144 core CUDA e Tensor Core di quinta generazione con precisione FP4, accreditata di un petaflop di prestazioni AI. Dall’altro c’è una CPU Grace a 20 core, composta da dieci core ad alte prestazioni Cortex-X925 e dieci core efficienti Cortex-A725, con frequenze che arrivano a 4,1 GHz.

Jensen Huang, CEO di NVIDIA presenta il chip **RTX Spark**

I due chiplet dialogano tramite NVLink-C2C a 600 GB/s, un collegamento interno che NVIDIA descrive come circa cinque volte più veloce di un PCIe Gen 5, ma con consumi molto inferiori.

Il dettaglio che cambia il comportamento della macchina è la memoria unificata, fino a 128 GB condivisi tra CPU e GPU con 300 GB/s di banda. In un PC tradizionale la GPU ha la sua memoria dedicata e la CPU la sua, e i dati vengono copiati di continuo avanti e indietro lungo il bus PCIe.

Qui invece esiste un unico serbatoio che entrambe le unità vedono allo stesso modo, con la possibilità di assegnare in modo dinamico quanta memoria spetta all’una e quanta all’altra. È un’architettura che si presta bene ai grandi modelli AI, affamati di memoria più che di pura banda grafica.

Questa descrizione ricalca quasi interamente il silicio del DGX Spark, la piccola workstation AI che NVIDIA ha già messo sul mercato per gli sviluppatori. La differenza più visibile riguarda la rete, perché i laptop RTX Spark rinunciano al controller ConnectX-7 da 200 GbE che caratterizzava il DGX Spark. Una scelta sensata, dato che quella connettività serviva a costruire cluster di sviluppo, non a far girare Photoshop su un notebook.

Va aggiunto che RTX Spark non è un singolo chip ma una famiglia. La memoria spazierà da 16 a 128 GB e NVIDIA ha già fatto intravedere una versione più piccola da 400 TFLOP, segno che la piattaforma punta a coprire diverse fasce di prezzo.

Su RTX Spark dovrebbe essere possibile eseguire in locale modelli linguistici da 120 miliardi di parametri con una finestra di contesto da un milione di token, montare video 12K in 4:2:2 sfruttando il decoder Blackwell, lavorare scene 3D da oltre 90 GB e giocare a titoli AAA a 1440p oltre i 100 fps con ray tracing e DLSS.

Il confronto con la memoria unificata dei Mac

Apple ha introdotto la memoria unificata nei Mac con il passaggio ai chip Apple Silicon, a partire dall’M1 del novembre 2020, e oggi la trovi su tutta la famiglia M (M1, M2, M3, M4, comprese le versioni Pro, Max e Ultra). Il principio è esattamente quello di RTX Spark: CPU, GPU e Neural Engine condividono un unico bacino di memoria sullo stesso pacchetto, così i dati non devono essere copiati avanti e indietro tra RAM di sistema e memoria video.

Ma l’idea della memoria unificata CPU/GPU non è né di Apple né di NVIDIA in senso stretto. Da un lato, una forma di memoria condivisa esiste da tempo: per esempio, le GPU integrate di Intel e AMD attingono da sempre alla RAM di sistema, e le console come PS5 e Xbox Series usano un pool unico condiviso tra CPU e GPU.

Più di recente, sul lato PC, AMD con i chip Ryzen AI Max ha spinto sullo stesso terreno: tanta memoria condivisa pensata proprio per i modelli AI. Quello che Apple ha fatto è stato portare l’approccio nei personal computer mainstream in modo pulito ed efficiente, rendendolo un tratto distintivo dei Mac.

Dall’altro, sui Mac la banda di memoria varia molto a seconda del chip, e nelle versioni di fascia alta arriva a cifre ben superiori ai 300 GB/s dichiarati per RTX Spark (un M-series Ultra supera gli 800 GB/s). In compenso la vera particolarità di RTX Spark non è la memoria unificata in sé, ma il fatto di abbinarla a una GPU Blackwell con lo stack CUDA completo e fino a 128 GB di capacità, cosa che conta parecchio per chi sviluppa AI, dato che gran parte degli strumenti e dei modelli del settore è scritta attorno a CUDA e non gira nativamente sull’hardware Apple.

L’agente come sistema operativo

Durante la presentazione NVIDIA ha spostato l’attenzione su ciò che il chip renderà possibile. Jensen Huang ha riassunto il concetto con una frase, ovvero che per quarant’anni si lanciavano app, si cliccava e si digitava, mentre con RTX Spark basterà chiedere cosa fare e il PC farà il lavoro. Il passaggio chiave, nelle sue parole, è quello da strumento a collega.

NVIDIA e Microsoft hanno introdotto due tasselli, ovvero nuove primitive di sicurezza in Windows e un runtime chiamato NVIDIA OpenShell.

Servono a un problema preciso, far girare gli agenti sul PC principale di chi lo usa senza esporlo a rischi. OpenShell permette di definire cosa un agente può e non può fare, di indirizzare le richieste verso modelli locali in base alle proprie regole di privacy, e persino di mascherare le informazioni personali nelle query inviate ai modelli in cloud.

A muoversi per primi su questa piattaforma non sono i soliti colossi, ma realtà giovani dell’ecosistema degli agenti, tra cui la OpenClaw Foundation e Nous Research con il suo Hermes Agent, progetti open source che hanno macinato numeri record su GitHub e OpenRouter.

Per ora gli agenti AI sono rimasti confinati al cloud o ai desktop per sviluppatori, mentre un hardware con 128 GB di memoria unificata e un petaflop di calcolo li porta sulla scrivania. Puoi pensare a software che gira in locale, privato per costruzione, senza la bolletta del cloud a ogni richiesta.

RTX Spark: una scommessa che ridisegna gli equilibri

NVIDIA presenta questa linea come una famiglia permanente, con laptop, desktop e workstation per ogni futura generazione di architettura, e sostiene di avere a bordo quasi tutta l’industria PC.

Il punto è che, se fino a ieri l’azienda vendeva solo la componente GPU per sistemi terzi, con RTX Spark fornisce il cuore stesso della macchina (CPU inclusa), entrando in diretta competizione con Intel, AMD e, sul fronte Arm, con Qualcomm. Nessuno resterà a guardare, ed è ragionevole aspettarsi una risposta da ciascuno, con prodotti pensati anch’essi per gli agenti AI in locale.

L’hardware è credibile, e l’idea di portare i grandi modelli sulla scrivania in modo privato, senza il conto del cloud a ogni richiesta, è la cosa più solida vista in questa prima ondata di “AI PC” spesso più slogan che sostanza.

Molto dipenderà dalla capacità di Microsoft di rendere Windows su Arm all’altezza del silicio, e in parte anche dai produttori OEM che dovranno lasciar respirare un chip tanto potente invece di soffocarlo in chassis troppo sottili. La risposta la daranno le prime macchine che usciranno il prossimo autunno.

Ultimi Articoli

Con RTX Spark, NVIDIA reinventa il PC Windows

RTX Spark ha lo stesso silicio del DGX Spark

Il confronto con la memoria unificata dei Mac

L’agente come sistema operativo

RTX Spark: una scommessa che ridisegna gli equilibri