IBM ha recentemente presentato il suo nuovo processore IA NorthPole, progettato specificamente per l’inferenza neurale. Questo chip dall’architettura innovativa rappresenta un grande risultato in termini di efficienza energetica, densità computazionale e prestazioni rispetto alle soluzioni esistenti.
L’inferenza neurale si riferisce al processo in cui un modello di intelligenza artificiale applica le conoscenze apprese durante l’addestramento per effettuare previsioni, classificazioni o elaborazioni di dati. Durante l’inferenza, il modello prende in input nuovi dati o situazioni e utilizza i parametri appresi durante l’addestramento per generare output o decisioni basate su quelle nuove informazioni.
Caratteristiche principali di NorthPole
NorthPole è stato sviluppato presso il centro di ricerca IBM di Almaden, in California, ed è il risultato di oltre 15 anni di ricerca nel campo del calcolo ispirato al cervello.
Il chip è realizzato con un processo produttivo a 12 nm e integra 22 miliardi di transistor all’interno di un’area di 800 mm2. Presenta una struttura con 256 core dotati di memoria integrata e networking on-chip.
La memoria integrata è una delle chiavi dell’incredibile efficienza di NorthPole, consentendo di superare il collo di bottiglia von Neumann tra processore e memoria che affligge le architetture tradizionali.
Ogni core è in grado di eseguire fino a 2048 operazioni per ciclo a 8 bit di precisione, con il potenziale di raddoppiare a 4 bit e quadruplicare a 2 bit.
NorthPole è ottimizzato specificamente per l’inferenza neurale ed è pensato per applicazioni di computer vision, NLP e speech recognition. Non può invece eseguire carichi di lavoro generici come un normale processore CPU o GPU.
Prestazioni senza precedenti
I test condotti su modelli come ResNet-50 per il riconoscimento di immagini hanno evidenziato prestazioni imbattibili di NorthPole rispetto alle migliori CPU e GPU attualmente sul mercato.
In termini di efficienza energetica, il nuovo processore è risultato fino a 25x migliore di comuni GPU a 12 nm e CPU a 14 nm. Anche la latenza è stata ridotta di un fattore 22x.
Considerando la densità computazionale, NorthPole batte qualsiasi rivale, anche soluzioni più avanzate come GPU a 4 nm. IBM parla di risultati “sbalorditivi” mai visti prima.
Secondo i ricercatori IBM, surclassa tutte le principali architetture esistenti nell’esecuzione di reti neurali profonde per il riconoscimento di immagini e oggetti.
Vantaggi dell’approccio di NorthPole
L’integrazione di memoria e calcolo all’interno dello stesso chip permette di superare il collo di bottiglia von Neumann, responsabile di gran parte dei costi energetici e di latenza nelle architetture odierne.
La semplicità dei core, ottimizzati per l’inferenza e non per il calcolo generico, consente di ottenere un parallelismo estremo e quindi prestazioni molto elevate.
Inoltre, NorthPole non richiede sistemi di raffreddamento complessi come nelle GPU, riducendo ulteriormente la complessità e il costo complessivo.
Prospettive future
NorthPole è ancora nelle prime fasi del suo sviluppo e ci sono margini di miglioramento sostanziali man mano che il progetto andrà avanti.
IBM prevede di realizzare versioni future del chip con nodi produttivi più avanzati per aumentare ulteriormente prestazioni ed efficienza. Anche l’architettura può essere ottimizzata e raffinata col tempo.
Secondo IBM, NorthPole apre la strada ad una nuova era di sistemi AI ultra-efficienti con un rapporto prestazioni/watt senza precedenti. Questo può abilitare nuove applicazioni ai confini della rete, nel mondo reale.
I ricercatori immaginano NorthPole a bordo di droni e robot, satelliti, infrastrutture smart city, veicoli a guida autonoma ed altro ancora.
I risultati ottenuti aprono scenari entusiasmanti per l’implementazione massiccia di sistemi di intelligenza artificiale sul campo, ai confini della rete.