La testata giornalistica Sedaily ha riportato che il responsabile della divisione semiconduttori (DS) di Samsung Electronics, ha annunciato che Samsung vuole entrare nel mercato dei chip acceleratori IA con il lancio del Mach-1 nel 2025.
Il Mach-1 è un chip progettato specificamente per l’inferenza IA. L’annuncio è arrivato durante la 55a assemblea ordinaria degli azionisti di Samsung Electronics. Ciò viene interpretato come un tentativo di Samsung Electronics di rompere la roccaforte di Nvidia. Al momento, Nvidia domina il mercato dei semiconduttori IA.
Mach-1
Il Mach-1 è un chip ASIC (Application Specific Integrated Circuit) basato su una struttura innovativa. Promette di ridurre drasticamente il collo di bottiglia nel trasferimento di dati tra CPU, GPU e memoria; un problema comune nell’inferenza IA. Samsung afferma che il chip ridurrà questo collo di bottiglia fino a 1/8 rispetto ai livelli attuali.
A differenza di molti altri chip IA che utilizzano esclusivamente memoria HBM (High Bandwidth Memory), il Mach-1 può sfruttare anche la memoria LPDDR. Diventa quindi una soluzione più versatile. Questo lo rende adatto per applicazioni anche su dispositivi edge con risorse limitate come consumo energetico, dimensioni e costi contenuti.
Inferenza IA
L’inferenza nell’ambito dell’intelligenza artificiale si riferisce al processo di applicare un modello di machine learning pre-addestrato a nuovi dati per ottenere previsioni o risultati. Quindi l’inferenza è la fase in cui i modelli di IA vengono effettivamente sfruttati nelle applicazioni reali, a differenza della fase di addestramento intensivo che avviene in precedenza.
Ad esempio, dopo aver addestrato un modello di visione artificiale su milioni di immagini per riconoscere oggetti, il processo di inferenza consiste nell’utilizzare quel modello addestrato per identificare oggetti in nuove immagini.
Quindi un acceleratore IA per l’inferenza è un chip o un hardware specializzato progettato per eseguire in modo efficiente questa fase di inferenza; ovvero l’applicazione pratica del modello IA addestrato per generare previsioni o risultati sui nuovi dati di input.
Disponibilità Mach-1
Il design del chip Mach-1 ha già superato la verifica tecnica su FPGA (Field Programmable Gate Array) e il progetto del System-on-Chip (SoC) è attualmente in corso. Samsung prevede di avviare la produzione di massa entro la fine del 2024, con un sistema IA basato su Mach-1 pronto per essere lanciato all’inizio del 2025.
Sebbene il Mach-1 non sia progettato per competere con i processori IA di fascia alta come l’NVIDIA H100, entrerà in competizione con altre soluzioni orientate all’inferenza, come l’ AWS Inferentia. AWS Inferentia è un chip sviluppato da Amazon Web Services (AWS) che mira ad accelerare le prestazioni dell’inferenza IA per le applicazioni di machine learning su larga scala eseguite sul cloud AWS, consentendo tempi di risposta più rapidi e costi operativi ridotti.
Attualmente, Samsung Electronics sta lavorando duramente per fornire a Nvidia le memorie HBMe utilizzate nelle GPU IA.
Oltre allo sviluppo del Mach-1, Samsung ha istituito un laboratorio dedicato all’Intelligenza Artificiale Generale (AGI) nella Silicon Valley, segnalando il suo impegno a diventare un attore chiave nel futuro dell’IA. Il laboratorio mira a creare nuovi tipi di processori e memorie in grado di soddisfare i requisiti di elaborazione dei futuri sistemi AGI.
Samsung e l’AGI
L’AGI si riferisce alla capacità di un sistema di intelligenza artificiale di eguagliare o superare l’intelligenza umana in tutte le attività cognitive. Un AGI sarebbe in grado di apprendere qualsiasi compito intellettuale nello stesso modo in cui un essere umano può imparare, ragionare, prendere decisioni e risolvere problemi in tutti i domini.
Attualmente, l’IA tramite l’uso di modelli LLM (large language models) è specializzata in compiti specifici e ristretti, come il riconoscimento delle immagini, l’elaborazione del linguaggio naturale, il coding o altro. Questi sono esempi di Intelligenza Artificiale ristretta o Narrow AI.
L’AGI, invece, mira a creare un’intelligenza artificiale generale, flessibile e adattabile che possa applicarsi a qualsiasi compito cognitivo con le stesse capacità di ragionamento e apprendimento di un essere umano.
Raggiungere l’AGI è considerata una delle maggiori sfide nell’ambito dell’intelligenza artificiale, in quanto richiede di superare molte barriere tecniche e teoriche ancora aperte. Alcune delle principali sfide includono la comprensione del ragionamento umano, l’apprendimento continuo, il trasferimento di conoscenze e l’intelligenza generale.
L’istituzione di un laboratorio AGI da parte di Samsung indica il suo interesse a esplorare e contribuire allo sviluppo di sistemi di intelligenza artificiale generale per il futuro.
“Il laboratorio specializzato sta lavorando per creare un tipo completamente nuovo di semiconduttore, un semiconduttore progettato per soddisfare i requisiti di elaborazione del futuro AGI“, ha affermato il presidente Kyung.