In questo articolo, scopriremo insieme cos’è una GPU, come funziona, come sono cambiate nel corso del tempo, le caratteristiche importanti da non sottovalutare prima dell’acquisto. Mettii comodo perché di carne al fuoco ce n’è molta , buona lettura !
GPU
GPU è l’acronimo di Graphics Processing Unit, ovvero l’unità di elaborazione grafica. È un componente essenziale dei computer moderni, si occupa di eseguire calcoli complessi necessari per la generazione di immagini e video in tempo reale. Grazie alla loro struttura, le GPU sono particolarmente adatte anche gestire operazioni matematiche parallele, ovvero calcoli che possono essere eseguiti simultaneamente su molti dati differenti. Negli ultimi anni si è scoperta anche la loro importanza nel campo dell’IA. Sono in grado i gestire ed eseguire i large language models (LLM) IA in modo molto più efficacie di una CPU.
Le GPU hanno fatto la loro comparsa negli anni ’90, quando i videogiochi e le applicazioni grafiche richiedevano sempre più potenza di calcolo. La prima GPU commerciale fu la GeForce 256, lanciata da NVIDIA nel 1999. Da allora, la tecnologia delle GPU è progredita a ritmi vertiginosi, con i produttori che continuano a innovare e migliorare le loro soluzioni.
L’architettura di una GPU
L’architettura di una GPU si riferisce alla progettazione e alla struttura del chip della GPU. L’architettura determina come i componenti della GPU, come i core di elaborazione, la memoria e le unità di elaborazione specializzate, sono organizzati e come funzionano insieme per eseguire le operazioni grafiche. Le diverse architetture delle GPU possono avere diverse prestazioni e caratteristiche in base alla loro progettazione. Ad esempio, alcune architetture possono essere più efficienti dal punto di vista energetico o avere un maggiore numero di core di elaborazione rispetto ad altre. Alcuni componenti chiave di una architettura o struttura della GPU sono :
- Stream processors o CUDA cores sono i “motori” che eseguono i calcoli paralleli. La differenza tra i due termini sta nel fatto che “CUDA cores” è un termine specifico utilizzato da NVIDIA per le proprie GPU, mentre “stream processors” è un termine più generico che può essere applicato a GPU di diversi produttori, incluso AMD. Stream processors e CUDA cores sono progettati per gestire operazioni matematiche e di elaborazione parallela, il che li rende particolarmente adatti per l’elaborazione grafica. Questo perché le operazioni grafiche richiedono spesso la manipolazione di grandi quantità di dati (come pixel, vertici e texture) in maniera indipendente e simultanea. Anche se le architetture delle GPU di NVIDIA e AMD sono diverse, entrambe utilizzano una struttura gerarchica di stream processors o CUDA cores raggruppati in blocchi o unità di elaborazione più grandi. Ad esempio, nelle GPU NVIDIA, i CUDA cores sono organizzati in blocchi chiamati “streaming multiprocessors” (SM), mentre nelle GPU AMD, gli stream processors sono raggruppati in unità chiamate “compute units” (CU). Il numero di stream processors o CUDA cores in una GPU è un indicatore importante delle prestazioni di elaborazione parallela. In generale, più CUDA cores o stream processors ci sono in una GPU, maggiore sarà la sua capacità di eseguire calcoli paralleli e, di conseguenza, migliore sarà la sua performance in ambito grafico e computazionale.
- La memoria video, conosciuta anche come VRAM (Video Random Access Memory), è un tipo di memoria dedicata alle informazioni grafiche all’interno di una GPU. La VRAM memorizza temporaneamente i dati necessari per l’elaborazione delle immagini, come texture, modelli 3D, buffer di fotogrammi e altre informazioni utili per la generazione di immagini in tempo reale. Ci sono diversi tipi di memoria video, ognuno con le proprie caratteristiche in termini di velocità, larghezza di banda e capacità. Le più note sono le GDDR (Graphics Double Data Rate) . Le versioni più recenti includono GDDR5, GDDR5X, GDDR6 e GDDR6X. Ogni nuova generazione di GDDR offre miglioramenti in termini di velocità, larghezza di banda e efficienza energetica rispetto alla generazione precedente. Ad esempio, GDDR6X, introdotta da NVIDIA con le GPU della serie RTX 30, offre una larghezza di banda molto più elevata rispetto a GDDR6, grazie all’implementazione della tecnologia PAM4 (Pulse Amplitude Modulation) per la trasmissione dei dati. Meno note le HBM (High Bandwidth Memory), altro tipo di memoria video ad alte prestazioni, sviluppato da SK Hynix e Samsung. A differenza della memoria GDDR, la memoria HBM utilizza uno stack di memoria 3D e un’interfaccia a larghezza di banda molto elevata. Ciò permette di ottenere una larghezza di banda molto più elevata rispetto alla memoria GDDR, pur mantenendo un consumo energetico più basso. La memoria HBM è stata utilizzata per la prima volta nelle GPU AMD Radeon Fury e successivamente nelle GPU Vega. HBM2 e HBM2E sono evoluzioni successive della tecnologia HBM, con una maggiore capacità e larghezza di banda.
Altri due aspetti della VRAM sono la velocità e la capacità della memoria video . Una maggiore capacità di memoria, misurata in GB, consente di gestire texture e modelli più dettagliati, mentre una maggiore velocità e larghezza di banda della memoria consentono un trasferimento più rapido dei dati tra la GPU e la VRAM, migliorando le prestazioni in situazioni in cui il throughput di dati è cruciale, come nel caso di risoluzioni elevate e configurazioni multi-monitor.
Negli ultimi anni si è scoperta anche l’importanza della VRAM nel campo dell’IA. Maggiore è la quantità di VRAM e più veloce sarà il tempo di risposta quando si eseguono dei (LLM) IA per esempio su LM studio (chatbot) o per la generazione di immagini e video a partire da testo.
La velocità di una VRAM viene misurata utilizzando diverse metriche, tra cui: - Frequenza di clock: La frequenza di clock della VRAM è espressa in megahertz (MHz) o gigahertz (GHz) ed indica il numero di cicli di clock che la memoria può eseguire in un secondo. Una frequenza di clock più alta indica una VRAM più veloce, in grado di leggere e scrivere dati più rapidamente.
- Larghezza di banda: La larghezza di banda della VRAM è una misura della quantità di dati che può essere trasferita tra la memoria e la GPU per unità di tempo. Viene solitamente misurata in gigabyte al secondo (GB/s) o terabyte al secondo (TB/s). Una larghezza di banda più elevata consente un trasferimento dati più veloce, migliorando le prestazioni della GPU, soprattutto in situazioni che richiedono un throughput di dati elevato, come risoluzioni più alte e configurazioni multi-monitor.
- Velocità di trasferimento dati: La velocità di trasferimento dati della VRAM è una misura della velocità effettiva con cui la memoria può leggere e scrivere dati. Viene solitamente espressa in gigabit al secondo (Gbps) e dipende dalla frequenza di clock e dalla larghezza del bus di memoria.
- Bus di memoria: Il bus di memoria è il canale di comunicazione tra la VRAM e la GPU. La sua larghezza viene misurata in bit (ad esempio, 256-bit, 384-bit) e influenza direttamente la larghezza di banda complessiva della VRAM. Un bus di memoria più ampio consente un trasferimento dati più efficiente tra la GPU e la VRAM.
È importante considerare l’interazione tra queste metriche per valutare la velocità di una VRAM e, di conseguenza, le prestazioni di una GPU. Ad esempio, una memoria con una frequenza di clock elevata ma un bus di memoria stretto potrebbe avere una larghezza di banda limitata, mentre una memoria con un bus di memoria ampio ma una frequenza di clock più bassa potrebbe avere una larghezza di banda simile o superiore .
Le ultime tre architetture usate da Nvidia , ordinate dalla più recente alla meno recente sono
Ada Lovelace : RTX 4090
Ampere : RTX 3090,RTX 3080Ti,RTX 3080,RTX 3070Ti,RTX 3070,RTX 3060Ti,RTX 3060,RTX 3050Ti
Turing : RTX 2080 Ti,RTX 2080 Super,RTX 2080,RTX 2070 Super,RTX 2070,RTX 2060 Super,RTX 2060,GTX 1660 Ti,GTX 1660 Super,GTX 1660,GTX 1650 Super,GTX 1650
La più recente architettura Ada Lovelace di Nvidia segna il punto di svolta per l’IA, il ray tracing e la grafica neurale. L’architettura Ada Lovelace presenta diverse innovazioni chiave, tra cui i Tensor Core di quarta generazione con TF32 e i RT Core di terza generazione. I Tensor Core di quarta generazione sono incredibilmente veloci, hanno un incremento di velocità di elaborazione fino a 5 volte rispetto alla generazione precedente. Gli RT Core di terza generazione hanno il doppio della velocità di intersezione dei raggi-triangoli, e aumentano le prestazioni RT-TFLOP del doppio.
Le ultime tre architetture usate da AMD , ordinate dalla più recente alla meno recente sono ;
RDNA 3 | Radeon RX 7900 XTX 24GB, Radeon RX 7900 XT 20GB per il 4K |
Radeon RX 7800 16GB , Radeon RX 7700 12GB per il 2K (1440p) | |
Radeon RX 7600 8GB per 1080p | |
RDNA2 | RX 6900 XT,RX 6800 XT,RX 6800,RX 6700 XT,RX 6600 XT, RX 6600 |
RDNA | RX 5700 XT,RX 5700,RX 5600 XT,RX 5500 XT |
La più recente architettura AMD RDNA 3 usa la tecnologia chiplet e combina nodi di processo a 5nm e 6nm, ognuno ottimizzato per lavori specifici.
Un chiplet è un blocco di circuiti integrati progettato specificamente per lavorare con altri chiplet simili per formare chip più grandi e complessi. In tali chip, un sistema viene suddiviso in blocchi di circuiti funzionali, chiamati “chiplet”. La tecnologia chiplet consente ad AMD di utilizzare più chip più piccoli per creare un circuito integrato più grande, piuttosto che produrre un processore su un singolo pezzo di silicio con il numero desiderato di core. Questo aumenta le rese poiché i produttori di chip possono inserire più chiplet in un singolo processore per ottenere il conteggio dei core desiderato.
AMD RDNA 3 offre fino al 54% in più di prestazioni per watt rispetto all’architettura AMD RDNA 2 e collega i chiplet del sistema grafico e della memoria con velocità fino a 5,3 TB/s.
L’architettura AMD RDNA 3 presenta anche nuovi acceleratori AI e acceleratori Raytracing di seconda generazione per prestazioni migliori nei carichi di lavoro più complessi. RDNA 3 usa il motore di visualizzazione AMD Radiance™ che supporta HDR a 12 bit e copertura completa dello spazio colore REC2020 per una migliore precisione del colore.
Ray tracing
Il Ray Tracing è una tecnica avanzata di rendering grafico delle GPU che ha rivoluzionato il modo in cui vengono generate immagini realistiche e dettagliate nei videogiochi e nelle animazioni. A differenza delle tecniche di rendering tradizionali, il Ray Tracing simula il comportamento della luce in un ambiente virtuale, permettendo di creare effetti di ombreggiatura, riflessione e rifrazione molto più fedeli alla realtà.
Il Ray Tracing si basa sul principio di tracciare i percorsi della luce attraverso una scena virtuale. Invece di utilizzare approssimazioni e calcoli semplificati per determinare l’illuminazione e le ombre, il Ray Tracing calcola il percorso dei raggi di luce emessi da una sorgente luminosa, riflessi e rifratti dagli oggetti nella scena, fino a raggiungere la “telecamera” o il punto di vista dell’osservatore.
Per farlo, il Ray Tracing lancia raggi di luce “inversi” dalla telecamera attraverso i pixel dello schermo e calcola le intersezioni con gli oggetti nella scena. Questi raggi possono essere riflessi, rifratti o assorbiti dagli oggetti, e possono anche interagire con altre luci nella scena, come luci indirette o global illumination. Il risultato è un’immagine estremamente dettagliata e realistica, con effetti di luce e ombra che si comportano in modo simile a come farebbero nel mondo reale.
Il Ray Tracing ha un impatto significativo sulla qualità della grafica nei videogiochi e nelle animazioni, offrendo un livello di realismo senza precedenti. Grazie al Ray Tracing, gli sviluppatori di videogiochi possono creare ambienti e personaggi più immersivi, con effetti di luce e ombra che rispondono in modo più accurato alle leggi della fisica.
Ad esempio, il Ray Tracing consente di simulare riflessi realistici su superfici come acqua, vetro o metallo, permettendo ai giocatori di vedere oggetti e personaggi riflesse in modo fedele. Inoltre, il Ray Tracing migliora notevolmente la qualità delle ombre, rendendole più morbide e naturali, e permette di simulare effetti di luce indiretta, come il colore che si riflette da un oggetto all’altro.
Per elaborare il Ray Tracing NVIDIA utilizza unità di elaborazione dedicate chiamate RT Core, mentre AMD utilizza i Ray Accelerators. Anche se il numero di unità di elaborazione dedicate al Ray Tracing (RT Core per NVIDIA e Ray Accelerators per AMD) non è un indicatore perfetto delle prestazioni, può darti un’idea generale della potenza di Ray Tracing di una GPU. Una GPU con un numero maggiore di queste unità avrà maggiori probabilità di offrire migliori prestazioni nel Ray Tracing.
Intel invece per il Ray Tracing ha sviluppato la tecnologia Intel® Advanced Ray Tracing (Intel® ART) . Questa tecnologia offre una piattaforma completa e flessibile per il ray tracing che affronta i carichi di lavoro più complessi con la massima fedeltà. Questa tecnologia offre la flessibilità della programmazione open source tramite la programmazione di Intel® oneAPI., combinata con le funzionalità e le prestazioni necessarie per creare rendering fotorealistici. tramite la programmazione eterogenea di Intel® oneAPI.
DLSS (Nvidia) / FSR (AMD) / XeSS (Intel)
L’upscaling, noto anche come ridimensionamento, è un processo che aumenta la risoluzione di un’immagine o di un video, convertendo i pixel dell’immagine originale in un’immagine a risoluzione superiore. L’obiettivo dell’upscaling è di migliorare la qualità visiva delle immagini o dei video quando vengono visualizzati su schermi con risoluzioni più elevate rispetto a quella dell’immagine originale, senza avere cali di prestazione (frame per secondo) evidenti .
Durante il processo di upscaling, un algoritmo di ridimensionamento viene utilizzato per stimare e creare i pixel mancanti nell’immagine a risoluzione superiore.
DLSS è la tecnologia di upscaling usata nelle GPU Nvidia mentre FSR è la tecnologia di upscaling per le GPU AMD. L’upscaling è stato creato per permettere a schede GPU di fascia media di poter avere un numero di frame per secondo accettabile a risoluzioni molto alte (per esempio il 4K) o per permettere a schede GPU di fascia top di poter avere un numero di frame per secondo accettabile a risoluzioni altissime (8K) .
DLSS di NVIDIA: L’intelligenza artificiale al servizio del gaming
Il DLSS è una tecnologia di upscaling basata sull’intelligenza artificiale (IA) sviluppata da NVIDIA per le sue schede video GeForce RTX. Il DLSS utilizza reti neurali addestrate per migliorare la qualità delle immagini a bassa risoluzione, permettendo ai giocatori di ottenere un’esperienza di gioco ad alta risoluzione senza sacrificare le prestazioni e qualità.
Il processo inizia con il rendering del gioco a una risoluzione inferiore. Successivamente, l’IA DLSS analizza l’immagine e la “upscale” alla risoluzione desiderata, migliorando la qualità dell’immagine attraverso l’apprendimento profondo. Il risultato è un’immagine di qualità simile a quella ottenuta con un rendering nativo ad alta risoluzione, ma con un impatto molto minore sulle prestazioni della GPU.
L’ultima versione DLSS è la 3.5 . Il DLSS 3.5 include il Frame generator e il Ray Reconstruction
Frame generator di Nvidia genera frame aggiuntivi per aumentare il frame rate nei giochi. Il Frame Generator prende l’immagine upscalata dal DLSS e genera frame aggiuntivi interpolati per aumentarne il frame rate.
Quindi in sintesi il Frame Generator del DLSS permette di:
- Aumentare il frame rate nei giochi mantenendo una buona qualità dell’immagine grazie all’upscaling tramite deep learning
- Generare nuovi frame interpolati a partire dall’immagine upscalata, fornendo così un boost prestazionale soprattutto per GPU meno potenti
- Migliorare la fluidità complessiva dell’esperienza di gioco grazie all’aumento del frame rate
Sfortunatamente Nvidia limita il Frame generator solo alla serie Ada GeForce RTX 40 e superiori.
Il Ray Reconstruction introdotto con DLSS 3.5 migliora ulteriormente la resa qualitativa del DLSS, soprattutto per giochi con illuminazione ray-traced, generando immagini ancora più definite e fedeli all’originale. Si traduce in un boost di qualità importante per la tecnologia DLSS di Nvidia. A differenza del Frame Generator il Ray Reconstruction è disponibile per tutte le GPU RTX.
FSR di AMD: un approccio flessibile all’upscaling
Il FidelityFX Super Resolution (FSR) è la risposta di AMD al DLSS di NVIDIA. FSR è una tecnologia di upscaling open-source che mira a migliorare la qualità delle immagini e le prestazioni nei videogiochi. A differenza del DLSS, il FSR non si basa sull’intelligenza artificiale e può essere utilizzato con una vasta gamma di GPU, non solo quelle prodotte da AMD !.
FSR utilizza un algoritmo di upscaling basato su una combinazione di tecniche di sharpening e ricostruzione dell’immagine. Come il DLSS, il FSR inizia con il rendering del gioco a una risoluzione inferiore e poi “upscale” l’immagine alla risoluzione desiderata, migliorando la qualità dell’immagine nel processo. Il FSR offre diversi livelli di qualità, permettendo ai giocatori di scegliere il bilanciamento.
La tecnologia FSR (FidelityFX Super Resolution) introdotta da AMD ha avuto diversi aggiornamenti nel tempo. Ogni nuova versione porta miglioramenti nella qualità dell’immagine di upscaling e nella riduzione di problemi come “High-Velocity Ghosting”. I’ “High-Velocity Ghosting” è un problema che si verifica in alcuni giochi, in particolare nei giochi di corse. Si tratta di un effetto fantasma dove l’immagine viene replicata e sfalsata, sovrapponendola al nuovo frame. AMD ha introdotto una nuova logica nella versione 2.2 di FSR per ridurre questo problema.
Sebbene le due tecnologie abbiano approcci diversi all’upscaling delle immagini, entrambe offrono soluzioni efficaci per migliorare la qualità delle immagini e le prestazioni nei videogiochi. Con l’evoluzione continua di queste tecnologie, i giocatori possono aspettarsi un futuro ancora più emozionante nel mondo del gaming su PC. Se vuoi sapere come abillitare FSR di AMD su una scheda video AMD o NVIDIA leggi questo articolo.
L’ultima versione di FSR e l’AMD FSR3. FSR3 include una nuova funzione chiamata AMD Fluid Motion Frames (AFMF) , che può essere intesa come una funzione equivalente del “Frame Generation” del DLSS 3 di NVIDIA. AMD FSR 3 Fluid Motion è una tecnologia di raddoppio dei frame che genera frame alternati stimando un frame intermedio tra due frame renderizzati dalla GPU (che è essenzialmente ciò che fa DLSS 3). Però a differenza di DLSS 3, in cui il “Frame Generation” è limitato alla serie Ada GeForce RTX 40, FSR 3 porta lo stesso tipo di supporto su tutta la serie Radeon RX 7000 più recente, così come sulle schede grafiche RDNA2 della serie RX 6000 di generazioni precedenti, e anche sulle serie NVIDIA GeForce RTX 40, RTX 30 e RTX 20.
FSR3 è supportato anche da altri produttori di GPU, incluse le GPU Nvidia e le console. Quindi FSR3 può essere usato anche da possessori di Steam Deck , Asus Rog Ally, e Xbox !
XeSS , l’upscaling di Intel
Xe Super Sampling (XeSS) è una tecnologia di upscaling basata sull’IA sviluppata da Intel ed utilizzata nelle sue GPU. Questa tecnologia utilizza un algoritmo basato sull’IA e l’accelerazione hardware per migliorare le prestazioni e la qualità delle immagini. XeSS offre diverse opzioni di upscaling che vanno dal massimo dettaglio (modalità ultra qualità) alla massima velocità (modalità prestazioni).
Il TDP delle schede video
Il Thermal Design Power (TDP) è un parametro essenziale nella scelta di una GPU, poiché influisce direttamente sull’efficienza energetica, le esigenze di raffreddamento e le prestazioni del dispositivo. Vediamo di capire come viene calcolato e perché è importante considerarlo quando si sceglie una GPU.
Il TDP, o Thermal Design Power, indica la quantità massima di calore generato da un componente elettronico, come una GPU, che il sistema di raffreddamento deve dissipare per garantire un funzionamento stabile e affidabile. Esso è espresso in watt (W) e rappresenta un’informazione fondamentale per chi vuole assemblare un computer con un adeguato sistema di raffreddamento e ai fine della scelta del wattaggio dell’alimentatore.
Il TDP viene calcolato in base a vari fattori, tra cui l’architettura della GPU, la frequenza di clock, il numero di core e la tensione operativa. In generale, un TDP più elevato indica un maggior consumo energetico e, di conseguenza, una maggiore generazione di calore. Tuttavia, è importante notare che il TDP non è una misura diretta del consumo energetico, ma piuttosto un’indicazione del calore generato e delle esigenze di raffreddamento.
Per riassumere conoscere il TDP è importante per i seguenti motivi
- Efficienza energetica: Una GPU con un TDP più basso consuma generalmente meno energia, il che si traduce in un minore impatto sui costi energetici e sull’ambiente. Per chi desidera un sistema più efficiente dal punto di vista energetico ovvero avere una bolletta meno salata, una GPU con un TDP inferiore può essere una scelta ideale.
- Esigenze di raffreddamento: Un TDP più alto richiede un sistema di raffreddamento più potente per garantire che la GPU rimanga entro temperature di funzionamento sicure. Se si dispone di un case con spazio e flusso d’aria limitati, una GPU con un TDP inferiore potrebbe essere più adatta per evitare surriscaldamenti e prolungare la durata del componente.
- Prestazioni: Il TDP può avere un impatto sulle prestazioni della GPU. Se il sistema di raffreddamento non riesce a dissipare il calore generato dalla GPU, questa potrebbe ridurre automaticamente le sue prestazioni (un fenomeno noto come “thermal throttling“) per evitare danni dovuti al surriscaldamento. Pertanto, considerare il TDP nella scelta di una GPU è essenziale per garantire prestazioni ottimali.
- Rumore: Il TDP può influire anche sul livello di rumore generato dal sistema di raffreddamento. Un TDP più alto richiede solitamente un sistema di raffreddamento più potente, che potrebbe risultare più rumoroso. Se il silenzio è una priorità, optare per una GPU con un TDP più basso potrebbe contribuire a ridurre il rumore complessivo del sistema.
- Overclocking: Il TDP può influenzare la capacità di overclocking di una GPU quando disponibili. Le GPU con un TDP più basso potrebbero avere un margine maggiore per l’overclocking, poiché il sistema di raffreddamento potrebbe essere in grado di gestire l’aumento del calore generato dall’aumento delle frequenze di clock.
- Scelta dell’alimentatore : conoscere il TDP delle componenti hardware, come la GPU, è fondamentale per scegliere correttamente il wattaggio dell’alimentatore del computer. Naturalmente oltre alla GPU, è importante considerare anche il consumo energetico di altri componenti, come la CPU, la RAM, gli hard disk, i dispositivi di raffreddamento e le periferiche aggiuntive. Se l’alimentatore non è adeguato, può causare instabilità, riavvii improvvisi, riduzione delle prestazioni o, nel peggiore dei casi, danni ai componenti.
Supporto API grafiche
Le API grafiche (Application Programming Interfaces) sono fondamentali per il corretto funzionamento delle GPU in giochi e applicazioni. Queste interfacce consentono agli sviluppatori di sfruttare appieno le capacità delle GPU moderne.Vediamo il ruolo delle API grafiche, le principali API disponibili e l’importanza del supporto API nelle GPU.
Cos’è un’API grafica?
Un’API grafica è un’interfaccia di programmazione che consente agli sviluppatori di software di comunicare con l’hardware grafico, le GPU, per creare immagini e animazioni in tempo reale. Le API grafiche forniscono funzioni e strumenti standardizzati per semplificare lo sviluppo di applicazioni e giochi, garantendo al contempo prestazioni ottimali e compatibilità con una vasta gamma di dispositivi.
Principali API grafiche
Le tre API grafiche più diffuse e importanti sono:
- DirectX: sviluppata da Microsoft, è l’API grafica predominante su piattaforma Windows e Xbox. L’ultima versione, DirectX 12, offre un controllo più preciso sull’hardware e un migliore utilizzo delle risorse, migliorando le prestazioni e riducendo il consumo energetico.
- OpenGL: è un’API grafica open-source e multipiattaforma, utilizzata principalmente su sistemi operativi come Linux e macOS. OpenGL è ampiamente utilizzata anche in applicazioni professionali, come la modellazione 3D e la simulazione.
- Vulkan: è un’API grafica di nuova generazione sviluppata da Khronos Group, la stessa organizzazione che ha creato OpenGL. Vulkan è progettata per offrire un controllo più fine sull’hardware e ridurre il sovraccarico del processore, migliorando l’efficienza e le prestazioni in un’ampia varietà di dispositivi, compresi i dispositivi mobili.
Importanza del supporto API nelle GPU
Il supporto API è cruciale per garantire che una GPU sia in grado di eseguire correttamente giochi e applicazioni. Alcuni motivi per cui il supporto API è importante includono:
- Compatibilità: Le GPU che supportano le ultime versioni delle API grafiche offrono una maggiore compatibilità con i titoli di giochi più recenti e le applicazioni professionali, garantendo una migliore esperienza utente.
- Prestazioni: Le nuove versioni delle API grafiche introducono spesso miglioramenti nelle prestazioni e nell’efficienza energetica, sfruttando appieno le capacità delle GPU moderne.
- Funzionalità avanzate: Le API grafiche più recenti offrono funzionalità avanzate, come il ray tracing e il supporto per l’intelligenza artificiale, che migliorano notevolmente la qualità visiva e l’esperienza di gioco.
- Longevità: Una GPU che supporta le ultime API grafiche avrà una maggiore durata nel tempo, poiché sarà in grado di eseguire futuri giochi e applicazioni.
Il supporto PCI express
Il supporto PCI Express (Peripheral Component Interconnect Express) è un elemento cruciale per le prestazioni delle GPU nei computer moderni. Questa interfaccia di connessione ad alta velocità consente alle GPU di comunicare in modo efficiente con il sistema e di scambiare dati rapidamente.
Cos’è il PCI Express?
PCI Express è un’interfaccia di connessione standard utilizzata per collegare dispositivi ad alta velocità, come le GPU, alle schede madri dei computer. È stato introdotto per la prima volta nel 2003 come evoluzione dell’interfaccia PCI originale, con l’obiettivo di aumentare la larghezza di banda e ridurre la latenza nelle comunicazioni tra i dispositivi.
Generazioni di PCI Express
Con il passare degli anni, sono state introdotte diverse generazioni di PCI Express, ognuna delle quali ha migliorato la larghezza di banda e le prestazioni rispetto alla generazione precedente:
- PCI Express 1.0: introdotto nel 2003, offriva una larghezza di banda di 250 MB/s per lane.
- PCI Express 2.0: lanciato nel 2007, raddoppiava la larghezza di banda a 500 MB/s per lane.
- PCI Express 3.0: arrivato nel 2010, ulteriormente raddoppiato a 1 GB/s per lane.
- PCI Express 4.0: introdotto nel 2017, ancora una volta raddoppiato a 2 GB/s per lane.
- PCI Express 5.0: annunciato nel 2019, offre una larghezza di banda di 4 GB/s per lane.
L’importanza del supporto PCI Express nelle GPU
Il supporto PCI Express nelle GPU è fondamentale per garantire prestazioni ottimali e una rapida comunicazione tra la GPU e il resto del sistema. Ecco alcuni motivi per cui il supporto PCI Express è importante:
- Larghezza di banda: una maggiore larghezza di banda PCI Express consente alle GPU di scambiare dati più rapidamente con la CPU e la memoria del sistema. Ciò è particolarmente importante per i giochi e le applicazioni che richiedono un flusso costante di dati, come texture ad alta risoluzione, modelli 3D complessi e simulazioni in tempo reale.
- Latenza ridotta: un’interfaccia PCI Express più veloce aiuta a ridurre la latenza nelle comunicazioni tra la GPU e il sistema, migliorando la fluidità e la reattività dei giochi e delle applicazioni grafiche.
- Compatibilità e scalabilità: il supporto per le ultime generazioni di PCI Express garantisce una maggiore compatibilità con le schede madri e i sistemi più recenti, consentendo di sfruttare appieno le prestazioni delle GPU. PCI Express è retrocompatibile, il che significa che le GPU possono funzionare anche su slot PCI Express di generazioni precedenti.
- Supporto per tecnologie aggiuntive: le generazioni più recenti di PCI Express consentono anche di supportare nuove tecnologie, come il supporto per NVMe nelle schede grafiche, che possono ulteriormente migliorare le prestazioni e l’esperienza utente.
Come scegliere la GPU giusta in base al supporto PCI Express
- Quando si sceglie una GPU, è importante tenere in considerazione il supporto PCI Express offerto dalla scheda madre del tuo sistema. Se la tua scheda madre supporta solo una generazione precedente di PCI Express, potresti non essere in grado di sfruttare appieno le prestazioni di una GPU di ultima generazione. Tuttavia, poiché PCI Express è retrocompatibile, una GPU più recente funzionerà ancora, anche se con una larghezza di banda inferiore.
- Se prevedi di aggiornare il tuo sistema nel prossimo futuro, potrebbe essere utile acquistare una GPU che supporti l’ultima generazione di PCI Express, in modo da essere pronto per un eventuale aggiornamento della scheda madre.
Cosa sono le PCI Express lanes
Spesso quando state per acquistare una GPU nelle caratteristiche troverete scritto PCI-Express x16 . x16 non indiva una versione particolare del PCI-express ma semplicemente il numero di linee che utilizza la GPU per connettersi alla scheda madre. Le GPU moderne utilizzano di solito una connessione PCIe x16, il che significa che utilizzano 16 lanes per la comunicazione con il chipset del computer. Tuttavia, ci sono anche vecchie GPU che utilizzano meno lanes, come x8, x4 o anche x1, a seconda delle loro esigenze di larghezza di banda. Quindi, prima di acquistare una GPU assicuratevi che la vostra motherboard abbia uno slot PCIe x16 , se è anche PCI Express 5.0 molto meglio.
Encoder video nelle GPU
Un encoder video è un componente hardware o software che converte un flusso video non compresso in un formato compresso. Questo processo è chiamato “codifica” ed è essenziale per ridurre la dimensione dei file video, facilitando la loro memorizzazione e trasmissione. La GPU è spesso coinvolta in questo processo grazie agli encoder video hardware integrati, che possono offrire prestazioni migliori e un consumo energetico inferiore rispetto agli encoder software utilizzati dalla CPU.
I decoder video hardware offrono diversi vantaggi rispetto ai decoder software, tra cui prestazioni superiori, minore utilizzo della CPU e consumo energetico ridotto. La decodifica hardware è particolarmente importante per la riproduzione di video ad alta risoluzione, come il 4K e l’8K, che richiedono una maggiore potenza di elaborazione.
Ecco alcuni dei motivi per cui sono importanti gli Encoder video integrati nella GPU :
- Streaming video: La codifica e decodifica efficiente dei flussi video è fondamentale per lo streaming di contenuti in tempo reale su piattaforme come YouTube, Netflix e Twitch. Encoder e decoder efficienti consentono un’esperienza di streaming senza interruzioni, con meno buffering e una migliore qualità video.
- Registrazione e condivisione di contenuti: Gli encoder video nelle GPU consentono di registrare e condividere gameplay, tutorial e altre attività sullo schermo con facilità e in alta qualità. La codifica hardware accelera il processo e riduce l’impatto sulle prestazioni del sistema.
- Riproduzione video fluida: I decoder video hardware nelle GPU consentono una riproduzione video fluida e senza sollecitare eccessivamente la CPU. Ciò è particolarmente importante per la riproduzione di contenuti ad alta risoluzione e con elevati frame rate.
Ecco un elenco dei più importanti e veloci encoder video supportati dalle GPU moderne. Questi encoder offrono prestazioni elevate e una buona efficienza nella compressione dei video:
- H.264 (AVC): Advanced Video Coding è uno dei codec video più diffusi e ampiamente supportati. Offre un buon equilibrio tra qualità video, compressione e compatibilità con una vasta gamma di dispositivi e piattaforme.
- H.265 (HEVC): High Efficiency Video Coding è il successore dell’H.264 e offre una compressione significativamente migliore con una qualità video simile. HEVC è ideale per la riproduzione e lo streaming di contenuti ad alta risoluzione, come il 4K e l’8K.
- VP9: VP9 è un codec video open-source sviluppato da Google. Offre una compressione simile a quella dell’HEVC ma senza i costi di licenza associati. VP9 è ampiamente utilizzato per lo streaming video su piattaforme come YouTube.
- AV1: AOMedia Video 1 è un codec video open-source e royalty-free sviluppato dall’Alliance for Open Media. AV1 offre una compressione superiore all’HEVC e al VP9, rendendolo ideale per lo streaming di contenuti ad alta risoluzione e con bit rate ridotti. La complessità dell’AV1 può richiedere più risorse di elaborazione rispetto ad altri codec.
- H.266 (VVC): Versatile Video Coding è il successore dell’HEVC e mira a migliorare ulteriormente la compressione e l’efficienza energetica rispetto ai codec precedenti. VVC è ancora in fase di adozione e potrebbe diventare uno standard diffuso in futuro.
È importante notare che la disponibilità e le prestazioni di questi encoder possono variare a seconda della GPU e della generazione del dispositivo. I produttori di GPU, come NVIDIA e AMD, offrono solitamente supporto hardware per diversi encoder video nelle loro schede grafiche, prima di acquistare una GPU verificate le specifiche tecniche del prodotto per determinare quali codec sono supportati soprattutto se userete la scheda GPU per il video editing .
Interfacce Audio/Video GPU
Le interfacce audio/video in una GPU sono essenziali per garantire una connessione ottimale tra la GPU e i dispositivi di visualizzazione, come monitor e televisori. Vediamo le principali interfacce audio/video utilizzate nelle GPU, caratteristiche e vantaggi. Prima di acquistare una GPU verificate le specifiche tecniche del prodotto per determinare quali Interfacce audio/video sono supportati soprattutto in base alla qualità dei vostri monitor o televisori.
- HDMI (High Definition Multimedia Interface)
HDMI è uno standard di interfaccia audio/video ampiamente utilizzato che consente la trasmissione di video ad alta definizione e audio multicanale attraverso un singolo cavo. Le GPU moderne supportano diverse versioni di HDMI, tra cui:
- HDMI 2.0: Supporta risoluzioni fino a 4K a 60 Hz, con un ampio spettro di colori e una profondità di colore fino a 12 bit. HDMI 2.0 è compatibile con il supporto HDR (High Dynamic Range) e offre una larghezza di banda fino a 18 Gbps.
- HDMI 2.1: Introduce miglioramenti significativi rispetto alla versione precedente, con supporto per risoluzioni fino a 10K e frequenze di aggiornamento fino a 120 Hz per il 4K e l’8K. HDMI 2.1 offre anche una larghezza di banda fino a 48 Gbps e include funzionalità come il Variable Refresh Rate (VRR) e il Quick Frame Transport (QFT).
- DisplayPort (DP)
DisplayPort è un’interfaccia audio/video sviluppata da VESA (Video Electronics Standards Association) che offre prestazioni elevate e funzionalità avanzate. Le GPU moderne supportano le seguenti versioni di DisplayPort:
- DisplayPort 1.4: Supporta risoluzioni fino a 8K a 60 Hz e offre una larghezza di banda fino a 32,4 Gbps. DisplayPort 1.4 include il supporto per HDR, VRR e il Multi-Stream Transport (MST), che consente la connessione di più monitor a una singola porta.
- DisplayPort 2.0: Introduce un notevole aumento delle prestazioni rispetto alla versione precedente, con una larghezza di banda fino a 77,4 Gbps e supporto per risoluzioni fino a 16K a 60 Hz. DisplayPort 2.0 mantiene le funzionalità avanzate della versione 1.4, come HDR e MST.
- USB Type-C : l’USB Type-C è un connettore reversibile che supporta la trasmissione di dati, video e alimentazione attraverso un singolo cavo. Alcune GPU moderne includono porte USB Type-C con supporto per DisplayPort Alternate Mode, che consente la trasmissione di segnali DisplayPort attraverso un cavo USB Type-C.
- Thunderbolt : è un’interfaccia di connessione ad alta velocità sviluppata da Intel che combina PCI Express, DisplayPort e alimentazione attraverso un singolo cavo. Thunderbolt 3 e Thunderbolt 4 utilizzano il connettore USB Type-C e offrono velocità di trasmissione dei dati fino a 40 Gbps. Entrambe le versioni di Thunderbolt supportano la trasmissione di segnali DisplayPort, consentendo l’uso di monitor ad alta risoluzione e altre periferiche video avanzate. Thunderbolt è presente principalmente su dispositivi Apple, ma anche su alcuni dispositivi Windows di fascia alta.
Connettori di alimentazione di una GPU
Le GPU sono alimentate da un connettore di alimentazione separato per garantire una fornitura di energia costante e affidabile. Ci sono diversi tipi di connettori di alimentazione per le GPU, ognuno dei quali ha le proprie specifiche e limitazioni. Vediamo i diversi tipi di connettori di alimentazione per le GPU.
- Connettore PCIe a 6 pin: Il connettore PCIe a 6 pin è uno dei connettori di alimentazione più comuni per le GPU di fascia bassa o media. È in grado di fornire fino a 75 watt di energia, il che significa che una GPU con un solo connettore PCIe a 6 pin potrebbe richiedere un massimo di 150 watt di potenza totale.
- Connettore PCIe a 8 pin: Il connettore PCIe a 8 pin è un po’ più potente del connettore a 6 pin e può fornire fino a 150 watt di energia. Questo connettore viene solitamente utilizzato dalle GPU di fascia media o alta e viene spesso utilizzato in combinazione con il connettore a 6 pin per fornire ancora più potenza alla scheda video.
- Connettore PCIe a 12 pin: Il connettore PCIe a 12 pin è il nuovo standard introdotto dalle GPU NVIDIA della serie 30. Questo connettore è in grado di fornire fino a 300 watt di energia e ha un design più compatto rispetto ai connettori a 6 e 8 pin. Tuttavia, poiché è un nuovo standard, potrebbe essere necessario un adattatore per collegarlo al tuo alimentatore.
- Connettore Molex: Alcune schede video più vecchie utilizzano il connettore Molex per l’alimentazione, che è un tipo di connettore a 4 pin utilizzato principalmente per l’alimentazione dei drive a disco rigido. Questo connettore non è più molto comune e non è in grado di fornire molta potenza, quindi le GPU che lo utilizzano tendono ad essere di fascia bassa.
- Connettore SATA: Il connettore SATA è un altro tipo di connettore utilizzato per l’alimentazione delle GPU, ma non è raccomandato in quanto può essere instabile e non in grado di fornire abbastanza energia per soddisfare le esigenze della scheda video.
- Connettore 12VHPWR a 16 pin (12+4) : Questo nuovo connettore 12VHPWR a 16 pin (12+4), introdotto dalle nuove spefiche ATX 3.0, consente un’erogazione di potenza fino a 600W per una scheda grafica. Questo è essenziale per supportare la generazione di schede grafiche di fascia alta, come la serie RTX 40 di NVIDIA o le future RTX 50.
- Nuovo connettore 12V-2×6 : quando le prime schede grafiche della serie NVIDIA GeForce RTX 40 furono lanciate con il connettore 12VHPWR (16 pin) di ATX 3.0, furono segnalati diversi casi di bruciatura delle spine di alimentazione. Il problema derivava dall’inserimento errato del connettore nelle prese di alimentazione. Inoltre, il cavo non avrebbe dovuto essere piegato, perché ciò avrebbe sollecitato i punti di contatto, con conseguente potenziale surriscaldamento dovuto alla gestione del carico. Il nuovo connettore 12V-2×6 del formato ATX 3.1 porta essenzialmente con sé solo alcune modifiche meccaniche come i pin di rilevamento, montati in posizione arretrata per assicurarsi che venga stabilito un contatto appropriato prima che possa essere richiesta un’elevata potenza dalla scheda video. Mentre il connettore 12VHPWR poteva essere inserito in modo non corretto (non completamente inserito) e funzionare (causando possibili problemi) il connettore 12V-2×6 se non è inserito correttamente non avvierà la GPU. Di conseguenza il nuovo connettore 12V-6×2 è molto più sicuro del precedente. Il connettore 12V-2×6 come il precedente è ancora progettato per offrire una potenza fino a 600 W mentre altri 75 W saranno disponibili tramite lo slot PCIe. L’aspetto positivo del nuovo connettore 12V-2×6 è che sarà compatibile con le specifiche del fattore precedente 2VHPWR.
È importante scegliere il connettore di alimentazione corretto per la tua GPU per evitare danni alla scheda video e all’alimentatore. Inoltre, è importante assicurarsi che l’alimentatore sia in grado di fornire abbastanza energia per soddisfare le esigenze della tua scheda video e di altri componenti del computer. In generale, le GPU richiedono almeno un connettore PCIe a 8 pin o a 12 pin . Se hai una nuova PSU e GPU in standard ATX 3.0 dovrai usare il connettore 12VHPWR a 16 pin (12+4) mostrato nella immagine sopra.
Le principali aziende produttrici di GPU
Nel mondo delle GPU, NVIDIA e AMD sono i due giganti che si contendono la supremazia. NVIDIA è nota per le sue soluzioni GeForce e le architetture come Turing e Ampere, mentre AMD è famosa per le sue serie Radeon e le architetture RDNA. Entrambe le aziende sono costantemente impegnate nella ricerca e nello sviluppo di nuove tecnologie per migliorare l’efficienza e la potenza delle loro GPU. Intel pochi anni fa ha introdotto la sua nuova linea di schede video dedicate chiamata Intel® Iris Xe1 e Intel Arc .
Intel Arc offre buone prestazioni (ma ancora lontana dalle prestazioni Nvidia e AMD) grazie alla tecnologia Dynamic Power Share e alla tecnologia Intel Deep Link. Questa linea di GPU supporta l’upscaling basato sull’IA con Xe Super Sampling e offre pieno supporto per DirectX 12 Ultimate.
Intel Deep Link è una tecnologia che consente di utilizzare la potenza di calcolo della GPU per accelerare i carichi di lavoro della CPU. Questa tecnologia utilizza un algoritmo intelligente per bilanciare il carico di lavoro tra la CPU e la GPU, in modo da ottenere il massimo delle prestazioni in ogni situazione. Intel Deep Link è composto da tre componenti principali: Intel® Deep Link Hyper Compute, Intel Deep Link Hyper Encode e Intel Deep Link Stream Assist.
Intel Dynamic Power Share è una tecnologia che consente di massimizzare le prestazioni di CPU e GPU. Questa tecnologia utilizza un algoritmo intelligente per bilanciare il carico di lavoro tra la CPU e la GPU, in modo da ottenere il massimo delle prestazioni in ogni situazione. Ad esempio, durante il gaming, Dynamic Power Share può indirizzare più potenza alla GPU per aumentare la frequenza dei frame, mentre durante la creazione di contenuti può indirizzare più potenza alla CPU per accelerare i tempi di rendering.
Intel Xe Super Sampling (XeSS) è una tecnologia di upscaling basata sull’IA sviluppata da Intel. Questa tecnologia utilizza un algoritmo basato sull’IA e l’accelerazione hardware per migliorare le prestazioni e la qualità delle immagini. XeSS offre diverse opzioni di upscaling che vanno dal massimo dettaglio (modalità ultra qualità) alla massima velocità (modalità prestazioni).
Le migliori schede video
Al momento le migliori schede video in circolazione sono le Nvidia, seguite da AMD e da Intel.
La migliore GPU Nvidia è la GeForce RTX 4090 seguita dalla GPU AMD Radeon RX 7900 XTX . La migliore GPU Intel al momento è la Intel Arc A770 16GB , che ha prestazioni simili a una AMD Radeon RX 6600 XT o ad una GeForce RTX 3060. Si nota quindi che le GPU Intel sono ancora fuori dalla battaglia delle migliori schede video, per ora.
Se non hai problemi di budget, la migliore GPU Nvidia in circolazione è la RTX 4090. Questa scheda richiede che il tuo desktop abbia un alimentatore di qualità e sufficientemente potente, raccomandati 1000W o oltre, meglio se la PSU è ATX 3.0 o superiore.
Invece la migliore GPU AMD in circolazione è la RX 7900XT. Per questa scheda è sufficiente che il tuo desktop abbia un alimentatore di 650 Watt. Il prezzo è decisamente più abbordabile della RTX 4090 . Una GPU in grado di girare qualsiasi videogame e a qualsiasi risoluzione video.
Migliori GPU per rapporto qualità prezzo
Per rapporto qualità prezzo segnaliamo tra le schede AMD la Radeon RX 6600 , e tra le schede Nvidia segnaliamo la RTX 2060 . Entrambe queste schede riescono a far girare bene ogni gioco attualmente in circolazione, ovviamente non sempre con il massimo dei dettagli e non sempre al massimo della risoluzione. RX 6600 e RTX 2060 hanno prestazioni molto simili, dati benchmark alla mano è appena meglio la RTX 2060 .
La Radeon RX 6600 è sul mercato dal 2021 (prezzo di uscita di circa 1000 euro), ora la puoi avere a 228 euro ed hai una ottima scheda.
La Nvidia RTX 2060 è invece sul mercato dal 2019 (prezzo di uscita di oltre 1000 euro), ora la puoi avere a 293 euro ed avrai anche qui una ottima scheda video.
Un altra buona scheda video a basso costo che ti darà grandissime soddisfazioni è la NVIDIA GeForce GTX1660 SUPER . La Nvidia GeForce GTX 1660 Super si basa sullo stesso GPU TU116 sia della GTX 1660 che della GTX 1660 Ti. La differenza tra questo modello “super” rispetto alle precedenti versioni è il passaggio alla memoria video GDDR6, che comporta un aumento della velocità della memoria da 8 Gbps a 14 Gbps, ovvero altrettanto veloce della VRAM nella potentissima RTX 2080 Ti.
GPU oltre il gaming
Sebbene le GPU siano spesso associate ai videogiochi, il loro impiego si estende ben oltre. Le GPU sono infatti impiegate anche in ambito scientifico, per l’elaborazione di dati complessi e la simulazione di fenomeni naturali, così come nell’intelligenza artificiale e nel machine learning, dove svolgono un ruolo cruciale nell’accelerare algoritmi e modelli.
Le GPU sono ampiamente utilizzate anche nel campo delle criptovalute, soprattutto per il processo di mining. Il mining di criptovalute è il processo di verifica e aggiunta di nuove transazioni alla blockchain, il registro pubblico decentralizzato su cui si basano molte criptovalute. In cambio del loro lavoro, i minatori ricevono una ricompensa sotto forma di nuove unità della criptovaluta in questione.
Le GPU sono particolarmente adatte al mining di criptovalute perché possono eseguire molti calcoli paralleli, che è un requisito fondamentale per il processo di mining.
Negli ultimi anni si è scoperta anche la loro importanza nel campo dell’IA. Sono in grado i gestire ed eseguire i large language models (LLM) IA in modo molto più efficacie di una CPU.
Si conclude qui la nostra descrizione dettagliata sulle GPU, ora dovresti conoscere molto meglio la tua GPU e dovresti essere in grado anche di scegliere una nuova GPU per un aggiornamento del tuo PC . Alla prossima e felice assemblaggio !