Caratteristiche del software Tesla
I prodotti di GPU Computing NVIDIA® Tesla™ sono progettati per l’elaborazione a elevate prestazioni (HPC) nelle workstation e nei data center. Ci sono numerose funzionalità software di CUDA e OpenCL che sono state ideate specificamente per il GPGPU e sono supportate esclusivamente dai prodotti Tesla. La tabella qui sotto le riepiloga.
Applicazione software |
Descrizione |
Matrice di supporto |
Scaricamento |
Performance Driver per Windows: driver TCC |
| • |
Driver Tesla per Windows |
| • |
Consente l'uso di desktop remoti e Windows Services |
| • |
Riduce l’overhead del kernel all’avvio |
| • |
Funziona con CUDA C/C++ |
|
| • |
GPU serie C: Windows Vista, Windows 7 |
| • |
Prodotti serie M ed S: Windows HPC Server 2008 e 2008 R2 |
|
|
Monitoraggio delle GPU: nvsmi |
| • |
Temperatura delle GPU |
| • |
Velocità della ventola |
| • |
Informazioni ECC |
|
| • |
Prodotti serie M ed S |
| • |
Windows e Linux |
|
|
Gestione di cluster di GPU |
| • |
Modalità esclusiva: Permette a un’applicazione accesso esclusivo a una particolare GPU |
| • |
Dispositivi GPU visibili: Variabile di ambiente che consente di attivare il software di gestione dei cluster per limitare le GPU Tesla utilizzabili da una specifica applicazione |
|
| • |
Prodotti serie M ed S |
| • |
Windows e Linux |
|
|
NVIDIA GPUDirect™ |
| • |
Driver per Tesla e Infiniband che rende più rapide le comunicazioni tra GPU e Infiniband |
|
| • |
Prodotti serie M ed S |
| • |
Solo per Redhat Enterprise Linux (RHEL) 5.4 |
|
Scaricamento
| • |
Driver Tesla |
| • |
Patch kernel RHEL |
| • |
Driver OFED Infiniband |
| • |
Istruzioni per l’installazione |
|
DRIVER TCC PER WINDOWS
Il driver TCC (Tesla Computer Cluster) è un driver Windows per CUDA C/C++ che consente di utilizzare desktop remoti e Windows Services oltre a ridurre l’overhead del kernel CUDA all’avvio su Windows. Si noti che il driver TCC disabilita la grafica sui prodotti Tesla.
MONITORAGGIO DELLE GPU
Il software di monitoraggio della GPU per Tesla è disponibile usando lo strumento nvsmi. Questo strumento attualmente fornisce la temperatura delle GPU, la velocità delle ventole e anche le informazioni ECC. nvsmi continuerà ad evolversi e ad arricchirsi di nuove funzionalità di monitoraggio delle GPU.
GESTIONE DI CLUSTER DI GPU
NVIDIA collabora con diversi produttori di software di gestione di cluster, che supportano già sistemi basati su GPU:
| – |
Bright Computing |
| – |
ClusterCorp Rocks |
| – |
Platform Computing |
Oltre a ciò, i driver CUDA offrono due funzionalità importantissime:
| – |
Modalità esclusiva: permette a un'applicazione di ottenere accesso esclusivo a una GPU |
| – |
Dispositivi GPU visibili: permette al software di gestione dei cluster di amministrare le risorse delle GPU controllando le GPU utilizzabili da ogni applicazione |
NVIDIA GPUDIRECT™
NVIDIA GPUDirect™ è una nuova tecnologia NVIDIA che rende più rapide le comunicazioni tra le GPU e altri dispositivi sul bus PCIe rimuovendo l’overhead legato alla CPU. Il primo dispositivo su cui NVIDIA ha focalizzato la propria attenzione è Infiniband; NVIDIA ha collaborato con Mellanox per rendere le comunicazioni tra le GPU e Infiniband più rapide e ridurre il numero di copie archiviate nella memoria principale.
 |
Usando NVIDIA GPUDirect si elimina la copia in memoria dal buffer 1 al 2 |