INFORMAZIONI SUI PRODOTTI
INFORMAZIONI ADDIZIONALI
 
 
Il sistema di computing NVIDIA® TeslaTM S1070 (con doppia connessione PCI Express 2.0) è un sistema 1U da quattro teraflop potenziato dal primo processore da un teraflop del mondo.

Grazie al primo processore multi-core da un teraflop al mondo, il sistema di computing NVIDIA® Tesla™ S1070 accelera la transizione al computing parallelo ad altissima efficienza energetica. Grazie a 240 core e un compilatore C standard che semplifica lo sviluppo di applicazioni, Tesla S1070 offre la scalabilità necessaria a risolvere le sfide di computing più impegnative al mondo — con maggiore rapidità e precisione.

In grado di soddisfare l’inesauribile richiesta di prestazioni del settore HPC.
La soluzione riesce a tenere il passo con le crescenti domande delle sfide di computing più impegnative, fra cui le ricerche farmaceutiche, la prospezione petrolchimica e i calcoli finanziari.

L’architettura multi-core offre una scalabilità ottimale alle applicazioni HPC.
Le prestazioni in parallelo offerte da 240 core capaci di eseguire in modo concomitante migliaia di thread di elaborazione e dotati di un architettura scalabile che soddisfa le esigenze di calcolo di applicazioni troppo complesse per la CPU.
 
Piattaforma di computing ad elevata efficienza per le organizzazioni più attente ai consumi energetici.
Maggiore rendimento e più elevata densità di computing per la soluzione di problemi più complessi con un numero minore di risorse.
 
La tecnologia NVIDIA CUDA™ libera tutta la potenza dei prodotti di elaborazione multi-core Tesla.
Il solo ambiente in linguaggio C in grado di liberare tutta la potenza dell’elaborazione multi-core delle GPU per risolvere i problemi di computing più impegnativi del mondo.

Caratteristiche Vantaggi
Quattro processori da 1 Teraflop in un sistema 1U ad alta densità Il sistema offre sino a 4 teraflop di rendimento in un rack 1U: un rendimento senza precedenti per i sistemi ad alta densità in rack.
Architettura multi-core massicciamente parallela 240 core di computing per processore consentono l’esecuzione di migliaia di thread concomitanti.
Computing scalabile su più GPU La capacità della GPU di risolvere problemi su larga scala può essere incrementata nettamente suddividendo il problema su più GPU.
Programmazione in NVIDIA CUDA™: C per le GPU Programmazione in NVIDIA CUDA™: C per le GPU La soluzione è programmabile usando CUDA, la piattaforma di sviluppo applicazioni leader mondiale per le soluzioni multi-core.
Precisione in virgola mobile IEEE 754 [precisione singola e doppia] La soluzione assicura che i vostri risultati soddisfino gli standard di precisione del settore, ad inclusione di caratteristiche di accuratezza opzionali.
Supporto di doppia precisione in virgola mobile La soluzione soddisfa i requisiti di precisione delle applicazioni più esigenti grazie alla doppia precisione IEEE 754 a 64 bit.
Trasferimento dati asincrono Potenziate al massimo il rendimento del sistema grazie alla possibilità di eseguire i trasferimenti di dati anche quando i core di computing sono occupati.
16 GB di memoria ultra rapida La soluzione permette l’archiviazione locale di serie di dati di dimensioni superiori grazie ai 4 GB dedicati per ogni processore. Questa memoria consente di massimizzare il rendimento e di ridurre al minimo il movimento di dati all’interno del sistema.
Interfaccia di memoria complessiva a 2048 Bit La soluzione è in grado di offrire 408 GB/s di picco della banda passante di memoria. Questo consente trasferimenti dati rapidissimi con 512 bit di interfaccia dedicata per ogni processore.
Trasferimento dati PCI-Express 2.0 ad altissima velocità Grazie alla bassa latenza e all’elevata banda passante, le applicazioni di calcolo sfruttano una velocità di trasferimento dati davvero strepitosa, resa possibile dall’architettura PCI-Express.
Montaggio su binario con vite singola La concezione del binario a vite singola consente la massima rapidità di installazione, proprio come le tipologie tool-less design, ma con la sicurezza e la solidità supplementare che solo un fissaggio con viti può conferire al sistema.
Caratteristiche di monitoraggio del sistema Massima facilità di gestione e monitoraggio post-installazione aiutano il vostro personale IT ad amministrare il sistema con uno sforzo quasi nullo. Le capacità di gestione in remoto e le spie di stato poste sul fronte e sul retro dell’unità garantiscono che il vostro personale sia in grado di leggere lo stato delle macchina qualsiasi posizione, dal lato opposto del rack, o dall’altra parte del pianeta.
Doppia connessione PCI-Express 2.0 Massimizza la banda passante tra il processore host e i processori Tesla con un massimo di 12,8 GB/s di velocità di trasferimento (sino a 6,4 GB/s per connessione PCI Express)
Scheda adattatrice host SFF (Small-form-factor) La scheda adattatrice a basso assorbimento energetico permette ai sistemi Tesla di operare con pressoché tutti i sistemi host compatibili PCIe dotati di uno slot PCI Express libero (x8 o x16).
 
Numero di processori Tesla 4
Numero di core di elaborazione 960 (240 per processore)
Precisione in virgola mobile IEEE 754 singola e doppia
Memoria dedicata totale 16 GB
Interfaccia di memoria 512 bit)
Banda passante di memoria 408 GB/secondo
Consumo energetico medio 800 W (tipico)
Interfaccia di sistema PCIe x16 o x8
Ambiente di programmazione CUDA


 
 
FacebookTwitterGoogle+LinkedInPinterest