TESLA

GIS FEDERAL RIVOLUZIONA L'ACCESSO AI DATI GEOSPAZIALI

Il database GAIA accelerato dalle GPU fornisce analisi e visualizzazione dei dati in tempo reale

PROFILO DEL CLIENTE

  • GIS Federal si focalizza sull'architettura dei sistemi aziendali, sul cloud computing e sulla gestione dei big data

SFIDA DEL PROGETTO

  • Creare un sistema in grado di fornire all'esercito un accesso quasi in tempo reale a dati geospaziali variegati da ubicazioni remote

SOLUZIONE NVIDIA

  • L'accelerazione delle GPU NVIDIA® con CUDA permette di ottenere un livello del tutto nuovo di capacità delle query



Nel 2009, la nozione di accesso in tempo reale e basato sul cloud a dati geospaziali dettagliati era assolutamente fantascientifica anche per i motori computazionali più avanzati. All'epoca, GIS Federal aveva appena dato inizio a un progetto di ricerca per l'esercito che aveva per obiettivo il filtraggio di 10 milioni di punti all'interno di un'area di interesse definita. L'azienda riuscì a ottenere il risultato sperato, creando un sistema basato su CPU che eseguiva il filtraggio in 92 minuti. GIS Federal si rese però conto degli inconvenienti associati all'esecuzione di operazioni impegnative di calcolo analitico sulle CPU tradizionali. Il supercomputing su GPU offre vantaggi enormi in termini di potenza di calcolo pur riducendo i costi associati all'assorbimento energetico. Grazie alle GPU il tempo di elaborazione delle operazioni GIS più impegnative si riduce da ore a minuti e da minuti a secondi. Questo permette agli utenti di eseguire complesse operazioni GIS in un ambiente basato sul Web, offrendo una potenza di calcolo nettamente superiore alle ubicazioni remote.

In un ambiente ostile o remoto l'accesso tempestivo ai dati di intelligence è davvero essenziale, quindi ridurre il tempo che intercorre dalla cattura alla consegna è un fattore cruciale. “Sfruttando la potenza delle GPU, siamo in grado di erogare dati relativi a un miliardo di punti geospaziali in un'area di interesse definita in meno di 2 secondi da un laptop 0, con l'hardware del 2010”, ha dichiarato Amit Vij, CEO di GIS Federal. “La combinazione del nostro database GAIA brevettato e di un sistema basato su GPU cambia nettamente le regole del gioco quando si tratta di accesso all'intelligence geospaziale.”

Database brevettato che sfrutta l'accelerazione via GPU

GIS Federal

Le foto aeree dei percorsi dimostrano le capacità di rasterizzazione geospaziale dei big data per mezzo delle GPU. Invece di fornire dati limitati su un browser Web, GIS Federal ha la capacità di mostrare tutti i dati all'utente creando al volo un'immagine raster o PNG da 4 kb.

GAIA è un database distribuito che è stato realizzato specificamente per un motore multi-core. “Il vantaggio distintivo di GAIA si deve alla possibilità di legare i thread forniti dalla GPU ai dati, ottenendo così un livello di capacità di query tradizionalmente inaccessibile agli sviluppatori che si occupano di serie di dati di grandi dimensioni”, ha dichiarato Nima Negahban, Chief Technology Officer di GIS Federal. “Grazie a GAIA possiamo usare operazioni come ‘join’ e ‘group by’. Questo ci permette di usare capacità prima del tutto impossibili negli analitici. Lo sviluppatore non deve tentare di creare un indice o precalcolare ogni possibile combinazione di assoluti e variabili. La maggior parte dei sistemi ‘big data’ sono semplicemente in grado di fornire all'utente un puntatore che indica una lista molto lunga e di chiedere quanti elementi contenga la lista. Poi l'utente deve attendere parecchio per avere una risposta. GAIA, invece, lega i thread delle GPU ai dati e quindi può affrontare questi calcoli aggregati di straordinaria complessità con estrema rapidità.”

“Quando abbiamo iniziato a sviluppare iniziale GAIA, volevamo che non tutti fossero costretti a conoscere CUDA o a sapere come sincronizzare i dati su più core o macchine”, ha proseguito Negahban. “Quindi abbiamo reso tutto invisibile: ora GAIA funziona come un database tradizionale nel quale è possibile inserire dati ed eseguire query mediante un'API. Questo consente di usarlo come meglio si crede senza dover sapere nulla dei dettagli tecnici della scheda o del cluster.”

Accesso quasi in tempo reale ad analitici predittivi da ubicazioni remote

Gli sviluppatori che ricorrono a GAIA possono aggiungere oggetti da un'ampia varietà di sorgenti e schemi e avere accesso istantaneo all'esecuzione di query complicate concernenti qualsiasi progetto o combinazione di dati, senza subire alcun ritardo legato all'indicizzazione, persino quando operano in remoto. “Prima, si interessavano soltanto a quello che rientrava nella mia area di interesse, e potevano eseguire analitici predittivi relativi a un numero di giorni precedenti variabile da uno a tre”, ha dichiarato Vij. “L'elaborazione richiedeva molti minuti o persino ore, a seconda della quantità di dati da trattare. Ora, invece, gli analisti dell'intelligence sul campo hanno tutto a portata di mano. Possono attivare e disattivare, ottimizzare e cambiare molteplici variabili legate ai calcoli per ottenere i dati che gli servono con estrema rapidità. Le operazioni che prima richiedevano ore o giorni ora sono eseguibili quasi in tempo reale.”

Per esempio, GAIA permette agli utenti di eseguire analisi delle tendenze e analitici predittivi per il rilevamento di IED utilizzano la cronologia degli eventi passati relativa agli IED esplosi su certi percorsi. I percorsi di rifornimento di missione primario e secondario possono fare ricorso a queste informazioni. È inoltre presente un sistema di allarme che può mostrare i migliori percorsi quasi in tempo reale sulla base degli eventi più recenti. “I veicoli creano un punto ogni secondo”, ha dichiarato Vij. “Questo si traduce in milioni di tracce con miliardi di punti. GAIA con accelerazione via GPU può eseguire in memoria operazioni che richiederebbero anni a un sistema basato su CPU. Con una soluzione UV 2000 di SGI e schede GPU NVIDIA K20X, possiamo disporre di 43.000 core fisici e di 10 terabyte di RAM. Questo permette di realizzare ogni secondo un numero di operazioni in virgola mobile del tutto impossibile su un sistema basato su CPU.”

Fusione dei dati e altre soluzioni rivoluzionarie che saranno rese possibili prossimamente da GAIA

Nel prossimo futuro verranno realizzati altri analitici e algoritmi. “Si stanno aprendo moltissime nuove porte”, ha dichiarato Vij. “Ora possiamo vedere quali punti sono collegati ad altri. Possiamo creare filmati che ci raccontino l'evoluzione nel tempo delle mappe termiche. Possiamo rasterizzare risultati complessi in forma di immagine o filmato in meno di un secondo. Questo tipo di visualizzare prima sarebbe stata del tutto impossibile. Le capacità avanzate di tipizzazione di GAIA creano anche numerose opportunità di fusione dei dati, un'altra novità davvero entusiasmante. Una singola query può essere eseguita su molteplici tipi di dati con molteplici schemi e un sistema di tipizzazione GAIA sarà in grado di capire come fondere queste tipologie apparentemente isolate in una serie concisa di risultati fusi.”