Scritto: Martedì, 19 Novembre 2019 07:12 Ultima modifica: Mercoledì, 20 Novembre 2019 22:31

La calma prima della tempEXA In evidenza


Pubblicata la nuova classifica dei Supercomputer più potenti. Nessuna novità ai primi posti, ma molto bolle in pentola!

Rate this item
(0 votes)
Trend aggiornati della lista Top500: capacità di calcolo complessiva (in verde), potenza del primo classificato (in giallo) e dell'ultimo (in blu), con possibile estrapolazione nei prossimi 24 mesi Trend aggiornati della lista Top500: capacità di calcolo complessiva (in verde), potenza del primo classificato (in giallo) e dell'ultimo (in blu), con possibile estrapolazione nei prossimi 24 mesi Credits: Top500.org - Processing: Marco Di Lorenzo

 Lo avevamo preannunciato in un articolo recente, lunedì è finalmente uscita la nuova lista TOP500 che elenca, due volte all'anno da ormai 26 anni a questa parte, i sistemi di calcolo più performanti al mondo, almeno tra quelli di pubblico dominio. Come era già successo nella precedente edizione a Giugno, anche stavolta non si notano cambiamenti al vertice, anzi per la prima volta la graduatoria dei primi 10 sistemi è rimasta completamente immutata. Tuttavia, l'evoluzione non si è affatto interrotta, come dimostra la crescita delle prestazioni cumulative (tutti i 500 supercomputer, se sommati, raggiungono un potenza di 1,65 ExaFlops, o 1,65·1018 operazioni in doppia precisione ogni secondo); anche le prestazioni dell'ultimo classificato, alla posizione n.500, sono aumentate del 12%, passando da 1,02 a 1,14 PetaFlops.

 I diagrammi a torta sottostanti, generati insieme a tanti altri sul sito Top500, visualizzano la distribuzione della potenza di calcolo e del numero di sistemi contenuti nella lista in funzione del paese che li ospita. Come si vede, adesso la Cina detiene il maggiore numero di supercomputers al mondo, quasi il doppio di quanti ce ne sono USA. In Italia ce ne sono cinque e i due più performanti sono un HPC4 da 12,2 PFlops gestito da Eni e il computer Marconi basato su Xeon Phi da 10,4 PFlops, presso il CINECA, principale centro di calcolo nazionale vicino Bologna e destinato ad ospitare un supercomputer "exa-scale" nei prossimi anni; i due sistemi occupano le posizioni 17 e 19 della lista, rispettivamente. 

Nov19 bu Country

Credits: Top500.org - Processing: Marco Di Lorenzo

 In realtà, sotto la brace sta covando la ormai imminente rivoluzione degli ExaFlops ed è probabile che la prima macchina con questo livello di prestazioni entrerà in funzione già tra uno o al massimo due anni; questo almeno si deduce dagli annunci ufficiali fatti da più parti. Ma andiamo con ordine e vediamo intanto come è fatta la lista pubblicata ieri, tanto più che si tratta, in realtà, di ben 3 differenti liste basate su altrettanti criteri. In effetti, la lista tradizionale "Top500" viene stilata sulla base dei risultati di un insieme di routines piuttosto datate, il cosiddetto "LINPACK benchmark" (HPL); i risultati forniti da esso risultano decisamente ottimistici e forniscono una potenza di calcolo difficilmente raggiungibili nelle simulazioni reali, poiché favorisce situazioni in cui il calcolo in virgola mobile è la parte preponderante del lavoro. Invece, spesso, nei tipici carichi di lavoro a cui sono sottoposti i moderni supercomputers la "larghezza di banda" necessaria per trasferire grandi volumi di dati tra le varie unità e la memoria fa la parte del padrone, limitando fortemente le prestazioni. Per questo, da qualche anno, accanto a HPL è apparso un altro sistema di valutazione più ricco e complesso, chiamato "High Performance Conjugate Gradients benchmark" (HPCG). I risultati di HPCG, in termini di PetaFlops, sono nettamente inferiori a quelli del test precedente e a volte riservano sorprese, come mostrato da questo confronto sui primi classificati secondo i due criteri:

1911 T500 vs HPCG

Confronto tra i primi classificati delle due liste di Novembre 2019 basate sul classico criterio HPL (a sinistra) e sul più recente HPCG (a destra). I cambiamenti di posizione sono evidenziati dalle frecce rosse. - Credits: www.top500.org - Processing: Marco Di Lorenzo

 Come si vede, la potenza di calcolo con il nuovo algoritmo risulta svariate decine di volte inferiore e il quoziente tra i due dipende anche dalla particolare architettura del sistema, cosa che provoca spostamenti sensibili in molte posizioni della classifica. Tutto questo è ancora più evidente nella seguente slide, realizzata nel 2017 quando questo benchmark era stato da poco introdotto.

2017 HPCG vs T500

Confronto tra le prestazioni HPL (in verde) e HPCG (in blu) per i sistemi della lista un paio di anni fa. - Credits: Top500.org - Processing: Marco Di Lorenzo

 Esiste poi una terza lista altrettanto importante che riguarda l'efficienza di calcolo in termini energetici. Si chiama "Green500" ed è basata sul rapporto GigalFlops/Watts; la classifica che ne risulta è completamente stravolta rispetto alle precedenti due, come si intuisce confrontando le posizioni della "Top 500" (seconda colonna); in particolare, l'americano "Summit" risulta declassato dal primo al quinto posto mentre nelle posizioni di testa ci sono macchine relativamente poco potenti (pochi PetaFlops), perché basate su un numero limitato di processori ma capaci di effettuare oltre 15 miliardi di operazioni al secondo con meno di 1 Watt di potenza! 

1911 Green500

La parte più alta dell'ultima lista "Green500"

 In particolare, al primo posto di quest'ultima lista c'è un prototipo che, in prospettiva, costituirà la base per realizzare futuri primati. Il processore utilizzato, infatti, è il Fujitsu-Riken A64fx, un nuovo dispositivo con architettura ARM (set di istruzioni ridotto) e tecnologia da 7nm, attualmente la punta di diamante nei processi di produzione di circuiti integrati. Dotato di una cinquantina di cores (divisi in 4 gruppi con memoria condivisa che comunicano tra loro con un sistema "Network on Chip"), è ottimizzato per avere una efficienza energetica circa 10 volte superiore ai tradizionali processori i86 usati nei personal computers, possiede un'ampia larghezza di banda (oltre 1 TB/s) per il trasferimento dei dati ad alta velocità e ha funzionalità AI. Queste caratteristiche lo rendono ideale per realizzare il successore del computer-K giapponese, che fu il primo a superare i 10 PetaFlops nel 2011. Secondo indiscrezioni. il supercomputer "Post-K" conterrà almeno 150mila processori (8 milioni di cores) raffreddati ad acqua e distribuiti in oltre 400 "armadi" (racks); nonostante l'elevata efficienza, consumerà oltre 40 MW di potenza avvicinandosi parecchio a 1 EF (ExaFlops) ma senza arrivarci, perlomeno nel calcolo 64 bit ad alta precisione. Ultimamente, anche la storica Cray Corporation ha annunciato che utilizzerà il processore Fujitsu nei suoi futuri modelli.

 Un altro campione di efficienza e di prestazioni è sicuramente il processore NVIDIA V100, un vero mostro con migliaia di cores specializzati e funzionalità AI avanzate; le sue principali caratteristiche sono elencate nella seguente immagine.

NVIDIA Tesla

Credits: NVIDIA - Processing: Marco Di Lorenzo

 Naturalmente, Intel non sta certo a guardare e ha recentemente svelato le caratteristiche del suo processore per l'era "exascale". Il nome in codice è "PonteVecchio" (proprio in onore al ponte fiorentino!) e utilizzerà la teconologia "EMIB" (embedded multi connect bridge) che si basa anche su chip "tridimensionali" (più strati di circuiti stampati interconnessi); inutile dirlo, anche qui ci saranno evolute funzionalità AI e si userà la tecnologia 7nm. I primi esemplari dovrebbero uscire sul mercato il prossimo anno e questo sistema sarà alla base del computer americano da 1 EF, di nome Aurora e che dovrebbe vedere la luce nel 2021. Si prevede che Aurora avrà 200 racks, 10 petabytes di RAM e 230 di memoria di massa. Ciascun nodo sarà composto da due processori Xeon "Sapphire Rapids" connessi con 6 "Ponte Vecchio".

 Alla fine, probabilmente, i cinesi batteranno tutti sul tempo nel raggiungere la pietra miliare dell'Exaflop, con il loro Thiane-3 che potrebbe vedere la luce tra un anno. Dopo, probabilmente, la competizione si sposterà sempre più su altri settori e il semplice "number crunch" a doppia precisione diventerà secondario...

Riferimenti:

https://www.top500.org/

https://www.cineca.it/it/news/litalia-ospitera-uno-dei-supercomputer-europei-pre-exascale

https://www.hpcg-benchmark.org/index.html

https://www.hpcwire.com/2019/11/17/intel-debuts-new-gpu-ponte-vecchio-and-outlines-aspirations-for-oneapi/

Altre informazioni su questo articolo

Read 158 times Ultima modifica Mercoledì, 20 Novembre 2019 22:31
Marco Di Lorenzo (DILO)

Sono laureato in Fisica e insegno questa materia nelle scuole superiori; in passato ho lavorato nel campo dei semiconduttori e dei sensori d'immagine. Appassionato di astronautica e astronomia fin da ragazzo, ho continuato a coltivare queste passioni sul web, elaborando e pubblicando numerose immagini insieme al collega Ken Kremer. E naturalmente amo la fantascienza e la fotografia!

https://www.facebook.com/marco.lorenzo.58 | Questo indirizzo email è protetto dagli spambots. È necessario abilitare JavaScript per vederlo.

Leave a comment

Make sure you enter all the required information, indicated by an asterisk (*). HTML code is not allowed.

Seguici!

Newsletter

Abilita il javascript per inviare questo modulo

Immagine del giorno

NEO news

  • NEO News

    Notizie e aggiornamenti sugli incontri ravvicinati con oggetti potenzialmente pericolosi e sulla loro catalogazione. Ultimo aggiornamento: 12 Dicembre (ore 17)

Log: Missioni e Detriti

  • Rilevazione di Onde Gravitazionali
    Rilevazione di Onde Gravitazionali

    Stato della rivelazione di probabili Onde Gravitazionali da parte di Virgo e Ligo (aggiornato al 13 Dicembre) Hot!

  • ISS height
    ISS height

    Andamento dell'orbita della Stazione Spaziale Internazionale.

    Aggiornamento del 12/12 [Last update: Dec,12]

  • Hayabusa 2 operations
    Hayabusa 2 operations

    Le manovre della sonda giapponese intorno a Ryugu (aggiornato il 9/12/19).

  • HST orbit
    HST orbit

    Hubbe Space Telescope orbit monitor.

    Aggiornamento del 12/12 [Last update: Dic,12].

  • Insight statistics
    Insight statistics

    Meteorologia e numero di immagini trasmesse dal lander geologo [aggiornato al 13/12 - Sol 370]

  • OSIRIS REx operations
    OSIRIS REx operations

    Le manovre della sonda americana intorno a Bennu (aggiornato il 13/8/19).

  • Curiosity odometry
    Curiosity odometry

    Statistiche sulla distanza percorsa, posizione, velocità e altezza del rover Curiosity.

    Aggiornato il 6 Dicembre [updated on Dec,06]

HOT NEWS