Wykres500
Graph500 to ocena systemów superkomputerowych , koncentrująca się na obciążeniach intensywnie przetwarzających dane . Projekt został ogłoszony na International Supercomputing Conference w czerwcu 2010. Pierwsza lista została opublikowana na ACM/IEEE Supercomputing Conference w listopadzie 2010. Nowe wersje listy publikowane są dwa razy do roku. Głównym wskaźnikiem wydajności używanym do uszeregowania superkomputerów jest GTEPS ( giga pokonanych krawędzi na sekundę ).
Richard Murphy z Sandia National Laboratories mówi, że „Celem Graph500 jest promowanie świadomości złożonych problemów z danymi”, zamiast skupiania się na komputerowych testach porównawczych, takich jak HPL (High Performance Linpack), na którym opiera się TOP500 .
Wbrew swojej nazwie w rankingu znalazło się kilkaset systemów, których liczba wzrosła do 174 w czerwcu 2014 roku.
Algorytm i implementacja, które zdobyły mistrzostwo, zostały opublikowane w artykule zatytułowanym „Wyszukiwanie wszerz w ekstremalnej skali na superkomputerach”.
Istnieje również lista Green Graph 500, która wykorzystuje te same wskaźniki wydajności, ale sortuje listę według wydajności na wat, tak jak Green 500 współpracuje z TOP500 (HPL).
Reper
Benchmark zastosowany w Graph500 kładzie nacisk na podsystem komunikacyjny systemu, zamiast zliczania zmiennoprzecinkowego podwójnej precyzji. Opiera się na przeszukiwaniu wszerz dużego nieskierowanego grafu (model grafu Kroneckera o średnim stopniu 16). Test porównawczy obejmuje trzy jądra obliczeniowe: pierwsze jądro służy do generowania wykresu i kompresji go do rzadkich struktur CSR lub CSC (Compressed Sparse Row/Column); drugie jądro wykonuje równoległe przeszukiwanie BFS niektórych losowych wierzchołków (64 iteracje wyszukiwania na przebieg); trzecie jądro wykonuje obliczenia najkrótszych ścieżek (SSSP) z jednego źródła. Zdefiniowano sześć możliwych rozmiarów (skali) wykresu: zabawka (2 26 wierzchołków; 17 GB RAM), mini (2 29 ; 137 GB), mały (2 32 ; 1,1 TB), średni (2 36 ; 17,6 TB), duży (2 39 ; 140 TB) i ogromny (2 42 ; 1,1 PB) pamięci RAM).
Referencyjna implementacja benchmarku zawiera kilka wersji:
- szeregowy wysokiego poziomu w GNU Octave
- szeregowy niski poziom w C
- równoległa wersja C z wykorzystaniem OpenMP
- dwie wersje dla Cray-XMT
- podstawowa wersja MPI (z funkcjami MPI-1)
- zoptymalizowana wersja MPI (z jednostronną komunikacją MPI-2 )
Strategię implementacji, która zdobyła mistrzostwo na japońskim komputerze K opisana jest w.
Ranking 10 najlepszych
2022
Zgodnie z wydaniem listy w listopadzie 2022 r.:
Ranga | Kraj | Strona | Maszyna (architektura) | Liczba węzłów | Liczba rdzeni | Skala problemu | GTEPS |
---|---|---|---|---|---|---|---|
1 | Japonia | RIKEN Zaawansowany Instytut Nauk Obliczeniowych | Superkomputer Fugaku ( Fujitsu A64FX ) | 158976 | 7630848 | 41 | 102955 |
2 | Chiny | Laboratorium Pengchenga | Pengcheng Cloudbrain-II (Kunpeng 920+Ascend 910) | 488 | 93696 | 40 | 25242.9 |
3 | Chiny | Narodowe Centrum Superkomputerowe w Wuxi | Sunway TaihuLight (Sunway MPP) | 40768 | 10599680 | 40 | 23755,7 |
4 | Japonia | Centrum Technologii Informacyjnych Uniwersytetu Tokijskiego | Wisteria/BDEC-01 (PRIMEHPC FX1000) | 7680 | 368640 | 37 | 16118 |
5 | Japonia | Japońska Agencja Eksploracji Lotnictwa i Kosmosu | TOKI-SORA (PRIMEHPC FX1000) | 5760 | 276480 | 36 | 10813 |
6 | UE | EuroHPC/CSC | LUMI-C ( HPE Cray EX ) | 1492 | 190976 | 38 | 8467.71 |
7 | NAS | Narodowe Laboratorium Oak Ridge | Szczyt OLCF ( IBM POWER9 ) | 2048 | 86016 | 40 | 7665.7 |
8 | Niemcy | Rechenzentrum Leibniza | SuperMUC-NG (ThinkSystem SD530 Xeon Platinum 8174 24C 3,1 GHz Intel Omni-Path ) | 4096 | 196608 | 39 | 6279.47 |
9 | Niemcy | Zuse Institute w Berlinie | Lise ( Intel Omni-Path ) | 1270 | 121920 | 38 | 5423,94 |
10 | Chiny | Narodowe Centrum Badań Inżynieryjnych ds. Technologii i Systemów Big Data | DepGraph Supernode (DepGraph (+ GPU Tesla A100)) | 1 | 128 | 33 | 4623.379 |
2020
Fugaku oparty na ramieniu zajął pierwsze miejsce na liście.
2016
Zgodnie z wydaniem listy w czerwcu 2016 r.:
Ranga | Strona | Maszyna (architektura) | Liczba węzłów | Liczba rdzeni | Skala problemu | GTEPS |
---|---|---|---|---|---|---|
1 | Zaawansowany Instytut Nauk Obliczeniowych Riken | Komputer K ( niestandardowy Fujitsu ) | 82944 | 663552 | 40 | 38621.4 |
2 | Narodowe Centrum Superkomputerowe w Wuxi | Sunway TaihuLight (NRCPC - Sunway MPP) | 40768 | 10599680 | 40 | 23755,7 |
3 | Narodowe Laboratorium Lawrence'a Livermore'a | IBM Sequoia ( Blue Gene/Q ) | 98304 | 1572864 | 41 | 23751 |
4 | Narodowe Laboratorium Argonne | IBM Mira (niebieski gen/Q) | 49152 | 786432 | 40 | 14982 |
5 | Forschungszentrum Jülich | JUQUEEN (niebieski gen/Q) | 16384 | 262144 | 38 | 5848 |
6 | KINO | Fermi (niebieski gen/Q) | 8192 | 131072 | 37 | 2567 |
7 | Changsha , Chiny | Tianhe-2 ( niestandardowy NUDT ) | 8192 | 196608 | 36 | 2061.48 |
8 | CNRS/IDRIS-GENCI | Turing (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
8 | Rada ds. Obiektów Naukowych i Technologicznych - Laboratorium Daresbury | Niebieski dżul (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
8 | Uniwersytet w Edynburgu | DIRAC (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
8 | Badania i rozwój EDF | Zumbrota (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
8 | Wiktoriańska Inicjatywa Obliczeniowa Nauk Przyrodniczych | Awokado (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
2014
Zgodnie z wydaniem listy w czerwcu 2014 r.:
Ranga | Strona | Maszyna (architektura) | Liczba węzłów | Liczba rdzeni | Skala problemu | GTEPS |
---|---|---|---|---|---|---|
1 | RIKEN Zaawansowany Instytut Nauk Obliczeniowych | Komputer K ( niestandardowy Fujitsu ) | 65536 | 524288 | 40 | 17977.1 |
2 | Narodowe Laboratorium Lawrence'a Livermore'a | IBM Sequoia ( Blue Gene/Q ) | 65536 | 1048576 | 40 | 16599 |
3 | Narodowe Laboratorium Argonne | IBM Mira (niebieski gen/Q) | 49152 | 786432 | 40 | 14328 |
4 | Forschungszentrum Jülich | JUQUEEN (niebieski gen/Q) | 16384 | 262144 | 38 | 5848 |
5 | KINO | Fermi (niebieski gen/Q) | 8192 | 131072 | 37 | 2567 |
6 | Changsha, Chiny | Tianhe-2 ( niestandardowy NUDT ) | 8192 | 196608 | 36 | 2061.48 |
7 | CNRS/IDRIS-GENCI | Turing (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Rada ds. Obiektów Naukowo-Technicznych - Laboratorium Daresbury | Niebieski dżul (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Uniwersytet w Edynburgu | DIRAC (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Badania i rozwój EDF | Zumbrota (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Wiktoriańska Inicjatywa Obliczeniowa Nauk Przyrodniczych | Awokado (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
2013
Zgodnie z wydaniem listy w czerwcu 2013 r.:
Ranga | Strona | Maszyna (architektura) | Liczba węzłów | Liczba rdzeni | Skala problemu | GTEPS |
---|---|---|---|---|---|---|
1 | Narodowe Laboratorium Lawrence'a Livermore'a | IBM Sequoia (Blue Gene/Q) | 65536 | 1048576 | 40 | 15363 |
2 | Narodowe Laboratorium Argonne | IBM Mira (niebieski gen/Q) | 49152 | 786432 | 40 | 14328 |
3 | Forschungszentrum Jülich | JUQUEEN (niebieski gen/Q) | 16384 | 262144 | 38 | 5848 |
4 | RIKEN Zaawansowany Instytut Nauk Obliczeniowych | Komputer K (niestandardowy Fujitsu) | 65536 | 524288 | 40 | 5524.12 |
5 | KINO | Fermi (niebieski gen/Q) | 8192 | 131072 | 37 | 2567 |
6 | Changsha, Chiny | Tianhe-2 (niestandardowy NUDT) | 8192 | 196608 | 36 | 2061.48 |
7 | CNRS/IDRIS-GENCI | Turing (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Rada ds. Obiektów Naukowych i Technologicznych - Laboratorium Daresbury | Niebieski dżul (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Uniwersytet w Edynburgu | DIRAC (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Badania i rozwój EDF | Zumbrota (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |
7 | Wiktoriańska Inicjatywa Obliczeniowa Nauk Przyrodniczych | Awokado (niebieski gen/Q) | 4096 | 65536 | 36 | 1427 |