Centrum superkomputerowe NCAR-Wyoming

Budynek NCAR w 2014 roku

NCAR -Wyoming Supercomputing Center ( NWSC ) to wysokowydajne centrum obliczeniowe (HPC) i archiwizacja danych zlokalizowane w Cheyenne w stanie Wyoming , które zapewnia zaawansowane usługi obliczeniowe naukowcom zajmującym się naukami o Ziemi .

NWSC zaspokaja potrzeby naukowców w zakresie obliczeń, analizy danych i zasobów wizualizacji naukowej w połączeniu z potężnymi możliwościami zarządzania danymi w celu obsługi dokładniejszej rozdzielczości modelu systemu Ziemi , zwiększonej złożoności modelu, lepszych statystyk, większej mocy predykcyjnej i dłuższych czasów symulacji . Obiekt do przechowywania i archiwizacji danych w NWSC zawiera unikalne historyczne zapisy klimatyczne i bogactwo innych danych naukowych. Naukowcy z amerykańskich uniwersytetów i instytucji badawczych uzyskują zdalny dostęp do zasobów NWSC za pośrednictwem Internet z komputerów stacjonarnych lub laptopów.

Historia

Wewnątrz centrum dowodzenia superkomputerem w NCAR w 2014 roku

Centrum danych NWSC jest finansowane przez National Science Foundation (NSF) i stan Wyoming , a obsługiwane jest przez National Center for Atmospheric Research . Powstał dzięki partnerstwu University Corporation for Atmospheric Research (UCAR), stanu Wyoming, University of Wyoming , Cheyenne LEADS, Rady Biznesu Wyoming oraz Cheyenne Light Fuel and Power Company (obecnie o nazwie Black Hills Corporation). Zgodnie z misją NCAR, to centrum superkomputerowe jest liderem w dziedzinie efektywności energetycznej , wykorzystując najnowsze i najbardziej wydajne projekty i dostępne technologie. Planowanie tego centrum danych rozpoczęło się w 2003 r., wmurowanie kamienia węgielnego pod North Range Business Park w Cheyenne miało miejsce w czerwcu 2010 r., a operacje obliczeniowe rozpoczęto w październiku 2012 r.

Zrównoważony rozwój i efektywność energetyczna

Projekt obiektu opiera się na modułowych i rozszerzalnych przestrzeniach, które można dostosować do modernizacji systemów komputerowych. Jego zrównoważona konstrukcja sprawia, że ​​jest o 89% bardziej wydajne niż typowe centrum danych i do 10% bardziej wydajne niż najnowocześniejsze centra danych działające w 2010 r. Prawie 92% zużywanej energii jest bezpośrednio wykorzystywane do głównego celu, jakim jest zasilania superkomputerów, aby umożliwić odkrycia naukowe. Część jego wydajności pochodzi z regionalnie zintegrowanego projektu, który wykorzystuje klimat Wyoming do zapewnienia naturalnego chłodzenia przez 96% roku oraz lokalną energię wiatrową, która dostarcza co najmniej 10% jego mocy. Głównym wykorzystywanym źródłem energii jest węgiel. NWSC uzyskał certyfikat LEED Gold za zrównoważony projekt i konstrukcję. W 2013 roku zdobyła pierwsze miejsce za Facility Design Implementation w konkursie Green Enterprise IT przyznawanym przez Uptime Institute. Nagroda ta przyznawana jest pionierskim projektom i innowacjom, które znacząco poprawiają wydajność energetyczną i wykorzystanie zasobów w technologii informacyjnej. W czerwcu 2013 r. NWSC zdobyło nagrodę Datacenter Dynamics North American „Green” Data Center za wykazany zrównoważony rozwój w projektowaniu i eksploatacji obiektów.

Centrum ma obecnie łącznie 153 000 stóp kwadratowych z podniesioną podłogą o powierzchni 24 000 stóp kwadratowych moduły do ​​systemów superkomputerowych o rozszerzalnej konstrukcji. Zawiera liczne funkcje ochrony zasobów, aby zmniejszyć wpływ na środowisko. Zużycie wody w NWSC jest zmniejszone o około 40% w porównaniu z tradycyjnymi projektami dzięki zastosowaniu innowacyjnych technologii, specjalistycznego wyposażenia wieży chłodniczej i osprzętu hydraulicznego o niskim przepływie. Ciepło odpadowe z systemów jest zawracane do wstępnego podgrzewania komponentów w elektrowni, do ogrzewania pomieszczeń biurowych oraz do topienia śniegu i lodu na zewnętrznych chodnikach i dachach. Okna dostarczają naturalnego światła; w połączeniu z czujnikami zajętości pomieszczeń budynek oszczędza 20-30% na oświetleniu i energii elektrycznej w porównaniu z typowymi budynkami biurowymi. A automatyki budynkowej oszczędza energię poprzez ciągłą optymalizację pomp, wentylatorów i sterowań, które ogrzewają lub chłodzą tylko zajmowane obszary obiektu. Podczas budowy zastosowano zrównoważone praktyki, z naciskiem na materiały pochodzące z recyklingu i pochodzące z lokalnych źródeł.

Zasoby superkomputerowe

Granty NSF na zasoby obliczeniowe, dane i wizualizacje naukowe są przydzielane naukowcom, którzy badają system Ziemi poprzez symulację. Obecne środowisko HPC obejmuje dwa petaskalowe superkomputery , serwery do analizy i wizualizacji danych , operacyjny system prognozowania pogody, platformę eksperymentalnej architektury superkomputerowej, scentralizowany system plików , zasoby do przechowywania danych oraz archiwum historycznych danych badawczych. Wszystkie systemy obliczeniowe i pomocnicze wymagane do przepływu pracy naukowej są podłączone do współdzielonego, szybkiego, centralnego systemu plików, aby poprawić produktywność naukową i obniżyć koszty poprzez analizę i wizualizację swoich plików danych w NWSC.

Superkomputer: Yellowstone

Superkomputer Yellowstone w 2014 roku.

W 2012 roku superkomputer Yellowstone został zainstalowany w NWSC jako jego inauguracyjny zasób HPC. Yellowstone to klaster IBM iDataPlex składający się z 72 288 rdzeni procesorów Intel Sandy Bridge EP w 4518 16-rdzeniowych węzłach , każdy z 32 gigabajtami pamięci. Wszystkie węzły są połączone za pomocą pełnotłustej sieci Mellanox FDR InfiniBand . Yellowstone ma szczytową wydajność 1,504 petaflopsa i wykazał zdolność obliczeniową na poziomie 1,2576 petaflopsa, zmierzoną za pomocą testu High-Performance LINPACK (HPL). Zadebiutował jako 13. najszybszy komputer świata w rankingu TOP500 z listopada 2012 roku . Również w listopadzie 2012 r. Yellowstone zadebiutował jako 58. najbardziej energooszczędny superkomputer na świecie, działając z szybkością 875,34 megaflopa na wat , zgodnie z rankingiem organizacji Green500 . Oczekuje się, że Yellowstone pozostanie w produkcji do końca 2017 roku.

Superkomputer: Cheyenne

Uruchomiony w 2017 r. superkomputer Cheyenne o mocy 5,34 petaflopsa zapewnia obecnie ponad trzykrotnie większą moc obliczeniową niż Yellowstone. Cheyenne to system SGI ICE XA z 4032 dwuprocesorowymi naukowymi węzłami obliczeniowymi z 145 152, 18-rdzeniowymi rdzeniami przetwarzającymi Intel Xeon E5-2697v4 (Broadwell) 2,3 GHz i ma 315 terabajtów pamięci. Te węzły łączy sieć Mellanox EDR InfiniBand z ulepszoną topologią hipersześcianu 9-D, która działa z opóźnieniem wynoszącym zaledwie 0,5 mikrosekundy. Cheyenne pracuje pod kontrolą systemu operacyjnego SUSE Linux Enterprise Server 12 SP1. Podobnie jak w przypadku Yellowstone, projekt i konfiguracja Cheyenne zapewnią zrównoważone wejścia/wyjścia i wyjątkową moc obliczeniową dla potrzeb społeczności użytkowników intensywnie korzystających z danych. Cheyenne zadebiutował jako 20. najpotężniejszy komputer na świecie w listopadzie 2016 r Top500 .

Superkomputer: nienazwany

27 stycznia 2021 roku ogłoszono nowy superkomputer, zdolny do wykonywania 20 biliardów obliczeń na sekundę, czyli 3,5 razy szybszy niż obecny system działający w obiekcie. Harmonogram do uruchomienia na początku 2022 roku.

Klastry analizy danych i wizualizacji: gejzer i kaldera

Klastry Geyser i Caldera to wyspecjalizowane zasoby do analizy i wizualizacji danych w skoncentrowanym na danych środowisku Yellowstone. Serwer analizy danych Geyser to 640-rdzeniowy klaster składający się z 16 węzłów, z których każdy ma 1 terabajt pamięci. Dzięki dużej pamięci na węzeł, Geyser został zaprojektowany w celu ułatwienia analizy danych na dużą skalę i przetwarzania końcowego , w tym wizualizacji 3D, z aplikacjami, które nie obsługują równoległości pamięci rozproszonej . Klaster obliczeniowy Caldera ma 256 rdzeni w 16 węzłach, każdy z 64 gigabajtami pamięci i dwoma jednostkami przetwarzania grafiki (GPU) do użytku jako procesory obliczeniowe lub akceleratory graficzne. Dwa NVIDIA Tesla firmy Caldera na węzeł obsługują przetwarzanie równoległe, działania związane z wizualizacją oraz opracowywanie i testowanie kodu GPU ogólnego przeznaczenia (GPGPU).

Operacyjny system prognozowania pogody na Antarktydzie: Erebus

W centrum znajduje się również oddzielny, mniejszy klaster IBM iDataPlex o nazwie Erebus, który obsługuje prognozy operacyjne Antarctic Mesoscale Prediction System (AMPS) Biura Programów Polarnych NSF . Erebus ma 84 węzły podobne do Yellowstone, interkonekt FDR-10 InfiniBand i dedykowany system plików o pojemności 58 terabajtów. W razie potrzeby Yellowstone uruchomi codzienne prognozy pogody Erebus dla kontynentu antarktycznego, aby zapewnić, że światowa społeczność użytkowników otrzyma te prognozy bez przerwy.

Eksperymentalna platforma architektury superkomputerowej: Pronghorn

Architektura Pronghorna może spełnić wysokie wymagania nauk o systemach Ziemi w zakresie analizy danych, wizualizacji i obliczeń wspomaganych GPU. W ramach partnerstwa między firmami Intel, IBM i NCAR, ten eksploracyjny system jest wykorzystywany do oceny efektywności architektury Many Integrated Core (MIC) koprocesora Xeon Phi pod kątem warunków klimatycznych, pogodowych i innych aplikacji środowiskowych. Jeśli te koprocesory okażą się korzystne dla kluczowych aplikacji NCAR, można je łatwo dodać do standardowych węzłów IBM iDataPlex w Yellowstone jako ekonomiczny sposób rozszerzenia jego możliwości.

Pronghorn ma 16 dwugniazdowych węzłów IBM x360 wyposażonych w koprocesory Intel Xeon Phi 5110P i 2,6-gigahercowe rdzenie Intel Sandy Bridge (Xeon E5-2670). System ma 64 gigabajty pamięci DDR3-1600 na węzeł (63 GB pamięci użytkowej na węzeł) i jest połączony z pełnotłustą siecią Mellanox FDR InfiniBand.

Scentralizowany system plików: GLADE

Geyser, Caldera i Yellowstone montują centralny system plików o nazwie GLobally Accessible Data Environment (GLADE), który zapewnia przestrzenie robocze wspólne dla wszystkich zasobów HPC w NWSC do obliczeń, analiz i wizualizacji. Pozwala to użytkownikom analizować pliki danych na miejscu, bez wysyłania dużych ilości danych przez sieć lub tworzenia duplikatów w wielu lokalizacjach. GLADE zapewnia scentralizowane systemy plików o wysokiej wydajności, obejmujące superkomputery, przetwarzanie danych, analizę danych, wizualizację i usługi transferu danych oparte na HPC. Research Data Archive NCAR , Community Data Portal NCAR oraz Earth System Grid , która zarządza danymi CMIP5 / AR5 . Centralny zasób dysku GLADE ma użyteczną pojemność 36 petabajtów według stanu na luty 2017 r. GLADE ma zrównoważoną łączną przepustowość we / wy na poziomie ponad 220 gigabitów na sekundę .

Usługa archiwizacji danych: HPSS

Przechowywanie danych archiwalnych w NWSC zapewnia High Performance Storage System (HPSS), który składa się z bibliotek taśmowych o pojemności 320 petabajtów. Te skalowalne systemy zrobotyzowane składają się z sześciu bibliotek taśmowych Oracle StorageTek SL8500 wykorzystujących napędy taśmowe T10000C o szybkości we/wy 240 megabitów na sekundę .

Archiwum danych klimatycznych: RDA

Strategia NWSC polegająca na intensywnym przetwarzaniu danych obejmuje pełen zestaw usług danych społeczności. NCAR opracowuje produkty i usługi związane z danymi, które odpowiadają przyszłym wyzwaniom związanym z rozwojem, przechowywaniem i zarządzaniem danymi. Archiwum danych badawczych (RDA) zawiera duży zbiór zbiorów danych meteorologicznych i oceanograficznych, które wspierają badania naukowe w zakresie klimatu, pogody, hydrologii, modelowania systemu Ziemi i innych nauk pokrewnych. Jest to otwarty zasób; używa go również światowa społeczność naukowa.

Projekty edukacyjne

NWSC pełni również rolę edukacyjną. Jego publiczny program informacyjny obejmuje centrum dla zwiedzających NWSC, które wyjaśnia cele naukowe i technologię NCAR i University of Wyoming. Program staży NCAR w szkolnictwie wyższym każdego lata umieszcza dwóch stażystów inżynierów w NWSC.

Obiekty w NWSC są wykorzystywane we współpracy badawczej z Colorado State University , Oak Ridge National Laboratory , Lagrange Systems i NCAR w celu opracowania odpornych strategii zarządzania zasobami dla środowisk HPC, zwiększenia liczby badaczy i rozwiązywania problemów naukowych, które mogą wykorzystywać HPC, oraz pomóc w osiągnięciu zrównoważonych obliczeń w ekstremalnych skalach przy realistycznych budżetach mocy.

Zobacz też

Linki zewnętrzne

Współrzędne :