MOC9
Informacje ogólne | |
---|---|
Wystrzelony | 2017 |
Zaprojektowany przez | IBM |
Wspólni producenci | |
Wydajność | |
Maks. Częstotliwość taktowania procesora | 4 GHz |
Pamięć podręczna | |
Pamięć podręczna L1 | 32+32 KiB na rdzeń |
Pamięć podręczna L2 | 512 KiB na rdzeń |
Pamięć podręczna L3 | 120 MiB na chip |
Pamięć podręczna L4 | przez Centaura |
Architektura i klasyfikacja | |
Węzeł technologiczny | 14 nm ( FinFET ) |
Zestaw instrukcji | Power ISA ( Power ISA v.3.0 ) |
Specyfikacje fizyczne | |
Rdzenie |
|
Historia | |
Poprzednik | MOC8 |
Następca | Moc10 |
Architektura POWER , PowerPC i Power ISA |
---|
NXP (wcześniej Freescale i Motorola) |
IBM |
|
IBM/Nintendo |
Inny |
Powiązane linki |
Anulowane na szaro , historyczne kursywą |
POWER9 to rodzina superskalarnych , wielowątkowych , wielordzeniowych mikroprocesorów produkowanych przez IBM , opartych na Power ISA . Został ogłoszony w sierpniu 2016 r. Procesory oparte na POWER9 są produkowane przy użyciu FinFET 14 nm , w wersjach 12- i 24-rdzeniowych, do skalowania w górę i w górę aplikacji oraz prawdopodobnie innych odmian, ponieważ architektura POWER9 jest otwarta do licencjonowania i modyfikacji przez Fundację OpenPOWER członkowie.
Summit , czwarty najszybszy superkomputer na świecie (na podstawie listy Top500 z czerwca 2022 r.), jest oparty na procesorze POWER9, a jako akceleratory wykorzystuje również procesory graficzne Nvidia Tesla .
Projekt
Rdzeń
Rdzeń POWER9 jest dostępny w dwóch wariantach, czterokierunkowym wielowątkowym o nazwie SMT4 i ośmiokierunkowym o nazwie SMT8 . Rdzenie SMT4 i SMT8 są podobne, ponieważ składają się z wielu tak zwanych wycinków zasilanych przez wspólne programy planujące. Wycinek to podstawowy 64-bitowy, jednowątkowy rdzeń przetwarzający z jednostką magazynu ładunku (LSU), jednostką całkowitą (ALU) i wektorową jednostką skalarną (VSU, robiącą SIMD i zmiennoprzecinkową). Super plasterek to połączenie dwóch plasterków. Rdzeń SMT4 składa się z 32 KiB Pamięć podręczna L1 (1 KiB = 1024 bajtów), pamięć podręczna danych L1 o pojemności 32 KiB, jednostka pobierania instrukcji (IFU) i jednostka sekwencjonowania instrukcji (ISU), która zasila dwa super-wycinki. Rdzeń SMT8 ma dwa zestawy pamięci podręcznych L1 oraz IFU i ISU do zasilania czterech super-wycinków. W rezultacie 12-rdzeniowa i 24-rdzeniowa wersja POWER9 składa się z tej samej liczby segmentów (96 każdy) i takiej samej ilości pamięci podręcznej L1.
Rdzeń POWER9, czy to SMT4, czy SMT8, ma 12-stopniowy potok (pięć etapów krótszy niż jego poprzednik, POWER8 ) , ale ma na celu utrzymanie częstotliwości zegara około 4 GHz. Będzie pierwszym, który będzie zawierał elementy Power ISA v.3.0 , który został wydany w grudniu 2015 r., w tym instrukcje VSX-3 . Projekt POWER9 ma być modułowy i używany w większej liczbie wariantów procesorów oraz używany do licencjonowania, w innym procesie produkcyjnym niż IBM. Na chipie znajdują się koprocesory do kompresji i kryptografii, a także duża pamięć podręczna eDRAM L3 o niskim opóźnieniu.
POWER9 jest wyposażony w nową architekturę kontrolera przerwań o nazwie „eXternal Interrupt Virtualization Engine” (XIVE), która zastępuje znacznie prostszą architekturę stosowaną w modelach POWER4 do POWER8. XIVE będzie również używany w Power10 .
Skaluj w górę / skaluj w górę
- IBM POWER9 SO - wariant skalowalny w poziomie , zoptymalizowany dla komputerów z dwoma gniazdami i przepustowością do 120 GB / s (1 GB = 1 miliard bajtów) z bezpośrednio podłączoną pamięcią DDR4 (premiera planowana na 2017 r.)
- IBM POWER9 SU - wariant skalowalny , zoptymalizowany pod kątem czterech lub więcej gniazd, dla dużych maszyn NUMA z przepustowością do 230 GB / s do pamięci buforowanej (wykorzystuje sygnalizację „25,6 GHz” z interfejsem PowerAXON 25 GT / s Link)
Oba warianty POWER9 mogą być dostarczane w wersjach z niektórymi rdzeniami wyłączonymi ze względu na wydajność , ponieważ Raptor Computing Systems jako pierwszy sprzedawał 4-rdzeniowe chipy, a nawet IBM początkowo sprzedawał swoje systemy AC922 z nie więcej niż 22-rdzeniowymi chipami, mimo że oba typy żetony mają 24 rdzenie na matrycach.
we/wy
Wiele urządzeń jest wbudowanych w układ, aby pomóc w uzyskaniu ogromnej wydajności we/wy poza układem :
- Wariant SO ma zintegrowane kontrolery DDR4 dla bezpośrednio podłączonej pamięci RAM, podczas gdy wariant SU będzie wykorzystywać architekturę Centaur poza chipem wprowadzoną wraz z POWER8, obejmującą wysokowydajną pamięć podręczną eDRAM L4 i kontrolery pamięci dla pamięci RAM DDR4.
- Bluelink do bliskiego podłączania koprocesorów graficznych firmy Nvidia (przez NVLink v.2 ) i akceleratorów OpenCAPI .
- ogólnego przeznaczenia PCIe v.4 do podłączania zwykłych układów ASIC , FPGA i innych urządzeń peryferyjnych, a także urządzeń CAPI 2.0 i CAPI 1.0 zaprojektowanych dla POWER8.
- wieloprocesorowe ( symetryczny system wieloprocesorowy ) umożliwiające podłączenie innych procesorów POWER9 na tej samej płycie głównej lub w innych blisko połączonych obudowach.
Rodzaje chipów
Chipy POWER9 mogą być wykonane z dwoma rodzajami rdzeni oraz w konfiguracji Scale Out lub Scale Up. Rdzenie POWER9 to SMT4 lub SMT8, przy czym rdzenie SMT8 są przeznaczone dla PowerVM , podczas gdy rdzenie SMT4 są przeznaczone dla systemów PowerNV, które nie korzystają z PowerVM i działają głównie na systemie Linux. W przypadku POWER9 chipy stworzone do skalowania w poziomie mogą obsługiwać pamięć podłączaną bezpośrednio, podczas gdy chipy Scale Up są przeznaczone do użytku z maszynami z więcej niż dwoma gniazdami procesora i wykorzystują pamięć buforowaną.
PowerNV | PowerVM | |
---|---|---|
24 × rdzeń SMT4 | 12 × rdzeń SMT8 | |
Skalowanie | Chmura | nieznany |
Powiększać w skali rysunek | Cumulus |
Moduły
Portal IBM dla OpenPOWER zawiera listę trzech dostępnych modułów dla układu Nimbus, chociaż wariant Scale-Out SMT8 dla PowerVM również wykorzystuje moduł/gniazdo LaGrange:
- Sforza - 50 mm × 50 mm, 4 DDR4, 48 linii PCIe, 1 XBus 4B
- Monza - 68,5 mm × 68,5 mm, 8 DDR4, 34 tory PCIe, 1 XBus 4B, 48 torów OpenCAPI
- LaGrange — 68,5 mm × 68,5 mm, 8 DDR4, 42 tory PCIe, 2 XBus 4B, 16 torów OpenCAPI
Moduły Sforza wykorzystują 2601-stykowe gniazdo LGA.
Systemy
Systemy komputerowe Raptor / Inżynieria Raptor
Talos II – dwuprocesorowa stacja robocza/platforma serwerowa wykorzystująca procesory POWER9 SMT4 Sforza; dostępne jako serwer 2U, serwer 4U, wieża lub płyta główna EATX. Sprzedawany jako bezpieczny i kontrolowany przez właściciela z bezpłatnym i otwartym oprogramowaniem i oprogramowaniem sprzętowym. Początkowo dostarczane z opcjami chipów 4-rdzeniowych, 8-rdzeniowych, 18-rdzeniowych i 22-rdzeniowych, dopóki nie będą dostępne chipy z większą liczbą rdzeni.
Talos II Lite – jednogniazdowa wersja płyty głównej Talos II, wykonana na tej samej płytce drukowanej.
Blackbird – jednogniazdowa platforma microATX wykorzystująca procesory SMT4 Sforza (do wariantu 8-rdzeniowego 160 W), 4–8 rdzeni, 2 gniazda RAM (łącznie obsługujące do 256 GiB )
Partnerstwo Google-Rackspace
Barreleye G2 / Zaius – dwugniazdowa platforma serwerowa wykorzystująca procesory LaGrange; zarówno obudowa Barreleye G2, jak i Zaius wykorzystują płytę główną Zaius POWER9
IBM
System zasilania AC922 – 2U, 2× POWER9 SMT4 Monza, z nawet 6× procesorami graficznymi Nvidia Volta, 2× dołączonymi akceleratorami CAPI 2.0 i 1 TiB DDR4 RAM. AC to skrót od Accelerated Computing; system ten jest również znany jako „Witherspoon” lub „Newell”.
Power System L922 – 2U, 1–2× POWER9 SMT8, 8–12 rdzeni na procesor, do 4 TiB DDR4 RAM (1 TiB = 1024 GiB), PowerVM z systemem Linux .
Power System S914 – 4U, 1× POWER9 SMT8, 4–8 rdzeni, do 1 TiB DDR4 RAM, PowerVM z systemem AIX / IBM i / Linux.
Power System S922 – 2U, 1–2× POWER9 SMT8, 4–11 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z systemem AIX/IBM i/Linux.
Power System S924 – 4U, 2× POWER9 SMT8, 8–12 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z systemem AIX/IBM i/Linux.
Power System H922 – 2U, 1–2× POWER9 SMT8, 4–10 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z systemem SAP HANA (w systemie Linux) z systemem AIX/IBM i na maksymalnie 25% systemu.
Power System H924 – 4U, 2× POWER9 SMT8, 8–12 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z SAP HANA (w systemie Linux) z AIX/IBM i na maksymalnie 25% systemu.
Power System E950 – 4U, 2–4× POWER9 SMT8, 8–12 rdzeni na procesor, do 16 TiB buforowanej pamięci RAM DDR4
Power System E980 – 1–4× 4U, 4–16× POWER9 SMT8, 8–12 rdzeni na procesor, do 64 TiB buforowanej pamięci RAM DDR4
Konsola do zarządzania sprzętem 7063-CR2 – 1U, 1× POWER9 SMT8, 6 rdzeni, 64-128 GB DDR4 RAM.
Komputery pingwina
Magna PE2112GTX – dwugniazdowy serwer 2U do wysokowydajnych obliczeń z wykorzystaniem procesorów LaGrange. Producent Wistron.
superkomputery IBM
Summit i Sierra - Departament Energii Stanów Zjednoczonych wraz z Oak Ridge National Laboratory i Lawrence Livermore National Laboratory zlecił IBM i Nvidia zbudowanie dwóch superkomputerów, Summit i Sierra , opartych na procesorach POWER9 połączonych z procesorami graficznymi Volta firmy Nvidia . Systemy te mają zostać uruchomione w 2017 r. Sierra jest oparta na węźle obliczeniowym IBM Power Systems AC922. Pierwsze stojaki Summit zostały dostarczone do Oak Ridge National Laboratory w dniu 31 lipca 2017 r.
MareNostrum 4 – Jednym z trzech klastrów w bloku nowych technologii czwartego superkomputera MareNostrum jest klaster POWER9 z procesorami graficznymi Nvidia Volta. Oczekuje się, że ten klaster po zainstalowaniu zapewni ponad 1,5 petaflopa mocy obliczeniowej. Blok nowych technologii MareNostrum 4 istnieje w celu sprawdzenia, czy nowe rozwiązania mogą być „odpowiednie dla przyszłych wersji MareNostrum”.
Obsługa systemu operacyjnego
Podobnie jak jego poprzednik, POWER9 jest obsługiwany przez FreeBSD , IBM AIX , IBM i , Linux (zarówno działające z PowerVM, jak i bez) oraz OpenBSD .
Implementacja obsługi POWER9 w jądrze Linuksa rozpoczęła się od wersji 4.6 w marcu 2016 roku.
Red Hat Enterprise Linux (RHEL), SUSE Linux Enterprise (SLES), Debian Linux i CentOS są obsługiwane od sierpnia 2018 r.
Menedżer pakietów GNU Guix również obsługuje POWER9, ale obecnie tylko z innym systemem operacyjnym, tj. bez systemu GNU Guix .