MOC9

MOC9
POWER9 (38486053844).jpg
Technik trzymający procesor POWER9
Informacje ogólne
Wystrzelony 2017
Zaprojektowany przez IBM
Wspólni producenci
Wydajność
Maks. Częstotliwość taktowania procesora 4 GHz
Pamięć podręczna
Pamięć podręczna L1 32+32 KiB na rdzeń
Pamięć podręczna L2 512 KiB na rdzeń
Pamięć podręczna L3 120 MiB na chip
Pamięć podręczna L4 przez Centaura
Architektura i klasyfikacja
Węzeł technologiczny 14 nm ( FinFET )
Zestaw instrukcji Power ISA ( Power ISA v.3.0 )
Specyfikacje fizyczne
Rdzenie
  • 12 rdzeni SMT8 lub 24 rdzenie SMT4 na matrycy
Historia
Poprzednik MOC8
Następca Moc10

POWER9 to rodzina superskalarnych , wielowątkowych , wielordzeniowych mikroprocesorów produkowanych przez IBM , opartych na Power ISA . Został ogłoszony w sierpniu 2016 r. Procesory oparte na POWER9 są produkowane przy użyciu FinFET 14 nm , w wersjach 12- i 24-rdzeniowych, do skalowania w górę i w górę aplikacji oraz prawdopodobnie innych odmian, ponieważ architektura POWER9 jest otwarta do licencjonowania i modyfikacji przez Fundację OpenPOWER członkowie.

Summit , czwarty najszybszy superkomputer na świecie (na podstawie listy Top500 z czerwca 2022 r.), jest oparty na procesorze POWER9, a jako akceleratory wykorzystuje również procesory graficzne Nvidia Tesla .

Projekt

Rdzeń

Rdzeń POWER9 jest dostępny w dwóch wariantach, czterokierunkowym wielowątkowym o nazwie SMT4 i ośmiokierunkowym o nazwie SMT8 . Rdzenie SMT4 i SMT8 są podobne, ponieważ składają się z wielu tak zwanych wycinków zasilanych przez wspólne programy planujące. Wycinek to podstawowy 64-bitowy, jednowątkowy rdzeń przetwarzający z jednostką magazynu ładunku (LSU), jednostką całkowitą (ALU) i wektorową jednostką skalarną (VSU, robiącą SIMD i zmiennoprzecinkową). Super plasterek to połączenie dwóch plasterków. Rdzeń SMT4 składa się z 32 KiB Pamięć podręczna L1 (1 KiB = 1024 bajtów), pamięć podręczna danych L1 o pojemności 32 KiB, jednostka pobierania instrukcji (IFU) i jednostka sekwencjonowania instrukcji (ISU), która zasila dwa super-wycinki. Rdzeń SMT8 ma dwa zestawy pamięci podręcznych L1 oraz IFU i ISU do zasilania czterech super-wycinków. W rezultacie 12-rdzeniowa i 24-rdzeniowa wersja POWER9 składa się z tej samej liczby segmentów (96 każdy) i takiej samej ilości pamięci podręcznej L1.

Rdzeń POWER9, czy to SMT4, czy SMT8, ma 12-stopniowy potok (pięć etapów krótszy niż jego poprzednik, POWER8 ) , ale ma na celu utrzymanie częstotliwości zegara około 4 GHz. Będzie pierwszym, który będzie zawierał elementy Power ISA v.3.0 , który został wydany w grudniu 2015 r., w tym instrukcje VSX-3 . Projekt POWER9 ma być modułowy i używany w większej liczbie wariantów procesorów oraz używany do licencjonowania, w innym procesie produkcyjnym niż IBM. Na chipie znajdują się koprocesory do kompresji i kryptografii, a także duża pamięć podręczna eDRAM L3 o niskim opóźnieniu.

POWER9 jest wyposażony w nową architekturę kontrolera przerwań o nazwie „eXternal Interrupt Virtualization Engine” (XIVE), która zastępuje znacznie prostszą architekturę stosowaną w modelach POWER4 do POWER8. XIVE będzie również używany w Power10 .

Skaluj w górę / skaluj w górę

  • IBM POWER9 SO - wariant skalowalny w poziomie , zoptymalizowany dla komputerów z dwoma gniazdami i przepustowością do 120 GB / s (1 GB = 1 miliard bajtów) z bezpośrednio podłączoną pamięcią DDR4 (premiera planowana na 2017 r.)
  • IBM POWER9 SU - wariant skalowalny , zoptymalizowany pod kątem czterech lub więcej gniazd, dla dużych maszyn NUMA z przepustowością do 230 GB / s do pamięci buforowanej (wykorzystuje sygnalizację „25,6 GHz” z interfejsem PowerAXON 25 GT / s Link)

Oba warianty POWER9 mogą być dostarczane w wersjach z niektórymi rdzeniami wyłączonymi ze względu na wydajność , ponieważ Raptor Computing Systems jako pierwszy sprzedawał 4-rdzeniowe chipy, a nawet IBM początkowo sprzedawał swoje systemy AC922 z nie więcej niż 22-rdzeniowymi chipami, mimo że oba typy żetony mają 24 rdzenie na matrycach.

we/wy

Wiele urządzeń jest wbudowanych w układ, aby pomóc w uzyskaniu ogromnej wydajności we/wy poza układem :

Rodzaje chipów

Chipy POWER9 mogą być wykonane z dwoma rodzajami rdzeni oraz w konfiguracji Scale Out lub Scale Up. Rdzenie POWER9 to SMT4 lub SMT8, przy czym rdzenie SMT8 są przeznaczone dla PowerVM , podczas gdy rdzenie SMT4 są przeznaczone dla systemów PowerNV, które nie korzystają z PowerVM i działają głównie na systemie Linux. W przypadku POWER9 chipy stworzone do skalowania w poziomie mogą obsługiwać pamięć podłączaną bezpośrednio, podczas gdy chipy Scale Up są przeznaczone do użytku z maszynami z więcej niż dwoma gniazdami procesora i wykorzystują pamięć buforowaną.

Chipy POWER9
PowerNV PowerVM
24 × rdzeń SMT4 12 × rdzeń SMT8
Skalowanie Chmura nieznany
Powiększać w skali rysunek Cumulus

Moduły

Portal IBM dla OpenPOWER zawiera listę trzech dostępnych modułów dla układu Nimbus, chociaż wariant Scale-Out SMT8 dla PowerVM również wykorzystuje moduł/gniazdo LaGrange:

  • Sforza - 50 mm × 50 mm, 4 DDR4, 48 linii PCIe, 1 XBus 4B
  • Monza - 68,5 mm × 68,5 mm, 8 DDR4, 34 tory PCIe, 1 XBus 4B, 48 torów OpenCAPI
  • LaGrange — 68,5 mm × 68,5 mm, 8 DDR4, 42 tory PCIe, 2 XBus 4B, 16 torów OpenCAPI

Moduły Sforza wykorzystują 2601-stykowe gniazdo LGA.

Systemy

Systemy komputerowe Raptor / Inżynieria Raptor

Talos II – dwuprocesorowa stacja robocza/platforma serwerowa wykorzystująca procesory POWER9 SMT4 Sforza; dostępne jako serwer 2U, serwer 4U, wieża lub płyta główna EATX. Sprzedawany jako bezpieczny i kontrolowany przez właściciela z bezpłatnym i otwartym oprogramowaniem i oprogramowaniem sprzętowym. Początkowo dostarczane z opcjami chipów 4-rdzeniowych, 8-rdzeniowych, 18-rdzeniowych i 22-rdzeniowych, dopóki nie będą dostępne chipy z większą liczbą rdzeni.

Talos II Lite – jednogniazdowa wersja płyty głównej Talos II, wykonana na tej samej płytce drukowanej.

Blackbird – jednogniazdowa platforma microATX wykorzystująca procesory SMT4 Sforza (do wariantu 8-rdzeniowego 160 W), 4–8 rdzeni, 2 gniazda RAM (łącznie obsługujące do 256 GiB )

Partnerstwo Google-Rackspace

Barreleye G2 / Zaius – dwugniazdowa platforma serwerowa wykorzystująca procesory LaGrange; zarówno obudowa Barreleye G2, jak i Zaius wykorzystują płytę główną Zaius POWER9

IBM

System zasilania AC922 – 2U, 2× POWER9 SMT4 Monza, z nawet 6× procesorami graficznymi Nvidia Volta, 2× dołączonymi akceleratorami CAPI 2.0 i 1 TiB DDR4 RAM. AC to skrót od Accelerated Computing; system ten jest również znany jako „Witherspoon” lub „Newell”.

Power System L922 – 2U, 1–2× POWER9 SMT8, 8–12 rdzeni na procesor, do 4 TiB DDR4 RAM (1 TiB = 1024 GiB), PowerVM z systemem Linux .

Power System S914 – 4U, 1× POWER9 SMT8, 4–8 rdzeni, do 1 TiB DDR4 RAM, PowerVM z systemem AIX / IBM i / Linux.

Power System S922 – 2U, 1–2× POWER9 SMT8, 4–11 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z systemem AIX/IBM i/Linux.

Power System S924 – 4U, 2× POWER9 SMT8, 8–12 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z systemem AIX/IBM i/Linux.

Power System H922 – 2U, 1–2× POWER9 SMT8, 4–10 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z systemem SAP HANA (w systemie Linux) z systemem AIX/IBM i na maksymalnie 25% systemu.

Power System H924 – 4U, 2× POWER9 SMT8, 8–12 rdzeni na procesor, do 4 TiB DDR4 RAM, PowerVM z SAP HANA (w systemie Linux) z AIX/IBM i na maksymalnie 25% systemu.

Power System E950 – 4U, 2–4× POWER9 SMT8, 8–12 rdzeni na procesor, do 16 TiB buforowanej pamięci RAM DDR4

Power System E980 – 1–4× 4U, 4–16× POWER9 SMT8, 8–12 rdzeni na procesor, do 64 TiB buforowanej pamięci RAM DDR4

Konsola do zarządzania sprzętem 7063-CR2 – 1U, 1× POWER9 SMT8, 6 rdzeni, 64-128 GB DDR4 RAM.

Komputery pingwina

Magna PE2112GTX – dwugniazdowy serwer 2U do wysokowydajnych obliczeń z wykorzystaniem procesorów LaGrange. Producent Wistron.

superkomputery IBM

Płytka POWER9 z certyfikatami TOP500 dla Summit & Sierra

Summit i Sierra - Departament Energii Stanów Zjednoczonych wraz z Oak Ridge National Laboratory i Lawrence Livermore National Laboratory zlecił IBM i Nvidia zbudowanie dwóch superkomputerów, Summit i Sierra , opartych na procesorach POWER9 połączonych z procesorami graficznymi Volta firmy Nvidia . Systemy te mają zostać uruchomione w 2017 r. Sierra jest oparta na węźle obliczeniowym IBM Power Systems AC922. Pierwsze stojaki Summit zostały dostarczone do Oak Ridge National Laboratory w dniu 31 lipca 2017 r.

MareNostrum 4 – Jednym z trzech klastrów w bloku nowych technologii czwartego superkomputera MareNostrum jest klaster POWER9 z procesorami graficznymi Nvidia Volta. Oczekuje się, że ten klaster po zainstalowaniu zapewni ponad 1,5 petaflopa mocy obliczeniowej. Blok nowych technologii MareNostrum 4 istnieje w celu sprawdzenia, czy nowe rozwiązania mogą być „odpowiednie dla przyszłych wersji MareNostrum”.

Obsługa systemu operacyjnego

Podobnie jak jego poprzednik, POWER9 jest obsługiwany przez FreeBSD , IBM AIX , IBM i , Linux (zarówno działające z PowerVM, jak i bez) oraz OpenBSD .

Implementacja obsługi POWER9 w jądrze Linuksa rozpoczęła się od wersji 4.6 w marcu 2016 roku.

Red Hat Enterprise Linux (RHEL), SUSE Linux Enterprise (SLES), Debian Linux i CentOS są obsługiwane od sierpnia 2018 r.

Menedżer pakietów GNU Guix również obsługuje POWER9, ale obecnie tylko z innym systemem operacyjnym, tj. bez systemu GNU Guix .

Zobacz też

Linki zewnętrzne