Sunway SW26010

SW26010 to 260-rdzeniowy , wielordzeniowy procesor zaprojektowany przez Shanghai Integrated Circuit Technology and Industry Promotion Center (w skrócie ICC) ( chiński : 上海集成电路技术与产业促进中心 (简称ICC)). Implementuje architekturę Sunway , 64-bitową architekturę przetwarzania ze zredukowanym zestawem instrukcji (RISC) zaprojektowaną w Chinach . SW26010 ma cztery klastry 64 elementów przetwarzania obliczeniowego (CPE), które są ułożone w macierz o wymiarach osiem na osiem. CPE obsługują SIMD i są w stanie wykonać osiem zmiennoprzecinkowych podwójnej precyzji na cykl. Każdemu klastrowi towarzyszy bardziej konwencjonalny rdzeń ogólnego przeznaczenia zwany elementem przetwarzania zarządzania (MPE), który zapewnia funkcje nadzorcze. Każdy klaster posiada własny, dedykowany kontroler DDR3 SDRAM oraz bank pamięci z własną przestrzenią adresową . Procesor pracuje z częstotliwością zegara 1,45 GHz.

Rdzenie CPE mają 64 KB pamięci notatnika na dane i 16 KB na instrukcje oraz komunikują się przez sieć na chipie zamiast tradycyjnej hierarchii pamięci podręcznej . MPE mają bardziej tradycyjną konfigurację, z 32 KB pamięci podręcznej L1 i danych oraz 256 KB pamięci podręcznej L2 . Wreszcie, sieć na chipie łączy się z pojedynczym interfejsem połączenia systemowego, który łączy chip ze światem zewnętrznym.

SW26010 jest używany w superkomputerze Sunway TaihuLight , który od marca do czerwca 2018 r. był najszybszym superkomputerem na świecie według rankingu projektu TOP500 . System wykorzystuje 40 960 SW26010, aby uzyskać 93,01 PFLOPS w teście porównawczym LINPACK .

Następca: SW26010P

SW26010P obejmuje 6 grup rdzeni (CG), z których każda zawiera jeden element przetwarzania zarządzania (MPE) i jeden klaster elementów przetwarzania danych (CPE) 8×8. Każda CG ma swój kontroler pamięci (MC), łączący się z 16 GB pamięci DDR4 o przepustowości 51,2 GB/s. Wymiana danych między każdymi dwoma CPE w tym samym klastrze CPE odbywa się za pośrednictwem interfejsu Remote Memory Access (RMA) (zastąpienie funkcji komunikacji rejestru w poprzedniej generacji). Każdy CPE ma szybką lokalną pamięć danych (LDM) o pojemności 256 KB. Każdy procesor SW26010P składa się z 390 elementów przetwarzających.

Zobacz też