Instynkt AMD

Instynkt AMD
AMD Radeon Instinct wordmark.svg
Data wydania 20 czerwca 2017
(5 lat temu)
( 20.06.2017 )
Zaprojektowany przez AMD
Sprzedawany przez AMD
Architektura
modele Seria MI
Tranzystory
  • 5.7B (Polaris10) 14 nm
  • 8.9B (Fidżi) 28 nm
  • 12,5B (Vega10) 14 nm
  • 13.2B (Vega20) 7 nm
  • 25,6B (Arcturus) 7 nm
  • 58.2B (Aldebaran) 6 nm
Proces wytwarzania
Historia
Poprzednik

AMD Instinct to marka profesjonalnych procesorów graficznych firmy AMD . W 2016 roku zastąpił markę AMD FirePro S. W porównaniu z marką Radeon , która jest głównym produktem konsumenckim/graczem, linia produktów Instinct ma na celu przyspieszenie głębokiego uczenia się, sztucznej sieci neuronowej oraz wysokowydajnych obliczeń / aplikacji GPGPU .

Linia produktów Radeon Instinct bezpośrednio konkuruje z kartami Nvidii Ampere i Intel Xeon Phi oraz nadchodzącymi liniami kart Intel Xe do uczenia maszynowego i GPGPU.

Przed wprowadzeniem MI100 w listopadzie 2020 r. rodzina Instinct była znana jako AMD Radeon Instinct , AMD usunęła markę Radeon ze swojej nazwy.

Superkomputery oparte na (procesorach AMD i) procesorach graficznych AMD Instinct przejmują teraz prowadzenie na liście superkomputerów Green500 z ponad 50% przewagą nad innymi i zajmują pierwsze 4 miejsca, w tym drugie, które jest obecnie najszybsze na świecie na Lista TOP500 , Granica .

Produkty

Trzy pierwsze produkty Radeon Instinct zostały ogłoszone 12 grudnia 2016 r. I wydane 20 czerwca 2017 r., A każdy z nich oparty jest na innej architekturze.

MI6

MI6 to chłodzona pasywnie karta oparta na Polaris 10 z 16 GB pamięci GDDR5 i TDP <150 W. Oczekuje się, że przy 5,7 TFLOPS ( FP16 i FP32 ) MI6 będzie używany głównie do wnioskowania, a nie do uczenia sieci neuronowych. MI6 ma szczytową wydajność obliczeniową o podwójnej precyzji (FP64) na poziomie 358 GFLOPS.

MI8

MI8 to karta oparta na Fidżi , analogiczna do R9 Nano i oczekuje się, że będzie miała TDP <175 W. MI8 ma 4 GB pamięci o dużej przepustowości . Przy 8,2 TFLOPS (FP16 i FP32) MI8 jest oznaczony w kierunku wnioskowania. MI8 ma szczytową (FP64) wydajność obliczeniową podwójnej precyzji 512 GFLOPS.

MI25

MI25 to karta oparta na Vega , wykorzystująca pamięć HBM2. Oczekuje się, że wydajność MI25 wyniesie 12,3 TFLOPS przy użyciu liczb FP32. W przeciwieństwie do MI6 i MI8, MI25 jest w stanie zwiększyć wydajność przy użyciu liczb o niższej precyzji i odpowiednio oczekuje się, że osiągnie 24,6 TFLOPS przy użyciu liczb FP16. MI25 ma TDP <300 W z pasywnym chłodzeniem. MI25 zapewnia również szczytową podwójną precyzję 768 GFLOPS (FP64) przy szybkości 1/16.

Akcelerator Architektura Litografia Jednostki obliczeniowe Pamięć Typ pamięci Obsługa PCIe Współczynnik kształtu Wydajność FP16 Wydajność BF16 Wydajność FP32 Wydajność matrycy FP32 Wydajność FP64 Wydajność matrycy FP64 Wydajność INT8 Wydajność INT4 Szczyt TBP
MI6 GCN 4 14 nm 36 16 giga bajtów GDDR5 3.0 PCIe 5,7 TFLOPSÓW Nie dotyczy 5,7 TFLOPSÓW Nie dotyczy 358 GFLOPSÓW Nie dotyczy Nie dotyczy Nie dotyczy 150 W
MI8 GCN 3 28 nm 64 4GB HBM 8,2 TFLOPS 8,2 TFLOPS 512 GLOPSÓW 175 W
MI25 GCN 5 14 nm 64 16 giga bajtów HBM2 26,4 TFLOPS 12,3 TFLOPS 768 GLOPSÓW 300 W
MI50 GCN 5 7 nm 60 4.0 26,5 TFLOPSÓW 13,3 TFLOPSÓW 6,6 TFLOPSÓW 53 BLATY 300 W
MI60 GCN 5 64 32 GB 29,5 TFLOPSÓW 14,7 TFLOPS 7,4 TFLOPSÓW 59 BLATY 300 W
MI100 CDNA 120 184,6 TFLOPSÓW 92,3 TFLOPS 23,1 TFLOPS 46,1 TFLOPSÓW 11,5 TFLOPSÓW 184,6 BLATY 300 W
MI210 CDNA 2 6 nm 104 64 GB HBM2e OM 181 TFLOPSÓW 22,6 TFLOPS 45,3 TFLOPSÓW 22,6 TFLOPS 45,3 TFLOPSÓW 181 BLATY 300 W
MI250 CDNA 2 208 128 GB 362,1 TFLOPS 45,3 TFLOPSÓW 90,5 TFLOPS 45,3 TFLOPSÓW 90,5 TFLOPS 362.1 BLATY 560 W
MI250X CDNA 2 220 383 TFLOPS 47,92 TFLOPSÓW 95,7 TFLOPSÓW 47,9 TFLOPSÓW 95,7 TFLOPSÓW 383 BLATY 560 W

Oprogramowanie

ROCm

Następujące oprogramowanie jest od 2022 r. Przegrupowane w ramach metaprojektu Radeon Open Compute.

MxGPU

wirtualizacji AMD MxGPU , umożliwiając współdzielenie zasobów GPU przez wielu użytkowników.

MIOtwórz

MIOpen to biblioteka głębokiego uczenia firmy AMD, która umożliwia akcelerację głębokiego uczenia przez GPU. Wiele z tego rozszerza oprogramowanie Boltzmann Initiative GPUOpen . Ma to na celu konkurowanie z częściami głębokiego uczenia się biblioteki CUDA firmy Nvidia . Obsługuje platformy głębokiego uczenia: Theano , Caffe , TensorFlow , MXNet , Microsoft Cognitive Toolkit , Torch i Chainer . Programowanie jest obsługiwane w OpenCL i Python , oprócz obsługi kompilacji CUDA przez Heterogeneous-compute Interface for Portability i Heterogeneous Compute Compiler firmy AMD.

Tabela chipsetów


Model ( nazwa kodowa )
Data wydania   Architektura faj
  Tranzystory i rozmiar matrycy
Rdzeń Współczynnik wypełnienia  
Moc obliczeniowa ( TFLOPS )
Pamięć TBP
Interfejs magistrali
Konfig
Zegar ( MHz )

Tekstura ( GT /s)

Piksel ( GP / s)
Połowa Pojedynczy Podwójnie Typ i szerokość autobusu  
 
Rozmiar
Zegar ( MT/s )

Przepustowość ( GB /s)

Radeon Instinct MI6 (Polaris 10)
20 czerwca 2017 r GCN 4
GloFo 14LP

5,7 × 10 9 232 mm 2

2304:144:32 36 CU

1120 1233

161,3 177,6

35,84 39,46

5,161 5,682

5,161 5,682

0,323 0,355

GDDR5 256-bitowy
  16 GB 7000 224   150 W
PCIe 3.0 × 16

Radeon Instinct MI8 (Fidżi)
GCN 3
TSMC 28 nm

8,9 × 10 9 596 mm 2

4096:256:64 64 CU
1000 256,0 64.00 8.192 8.192 0,512
HBM 4096-bitowy
  4GB _ 1000 512   175 W

Radeon Instinct MI25 (Vega 10)
GCN 5
GloFo 14LP

12,5 × 10 9 510 mm 2

1400 1500

358,4 384,0

89,60 96,00

22,94 24,58

11.47 12.29

0,717 0,768

HBM2 2048-bitowy
  16 GB 1890 484   300 W

Radeon Instinct MI50 (Vega 20)
18 listopada 2018 r GCN 5
TSMC N7

13,2 × 10 9 331 mm 2

3840:240:64 60 CU

1450 1725

348,0 414,0

92,80 110,4

22.27 26.50

11.14 13.25

5.568 6.624

HBM2 4096-bitowy
 
  16 GB 32 GB
2000 1024
PCIe 4.0 × 16

Radeon Instinct MI60 (Vega 20)

4096:256:64 64 CU

1500 1800

384,0 460,8

96,00 115,2

24,58 29,49

12.29 14.75

6.144 7.373
  32 GB

AMD Instinct MI100 (Arcturus)
16 listopada 2020 r CDNA
TSMC N7

25,6 × 10 9 750 mm 2

7680:480:- 120 CU

1000 1502

480,0 721,0

122,9 184,6

15.36 23.07

7,680 11,54
2400 1228,8

AMD Instinct MI210 (Aldebaran)
22 marca 2022 r CDNA 2
TSMC N6

28x10 9 ~770mm 2


6656:416:- 104 CU (1 × NWD)

1000 1700

416,0 707,2

106,5 181,0

13.31 22.63

13.31 22.63

HBM2e 4096-bitowy
  64 GB 3200 1638.4

AMD Instinct MI250 (Aldebaran)
8 listopada 2021 r
58 x 10 9 1540 mm 2


13312:832:- 208 CU (2 × NWD )

832,0 1414

213,0 362,1

26,62 45,26

26,62 45,26

HBM2e 2 × 4096 bitów
  2 × 64 GB 2 × 1638,4  
   500 W 560 W (szczyt)

AMD Instinct MI250X (Aldebaran)


14080:880:- 220 CU (2 × NWD )

880,0 1496

225,3 383,0

28,16 47,87

28,16 47,87


Zobacz też

Linki zewnętrzne