Instynkt AMD
Data wydania | 20 czerwca 2017 |
---|---|
Zaprojektowany przez | AMD |
Sprzedawany przez | AMD |
Architektura | |
modele | Seria MI |
Tranzystory |
|
Proces wytwarzania | |
Historia | |
Poprzednik |
AMD Instinct to marka profesjonalnych procesorów graficznych firmy AMD . W 2016 roku zastąpił markę AMD FirePro S. W porównaniu z marką Radeon , która jest głównym produktem konsumenckim/graczem, linia produktów Instinct ma na celu przyspieszenie głębokiego uczenia się, sztucznej sieci neuronowej oraz wysokowydajnych obliczeń / aplikacji GPGPU .
Linia produktów Radeon Instinct bezpośrednio konkuruje z kartami Nvidii Ampere i Intel Xeon Phi oraz nadchodzącymi liniami kart Intel Xe do uczenia maszynowego i GPGPU.
Przed wprowadzeniem MI100 w listopadzie 2020 r. rodzina Instinct była znana jako AMD Radeon Instinct , AMD usunęła markę Radeon ze swojej nazwy.
Superkomputery oparte na (procesorach AMD i) procesorach graficznych AMD Instinct przejmują teraz prowadzenie na liście superkomputerów Green500 z ponad 50% przewagą nad innymi i zajmują pierwsze 4 miejsca, w tym drugie, które jest obecnie najszybsze na świecie na Lista TOP500 , Granica .
Produkty
Trzy pierwsze produkty Radeon Instinct zostały ogłoszone 12 grudnia 2016 r. I wydane 20 czerwca 2017 r., A każdy z nich oparty jest na innej architekturze.
MI6
MI6 to chłodzona pasywnie karta oparta na Polaris 10 z 16 GB pamięci GDDR5 i TDP <150 W. Oczekuje się, że przy 5,7 TFLOPS ( FP16 i FP32 ) MI6 będzie używany głównie do wnioskowania, a nie do uczenia sieci neuronowych. MI6 ma szczytową wydajność obliczeniową o podwójnej precyzji (FP64) na poziomie 358 GFLOPS.
MI8
MI8 to karta oparta na Fidżi , analogiczna do R9 Nano i oczekuje się, że będzie miała TDP <175 W. MI8 ma 4 GB pamięci o dużej przepustowości . Przy 8,2 TFLOPS (FP16 i FP32) MI8 jest oznaczony w kierunku wnioskowania. MI8 ma szczytową (FP64) wydajność obliczeniową podwójnej precyzji 512 GFLOPS.
MI25
MI25 to karta oparta na Vega , wykorzystująca pamięć HBM2. Oczekuje się, że wydajność MI25 wyniesie 12,3 TFLOPS przy użyciu liczb FP32. W przeciwieństwie do MI6 i MI8, MI25 jest w stanie zwiększyć wydajność przy użyciu liczb o niższej precyzji i odpowiednio oczekuje się, że osiągnie 24,6 TFLOPS przy użyciu liczb FP16. MI25 ma TDP <300 W z pasywnym chłodzeniem. MI25 zapewnia również szczytową podwójną precyzję 768 GFLOPS (FP64) przy szybkości 1/16.
Akcelerator | Architektura | Litografia | Jednostki obliczeniowe | Pamięć | Typ pamięci | Obsługa PCIe | Współczynnik kształtu | Wydajność FP16 | Wydajność BF16 | Wydajność FP32 | Wydajność matrycy FP32 | Wydajność FP64 | Wydajność matrycy FP64 | Wydajność INT8 | Wydajność INT4 | Szczyt TBP |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
MI6 | GCN 4 | 14 nm | 36 | 16 giga bajtów | GDDR5 | 3.0 | PCIe | 5,7 TFLOPSÓW | Nie dotyczy | 5,7 TFLOPSÓW | Nie dotyczy | 358 GFLOPSÓW | Nie dotyczy | Nie dotyczy | Nie dotyczy | 150 W |
MI8 | GCN 3 | 28 nm | 64 | 4GB | HBM | 8,2 TFLOPS | 8,2 TFLOPS | 512 GLOPSÓW | 175 W | |||||||
MI25 | GCN 5 | 14 nm | 64 | 16 giga bajtów | HBM2 | 26,4 TFLOPS | 12,3 TFLOPS | 768 GLOPSÓW | 300 W | |||||||
MI50 | GCN 5 | 7 nm | 60 | 4.0 | 26,5 TFLOPSÓW | 13,3 TFLOPSÓW | 6,6 TFLOPSÓW | 53 BLATY | 300 W | |||||||
MI60 | GCN 5 | 64 | 32 GB | 29,5 TFLOPSÓW | 14,7 TFLOPS | 7,4 TFLOPSÓW | 59 BLATY | 300 W | ||||||||
MI100 | CDNA | 120 | 184,6 TFLOPSÓW | 92,3 TFLOPS | 23,1 TFLOPS | 46,1 TFLOPSÓW | 11,5 TFLOPSÓW | 184,6 BLATY | 300 W | |||||||
MI210 | CDNA 2 | 6 nm | 104 | 64 GB | HBM2e | OM | 181 TFLOPSÓW | 22,6 TFLOPS | 45,3 TFLOPSÓW | 22,6 TFLOPS | 45,3 TFLOPSÓW | 181 BLATY | 300 W | |||
MI250 | CDNA 2 | 208 | 128 GB | 362,1 TFLOPS | 45,3 TFLOPSÓW | 90,5 TFLOPS | 45,3 TFLOPSÓW | 90,5 TFLOPS | 362.1 BLATY | 560 W | ||||||
MI250X | CDNA 2 | 220 | 383 TFLOPS | 47,92 TFLOPSÓW | 95,7 TFLOPSÓW | 47,9 TFLOPSÓW | 95,7 TFLOPSÓW | 383 BLATY | 560 W |
Oprogramowanie
ROCm
Następujące oprogramowanie jest od 2022 r. Przegrupowane w ramach metaprojektu Radeon Open Compute.
MxGPU
wirtualizacji AMD MxGPU , umożliwiając współdzielenie zasobów GPU przez wielu użytkowników.
MIOtwórz
MIOpen to biblioteka głębokiego uczenia firmy AMD, która umożliwia akcelerację głębokiego uczenia przez GPU. Wiele z tego rozszerza oprogramowanie Boltzmann Initiative GPUOpen . Ma to na celu konkurowanie z częściami głębokiego uczenia się biblioteki CUDA firmy Nvidia . Obsługuje platformy głębokiego uczenia: Theano , Caffe , TensorFlow , MXNet , Microsoft Cognitive Toolkit , Torch i Chainer . Programowanie jest obsługiwane w OpenCL i Python , oprócz obsługi kompilacji CUDA przez Heterogeneous-compute Interface for Portability i Heterogeneous Compute Compiler firmy AMD.
Tabela chipsetów
Model ( nazwa kodowa ) |
Data wydania | Architektura | faj |
Tranzystory i rozmiar matrycy |
Rdzeń | Współczynnik wypełnienia |
Moc obliczeniowa ( TFLOPS ) |
Pamięć | TBP |
Interfejs magistrali |
|||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Konfig |
Zegar ( MHz ) |
Tekstura ( GT /s) |
Piksel ( GP / s) |
Połowa | Pojedynczy | Podwójnie | Typ i szerokość autobusu |
Rozmiar |
Zegar ( MT/s ) |
Przepustowość ( GB /s) |
|||||||
Radeon Instinct MI6 (Polaris 10) |
20 czerwca 2017 r | GCN 4 |
GloFo 14LP |
5,7 × 10 9 232 mm 2 |
2304:144:32 36 CU |
1120 1233 |
161,3 177,6 |
35,84 39,46 |
5,161 5,682 |
5,161 5,682 |
0,323 0,355 |
GDDR5 256-bitowy |
16 GB | 7000 | 224 | 150 W |
PCIe 3.0 × 16 |
Radeon Instinct MI8 (Fidżi) |
GCN 3 |
TSMC 28 nm |
8,9 × 10 9 596 mm 2 |
4096:256:64 64 CU |
1000 | 256,0 | 64.00 | 8.192 | 8.192 | 0,512 |
HBM 4096-bitowy |
4GB _ | 1000 | 512 | 175 W | ||
Radeon Instinct MI25 (Vega 10) |
GCN 5 |
GloFo 14LP |
12,5 × 10 9 510 mm 2 |
1400 1500 |
358,4 384,0 |
89,60 96,00 |
22,94 24,58 |
11.47 12.29 |
0,717 0,768 |
HBM2 2048-bitowy |
16 GB | 1890 | 484 | 300 W | |||
Radeon Instinct MI50 (Vega 20) |
18 listopada 2018 r | GCN 5 |
TSMC N7 |
13,2 × 10 9 331 mm 2 |
3840:240:64 60 CU |
1450 1725 |
348,0 414,0 |
92,80 110,4 |
22.27 26.50 |
11.14 13.25 |
5.568 6.624 |
HBM2 4096-bitowy |
16 GB 32 GB |
2000 | 1024 |
PCIe 4.0 × 16 |
|
Radeon Instinct MI60 (Vega 20) |
4096:256:64 64 CU |
1500 1800 |
384,0 460,8 |
96,00 115,2 |
24,58 29,49 |
12.29 14.75 |
6.144 7.373 |
32 GB | |||||||||
AMD Instinct MI100 (Arcturus) |
16 listopada 2020 r | CDNA |
TSMC N7 |
25,6 × 10 9 750 mm 2 |
7680:480:- 120 CU |
1000 1502 |
480,0 721,0 |
— |
122,9 184,6 |
15.36 23.07 |
7,680 11,54 |
2400 | 1228,8 | ||||
AMD Instinct MI210 (Aldebaran) |
22 marca 2022 r | CDNA 2 |
TSMC N6 |
28x10 9 ~770mm 2 |
6656:416:- 104 CU (1 × NWD) |
1000 1700 |
416,0 707,2 |
106,5 181,0 |
13.31 22.63 |
13.31 22.63 |
HBM2e 4096-bitowy |
64 GB | 3200 | 1638.4 | |||
AMD Instinct MI250 (Aldebaran) |
8 listopada 2021 r | 58 x 10 9 1540 mm 2 |
13312:832:- 208 CU (2 × NWD ) |
832,0 1414 |
213,0 362,1 |
26,62 45,26 |
26,62 45,26 |
HBM2e 2 × 4096 bitów |
2 × 64 GB | 2 × 1638,4 |
500 W 560 W (szczyt) |
||||||
AMD Instinct MI250X (Aldebaran) |
14080:880:- 220 CU (2 × NWD ) |
880,0 1496 |
225,3 383,0 |
28,16 47,87 |
28,16 47,87 |
Zobacz też
- ROCm — stos otwartego oprogramowania obliczeniowego firmy AMD
- AMD FirePro - poprzednik AMD dla Radeon Instinct
- AMD Radeon Pro — karta graficzna firmy AMD do stacji roboczych i rozwiązanie GPGPU
- Nvidia Quadro — konkurencyjne rozwiązanie graficzne firmy Nvidia dla stacji roboczych
- Nvidia Tesla - konkurencyjne rozwiązanie GPGPU firmy Nvidia
- Xeon Phi — konkurencyjna linia wielordzeniowych procesorów masowo-równoległych firmy Intel
- Lista procesorów graficznych AMD