Instynkt AMD

Instynkt AMD
Data wydania	20 czerwca 2017 ; (5 lat temu)
Zaprojektowany przez	AMD
Sprzedawany przez	AMD
Architektura	GCN 3 gen; GCN 4 gen; GCN 5 gen; CDNA; CDNA 2;
modele	Seria MI
Tranzystory	5.7B (Polaris10) 14 nm; 8.9B (Fidżi) 28 nm; 12,5B (Vega10) 14 nm; 13.2B (Vega20) 7 nm; 25,6B (Arcturus) 7 nm; 58.2B (Aldebaran) 6 nm;
Proces wytwarzania	TSMC 28 nm ; GloFo 14 nm ; TSMC 7 nm ; TSMC 6 nm ;
Historia
Poprzednik	AMD FirePro; Seria Radeon Sky;

AMD Instinct to marka profesjonalnych procesorów graficznych firmy AMD . W 2016 roku zastąpił markę AMD FirePro S. W porównaniu z marką Radeon , która jest głównym produktem konsumenckim/graczem, linia produktów Instinct ma na celu przyspieszenie głębokiego uczenia się, sztucznej sieci neuronowej oraz wysokowydajnych obliczeń / aplikacji GPGPU .

Linia produktów Radeon Instinct bezpośrednio konkuruje z kartami Nvidii Ampere i Intel Xeon Phi oraz nadchodzącymi liniami kart Intel Xe do uczenia maszynowego i GPGPU.

Przed wprowadzeniem MI100 w listopadzie 2020 r. rodzina Instinct była znana jako AMD Radeon Instinct , AMD usunęła markę Radeon ze swojej nazwy.

Superkomputery oparte na (procesorach AMD i) procesorach graficznych AMD Instinct przejmują teraz prowadzenie na liście superkomputerów Green500 z ponad 50% przewagą nad innymi i zajmują pierwsze 4 miejsca, w tym drugie, które jest obecnie najszybsze na świecie na Lista TOP500 , Granica .

Produkty

Trzy pierwsze produkty Radeon Instinct zostały ogłoszone 12 grudnia 2016 r. I wydane 20 czerwca 2017 r., A każdy z nich oparty jest na innej architekturze.

MI6

MI6 to chłodzona pasywnie karta oparta na Polaris 10 z 16 GB pamięci GDDR5 i TDP <150 W. Oczekuje się, że przy 5,7 TFLOPS ( FP16 i FP32 ) MI6 będzie używany głównie do wnioskowania, a nie do uczenia sieci neuronowych. MI6 ma szczytową wydajność obliczeniową o podwójnej precyzji (FP64) na poziomie 358 GFLOPS.

MI8

MI8 to karta oparta na Fidżi , analogiczna do R9 Nano i oczekuje się, że będzie miała TDP <175 W. MI8 ma 4 GB pamięci o dużej przepustowości . Przy 8,2 TFLOPS (FP16 i FP32) MI8 jest oznaczony w kierunku wnioskowania. MI8 ma szczytową (FP64) wydajność obliczeniową podwójnej precyzji 512 GFLOPS.

MI25

MI25 to karta oparta na Vega , wykorzystująca pamięć HBM2. Oczekuje się, że wydajność MI25 wyniesie 12,3 TFLOPS przy użyciu liczb FP32. W przeciwieństwie do MI6 i MI8, MI25 jest w stanie zwiększyć wydajność przy użyciu liczb o niższej precyzji i odpowiednio oczekuje się, że osiągnie 24,6 TFLOPS przy użyciu liczb FP16. MI25 ma TDP <300 W z pasywnym chłodzeniem. MI25 zapewnia również szczytową podwójną precyzję 768 GFLOPS (FP64) przy szybkości 1/16.

Akcelerator	Architektura	Litografia	Jednostki obliczeniowe	Pamięć	Typ pamięci	Obsługa PCIe	Współczynnik kształtu	Wydajność FP16	Wydajność BF16	Wydajność FP32	Wydajność matrycy FP32	Wydajność FP64	Wydajność matrycy FP64	Wydajność INT8	Wydajność INT4	Szczyt TBP
MI6	GCN 4	14 nm	36	16 giga bajtów	GDDR5	3.0	PCIe	5,7 TFLOPSÓW	Nie dotyczy	5,7 TFLOPSÓW	Nie dotyczy	358 GFLOPSÓW	Nie dotyczy	Nie dotyczy	Nie dotyczy	150 W
MI8	GCN 3	28 nm	64	4GB	HBM			8,2 TFLOPS		8,2 TFLOPS		512 GLOPSÓW				175 W
MI25	GCN 5	14 nm	64	16 giga bajtów	HBM2			26,4 TFLOPS		12,3 TFLOPS		768 GLOPSÓW				300 W
MI50	GCN 5	7 nm	60	16 giga bajtów		4.0		26,5 TFLOPSÓW		13,3 TFLOPSÓW		6,6 TFLOPSÓW		53 BLATY		300 W
MI60	GCN 5		64	32 GB				29,5 TFLOPSÓW		14,7 TFLOPS		7,4 TFLOPSÓW		59 BLATY		300 W
MI100	CDNA		120	32 GB				184,6 TFLOPSÓW	92,3 TFLOPS	23,1 TFLOPS	46,1 TFLOPSÓW	11,5 TFLOPSÓW		184,6 BLATY		300 W
MI210	CDNA 2	6 nm	104	64 GB	HBM2e		OM	181 TFLOPSÓW		22,6 TFLOPS	45,3 TFLOPSÓW	22,6 TFLOPS	45,3 TFLOPSÓW	181 BLATY		300 W
MI250	CDNA 2		208	128 GB				362,1 TFLOPS		45,3 TFLOPSÓW	90,5 TFLOPS	45,3 TFLOPSÓW	90,5 TFLOPS	362.1 BLATY		560 W
MI250X	CDNA 2		220	128 GB				383 TFLOPS		47,92 TFLOPSÓW	95,7 TFLOPSÓW	47,9 TFLOPSÓW	95,7 TFLOPSÓW	383 BLATY		560 W

Oprogramowanie

ROCm

Następujące oprogramowanie jest od 2022 r. Przegrupowane w ramach metaprojektu Radeon Open Compute.

MxGPU

wirtualizacji AMD MxGPU , umożliwiając współdzielenie zasobów GPU przez wielu użytkowników.

MIOtwórz

MIOpen to biblioteka głębokiego uczenia firmy AMD, która umożliwia akcelerację głębokiego uczenia przez GPU. Wiele z tego rozszerza oprogramowanie Boltzmann Initiative GPUOpen . Ma to na celu konkurowanie z częściami głębokiego uczenia się biblioteki CUDA firmy Nvidia . Obsługuje platformy głębokiego uczenia: Theano , Caffe , TensorFlow , MXNet , Microsoft Cognitive Toolkit , Torch i Chainer . Programowanie jest obsługiwane w OpenCL i Python , oprócz obsługi kompilacji CUDA przez Heterogeneous-compute Interface for Portability i Heterogeneous Compute Compiler firmy AMD.

Tabela chipsetów

Model ( nazwa kodowa )	Data wydania	Architektura	faj	Tranzystory i rozmiar matrycy	Rdzeń		Współczynnik wypełnienia		Moc obliczeniowa ( TFLOPS )			Pamięć				TBP	Interfejs magistrali
Model ( nazwa kodowa )	Data wydania	Architektura	faj	Tranzystory i rozmiar matrycy	Konfig	Zegar ( MHz )	Tekstura ( GT /s)	Piksel ( GP / s)	Połowa	Pojedynczy	Podwójnie	Typ i szerokość autobusu	Rozmiar	Zegar ( MT/s )	Przepustowość ( GB /s)	TBP	Interfejs magistrali
Radeon Instinct MI6 (Polaris 10)	20 czerwca 2017 r	GCN 4	GloFo 14LP	5,7 × 10 ⁹ 232 mm ²	2304:144:32 36 CU	1120 1233	161,3 177,6	35,84 39,46	5,161 5,682	5,161 5,682	0,323 0,355	GDDR5 256-bitowy	16 GB	7000	224	150 W	PCIe 3.0 × 16
Radeon Instinct MI8 (Fidżi)		GCN 3	TSMC 28 nm	8,9 × 10 ⁹ 596 mm ²	4096:256:64 64 CU	1000	256,0	64.00	8.192	8.192	0,512	HBM 4096-bitowy	4GB _	1000	512	175 W
Radeon Instinct MI25 (Vega 10)		GCN 5	GloFo 14LP	12,5 × 10 ⁹ 510 mm ²	4096:256:64 64 CU	1400 1500	358,4 384,0	89,60 96,00	22,94 24,58	11.47 12.29	0,717 0,768	HBM2 2048-bitowy	16 GB	1890	484	300 W
Radeon Instinct MI50 (Vega 20)	18 listopada 2018 r	GCN 5	TSMC N7	13,2 × 10 ⁹ 331 mm ²	3840:240:64 60 CU	1450 1725	348,0 414,0	92,80 110,4	22.27 26.50	11.14 13.25	5.568 6.624	HBM2 4096-bitowy	16 GB 32 GB	2000	1024		PCIe 4.0 × 16
Radeon Instinct MI60 (Vega 20)	18 listopada 2018 r	GCN 5	TSMC N7	13,2 × 10 ⁹ 331 mm ²	4096:256:64 64 CU	1500 1800	384,0 460,8	96,00 115,2	24,58 29,49	12.29 14.75	6.144 7.373		32 GB	2000	1024
AMD Instinct MI100 (Arcturus)	16 listopada 2020 r	CDNA	TSMC N7	25,6 × 10 ⁹ 750 mm ²	7680:480:- 120 CU	1000 1502	480,0 721,0	—	122,9 184,6	15.36 23.07	7,680 11,54		32 GB	2400	1228,8
AMD Instinct MI210 (Aldebaran)	22 marca 2022 r	CDNA 2	TSMC N6	28x10 ⁹ ~770mm ²	6656:416:- 104 CU (1 × NWD)	1000 1700	416,0 707,2		106,5 181,0	13.31 22.63	13.31 22.63	HBM2e 4096-bitowy	64 GB	3200	1638.4
AMD Instinct MI250 (Aldebaran)	8 listopada 2021 r			58 x 10 ⁹ 1540 mm ²	13312:832:- 208 CU (2 × NWD )		832,0 1414		213,0 362,1	26,62 45,26	26,62 45,26	HBM2e 2 × 4096 bitów	2 × 64 GB		2 × 1638,4	500 W 560 W (szczyt)
AMD Instinct MI250X (Aldebaran)	8 listopada 2021 r			58 x 10 ⁹ 1540 mm ²	14080:880:- 220 CU (2 × NWD )		880,0 1496		225,3 383,0	28,16 47,87	28,16 47,87	HBM2e 2 × 4096 bitów	2 × 64 GB		2 × 1638,4	500 W 560 W (szczyt)

Zobacz też

ROCm — stos otwartego oprogramowania obliczeniowego firmy AMD
AMD FirePro - poprzednik AMD dla Radeon Instinct
AMD Radeon Pro — karta graficzna firmy AMD do stacji roboczych i rozwiązanie GPGPU
Nvidia Quadro — konkurencyjne rozwiązanie graficzne firmy Nvidia dla stacji roboczych
Nvidia Tesla - konkurencyjne rozwiązanie GPGPU firmy Nvidia
Xeon Phi — konkurencyjna linia wielordzeniowych procesorów masowo-równoległych firmy Intel
Lista procesorów graficznych AMD

Linki zewnętrzne

Strona internetowa akceleratorów AMD Instinct

Historia

Data wydania	20 czerwca 2017 (5 lat temu) ( 20.06.2017 )
Zaprojektowany przez	AMD
Sprzedawany przez	AMD
Architektura	GCN 3 gen GCN 4 gen GCN 5 gen CDNA CDNA 2
modele	Seria MI
Tranzystory	5.7B (Polaris10) 14 nm 8.9B (Fidżi) 28 nm 12,5B (Vega10) 14 nm 13.2B (Vega20) 7 nm 25,6B (Arcturus) 7 nm 58.2B (Aldebaran) 6 nm
Proces wytwarzania	TSMC 28 nm GloFo 14 nm TSMC 7 nm TSMC 6 nm
Poprzednik	AMD FirePro Seria Radeon Sky