AMD PowerTune

AMD PowerTune
AMD PowerTune Technology logo 2014.svg
Firma projektowa Zaawansowane Mikro Urządzenia
wprowadzony grudzień 2011
Typ Dynamiczne skalowanie częstotliwości

AMD PowerTune to seria technologii dynamicznego skalowania częstotliwości wbudowanych w niektóre procesory graficzne i układy APU AMD , które umożliwiają dynamiczną zmianę częstotliwości zegara procesora (do różnych stanów P ) przez oprogramowanie. Pozwala to procesorowi spełnić natychmiastowe wymagania dotyczące wydajności wykonywanej operacji, jednocześnie minimalizując pobór mocy, wytwarzanie ciepła i unikanie hałasu. AMD PowerTune ma na celu rozwiązanie związanych z mocą i wydajnością projektu termicznego .

Oprócz zmniejszonego zużycia energii, AMD PowerTune pomaga obniżyć poziom hałasu generowanego przez chłodzenie komputerów stacjonarnych i wydłuża żywotność baterii w urządzeniach mobilnych. AMD PowerTune jest następcą AMD PowerPlay .

Obsługa „PowerPlay” została dodana do sterownika jądra Linuksa „amdgpu” 11 listopada 2015 r.

Jak pokazuje wykład z CCC w 2014 roku, firmware x86-64 SMU AMD jest wykonywany na niektórych LatticeMico32 , a PowerTune został wymodelowany przy użyciu Matlaba. Jest to podobne do PDAEMON Nvidii, RTOS odpowiedzialnego za zasilanie ich GPU.

Przegląd

Architektura wersji PowerTune, która została wprowadzona z chipami GCN1.1 , takimi jak Bonaire

Technologia AMD PowerTune została wprowadzona w TeraScale 3 (VLIW4) wraz z kartą Radeon HD 6900 15 grudnia 2010 r. i od tamtej pory jest dostępna na różnych etapach rozwoju w produktach marki Radeon i AMD FirePro .

Przez lata recenzje dokumentujące rozwój AMD PowerTune były publikowane przez AnandTech .

Dodatkowa technologia o nazwie AMD ZeroCore Power jest dostępna od serii Radeon HD 7000 , wdrażając mikroarchitekturę Graphics Core Next .

Bezsensowność stałej częstotliwości zegara została akredytowana w styczniu 2014 przez SemiAccurate .

Obsługa systemu operacyjnego

Wsparcie dla PowerTune jest zawarte w sterowniku urządzenia jądra Linuksa amdgpu .

AMD Catalyst jest dostępny dla Microsoft Windows i Linux i obsługuje AMD PowerTune od wersji. [ który? ]

Bezpłatny i otwarty sterownik karty graficznej „Radeon” obsługuje w pewnym stopniu technologię AMD PowerTune, patrz „Enduro”.

Przegląd funkcji dla procesorów AMD APU

Poniższa tabela przedstawia cechy procesorów AMD z grafiką 3D, w tym APU (patrz też: Lista procesorów AMD z grafiką 3D ).

Platforma Wysoka, standardowa i niska moc Niska i bardzo niska moc
Kryptonim serwer Podstawowy Toronto
Mikro Kioto
Pulpit Wydajność Rafał
Główny nurt Llano Trójca Richland Kaweri Odświeżenie Kaveri (Godavari) Carrizo Grzbiet Bristolski Raven Ridge Picassa Renoira Cezanne'a
Wejście
Podstawowy kabini Dalí
mobilny Wydajność Renoira Cezanne'a Rembrandta Smoczy zasięg
Główny nurt Llano Trójca Richland Kaweri Carrizo Grzbiet Bristolski Raven Ridge Picassa
Renoir Lucienne

Cezanne Barcelo
Feniks
Wejście Dalí Mendocino
Podstawowy Desna, Ontario, Zacate Kabini, Temasz Beema, Mullins Carrizo-L Stoney Ridge Pollock
Osadzony Trójca łysy orzeł
Merlin Sokół , Brązowy Sokół
Wielka Sowa Szary Jastrząb Ontario, Zacate kabini
Orzeł stepowy , orzeł w koronie , rodzina LX
sokół preriowy Pasiasta pustułka Rzeczny Jastrząb
Wydany sierpień 2011 październik 2012 czerwiec 2013 r styczeń 2014 r 2015 czerwiec 2015 r czerwiec 2016 r październik 2017 styczeń 2019 r marzec 2020 r styczeń 2021 r styczeń 2022 r wrzesień 2022 r styczeń 2023 r styczeń 2011 r maj 2013 kwiecień 2014 r maj 2015 r luty 2016 r kwiecień 2019 r lipiec 2020 r czerwiec 2022 r listopad 2022 r
Mikroarchitektura procesora K10 piledriver Walec parowy Koparka " Koparka+ " Zen Zen+ Zenek 2 Zenek 3 Zen 3+ Zenek 4 Ryś amerykański Jaguar Puma Puma+ " Koparka+ " Zen Zen+ " Zen2+ "
JEST x86-64 v1 x86-64 v2 x86-64 v3 x86-64 v4 x86-64 v1 x86-64 v2 x86-64 v3
Gniazdo elektryczne Pulpit Wydajność AM5
Główny nurt AM4
Wejście FM1 FM2 FM2+ FM2+ , AM4 AM4
Podstawowy AM1 FP5
Inny FS1 FS1+ , FP2 PR3 FP4 FP5 FP6 FP7 ? ? FT1 FT3 FT3b FP4 FP5 FT5 FP5 FT6
Wersja PCI Express 2.0 3.0 4.0 5.0 4.0 2.0 3.0
CXL
faj. ( nm )
GF 32SHP ( HKMG SOI )

GF 28SHP (luzem HKMG)

GF 14LPP ( masa FinFET )

GF 12LP (luzem FinFET)

TSMC N7 (luzem FinFET)

TSMC N6 (luzem FinFET)


CCD: TSMC N5 (masa FinFET)

cIOD: TSMC N6 (masa FinFET)

TSMC 4 nm (luzem FinFET)

TSMC N40 (luzem)

TSMC N28 (luzem HKMG)

GF 28SHP (luzem HKMG)

GF 14LPP ( masa FinFET )

GF 12LP (luzem FinFET)

TSMC N6 (luzem FinFET)
Powierzchnia matrycy (mm 2 ) 228 246 245 245 250 210 156 180 210
CCD: (2x) 70 cIOD: 122
178 75 (+ 28 FCH ) 107 ? 125 149 ~100
Min TDP (W) 35 17 12 10 15 105 35 4.5 4 3,95 10 6 12 8
Maks. TDP APU (W) 100 95 65 45 170 54 18 25 6 54 15
Maksymalny zegar bazowy APU (GHz) 3 3.8 4.1 4.1 3.7 3.8 3.6 3.7 3.8 4.0 3.3 4.7 4.3 1,75 2.2 2 2.2 3.2 2.6 1.2 3.35 2.8
Maksymalna liczba APU na węzeł 1 1
Maksymalna liczba zgonów rdzeni na procesor 1 2 1 1
Maks. CCX na matrycę rdzenia 1 2 1 1
Maksymalna liczba rdzeni na CCX 4 8 2 4 2 4
Maksymalna liczba rdzeni procesora na APU 4 8 16 8 2 4 2 4
Maksymalna liczba wątków na rdzeń procesora 1 2 1 2
Struktura potoku całkowitoliczbowego 3+3 2+2 4+2 4+2+1 1+3+3+1+2 1+1+1+1 2+2 4+2 4+2+1
i386, i486, i586, CMOV, NOPL, i686, PAE , bit NX , CMPXCHG16B, AMD-V , RVI , ABM i 64-bitowy LAHF/SAHF Yes Yes
IOMMU v2 v1 v2
BMI1 , AES-NI , CLMUL i F16C Yes Yes
MOVBE Yes
AVIC , BMI2 , RDRAND i MWAITX/MONITORX Yes
SME, TSME, ADX , SHA , RDSEED , SMAP , SMEP , XSAVEC, XSAVES, XRSTORS, CLFLUSHOPT, CLZERO i PTE Yes Yes
GMET , WBNOINVD, CLWB, QOS, PQE-BW, RDPID, RDPRU i MCOMMIT Yes Yes
MPK , VAES Yes
SGX
FPU na rdzeń 1 0,5 1 1 0,5 1
Rury na FPU 2 2
Szerokość rury FPU 128-bitowy 256-bitowy 80-bitowy 128-bitowy 256-bitowy
Zestaw instrukcji procesora na poziomie SIMD SSE4a AVX AVX2 AVX-512 SSSE3 AVX AVX2
3DN Teraz! 3DNow!+
POBIERZ WSTĘPNIE/POBIERZ WST Yes Yes
GFNI Yes
AMX
FMA4 , LWP, TBM i XOP Yes Yes
FMA3 Yes Yes
AMD XDNA Yes
L1 na rdzeń (KiB) 64 16 32 32
Asocjatywność pamięci podręcznej danych L1 (sposoby) 2 4 8 8
Pamięć podręczna instrukcji L1 na rdzeń 1 0,5 1 1 0,5 1
Maksymalna łączna pamięć podręczna instrukcji L1 APU (KiB) 256 128 192 256 512 256 64 128 96 128
Asocjatywność pamięci podręcznej instrukcji L1 (sposoby) 2 3 4 8 2 3 4 8
Pamięć podręczna L2 na rdzeń 1 0,5 1 1 0,5 1
Maksymalna łączna pamięć podręczna L2 APU (MiB) 4 2 4 16 1 2 1 2
Asocjatywność pamięci podręcznej L2 (sposoby) 16 8 16 8
Maks. włączona pamięć podręczna L3 na CCX (MiB) 4 16 32 4
Maks. V-Cache 3D na CCD (MiB) 64
Maksymalna łączna pamięć podręczna CCD L3 na jednostkę APU (MiB) 4 8 16 64 4
Maks. całkowita V-Cache 3D na APU (MiB) 64
Maks. płyta podręczna L3 na APU (MiB)
Maksymalna łączna pamięć podręczna L3 na jednostkę APU (MiB) 4 8 16 128 4
Asocjatywność pamięci podręcznej APU L3 (sposoby) 16 16
Schemat pamięci podręcznej L3 Ofiara Ofiara
Maks. Pamięć podręczna L4
Maksymalna obsługa pamięci DRAM DDR3 -1866 DDR3-2133 DDR3-2133 , DDR4-2400 DDR4-2400 DDR4-2933 DDR4-3200 , LPDDR4-4266 DDR5-4800 , LPDDR5-6400 _ DDR5-5200 _ DDR5-5600 , LPDDR5x -7500 DDR3L -1333 DDR3L-1600 DDR3L-1866 DDR3-1866 , DDR4-2400 DDR4-2400 DDR4-1600 DDR4-3200 LPDDR5-5500
Maksymalna liczba kanałów DRAM na APU 2 1 2 1 2
Maksymalna standardowa przepustowość pamięci DRAM (GB/s) na jednostkę APU 29.866 34.132 38.400 46.932 68.256 102.400 83.200 120.000 10.666 12.800 14.933 19.200 38.400 12.800 51.200 88.000
Mikroarchitektura GPU TeraScale 2 (VLIW5) TeraScale 3 (VLIW4) GCN 2 gen GCN 3 gen GCN 5 gen RDNA II gen RDNA 3 gen TeraScale 2 (VLIW5) GCN 2 gen GCN 3 gen GCN 5 gen RDNA II gen
Zestaw instrukcji GPU Zestaw instrukcji TeraScale Zestaw instrukcji GCN Zestaw instrukcji RDNA Zestaw instrukcji TeraScale Zestaw instrukcji GCN Zestaw instrukcji RDNA
Maksymalny podstawowy zegar GPU (MHz) 600 800 844 866 1108 1250 1400 2100 2400 400 538 600 ? 847 900 1200 600 1300 1900
Maksymalna podstawowa podstawowa karta graficzna GFLOPS 480 614,4 648.1 886,7 1134,5 1760 1971.2 2150.4 3686.4 102,4 86 ? ? ? 345,6 460,8 230,4 1331.2 486,4
Silnik 3D Do 400:20:8 Do 384:24:6 Do 512:32:8 Do 704:44:16 Do 512:32:8 768:48:8 128:?:? 80:8:4 128:8:4 Do 192:12:8 Do 192:12:4 192:12:4 Do 512:?:? 128:?:?
IOMMUv1 IOMMUv2 IOMMUv1 ? IOMMUv2
Dekoder wideo UVD 3.0 UVD 4.2 UVD 6.0 VCN 1.0 VCN 2.1 VCN 2.2 VCN 3.1 ? UVD 3.0 UVD 4.0 UVD 4.2 UVD 6.0 UVD 6.3 VCN 1.0 VCN 3.1
Koder wideo VCE 1.0 VCE 2.0 VCE 3.1 VCE 2.0 VCE 3.1
Płynny ruch AMD No Yes No No Yes No
Oszczędzanie energii GPU Mocne zagranie PowerTune Mocne zagranie PowerTune
Prawdziwy dźwięk Yes ? Yes
FreeSync
1 2

1 2
HDCP ? 1.4 2.2 2.3 ? 1.4 2.2 2.3
Gotowy do gry 3.0 jeszcze nie 3.0 jeszcze nie
Obsługiwane wyświetlacze 2–3 2–4 3
3 (stacjonarne) 4 (mobilne, wbudowane)
4 2 3 4 4
/drm/radeon Yes Yes
/drm/amdgpu Yes Yes

Przegląd funkcji kart graficznych AMD

Poniższa tabela przedstawia cechy procesorów graficznych AMD / ATI ( zobacz też: Lista procesorów graficznych AMD ).

Nazwa serii GPU Zastanawiać się Mach Wściekłość 3D Wściekłość Pro Wściekłość 128 R100 200 zł R300 R400 500 R R600 RV670 R700 Zimozielony Wyspy Północne
Wyspy Południowe
Wyspy Morskie
Wyspy Wulkaniczne
Wyspy Arktyczne
/ Polaris
Wega Nawigacja 1x Nawigacja 2x Nawigacja 3x
Wydany 1986 1991
kwiecień 1996

marzec 1997

sierpień 1998

kwiecień 2000 r

sierpień 2001

wrzesień 2002

maj 2004

październik 2005

maj 2007

listopad 2007

czerwiec 2008

wrzesień 2009

październik 2010

styczeń 2012 r

wrzesień 2013 r

czerwiec 2015 r
czerwiec 2016, kwiecień 2017, sierpień 2019 czerwiec 2017, luty 2019
lipiec 2019 r

listopad 2020 r

grudzień 2022 r
Nazwa marketingowa Zastanawiać się Mach Wściekłość 3D

Wściekłość Pro

Wściekłość 128

Radeona 7000

Radeona 8000

Radeona 9000

Radeon X700/X800

Radeona X1000

Radeona HD2000

Radeona HD3000

Radeona HD4000

Radeona HD5000

Radeona HD6000

Radeona HD7000

Radeona 200

Radeona 300

Radeony 400/500/600

Radeon RX Vega, Radeon VII

Radeona RX5000

Radeona RX6000

Radeona RX7000
wsparcie AMD Ended Current
Uprzejmy 2D 3D
Architektura zestawu instrukcji Nie znane publicznie Zestaw instrukcji TeraScale Zestaw instrukcji GCN Zestaw instrukcji RDNA
Mikroarchitektura
TeraScale 1 (VLIW)

TeraScale 2 (VLIW5)


TeraScale 2 (VLIW5)
do 68xx


TeraScale 3 (VLIW4)
w 69xx

GCN 1. gen

GCN 2 gen

GCN 3 gen

GCN 4 gen

GCN 5 gen
RDNA RDNA 2 RDNA 3
Typ Stały rurociąg Programowalne potoki pikseli i wierzchołków Ujednolicony model cieniowania
Direct3D 5.0 6.0 7.0 8.1
9,0 11 ( 9_2 )

9.0b 11 ( 9_2 )

9.0c 11 ( 9_3 )

10,0 11 ( 10_0 )

10,1 11 ( 10_1 )
11 ( 11_0 )
11 ( 11_1 ) 12 ( 11_1 )

11 ( 12_0 ) 12 ( 12_0 )

11 ( 12_1 ) 12 ( 12_1 )

11 ( 12_1 ) 12 ( 12_2 )
Model shaderów 1.4 2.0+ 2.0b 3.0 4.0 4.1 5.0 5.1
5.1 6.5
6.7 6.7
OpenGL 1.1 1.2 1.3 2.1 3.3 4,5 (w systemie Linux: 4,5 (Mesa 3D 21,0)) 4.6 (w systemie Linux: 4.6 (Mesa 3D 20.0))
Wulkan
1.0 ( Win 7+ lub Mesa 17+ )

1.2 (Adrenalin 20.1.2, Linux Mesa 3D 20.0) 1.3 (GCN 4 i nowsze (z Adrenalin 22.1.2, Mesa 22.0))
1.3
OpenCL Blisko Metalu 1.1 (brak obsługi Mesa 3D) 1.2 (w systemie Linux : 1.1 (bez obsługi obrazów) z Mesa 3D)
2.0 (sterownik Adrenalin w systemie Win7+ ) (w systemie Linux : 1.1 (bez obsługi obrazów) z Mesa 3D, 2.0 ze sterownikami AMD lub AMD ROCm)
2.0 2.1 ?
HSA / ROCm Yes ?
Dekodowanie wideo ASIC Avivo / UVD UVD+ UVD 2 UVD 2.2 UVD 3 UVD 4 UVD 4.2 UVD 5.0 ​​lub 6.0 UVD 6.3 UVD 7 VCN 2.0 VCN 3.0 ?
Kodowanie wideo ASIC VCE 1.0 VCE 2.0 VCE 3.0 lub 3.1 VCE 3.4 VCE 4.0
Płynny ruch ASIC No Yes No ?
Oszczędzanie energii ? Mocne zagranie PowerTune PowerTune i ZeroCore Power ?
Prawdziwy dźwięk Przez dedykowany procesor DSP Poprzez shadery ?
FreeSync
1 2
?
HDCP ? 1.4 2.2 2.3
Gotowy do gry 3.0 No 3.0 ?
Obsługiwane wyświetlacze 1–2 2 2–6 ?
Maks. rezolucja ?
2–6 × 2560 × 1600

2–6 × 4096 × 2160 przy 30 Hz

2–6 × 5120 × 2880 przy 60 Hz

3 × 7680 × 4320 przy 60 Hz

7680×4320 przy 60 Hz PowerColor
?
/drm/radeon Yes ?
/drm/amdgpu Eksperymentalny Yes ?

Zobacz też

Linki zewnętrzne