Element przetwarzający moc

Element przetwarzający moc
Informacje ogólne
Wystrzelony 2005
Przerwane Obecny
Sprzedawany przez IBM , Sony , Microsoft
Zaprojektowany przez IBM-a
Wspólny producent (y)
Wydajność
Maks. Częstotliwość taktowania procesora 2,8 GHz do 3,2 GHz
Pamięć podręczna
Pamięć podręczna L1 Instrukcja 32 KB + dane 32 KB
Architektura i klasyfikacja
Aplikacja Konsola do gier , HPC
Węzeł technologiczny 90 nm do 45 nm
Mikroarchitektura PPU
Zestaw instrukcji PowerPC 2.02
Specyfikacje fizyczne
Rdzenie
  • 1
GPU Xenos , w wariancie XCGPU .
Produkty, modele, warianty
Wariant(y)
Historia
Następca IBMA2

Element przetwarzający moc ( PPE ) składa się z jednostki przetwarzającej moc ( PPU ) i pamięci podręcznej L2 o wielkości 512 KB. W większości przypadków PPU jest używany w ŚOI. PPU to 64-bitowy , dwuwątkowy rdzeń mikroprocesora PowerPC 2.02 w kolejności zaprojektowany przez IBM do użytku głównie w konsolach do gier PlayStation 3 i Xbox 360 , ale znalazł również zastosowanie w obliczeniach o wysokiej wydajności w superkomputerach takie jak ustanowienie rekordu IBM Roadrunner .

PPU jest używany jako główny rdzeń procesora w trzech różnych konstrukcjach procesorów:

  • Silnik szerokopasmowy Cell (Cell BE), używany głównie w konsoli do gier Sony PlayStation 3 . Wykorzystuje PPE i jest dostępny w trzech wersjach: 90 nm, 65 nm i 45 nm.
  • PowerXCell 8i , który jest wersją Cell BE z ulepszonym podsystemem FPU i pamięci. Został wyprodukowany tylko w pojedynczej wersji 65 nm.
  • XCPU używany w konfiguracji z trzema rdzeniami i zunifikowaną pamięcią podręczną L2 o wielkości 1 MB w konsoli Xbox 360 firmy Microsoft . Występuje w trzech wersjach: 90 nm i 65 nm oraz 45 nm XCGPU ze zintegrowanym procesorem graficznym firmy ATI .

Główne cechy

Jednostki wykonawcze

W celu

PPU jest procesorem kolejnościowym, ale ma pewne unikalne cechy, które pozwalają mu osiągnąć pewne korzyści w postaci wykonywania poza kolejnością bez kosztownego zamawiania sprzętu. Po osiągnięciu braku pamięci podręcznej L1 - może wykonać się poza błędem pamięci podręcznej, zatrzymując się tylko wtedy, gdy instrukcja jest faktycznie zależna od obciążenia. Może wysłać do 8 instrukcji ładowania do pamięci podręcznej L2 poza kolejnością. Posiada rurkę opóźniającą instrukcje - boczną ścieżkę, która pozwala mu wykonywać instrukcje, które normalnie powodowałyby przestoje potoku , bez wstrzymywania reszty potoku . Potok opóźnienia instrukcji jest używany w przypadku ładowania/zapisów poza kolejnością: braki w pamięci podręcznej są tam umieszczane w trakcie ruchu.

Rurociąg PPE

PPE ma 23 etapy ogólnego potoku z dodatkowymi 11 etapami możliwymi dla mikrokodu i dodatkowymi 4 etapami możliwymi do przewidywania rozgałęzień.

Wielowątkowość

PPU obsługuje jednocześnie dwa wątki sprzętowe . Główne rejestry służące do wykonywania kodu są zduplikowane, podobnie jak rejestry wyjątków i obsługi przerwań, a także kilka podstawowych tablic i kolejek. Mogą jednocześnie generować wyjątki i przewidywać rozgałęzienia na podstawie historii poszczególnych rozgałęzień. Silnik wykonawczy i pamięci podręczne nie są jednak duplikowane, więc nadal jest to konstrukcja jednordzeniowa.

Pojemność zmiennoprzecinkowa

Jego 64-bitowa jednostka zmiennoprzecinkowa o podwójnej precyzji i 128-bitowa jednostka VMX (przy użyciu zestawu instrukcji AltiVec ) mogą wykonać teoretycznie 12 operacji zmiennoprzecinkowych na cykl, ponieważ jego jednostka zmiennoprzecinkowa może wykonywać mnożenie zmiennoprzecinkowe dodaje i nie jest mniejszy niż 64-bitowy. Daje to 3,2 miliarda cykli zegara × 12 = 38,4 miliarda operacji zmiennoprzecinkowych na sekundę.

Ulepszona jednostka PPU w procesorze PowerXCell 8i umożliwia wykonywanie jednocyklowych operacji zmiennoprzecinkowych o podwójnej precyzji, dostosowanych do obliczeń o wysokiej wydajności w superkomputerach.

Jednostka VMX w XCPU w konsoli Xbox 360 została wzbogacona o 128 rejestrów i nie jest w pełni kompatybilna ze zwykłym AltiVec.