Element przetwarzający moc
Architektury POWER , PowerPC i Power ISA |
---|
NXP (dawniej Freescale i Motorola) |
IBM-a |
|
IBM/Nintendo |
Inny |
Powiązane linki |
Anulowane w kolorze szarym , historyczne kursywą |
Informacje ogólne | |
---|---|
Wystrzelony | 2005 |
Przerwane | Obecny |
Sprzedawany przez | IBM , Sony , Microsoft |
Zaprojektowany przez | IBM-a |
Wspólny producent (y) | |
Wydajność | |
Maks. Częstotliwość taktowania procesora | 2,8 GHz do 3,2 GHz |
Pamięć podręczna | |
Pamięć podręczna L1 | Instrukcja 32 KB + dane 32 KB |
Architektura i klasyfikacja | |
Aplikacja | Konsola do gier , HPC |
Węzeł technologiczny | 90 nm do 45 nm |
Mikroarchitektura | PPU |
Zestaw instrukcji | PowerPC 2.02 |
Specyfikacje fizyczne | |
Rdzenie |
|
GPU | Xenos , w wariancie XCGPU . |
Produkty, modele, warianty | |
Wariant(y) |
|
Historia | |
Następca | IBMA2 |
Element przetwarzający moc ( PPE ) składa się z jednostki przetwarzającej moc ( PPU ) i pamięci podręcznej L2 o wielkości 512 KB. W większości przypadków PPU jest używany w ŚOI. PPU to 64-bitowy , dwuwątkowy rdzeń mikroprocesora PowerPC 2.02 w kolejności zaprojektowany przez IBM do użytku głównie w konsolach do gier PlayStation 3 i Xbox 360 , ale znalazł również zastosowanie w obliczeniach o wysokiej wydajności w superkomputerach takie jak ustanowienie rekordu IBM Roadrunner .
PPU jest używany jako główny rdzeń procesora w trzech różnych konstrukcjach procesorów:
- Silnik szerokopasmowy Cell (Cell BE), używany głównie w konsoli do gier Sony PlayStation 3 . Wykorzystuje PPE i jest dostępny w trzech wersjach: 90 nm, 65 nm i 45 nm.
- PowerXCell 8i , który jest wersją Cell BE z ulepszonym podsystemem FPU i pamięci. Został wyprodukowany tylko w pojedynczej wersji 65 nm.
- XCPU używany w konfiguracji z trzema rdzeniami i zunifikowaną pamięcią podręczną L2 o wielkości 1 MB w konsoli Xbox 360 firmy Microsoft . Występuje w trzech wersjach: 90 nm i 65 nm oraz 45 nm XCGPU ze zintegrowanym procesorem graficznym firmy ATI .
Główne cechy
- 64-bitowy, dwuwątkowy rdzeń
- Typowe taktowanie 3,2 GHz
- 32 KB pamięci podręcznej instrukcji L1
- 32 KB pamięci podręcznej danych L1
- 512 KB zunifikowanej pamięci podręcznej L2, 8-kierunkowy zestaw asocjacyjny w wariancie PPE.
- Kompatybilny z 64-bitowym PowerPC ISA v.2.02 ( POWER4 i PowerPC 970 )
- Funkcjonalność AltiVec SIMD
Jednostki wykonawcze
- Jednostka oddziałowa (BRU)
- Jednostka liczb całkowitych stałoprzecinkowych (FXU)
- Załaduj i przechowuj jednostkę (LSU)
- Jednostka zmiennoprzecinkowa (FPU)
- Moduł rozszerzenia nośnika wektorowego (VMX)
W celu
PPU jest procesorem kolejnościowym, ale ma pewne unikalne cechy, które pozwalają mu osiągnąć pewne korzyści w postaci wykonywania poza kolejnością bez kosztownego zamawiania sprzętu. Po osiągnięciu braku pamięci podręcznej L1 - może wykonać się poza błędem pamięci podręcznej, zatrzymując się tylko wtedy, gdy instrukcja jest faktycznie zależna od obciążenia. Może wysłać do 8 instrukcji ładowania do pamięci podręcznej L2 poza kolejnością. Posiada rurkę opóźniającą instrukcje - boczną ścieżkę, która pozwala mu wykonywać instrukcje, które normalnie powodowałyby przestoje potoku , bez wstrzymywania reszty potoku . Potok opóźnienia instrukcji jest używany w przypadku ładowania/zapisów poza kolejnością: braki w pamięci podręcznej są tam umieszczane w trakcie ruchu.
Rurociąg PPE
PPE ma 23 etapy ogólnego potoku z dodatkowymi 11 etapami możliwymi dla mikrokodu i dodatkowymi 4 etapami możliwymi do przewidywania rozgałęzień.
Wielowątkowość
PPU obsługuje jednocześnie dwa wątki sprzętowe . Główne rejestry służące do wykonywania kodu są zduplikowane, podobnie jak rejestry wyjątków i obsługi przerwań, a także kilka podstawowych tablic i kolejek. Mogą jednocześnie generować wyjątki i przewidywać rozgałęzienia na podstawie historii poszczególnych rozgałęzień. Silnik wykonawczy i pamięci podręczne nie są jednak duplikowane, więc nadal jest to konstrukcja jednordzeniowa.
Pojemność zmiennoprzecinkowa
Jego 64-bitowa jednostka zmiennoprzecinkowa o podwójnej precyzji i 128-bitowa jednostka VMX (przy użyciu zestawu instrukcji AltiVec ) mogą wykonać teoretycznie 12 operacji zmiennoprzecinkowych na cykl, ponieważ jego jednostka zmiennoprzecinkowa może wykonywać mnożenie zmiennoprzecinkowe dodaje i nie jest mniejszy niż 64-bitowy. Daje to 3,2 miliarda cykli zegara × 12 = 38,4 miliarda operacji zmiennoprzecinkowych na sekundę.
Ulepszona jednostka PPU w procesorze PowerXCell 8i umożliwia wykonywanie jednocyklowych operacji zmiennoprzecinkowych o podwójnej precyzji, dostosowanych do obliczeń o wysokiej wydajności w superkomputerach.
Jednostka VMX w XCPU w konsoli Xbox 360 została wzbogacona o 128 rejestrów i nie jest w pełni kompatybilna ze zwykłym AltiVec.