Szczytowy stosunek sygnału do szumu

Szczytowy stosunek sygnału do szumu ( PSNR ) to termin inżynierski określający stosunek maksymalnej możliwej mocy sygnału do mocy zakłócającego szumu , który wpływa na wierność jego reprezentacji. Ponieważ wiele sygnałów ma bardzo szeroki zakres dynamiczny , PSNR jest zwykle wyrażany jako wielkość logarytmiczna przy użyciu skali decybeli .

PSNR jest powszechnie używany do ilościowego określania jakości rekonstrukcji obrazów i wideo poddanych kompresji stratnej .

Definicja

PSNR najłatwiej zdefiniować za pomocą błędu średniokwadratowego ( MSE ). Mając wolny od szumów monochromatyczny obraz m × n I i jego hałaśliwe przybliżenie K , MSE definiuje się jako

PSNR (w dB ) definiuje się jako

Tutaj MAX I to maksymalna możliwa wartość piksela obrazu. Gdy piksele są reprezentowane przy użyciu 8 bitów na próbkę, jest to 255. Bardziej ogólnie, gdy próbki są reprezentowane przy użyciu liniowego PCM z B bitami na próbkę, MAX I wynosi 2 B - 1.

Zastosowanie w kolorowych obrazach

W przypadku obrazów kolorowych z trzema wartościami RGB na piksel definicja PSNR jest taka sama, z wyjątkiem tego, że MSE jest sumą wszystkich różnic wartości do kwadratu (teraz dla każdego koloru, tj. trzy razy więcej różnic niż w obrazie monochromatycznym) podzieloną przez rozmiar obrazu i przez trzy. Alternatywnie, w przypadku obrazów kolorowych obraz jest konwertowany do innej przestrzeni kolorów i zgłaszany jest PSNR dla każdego kanału tej przestrzeni kolorów, np. YCbCr lub HSL .

Ocena jakości za pomocą PSNR

PSNR jest najczęściej używany do pomiaru jakości rekonstrukcji kodeków kompresji stratnej (np. do kompresji obrazu ). Sygnał w tym przypadku to oryginalne dane, a szum to błąd wprowadzony przez kompresję. Porównując kodeki kompresji, PSNR jest przybliżeniem ludzkiej percepcji jakości rekonstrukcji.

Typowe wartości PSNR w stratnej kompresji obrazu i wideo wynoszą od 30 do 50 dB, pod warunkiem, że głębia bitowa wynosi 8 bitów , gdzie im wyższa, tym lepsza. Jakość przetwarzania obrazów 12-bitowych uważana jest za wysoką, gdy wartość PSNR wynosi 60 dB lub więcej. Dla danych 16-bitowych typowe wartości PSNR wynoszą od 60 do 80 dB. Za dopuszczalne wartości strat jakości transmisji bezprzewodowej uważa się ok. 20 dB do 25 dB.

W przypadku braku szumu dwa obrazy I i K są identyczne, a zatem MSE wynosi zero. W tym przypadku PSNR jest nieskończony (lub niezdefiniowany, patrz Dzielenie przez zero ).

Oryginalny nieskompresowany obraz
Q=90, PSNR 45,53dB
Q=30, PSNR 36,81dB
Q=10, PSNR 31,45dB
Przykładowe wartości Luma PSNR dla skompresowanego obrazu cjpeg na różnych poziomach jakości.

Porównanie wydajności

Chociaż wyższy PSNR ogólnie wskazuje, że rekonstrukcja jest wyższej jakości, w niektórych przypadkach może tak nie być. Trzeba być bardzo ostrożnym z zakresem ważności tej miary; jest ostatecznie ważny tylko wtedy, gdy jest używany do porównywania wyników z tego samego kodeka (lub typu kodeka) i tej samej treści.

Ogólnie rzecz biorąc, wykazano, że PSNR działa słabo w porównaniu z innymi wskaźnikami jakości, jeśli chodzi o szacowanie jakości obrazów , a zwłaszcza filmów, postrzeganych przez ludzi.

Warianty

PSNR-HVS jest rozszerzeniem PSNR, które obejmuje właściwości ludzkiego układu wzrokowego, takie jak percepcja kontrastu .

PSNR-HVS-M poprawia PSNR-HVS poprzez dodatkowe uwzględnienie maskowania wizualnego . W badaniu z 2007 roku dostarczył znacznie lepszych przybliżeń ocen jakości wizualnej ludzi niż PSNR i SSIM . Wykazano również, że ma wyraźną przewagę nad DCTune i PSNR-HVS.

Zobacz też