Szczytowy stosunek sygnału do szumu
Szczytowy stosunek sygnału do szumu ( PSNR ) to termin inżynierski określający stosunek maksymalnej możliwej mocy sygnału do mocy zakłócającego szumu , który wpływa na wierność jego reprezentacji. Ponieważ wiele sygnałów ma bardzo szeroki zakres dynamiczny , PSNR jest zwykle wyrażany jako wielkość logarytmiczna przy użyciu skali decybeli .
PSNR jest powszechnie używany do ilościowego określania jakości rekonstrukcji obrazów i wideo poddanych kompresji stratnej .
Definicja
PSNR najłatwiej zdefiniować za pomocą błędu średniokwadratowego ( MSE ). Mając wolny od szumów monochromatyczny obraz m × n I i jego hałaśliwe przybliżenie K , MSE definiuje się jako
PSNR (w dB ) definiuje się jako
Tutaj MAX I to maksymalna możliwa wartość piksela obrazu. Gdy piksele są reprezentowane przy użyciu 8 bitów na próbkę, jest to 255. Bardziej ogólnie, gdy próbki są reprezentowane przy użyciu liniowego PCM z B bitami na próbkę, MAX I wynosi 2 B - 1.
Zastosowanie w kolorowych obrazach
W przypadku obrazów kolorowych z trzema wartościami RGB na piksel definicja PSNR jest taka sama, z wyjątkiem tego, że MSE jest sumą wszystkich różnic wartości do kwadratu (teraz dla każdego koloru, tj. trzy razy więcej różnic niż w obrazie monochromatycznym) podzieloną przez rozmiar obrazu i przez trzy. Alternatywnie, w przypadku obrazów kolorowych obraz jest konwertowany do innej przestrzeni kolorów i zgłaszany jest PSNR dla każdego kanału tej przestrzeni kolorów, np. YCbCr lub HSL .
Ocena jakości za pomocą PSNR
PSNR jest najczęściej używany do pomiaru jakości rekonstrukcji kodeków kompresji stratnej (np. do kompresji obrazu ). Sygnał w tym przypadku to oryginalne dane, a szum to błąd wprowadzony przez kompresję. Porównując kodeki kompresji, PSNR jest przybliżeniem ludzkiej percepcji jakości rekonstrukcji.
Typowe wartości PSNR w stratnej kompresji obrazu i wideo wynoszą od 30 do 50 dB, pod warunkiem, że głębia bitowa wynosi 8 bitów , gdzie im wyższa, tym lepsza. Jakość przetwarzania obrazów 12-bitowych uważana jest za wysoką, gdy wartość PSNR wynosi 60 dB lub więcej. Dla danych 16-bitowych typowe wartości PSNR wynoszą od 60 do 80 dB. Za dopuszczalne wartości strat jakości transmisji bezprzewodowej uważa się ok. 20 dB do 25 dB.
W przypadku braku szumu dwa obrazy I i K są identyczne, a zatem MSE wynosi zero. W tym przypadku PSNR jest nieskończony (lub niezdefiniowany, patrz Dzielenie przez zero ).
Porównanie wydajności
Chociaż wyższy PSNR ogólnie wskazuje, że rekonstrukcja jest wyższej jakości, w niektórych przypadkach może tak nie być. Trzeba być bardzo ostrożnym z zakresem ważności tej miary; jest ostatecznie ważny tylko wtedy, gdy jest używany do porównywania wyników z tego samego kodeka (lub typu kodeka) i tej samej treści.
Ogólnie rzecz biorąc, wykazano, że PSNR działa słabo w porównaniu z innymi wskaźnikami jakości, jeśli chodzi o szacowanie jakości obrazów , a zwłaszcza filmów, postrzeganych przez ludzi.
Warianty
PSNR-HVS jest rozszerzeniem PSNR, które obejmuje właściwości ludzkiego układu wzrokowego, takie jak percepcja kontrastu .
PSNR-HVS-M poprawia PSNR-HVS poprzez dodatkowe uwzględnienie maskowania wizualnego . W badaniu z 2007 roku dostarczył znacznie lepszych przybliżeń ocen jakości wizualnej ludzi niż PSNR i SSIM . Wykazano również, że ma wyraźną przewagę nad DCTune i PSNR-HVS.