Szczytowy stosunek sygnału do szumu

Szczytowy stosunek sygnału do szumu ( PSNR ) to termin inżynierski określający stosunek maksymalnej możliwej mocy sygnału do mocy zakłócającego szumu , który wpływa na wierność jego reprezentacji. Ponieważ wiele sygnałów ma bardzo szeroki zakres dynamiczny , PSNR jest zwykle wyrażany jako wielkość logarytmiczna przy użyciu skali decybeli .

PSNR jest powszechnie używany do ilościowego określania jakości rekonstrukcji obrazów i wideo poddanych kompresji stratnej .

Definicja

PSNR najłatwiej zdefiniować za pomocą błędu średniokwadratowego ( MSE ). Mając wolny od szumów monochromatyczny obraz m × n I i jego hałaśliwe przybliżenie K , MSE definiuje się jako

{\ Displaystyle {\ mathit {MSE}} = {\ Frac {1} {m \, n}} \ suma _ {i = 0} ^ {m-1} \ suma _ {j = 0} ^ {n-1} [I (i, j) -K (i, j)] ^ {2}.}

PSNR (w dB ) definiuje się jako

{\ Displaystyle {\ rozpocząć {wyrównane} {\ mathit {PSNR}} & = 10 \ cdot \ log _ {10} \ lewo ({\ Frac {{\ mathit {MAX}} _ {I} ^ {2}} {\mathit {MSE}}}\right)\\&=20\cdot \log _{10}\left({\frac {{\mathit {MAX}}_{I}}{\sqrt {\mathit { MSE}}}}\right)\\&=20\cdot \log _{10}({\mathit {MAX}}_{I})-10\cdot \log _{10}({\mathit {MSE }}).\end{wyrównane}}}

Tutaj MAX _I to maksymalna możliwa wartość piksela obrazu. Gdy piksele są reprezentowane przy użyciu 8 bitów na próbkę, jest to 255. Bardziej ogólnie, gdy próbki są reprezentowane przy użyciu liniowego PCM z B bitami na próbkę, MAX _I wynosi 2 ^B - 1.

Zastosowanie w kolorowych obrazach

W przypadku obrazów kolorowych z trzema wartościami RGB na piksel definicja PSNR jest taka sama, z wyjątkiem tego, że MSE jest sumą wszystkich różnic wartości do kwadratu (teraz dla każdego koloru, tj. trzy razy więcej różnic niż w obrazie monochromatycznym) podzieloną przez rozmiar obrazu i przez trzy. Alternatywnie, w przypadku obrazów kolorowych obraz jest konwertowany do innej przestrzeni kolorów i zgłaszany jest PSNR dla każdego kanału tej przestrzeni kolorów, np. YCbCr lub HSL .

Ocena jakości za pomocą PSNR

PSNR jest najczęściej używany do pomiaru jakości rekonstrukcji kodeków kompresji stratnej (np. do kompresji obrazu ). Sygnał w tym przypadku to oryginalne dane, a szum to błąd wprowadzony przez kompresję. Porównując kodeki kompresji, PSNR jest przybliżeniem ludzkiej percepcji jakości rekonstrukcji.

Typowe wartości PSNR w stratnej kompresji obrazu i wideo wynoszą od 30 do 50 dB, pod warunkiem, że głębia bitowa wynosi 8 bitów , gdzie im wyższa, tym lepsza. Jakość przetwarzania obrazów 12-bitowych uważana jest za wysoką, gdy wartość PSNR wynosi 60 dB lub więcej. Dla danych 16-bitowych typowe wartości PSNR wynoszą od 60 do 80 dB. Za dopuszczalne wartości strat jakości transmisji bezprzewodowej uważa się ok. 20 dB do 25 dB.

W przypadku braku szumu dwa obrazy I i K są identyczne, a zatem MSE wynosi zero. W tym przypadku PSNR jest nieskończony (lub niezdefiniowany, patrz Dzielenie przez zero ).

Oryginalny nieskompresowany obraz

Q=90, PSNR 45,53dB

Q=30, PSNR 36,81dB

Q=10, PSNR 31,45dB

Przykładowe wartości Luma PSNR dla skompresowanego obrazu cjpeg na różnych poziomach jakości.

Porównanie wydajności

Chociaż wyższy PSNR ogólnie wskazuje, że rekonstrukcja jest wyższej jakości, w niektórych przypadkach może tak nie być. Trzeba być bardzo ostrożnym z zakresem ważności tej miary; jest ostatecznie ważny tylko wtedy, gdy jest używany do porównywania wyników z tego samego kodeka (lub typu kodeka) i tej samej treści.

Ogólnie rzecz biorąc, wykazano, że PSNR działa słabo w porównaniu z innymi wskaźnikami jakości, jeśli chodzi o szacowanie jakości obrazów , a zwłaszcza filmów, postrzeganych przez ludzi.

Warianty

PSNR-HVS jest rozszerzeniem PSNR, które obejmuje właściwości ludzkiego układu wzrokowego, takie jak percepcja kontrastu .

PSNR-HVS-M poprawia PSNR-HVS poprzez dodatkowe uwzględnienie maskowania wizualnego . W badaniu z 2007 roku dostarczył znacznie lepszych przybliżeń ocen jakości wizualnej ludzi niż PSNR i SSIM . Wykazano również, że ma wyraźną przewagę nad DCTune i PSNR-HVS.

Zobacz też

Metryki oceny uczenia maszynowego
Regresja	MSE · MAE · sMAPE · MAPE · MASE · MSPE · RMS · RMSE/RMSD · R2 · MDA · MAD
Klasyfikacja	F-score · P4 · Dokładność · Precyzja · Przypomnienie · Kappa · MCC · AUC · ROC · Czułość i specyficzność · Utrata logarytmiczna
Grupowanie	Sylwetka · Calinski-Harabasz · Davies-Bouldin · Indeks Dunna · Statystyka Hopkinsa · Indeks Jaccarda · Indeks Rand · Miara podobieństwa · SMC · SimHash
Zaszeregowanie	MRR · DCG · NDCG · AP
Wizja komputerowa	PSNR · SSIM · IoU
NLP	Zakłopotanie · NIEBIESKI
Metryki związane z głębokim uczeniem	Wynik początkowy · FID
System rekomendacji	Zasięg · Podobieństwo wewnątrz listy
Podobieństwo	Podobieństwo cosinusowe · Odległość euklidesowa · Współczynnik korelacji Pearsona
Matryca zamieszania