W teorii informacji i przetwarzaniu sygnałów Discrete Universal Denoiser ( DUDE ) jest schematem odszumiania służącym do odzyskiwania sekwencji w skończonym alfabecie, które zostały uszkodzone przez dyskretny kanał bez pamięci . DUDE został zaproponowany w 2005 roku przez Tsachy'ego Weissmana, Erika Ordentlicha, Gadiela Seroussiego, Sergio Verdú i Marcelo J. Weinbergera.
Przegląd
Discrete Universal Denoiser (DUDE) to schemat odszumiania , który szacuje nieznany sygnał nad skończonym alfabetem z hałaśliwej wersji . Podczas gdy większość odszumiania w literaturze dotyczącej przetwarzania sygnałów i statystyki dotyczy sygnałów w nieskończonym alfabecie (zwłaszcza sygnałów o wartościach rzeczywistych), DUDE odnosi się do skończonego przypadku alfabetu. Zakłada wersja jest generowana przez transmisję znany kanał bez .
Dla ustalonego parametru długości kontekstu , DUDE wystąpienia wszystkich ciągów o długości się w . . Szacunkowa wartość jest określana na podstawie dwustronnego kontekstu z , biorąc pod uwagę wszystkie inne tokeny w tym samym kontekście, a także znaną macierz kanałów i funkcję utraty z ja {\ używany.
Pomysł leżący u podstaw KOLESA najlepiej ilustruje sytuacja, gdy losowego wektora . Jeśli rozkład warunkowy , a mianowicie dystrybucja bezgłośnego symbolu hałaśliwym kontekstem , estymator byłby odpowiedzią . Na szczęście, gdy macierz kanałów jest znana i niezdegenerowana, ten rozkład warunkowy można wyrazić za pomocą rozkładu warunkowego , a mianowicie rozkład hałaśliwego symbolu zależny od jego hałaśliwego kontekstu można oszacować na podstawie prawa wielkich liczb , pod warunkiem, że duży”.
Zastosowanie schematu DUDE z długością kontekstu sekwencji długości alfabetem wymaga operacje i przestrzeń .
Przy pewnych założeniach DUDE jest schematem uniwersalnym w sensie działania asymptotycznego, a także optymalnym denoiserem, który ma wyrocznię dostęp do nieznanej sekwencji. Dokładniej, załóżmy, że wydajność odszumiania jest mierzona przy użyciu danego kryterium wierności pojedynczego znaku i rozważmy reżim, w którym długość sekwencji do nieskończoności, a długość kontekstu dąży do nieskończoności „niezbyt szybko”. W ustawieniu stochastycznym, gdzie podwójnie nieskończona sekwencja bezgłośna sekwencja realizacją procesu stacjonarnego , KOLEŚ wykonuje również asymptotycznie w oczekiwaniu jako najlepszy denoiser, który ma dostęp wyroczni do dystrybucji źródłowej . W ustawieniu jednosekwencyjnym lub „półstochastycznym” ze stałą podwójnie nieskończoną sekwencją , DUDE asymptotycznie działa równie dobrze jak najlepszy denoiser „przesuwnego okna”, a mianowicie dowolny denoiser, z okna , który ma dostęp Oracle do .
Dyskretny problem odszumiania
Schemat blokowy opis problemu odszumiania dyskretnego
Niech skończonym alfabetem ustalonej, ale nieznanej oryginalnej „bezszelestnej” sekwencji . Sekwencja jest wprowadzana do dyskretnego kanału bez pamięci (DMC). DMC działa niezależnie na losowy symbol w DMC jest znany jako Markowa , . Wygodnie jest napisać dla - . DMC tworzy losową sekwencję szumów . Konkretna realizacja tego losowego wektora będzie oznaczona przez . Denoiser jest funkcją , który próbuje odzyskać bezszumową sekwencję zniekształconej wersji . Określona odszumiona sekwencja jest oznaczona przez . Problem wyboru denoisera znany jako szacowanie lub wygładzanie . Aby porównać kandydujących denoiserów, wybieramy kryterium wierności pojedynczego symbolu (na przykład strata Hamminga) i zdefiniuj utratę denoisera na symbol w wg
alfabetu według , kryterium wierności może być określone jako -by- macierz z kolumnami formularza
Schemat DUDE
Krok 1: Obliczenie rozkładu empirycznego w każdym kontekście
DUDE koryguje symbole zgodnie z ich kontekstem. długość kontekstu parametrem dostrajania schematu. k kontekst -tego symbolu w przez i odpowiedni prawy kontekst jako . dwustronny prawego
każdym możliwym dwustronnym kontekście wzdłuż hałaśliwej sekwencji . Formalnie dany kontekst dwustronny który pojawia się raz lub więcej wzdłuż, empiryczny rozkład prawdopodobieństwa na } którego wartość przy symbolu wynosi
schematu DUDE z długością kontekstu hałaśliwej sekwencji wejściowej i długości- empiryczny wektor dystrybucji (lub jego nieznormalizowana wersja, wektor zliczania) dla każdego dwustronnego kontekstu znalezionego wzdłuż . Ponieważ istnieje co najwyżej możliwe dwustronne konteksty wzdłuż ten krok wymaga operacji i przechowywania .
Krok 2: Obliczanie odpowiedzi Bayesa dla każdego kontekstu
kolumnę symbolowi przez . Definiujemy odpowiedź Bayesa na długości z nieujemnymi wpisami jako
Ta definicja jest uzasadniona w tle poniżej.
dwustronnego kontekstu zaobserwowanego w poprzednim kroku wzdłuż każdego symbolu każdym kontekście (mianowicie każdy że jest podłańcuchem odpowiedzi Bayesa na wektor , a mianowicie
że sekwencja i kontekstu . Tutaj jest -kolumny z i dla wektorów i za i , oznacza ich iloczyn Schur (wejściowy), zdefiniowany przez . iloczynem Schura oznacza .
że macierz kanałów kwadratowa ( i odwracalna) . kiedy nie jest odwracalny, przy rozsądnym założeniu, że ma pełny rząd wierszy, zastępujemy powyżej z pseudoodwrotnością Moore'a-Penrose'a i oblicz zamiast tego
Przez buforowanie odwrotności lub pseudo-odwrotności λ dla odpowiednich par , ) }
Krok 3: Szacowanie każdego symbolu na podstawie odpowiedzi Bayesa na jego kontekst
Trzecim i ostatnim krokiem schematu DUDE jest ponowne zeskanowanie odszumionej sekwencji . Odszumiony symbol wybrany do zastąpienia jest odpowiedzią Bayesa na dwustronny kontekst symbolu, a mianowicie z ja {\ displaystyle
Ten krok wymaga strukturę danych skonstruowaną w poprzednim
cały _ _
Asymptotyczne własności optymalności
DUDE jest zaprojektowany tak, aby był uniwersalnie optymalny, a mianowicie optymalny (przy pewnych założeniach ma to sens), niezależnie od oryginalnej sekwencji .
Niech oznaczają sekwencję schematów DUDE, jak opisano powyżej, gdzie używa długości kontekstu co jest ukryte w notacji. Wymagamy tylko, aby i że .
Dla źródła stacjonarnego
Oznacz przez wszystkich denoiserów , a mianowicie wszystkie mapy .
Niech nieznanym źródłem stacjonarnym i odpowiedniej hałaśliwej sekwencji Następnie
i istnieją obie granice. Jeśli dodatkowo źródło jest ergodyczne, to
Dla indywidualnej sekwencji
Oznacz przez zestaw wszystkich denoiserów przesuwnych okien -block mapy postaci z dowolnie .
Niech będzie nieznanym, cichym sekwencyjnym źródłem stacjonarnym i będzie rozkładem odpowiednią hałaśliwą sekwencję. Następnie
Wydajność nieasymptotyczna
Niech na z długością kontekstu zdefiniowaną -blokach. Wtedy istnieją jawne stałe, zależą od 1 samodzielnie, tak że dla dowolnego dowolnego mamy x
gdzie sekwencją odpowiadającą (której losowość wynika wyłącznie
samymi stałymi, powyżej dla każdego -block denoiser . dolnej granicy wymaga, aby macierz kanału para spełniała pewien
Tło
Aby uzasadnić konkretną definicję KOLEGO przy użyciu odpowiedzi Bayesa na określony wektor, znajdujemy teraz optymalny denoiser w przypadku nieuniwersalnym, w którym nieznana sekwencja jest realizacją a x wektor którego rozkład jest znany
Rozważmy najpierw przypadek . Ponieważ wspólny rozkład znany, biorąc pod uwagę obserwowany hałaśliwy symbol nieznany symbol jest dystrybuowane zgodnie ze znanym rozkładem . Zamawiając elementy , możemy opisać ten rozkład warunkowy na za pomocą wektora prawdopodobieństwa , indeksowane przez , którego wpisem jest . Oczywiście oczekiwana wyborze szacowanego wynosi .
Zdefiniuj Bayesa wektora prawdopodobieństwa opisując rozkład prawdopodobieństwa na minimalną oczekiwaną stratę i odpowiedź Bayesa na jako przewidywanie, które osiąga to minimum, . Zauważ, że odpowiedź Bayesa jest niezmienna w skali w tym sensie, że dla .
W przypadku optymalnym denoiserem jest . Ten optymalny denoiser można wyrazić za pomocą samego rozkładu krańcowego sposób. Kiedy macierz kanałów , mamy _ to Π . Oznacza to, że optymalny denoiser jest podany równoważnie przez . kiedy nie jest odwracalny, przy rozsądnym założeniu, że ma pełny rząd wierszy, możemy zastąpić z pseudoodwrotnością Moore'a-Penrose'a i otrzymać
Przechodząc teraz do arbitralnego z oczekiwaną stratą ) jest zatem dana przez odpowiedź Bayesa na
gdzie jest wektorem indeksowanym przez , którego - wpis jest . Warunkowy wektor prawdopodobieństwa jest trudne do obliczenia. Wyprowadzenie analogiczne do powyższego przypadku denoiser dopuszcza alternatywną reprezentację, a gdzie i jest wektorem prawdopodobieństwa indeksowanym przez którego -wpis jest jest zastępowane przez pseudo-odwrotność, jeśli nie jest } kwadratowy lub nieodwracalny.
Gdy dystrybucja (a zatem nie jest dostępna, KOLEJ zastępuje nieznany wektor z empirycznym oszacowaniem uzyskanym wzdłuż samej hałaśliwej sekwencji mianowicie z . Prowadzi to do powyższej definicji KOLEGO.
Chociaż argumenty zbieżności stojące za powyższymi właściwościami optymalności są bardziej subtelne, zauważamy, że powyższe, w połączeniu z twierdzeniem ergodycznym Birkhoffa , wystarczy, aby udowodnić, że dla stacjonarnego źródła ergodycznego KSIĄŻKA o długości kontekstu jest asymptotycznie optymalne wszystkie przesuwanego okna -tego rzędu
Rozszerzenia
Podstawowy DUDE, jak opisano tutaj, zakłada sygnał z jednowymiarowym indeksem ustawionym na skończonym alfabecie, znanym kanale bez pamięci i długości kontekstu, która jest z góry ustalona. Rozważono kolejno złagodzenia każdego z tych założeń. Konkretnie:
- Nieskończone alfabety
- Kanały z pamięcią
- Nieznana macierz kanałów
- Zmienny kontekst i adaptacyjny wybór długości kontekstu
- Sygnały dwuwymiarowe
Aplikacje
Zastosowanie do odszumiania obrazu
Oparta na DUDE struktura do odszumiania obrazów w skali szarości zapewnia najnowocześniejsze usuwanie szumów dla impulsowych kanałów szumów (np. porównywalny ze schematem odszumiania obrazu środków nielokalnych na tym kanale). Inny wariant DUDE mający zastosowanie do obrazów w skali szarości jest przedstawiony w.
Aplikacja do dekodowania kanałów nieskompresowanych źródeł
DUDE doprowadził do powstania uniwersalnych algorytmów dekodowania kanałów nieskompresowanych źródeł.