Dyskretny uniwersalny denoiser

W teorii informacji i przetwarzaniu sygnałów Discrete Universal Denoiser ( DUDE ) jest schematem odszumiania służącym do odzyskiwania sekwencji w skończonym alfabecie, które zostały uszkodzone przez dyskretny kanał bez pamięci . DUDE został zaproponowany w 2005 roku przez Tsachy'ego Weissmana, Erika Ordentlicha, Gadiela Seroussiego, Sergio Verdú i Marcelo J. Weinbergera.

Przegląd

Discrete Universal Denoiser (DUDE) to schemat odszumiania , który szacuje nieznany sygnał nad skończonym alfabetem z hałaśliwej wersji . Podczas gdy większość odszumiania w literaturze dotyczącej przetwarzania sygnałów i statystyki dotyczy sygnałów w nieskończonym alfabecie (zwłaszcza sygnałów o wartościach rzeczywistych), DUDE odnosi się do skończonego przypadku alfabetu. Zakłada wersja jest generowana przez transmisję znany kanał bez .

Dla ustalonego parametru długości kontekstu , DUDE wystąpienia wszystkich ciągów o długości się w . . Szacunkowa wartość jest określana na podstawie dwustronnego kontekstu z , biorąc pod uwagę wszystkie inne tokeny w tym samym kontekście, a także znaną macierz kanałów i funkcję utraty z ja {\ używany.

Pomysł leżący u podstaw KOLESA najlepiej ilustruje sytuacja, gdy losowego wektora . Jeśli rozkład warunkowy , a mianowicie dystrybucja bezgłośnego symbolu hałaśliwym kontekstem , estymator byłby odpowiedzią . Na szczęście, gdy macierz kanałów jest znana i niezdegenerowana, ten rozkład warunkowy można wyrazić za pomocą rozkładu warunkowego , a mianowicie rozkład hałaśliwego symbolu zależny od jego hałaśliwego kontekstu można oszacować na podstawie prawa wielkich liczb , pod warunkiem, że duży”.

Zastosowanie schematu DUDE z długością kontekstu sekwencji długości alfabetem wymaga operacje i przestrzeń .

Przy pewnych założeniach DUDE jest schematem uniwersalnym w sensie działania asymptotycznego, a także optymalnym denoiserem, który ma wyrocznię dostęp do nieznanej sekwencji. Dokładniej, załóżmy, że wydajność odszumiania jest mierzona przy użyciu danego kryterium wierności pojedynczego znaku i rozważmy reżim, w którym długość sekwencji do nieskończoności, a długość kontekstu dąży do nieskończoności „niezbyt szybko”. W ustawieniu stochastycznym, gdzie podwójnie nieskończona sekwencja bezgłośna sekwencja realizacją procesu stacjonarnego , KOLEŚ wykonuje również asymptotycznie w oczekiwaniu jako najlepszy denoiser, który ma dostęp wyroczni do dystrybucji źródłowej . W ustawieniu jednosekwencyjnym lub „półstochastycznym” ze stałą podwójnie nieskończoną sekwencją , DUDE asymptotycznie działa równie dobrze jak najlepszy denoiser „przesuwnego okna”, a mianowicie dowolny denoiser, z okna , który ma dostęp Oracle do .

Dyskretny problem odszumiania

Schemat blokowy opis problemu odszumiania dyskretnego

Niech skończonym alfabetem ustalonej, ale nieznanej oryginalnej „bezszelestnej” sekwencji . Sekwencja jest wprowadzana do dyskretnego kanału bez pamięci (DMC). DMC działa niezależnie na losowy symbol w DMC jest znany jako Markowa , . Wygodnie jest napisać dla - . DMC tworzy losową sekwencję szumów . Konkretna realizacja tego losowego wektora będzie oznaczona przez . Denoiser jest funkcją , który próbuje odzyskać bezszumową sekwencję zniekształconej wersji . Określona odszumiona sekwencja jest oznaczona przez . Problem wyboru denoisera znany jako szacowanie lub wygładzanie . Aby porównać kandydujących denoiserów, wybieramy kryterium wierności pojedynczego symbolu (na przykład strata Hamminga) i zdefiniuj utratę denoisera na symbol w wg


alfabetu według , kryterium wierności może być określone jako -by- macierz z kolumnami formularza


Schemat DUDE

Krok 1: Obliczenie rozkładu empirycznego w każdym kontekście

DUDE koryguje symbole zgodnie z ich kontekstem. długość kontekstu parametrem dostrajania schematu. k kontekst -tego symbolu w przez i odpowiedni prawy kontekst jako . dwustronny prawego

każdym możliwym dwustronnym kontekście wzdłuż hałaśliwej sekwencji . Formalnie dany kontekst dwustronny który pojawia się raz lub więcej wzdłuż, empiryczny rozkład prawdopodobieństwa na } którego wartość przy symbolu wynosi


schematu DUDE z długością kontekstu hałaśliwej sekwencji wejściowej i długości- empiryczny wektor dystrybucji (lub jego nieznormalizowana wersja, wektor zliczania) dla każdego dwustronnego kontekstu znalezionego wzdłuż . Ponieważ istnieje co najwyżej możliwe dwustronne konteksty wzdłuż ten krok wymaga operacji i przechowywania .

Krok 2: Obliczanie odpowiedzi Bayesa dla każdego kontekstu

kolumnę symbolowi przez . Definiujemy odpowiedź Bayesa na długości z nieujemnymi wpisami jako


Ta definicja jest uzasadniona w tle poniżej.

dwustronnego kontekstu zaobserwowanego w poprzednim kroku wzdłuż każdego symbolu każdym kontekście (mianowicie każdy że jest podłańcuchem odpowiedzi Bayesa na wektor , a mianowicie


że sekwencja i kontekstu . Tutaj jest -kolumny z i dla wektorów i za i , oznacza ich iloczyn Schur (wejściowy), zdefiniowany przez . iloczynem Schura oznacza .

że macierz kanałów kwadratowa ( i odwracalna) . kiedy nie jest odwracalny, przy rozsądnym założeniu, że ma pełny rząd wierszy, zastępujemy powyżej z pseudoodwrotnością Moore'a-Penrose'a i oblicz zamiast tego


Przez buforowanie odwrotności lub pseudo-odwrotności λ dla odpowiednich par , ) }

Krok 3: Szacowanie każdego symbolu na podstawie odpowiedzi Bayesa na jego kontekst

Trzecim i ostatnim krokiem schematu DUDE jest ponowne zeskanowanie odszumionej sekwencji . Odszumiony symbol wybrany do zastąpienia jest odpowiedzią Bayesa na dwustronny kontekst symbolu, a mianowicie z ja {\ displaystyle


Ten krok wymaga strukturę danych skonstruowaną w poprzednim

cały _ _

Asymptotyczne własności optymalności

DUDE jest zaprojektowany tak, aby był uniwersalnie optymalny, a mianowicie optymalny (przy pewnych założeniach ma to sens), niezależnie od oryginalnej sekwencji .

Niech oznaczają sekwencję schematów DUDE, jak opisano powyżej, gdzie używa długości kontekstu co jest ukryte w notacji. Wymagamy tylko, aby i że .

Dla źródła stacjonarnego

Oznacz przez wszystkich denoiserów , a mianowicie wszystkie mapy .

Niech nieznanym źródłem stacjonarnym i odpowiedniej hałaśliwej sekwencji Następnie


i istnieją obie granice. Jeśli dodatkowo źródło jest ergodyczne, to


Dla indywidualnej sekwencji

Oznacz przez zestaw wszystkich denoiserów przesuwnych okien -block mapy postaci z dowolnie .

Niech będzie nieznanym, cichym sekwencyjnym źródłem stacjonarnym i będzie rozkładem odpowiednią hałaśliwą sekwencję. Następnie


Wydajność nieasymptotyczna

Niech na z długością kontekstu zdefiniowaną -blokach. Wtedy istnieją jawne stałe, zależą od 1 samodzielnie, tak że dla dowolnego dowolnego mamy x


gdzie sekwencją odpowiadającą (której losowość wynika wyłącznie

samymi stałymi, powyżej dla każdego -block denoiser . dolnej granicy wymaga, aby macierz kanału para spełniała pewien

Tło

Aby uzasadnić konkretną definicję KOLEGO przy użyciu odpowiedzi Bayesa na określony wektor, znajdujemy teraz optymalny denoiser w przypadku nieuniwersalnym, w którym nieznana sekwencja jest realizacją a x wektor którego rozkład jest znany

Rozważmy najpierw przypadek . Ponieważ wspólny rozkład znany, biorąc pod uwagę obserwowany hałaśliwy symbol nieznany symbol jest dystrybuowane zgodnie ze znanym rozkładem . Zamawiając elementy , możemy opisać ten rozkład warunkowy na za pomocą wektora prawdopodobieństwa , indeksowane przez , którego wpisem jest . Oczywiście oczekiwana wyborze szacowanego wynosi .

Zdefiniuj Bayesa wektora prawdopodobieństwa opisując rozkład prawdopodobieństwa na minimalną oczekiwaną stratę i odpowiedź Bayesa na jako przewidywanie, które osiąga to minimum, . Zauważ, że odpowiedź Bayesa jest niezmienna w skali w tym sensie, że dla .

W przypadku optymalnym denoiserem jest . Ten optymalny denoiser można wyrazić za pomocą samego rozkładu krańcowego sposób. Kiedy macierz kanałów , mamy _ to Π . Oznacza to, że optymalny denoiser jest podany równoważnie przez . kiedy nie jest odwracalny, przy rozsądnym założeniu, że ma pełny rząd wierszy, możemy zastąpić z pseudoodwrotnością Moore'a-Penrose'a i otrzymać


Przechodząc teraz do arbitralnego z oczekiwaną stratą ) jest zatem dana przez odpowiedź Bayesa na


gdzie jest wektorem indeksowanym przez , którego - wpis jest . Warunkowy wektor prawdopodobieństwa jest trudne do obliczenia. Wyprowadzenie analogiczne do powyższego przypadku denoiser dopuszcza alternatywną reprezentację, a gdzie i jest wektorem prawdopodobieństwa indeksowanym przez którego -wpis jest jest zastępowane przez pseudo-odwrotność, jeśli nie jest } kwadratowy lub nieodwracalny.

Gdy dystrybucja (a zatem nie jest dostępna, KOLEJ zastępuje nieznany wektor z empirycznym oszacowaniem uzyskanym wzdłuż samej hałaśliwej sekwencji mianowicie z . Prowadzi to do powyższej definicji KOLEGO.

Chociaż argumenty zbieżności stojące za powyższymi właściwościami optymalności są bardziej subtelne, zauważamy, że powyższe, w połączeniu z twierdzeniem ergodycznym Birkhoffa , wystarczy, aby udowodnić, że dla stacjonarnego źródła ergodycznego KSIĄŻKA o długości kontekstu jest asymptotycznie optymalne wszystkie przesuwanego okna -tego rzędu

Rozszerzenia

Podstawowy DUDE, jak opisano tutaj, zakłada sygnał z jednowymiarowym indeksem ustawionym na skończonym alfabecie, znanym kanale bez pamięci i długości kontekstu, która jest z góry ustalona. Rozważono kolejno złagodzenia każdego z tych założeń. Konkretnie:

  • Nieskończone alfabety
  • Kanały z pamięcią
  • Nieznana macierz kanałów
  • Zmienny kontekst i adaptacyjny wybór długości kontekstu
  • Sygnały dwuwymiarowe

Aplikacje

Zastosowanie do odszumiania obrazu

Oparta na DUDE struktura do odszumiania obrazów w skali szarości zapewnia najnowocześniejsze usuwanie szumów dla impulsowych kanałów szumów (np. porównywalny ze schematem odszumiania obrazu środków nielokalnych na tym kanale). Inny wariant DUDE mający zastosowanie do obrazów w skali szarości jest przedstawiony w.

Aplikacja do dekodowania kanałów nieskompresowanych źródeł

DUDE doprowadził do powstania uniwersalnych algorytmów dekodowania kanałów nieskompresowanych źródeł.