Nierówność McDiarmida

W teorii prawdopodobieństwa i informatyce teoretycznej nierówność McDiarmida jest nierównością koncentracji , która ogranicza odchylenie między próbkowaną wartością a oczekiwaną wartością pewnych funkcji, gdy są one oceniane na podstawie niezależnych zmiennych losowych . Nierówność McDiarmida dotyczy funkcji spełniających ograniczone różnice właściwość, co oznacza, że ​​zastąpienie pojedynczego argumentu funkcji, przy pozostawieniu wszystkich pozostałych argumentów bez zmian, nie może spowodować zbyt dużej zmiany wartości funkcji.

Oświadczenie

Funkcja spełnia właściwość ograniczonych różnic , jeśli zastępuje się wartość współrzędnej zmienia się wartość co najwyżej o . istnieją dla , i wszystkie ,

Nierówność McDiarmida - Niech spełniają właściwość ograniczonych różnic z granicami .

niezależne gdzie dla wszystkich . Następnie, dla dowolnego , }

i jako bezpośrednia konsekwencja

Rozszerzenia

Rozkłady niezrównoważone

Silniejsze ograniczenie można podać, gdy argumenty funkcji są próbkowane z niezrównoważonych rozkładów, tak że ponowne próbkowanie pojedynczego argumentu rzadko powoduje dużą zmianę wartości funkcji.

Nierówność McDiarmida (niezrównoważona) - Niech właściwość ograniczonych różnic spełnia granice .

Rozważ niezależne zmienne losowe narysowane z rozkładu gdzie istnieje określona wartość , która występuje z prawdopodobieństwem . Następnie, dla dowolnego , }

Można to wykorzystać na przykład do scharakteryzowania wartości funkcji na wykresach , gdy są one oceniane na rzadkich losowych wykresach i hipergrafach , ponieważ na rzadkim grafie losowym jest znacznie bardziej prawdopodobne, że brakuje jakiejkolwiek określonej krawędzi niż jest obecna.

Różnice ograniczone dużym prawdopodobieństwem

Nierówność McDiarmida można rozszerzyć na przypadek, w którym analizowana funkcja nie spełnia ściśle własności różnic ograniczonych, ale duże różnice pozostają bardzo rzadkie.

Nierówność McDiarmida (różnice ograniczone z dużym prawdopodobieństwem) - Niech funkcją i będzie podzbiorem jego dziedziny i niech do stałymi takimi że dla wszystkich par i ,

niezależne gdzie dla wszystkich . Niech niech . Następnie, dla dowolnego , }

i jako bezpośrednia konsekwencja

Istnieją silniejsze udoskonalenia tej analizy w niektórych scenariuszach zależnych od dystrybucji, takich jak te, które pojawiają się w teorii uczenia się .

Normy subgaussowskie i subwykładnicze

Niech ta wyśrodkowana warunkowa wersja funkcji będzie

więc jest zmienną losową zależną od losowych wartości .

Nierówność McDiarmida (norma subgaussowska) - Niech będzie funkcją. Rozważ niezależne zmienne losowe gdzie dla wszystkich .

Niech odnosi się do wyśrodkowanej warunkowej wersji . Niech . _ _

Następnie, dla dowolnego , }

Nierówność McDiarmida (norma podwykładnicza) - Niech będzie funkcją. Rozważ niezależne zmienne losowe gdzie dla wszystkich .

Niech odnosi się do wyśrodkowanej warunkowej wersji . Niech .

Następnie dla dowolnego , }

Formy Bennetta i Bernsteina

Udoskonalenia nierówności McDiarmida w stylu nierówności Bennetta i nierówności Bernsteina są możliwe dzięki zdefiniowaniu terminu wariancji dla każdego argumentu funkcji. Pozwalać

Nierówność McDiarmida (forma Bennetta) - Niech właściwość różnic ograniczonych spełnia granice . Rozważ niezależne zmienne losowe gdzie dla wszystkich . Niech będą na początku

Następnie, dla dowolnego , }

McDiarmida (forma Niech właściwość granice . Niech i być zdefiniowane jak na początku tej sekcji.

Następnie dla dowolnego , }

Dowód

Poniższy dowód nierówności McDiarmida konstruuje martyngał Dooba śledzący warunkową wartość oczekiwaną funkcji w miarę próbkowania i warunkowania coraz większej liczby jej argumentów, a następnie stosuje nierówność koncentracji martyngału ( nierówność Azumy ). Istnieje również alternatywny argument unikający używania martyngałów, wykorzystujący niezależność argumentów funkcji, aby zapewnić podobny do Chernoffa .

Dla lepszej czytelności wprowadzimy skrót notacyjny: oznaczać liczb całkowitych tak że na przykład

Wybierz dowolny . Następnie dla dowolnego przez nierówność trójkąta ,

a zatem .

Ponieważ martyngał Dooba każdy losową zależną od losowej zmiennej wartości jako

ja i , tak że .

Teraz zdefiniuj zmienne losowe dla każdego

Ponieważ są od siebie niezależne, warunkowanie na nie wpływa na X ja = x prawdopodobieństw innych zmiennych, więc są one równe wyrażeniom

Zauważ, że . Ponadto,

Następnie, stosując ogólną postać nierówności Azumy do , mamy

Jednostronne ograniczenie w drugim kierunku uzyskuje się przez zastosowanie nierówności Azumy do a dwustronne ograniczenie wynika z ograniczenia łączącego .

Zobacz też