Płynne maksimum

W matematyce gładkie maksimum indeksowanej rodziny x 1 , ..., x n liczb jest gładkim przybliżeniem maksymalnej funkcji max oznacza parametryczną rodzinę funkcji takie, że dla każdego α funkcja jest gładka, a rodzina zbiega się do maksymalnej funkcji jak . Koncepcja płynnego minimum jest podobnie zdefiniowany. W wielu przypadkach pojedyncza rodzina zbliża się do obu: maksimum, gdy parametr dąży do dodatniej nieskończoności, minimum, gdy parametr dąży do ujemnej nieskończoności; w symbolach jak i jak . Termin ten może być również używany luźno dla określonej gładkiej funkcji, która zachowuje się podobnie do maksimum, niekoniecznie będąc częścią sparametryzowanej rodziny.

Przykłady

Operator Boltzmanna

Smoothmax z (-x, x) w porównaniu z x dla różnych wartości parametrów. Bardzo gładki dla i bardziej ostry dla .

Dla dużych dodatnich wartości parametru gładkim, różniczkowalnym przybliżeniem maksymalnej. Dla ujemnych wartości parametru, które są duże w wartości bezwzględnej, zbliża się do minimum.

ma następujące właściwości:

  1. jak
  2. to średnia arytmetyczna jego danych wejściowych
  3. jak

Gradient jest ściśle związany z softmax i jest określony przez

To sprawia, że ​​funkcja softmax jest przydatna w technikach optymalizacji wykorzystujących opadanie gradientu .

Ten operator jest czasami nazywany operatorem Boltzmanna, po rozkładzie Boltzmanna .

LogSumExp

Kolejnym płynnym maksimum jest LogSumExp :

Można to również znormalizować, jeśli są nieujemne, dając funkcję o domenie zakresie :

Termin koryguje fakt, że przez anulowanie wszystkich oprócz jednego jeśli wszystkie .

Mellowmax

Operator mellowmax jest zdefiniowany w następujący sposób:

Jest operatorem nieekspansywnym. Jako działa Jako działa jak średnia Jako działa Ten operator może być postrzegany jako szczególna instancja średniej quasi-arytmetycznej . Można to również wyprowadzić z zasad teorii informacji jako sposobu regulowania polityk z funkcją kosztu określoną przez dywergencję KL. Operator był wcześniej wykorzystywany w innych obszarach, np. w energetyce.

p-Norma

Kolejnym płynnym maksimum jest p-norma :

która jest zbieżna do jak .

Zaletą p-normy jest to, że jest normą . Jako taka jest niezmienna w skali ( jednorodna ): , i spełnia nierówność trójkąta .

Płynna jednostka maksymalna

Następujący operator binarny nosi nazwę Smooth Maximum Unit (SMU):

gdzie jest parametrem. jak , i tak .

Zobacz też

https://www.johndcook.com/soft_maximum.pdf

M. Lange, D. Zühlke, O. Holz i T. Villmann, „Zastosowania norm lp i ich gładkich przybliżeń do kwantyzacji wektorów uczenia opartej na gradiencie”, w Proc. ESANN , kwiecień 2014, s. 271-276. ( https://www.elen.ucl.ac.be/Proceedings/esann/esannpdf/es2014-153.pdf )