Filtry, pola losowe i model maksymalnej entropii

W dziedzinie fizyki i prawdopodobieństwa model filtrów , pól losowych i maksymalnej entropii (FRAME) jest modelem pola losowego Markowa (lub rozkładem Gibbsa ) stacjonarnych procesów przestrzennych, w których funkcja energii jest sumą niezmiennika translacji potencjalne funkcje, które są jednowymiarowymi nieliniowymi transformacjami liniowych odpowiedzi filtrów. Model FRAME został pierwotnie opracowany przez Song-Chun Zhu , Ying Nian Wu i Davida Mumforda do modelowania stochastycznych wzorów tekstur, takich jak trawy, liście drzew, ceglane ściany, fale wodne itp. Ten model jest maksymalnym rozkładem entropii, który odtwarza obserwowane krańcowe histogramy odpowiedzi z banku filtrów (takich jak filtry Gabora lub falki Gabora), gdzie dla każdego filtra dostrojonego do określonej skali i orientacji histogram krańcowy jest sumowany dla wszystkich pikseli w domenie obrazu. Udowodniono również, że model FRAME jest odpowiednikiem zespołu mikrokanonicznego, który nazwano zespołem Julesza. Próbnik Gibbsa jest przystosowany do syntezy obrazów tekstur poprzez pobieranie próbek z modelu FRAME.

Oryginalny model FRAME jest jednorodny do modelowania tekstur. Xie i in. zaproponował rzadki model FRAME, który jest niejednorodnym uogólnieniem oryginalnego modelu FRAME, w celu modelowania wzorców obiektów, takich jak ciała zwierząt, twarze itp. Jest to niestacjonarny model pola losowego Markowa, który odtwarza obserwowane właściwości statystyczne odpowiedzi filtrów w podzbiorze wybranych lokalizacji, skal i orientacji. Rozrzedzony model FRAME można uznać za odkształcalny szablon.

Głęboki model FRAME jest głębokim uogólnieniem oryginalnego modelu FRAME. Zamiast używać filtrów liniowych, jak w oryginalnym modelu FRAME, Lu i in. używa filtrów w określonej splotowej warstwie wyuczonej wcześniej sieci ConvNet. Zamiast polegać na wstępnie wyszkolonych filtrach z istniejącej sieci ConvNet, Xie i in. sparametryzowałem funkcję energii modelu FRAME strukturą ConvNet i nauczyłem się wszystkich parametrów od podstaw. Głęboki model FRAME to pierwsza struktura, która integruje nowoczesną głęboką sieć neuronową z głębokiego uczenia i dystrybucję Gibbsa z fizyki statystycznej. Głębokie modele FRAME są dalej uogólniane do modelowania wzorców wideo, wolumetrycznych wzorców kształtów 3D