Metody cząstek pola średniego

Metody cząstek średniego pola to szeroka klasa algorytmów Monte Carlo typu oddziałującego , służących do symulacji na podstawie sekwencji rozkładów prawdopodobieństwa spełniających nieliniowe równanie ewolucji. Te przepływy miar prawdopodobieństwa zawsze można interpretować jako rozkłady losowych stanów procesu Markowa, którego prawdopodobieństwa przejścia zależą od rozkładów bieżących stanów losowych. Naturalnym sposobem symulacji tych wyrafinowanych nieliniowych procesów Markowa jest próbkowanie dużej liczby kopii procesu, zastępując w równaniu ewolucji nieznane rozkłady losowych stanów próbkowanymi miary empiryczne . W przeciwieństwie do tradycyjnych metod Monte Carlo i łańcuchów Markowa, metody Monte Carlo te techniki średniego pola opierają się na sekwencyjnych oddziałujących próbkach . Terminologia pola średniego odzwierciedla fakt, że każda z próbek (aka cząstek, osobników, wędrowców, agentów, stworzeń lub fenotypów) oddziałuje z empirycznymi miarami procesu. Kiedy rozmiar systemu dąży do nieskończoności, te losowe miary empiryczne zbiegają się z deterministycznym rozkładem losowych stanów nieliniowego łańcucha Markowa, tak że statystyczna interakcja między cząstkami zanika. Innymi słowy, zaczynając od chaotycznej konfiguracji opartej na niezależnych kopiach stanu początkowego nieliniowego modelu łańcucha Markowa, chaos propaguje się w dowolnym horyzoncie czasowym, gdy rozmiar systemu dąży do nieskończoności; to znaczy skończone bloki cząstek sprowadzają się do niezależnych kopii nieliniowego procesu Markowa. Wynik ten nazywany jest właściwością propagacji chaosu. Terminologia „szerzenie chaosu” pochodzi z pracy Mark Kac w 1976 roku na modelu gazu kinetycznego zderzającego się średniego pola.

Historia

Teoria modeli cząstek oddziałujących ze średnim polem z pewnością rozpoczęła się w połowie lat sześćdziesiątych XX wieku wraz z pracą Henry'ego P. McKeana Jr. nad interpretacjami Markowa klasy nieliniowych parabolicznych równań różniczkowych cząstkowych pojawiających się w mechanice płynów. Matematyczne podstawy tych klas modeli zostały opracowane od połowy lat 80. do połowy lat 90. przez kilku matematyków, w tym Wernera Brauna, Klausa Heppa, Karla Oelschlägera, Gérarda Bena Arousa i Marca Brunauda, ​​Donalda Dawsona, Jeana Vaillancourta i Jürgena Gärtnera. Christian Léonard, Sylvie Méléard , Sylvie Roelly , Alain-Sol Sznitman i Hiroshi Tanaka za modele typu dyfuzyjnego; F. Alberto Grünbaum, Tokuzo Shiga, Hiroshi Tanaka, Sylvie Méléard i Carl Graham za ogólne klasy oddziałujących procesów dyfuzji skokowej.

Cytujemy również wcześniejszy, pionierski artykuł Theodore'a E. Harrisa i Hermana Kahna , opublikowany w 1951 roku, wykorzystujący metody genetyczne średniego pola, ale podobne do heurystycznych, do szacowania energii transmisji cząstek. Metody cząstek typu genetycznego pola średniego są również używane jako heurystyczne algorytmy wyszukiwania naturalnego (znane również jako metaheurystyka ) w obliczeniach ewolucyjnych. Początków tych technik obliczeniowych pola średniego można doszukiwać się w latach 1950 i 1954 wraz z pracami Alana Turinga nad maszynami uczącymi się mutacji typu genetycznego oraz artykułami Nilsa Aalla Barricelli z Instytut Studiów Zaawansowanych w Princeton, New Jersey . Australijski genetyk Alex Fraser opublikował również w 1957 roku serię artykułów na temat symulacji typu genetycznego sztucznej selekcji organizmów.

Quantum Monte Carlo , a dokładniej metody dyfuzji Monte Carlo, można również interpretować jako przybliżenie całki po ścieżce Feynmana-Kaca w średnim polu cząstek. Początki metod Quantum Monte Carlo są często przypisywane Enrico Fermiemu i Robertowi Richtmyerowi, którzy w 1948 r. ) do szacowania energii stanu podstawowego układów kwantowych (w modelach zredukowanej macierzy) zawdzięcza Jackowi H. Hetheringtonowi w 1984 r. W chemii molekularnej zastosowanie genetycznych heurystycznych metod cząstek (znanych również jako strategie przycinania i wzbogacania) można prześledzić wstecz do 1955 r. z przełomową pracą Marshalla. N. Rosenblutha i Arianny. W. Rosenblutha.

Pierwszymi pionierskimi artykułami na temat zastosowań tych heurystycznych metod cząstek w problemach filtrowania nieliniowego były niezależne badania Neila Gordona, Davida Salmona i Adriana Smitha (filtr bootstrap), Genshiro Kitagawa (filtr Monte Carlo) oraz Himilcon Carvalho , Pierre Del Moral, André Monin i Gérard Salut opublikowane w latach 90. Termin oddziałujące „filtry cząstek” został po raz pierwszy ukuty w 1996 roku przez Del Morala. Filtry cząstek zostały również opracowane w przetwarzaniu sygnałów na początku lat 1989-1992 przez P. Del Morala, JC Noyera, G. Rigala i G. Saluta w LAAS-CNRS w serii ograniczonych i tajnych raportów badawczych z STCAN (Service Technique des Constructions et Armes Navales), firma informatyczna DIGILOG oraz LAAS-CNRS (Laboratorium Analiz i Architektury Systemów) nad problemami przetwarzania sygnałów RADAR/SONAR i GPS.

Podstawy i pierwsza rygorystyczna analiza konwergencji modeli typu genetycznego i metod cząstek Feynmana-Kaca w polu średnim pochodzą od Pierre'a Del Morala w 1996 r. Metody cząstek typu rozgałęzionego o różnej wielkości populacji zostały również opracowane pod koniec lat 90. przez Dana Crisan, Jessica Gaines i Terry Lyons oraz Dan Crisan, Pierre Del Moral i Terry Lyons. Pierwsze jednorodne wyniki zbieżności w odniesieniu do parametru czasu dla modeli cząstek pola średniego zostały opracowane pod koniec lat 90. przez Pierre'a Del Morala i Alice Guionnet dla procesów typu skoku interakcji oraz przez Florenta Malrieu dla procesów typu dyfuzji nieliniowej.

Nowe klasy technik symulacji cząstek średniego pola dla problemów integracji ścieżek Feynmana-Kac obejmują modele oparte na drzewie genealogicznym, modele cząstek wstecznych, adaptacyjne modele cząstek średniego pola, modele cząstek typu wyspowego i łańcuch cząstek Markowa metody Monte Carlo

Aplikacje

W fizyce , aw szczególności w mechanice statystycznej , te nieliniowe równania ewolucji są często używane do opisania statystycznego zachowania mikroskopijnych oddziałujących cząstek w płynie lub w jakiejś skondensowanej materii. W tym kontekście losowa ewolucja wirtualnego płynu lub cząstki gazu jest reprezentowana przez procesy dyfuzyjne McKeana-Własowa , układy reakcja-dyfuzja lub procesy zderzeń typu Boltzmanna . Jak sama nazwa wskazuje, model cząstek pola średniego reprezentuje zbiorowe zachowanie mikroskopijnych cząstek słabo oddziałujących z ich miarami zajmowania. Makroskopowe zachowanie tych wielociałowych układów cząstek jest zawarte w modelu granicznym uzyskanym, gdy wielkość populacji dąży do nieskończoności. Równania Boltzmanna przedstawiają makroskopową ewolucję zderzających się cząstek w rozrzedzonych gazach, podczas gdy dyfuzje McKeana Własowa reprezentują makroskopowe zachowanie cząstek płynu i gazów ziarnistych.

W fizyce obliczeniowej , a dokładniej w mechanice kwantowej , energie stanu podstawowego układów kwantowych są związane z górną częścią spektrum operatorów Schrödingera. Równanie Schrödingera jest wersją mechaniki kwantowej drugiego prawa dynamiki Newtona mechaniki klasycznej (masa razy przyspieszenie jest sumą sił). To równanie przedstawia ewolucję funkcji falowej (inaczej stanu kwantowego) niektórych układów fizycznych, w tym układów molekularnych, atomowych lub subatomowych, a także układów makroskopowych, takich jak wszechświat. Rozwiązanie równania Schrödingera w czasie urojonym (znanego również jako równanie ciepła) jest podane przez rozkład Feynmana-Kac związany z swobodną ewolucją procesu Markowa (często reprezentowanego przez ruchy Browna) w zbiorze konfiguracji elektronicznych lub makrocząsteczkowych i pewnej funkcji energii potencjalnej. Długotrwałe zachowanie tych nieliniowych półgrup jest związane z górnymi wartościami własnymi i energiami stanu podstawowego operatorów Schrödingera. Interpretacja średniego pola typu genetycznego tych modeli Feynmana-Kac jest określana jako metody Resample Monte Carlo lub Diffusion Monte Carlo. Te algorytmy ewolucyjne typu rozgałęzionego są oparte na przejściach mutacyjnych i selekcyjnych. Podczas przejścia mutacyjnego wędrowcy ewoluują losowo i niezależnie w potencjalnym krajobrazie energetycznym w konfiguracjach cząstek. Proces selekcji średniego pola (inaczej teleportacja kwantowa, rekonfiguracja populacji, ponowne próbkowanie przejścia) jest powiązany z funkcją dopasowania, która odzwierciedla absorpcję cząstek w studni energetycznej. Konfiguracje o niskiej energii względnej są bardziej podatne na powielanie. W chemii molekularnej i fizyce statystycznej do pobierania próbek stosuje się również metody cząstek pola średniego Pomiary Boltzmanna-Gibbsa związane z pewnym harmonogramem chłodzenia i obliczenie ich stałych normalizujących (znanych również jako energia swobodna lub funkcje podziału).

W biologii obliczeniowej , a dokładniej w genetyce populacji , przestrzenne procesy rozgałęzień z mechanizmami selekcji konkurencyjnej i migracji można również przedstawić za pomocą modeli dynamiki populacji typu średniego pola genetycznego . Pierwsze momenty miar okupacji przestrzennego procesu rozgałęzień dają przepływy dystrybucji Feynmana-Kac. Średnie przybliżenie typu genetycznego pola tych przepływów zapewnia interpretację tych procesów rozgałęzień o ustalonej wielkości populacji. Prawdopodobieństwa ekstynkcji można interpretować jako prawdopodobieństwa absorpcji jakiegoś procesu Markowa ewoluującego w jakimś absorbującym środowisku. Te modele absorpcji są reprezentowane przez modele Feynmana-Kac. Długotrwałe zachowanie się tych procesów uwarunkowane niewymieraniem można wyrazić w równoważny sposób przez miary quasi-niezmienne , granice Yagloma lub miary niezmienne nieliniowych znormalizowanych przepływów Feynmana-Kaca.

W informatyce , aw szczególności w sztucznej inteligencji , te algorytmy genetyczne typu pola średniego są używane jako heurystyki wyszukiwania losowego, które naśladują proces ewolucji w celu generowania użytecznych rozwiązań złożonych problemów optymalizacyjnych. Te stochastyczne algorytmy wyszukiwania należą do klasy modeli ewolucyjnych . Chodzi o to, aby propagować populację możliwych rozwiązań kandydujących za pomocą mechanizmów mutacji i selekcji. Średnia interakcja pola między osobnikami jest zawarta w mechanizmach selekcji i krzyżowania.

W średnich grach terenowych i teoriach systemów oddziałujących z wieloma agentami procesy średnich cząstek pola są używane do reprezentowania zbiorowego zachowania złożonych systemów z oddziałującymi jednostkami. W tym kontekście średnia interakcja pola jest zawarta w procesie decyzyjnym oddziałujących agentów. Model ograniczający, ponieważ liczba agentów dąży do nieskończoności, jest czasami nazywany modelem kontinuum agentów

W teorii informacji , a dokładniej w statystycznym uczeniu maszynowym i przetwarzaniu sygnałów , metody średnich cząstek pola są wykorzystywane do sekwencyjnego próbkowania z rozkładów warunkowych jakiegoś losowego procesu w odniesieniu do sekwencji obserwacji lub kaskady rzadkich zdarzeń . W problemach filtrowania nieliniowego w czasie dyskretnym rozkłady warunkowe losowych stanów sygnału przy obserwacjach częściowych i zaszumionych spełniają nieliniowe równanie ewolucji predykcji aktualizacji. Krok aktualizacji określa reguła Bayesa , a krokiem przewidywania jest równanie transportu Chapmana-Kołmogorowa . Interpretacja cząstek średniego pola tych nieliniowych równań filtrowania jest algorytmem cząstek z selekcją typu genetycznego i mutacją. Podczas etapu mutacji cząstki ewoluują niezależnie od siebie zgodnie z przejściami Markowa sygnału. Podczas etapu selekcji cząstki o małych wartościach względnego prawdopodobieństwa są zabijane, podczas gdy cząstki o wysokich wartościach są mnożone. Te techniki średnich cząstek pola są również wykorzystywane do rozwiązywania problemów śledzenia wielu obiektów, a dokładniej do szacowania miar asocjacji

Wersje tych modeli cząstek w czasie ciągłym są interpretacjami cząstek typu Morana w polu średnim dla solidnych optymalnych równań ewolucji filtrów lub stochastycznego równania różniczkowego cząstkowego Kushnera-Stratonoticha. Te genetyczne algorytmy średniego pola cząstek, zwane również filtrami cząstek i sekwencyjnymi metodami Monte Carlo, są szeroko i rutynowo stosowane w badaniach operacyjnych i wnioskach statystycznych. Termin „filtry cząstek stałych” został po raz pierwszy ukuty w 1996 r. Przez Del Moral, a termin „sekwencyjny Monte Carlo” przez Liu i Chen w 1998 r. Symulacja podzbioru i techniki rozdzielania Monte Carlo są szczególnymi przypadkami genetycznych schematów cząstek i modeli cząstek Feynmana-Kac wyposażonych w przejścia mutacji Monte Carlo łańcucha Markowa

Ilustracje metody symulacji średniego pola

Przeliczalne modele przestrzeni stanów

Aby umotywować algorytm symulacji średniego pola, zaczynamy od skończonej lub policzalnej przestrzeni stanów S i niech P ( S ) oznacza zbiór wszystkich miar prawdopodobieństwa na S . Rozważ sekwencję rozkładów prawdopodobieństwa na S spełniających równanie ewolucji:

 

 

 

 

()

dla pewnego, prawdopodobnie nieliniowego, odwzorowania Rozkłady te są podane przez wektory

które spełniają:

Dlatego jest odwzorowaniem z jednostki na siebie, gdzie s oznacza liczność zbioru S. Φ \ Gdy s jest zbyt duże, rozwiązanie równania ( 1 ) jest trudne lub bardzo kosztowny obliczeniowo. Jednym z naturalnych sposobów przybliżenia tych równań ewolucji jest sekwencyjne zmniejszanie przestrzeni stanów za pomocą modelu cząstek średniego pola. Jeden z najprostszych schematów symulacji pola średniego jest zdefiniowany przez łańcuch Markowa

w przestrzeni produktu zaczynając od zmiennych losowych z rozkładem prawdopodobieństwa i elementarnymi przejściami displaystyle

z miarą empiryczną

gdzie funkcją stanu . _ _

Innymi słowy, biorąc pod uwagę próbki są niezależnymi zmiennymi losowymi o rozkładzie prawdopodobieństwa . Uzasadnienie tej techniki symulacji średniego pola jest następujące: Oczekujemy, że gdy jest dobrym przybliżeniem , a następnie jest przybliżeniem . η Φ N ) oczekujemy być dobrym przybliżeniem .

Inną strategią jest znalezienie kolekcji

macierzy stochastycznych indeksowanych przez takie, że

 

 

 

 

()

interpretować stanów } przejścia

Zbiór przejść Markowa 1 ) nazywany McKeana sekwencji Średnia interpretacja cząstki pola ( 2 ) jest teraz zdefiniowana przez łańcuch Markowa

w przestrzeni produktu , zaczynając od niezależnych losowych kopii i elementarnych przejść N

z miarą empiryczną

Przy pewnych słabych warunkach regularności na odwzorowaniu dla dowolnej funkcji prawie pewną zbieżność

Te nieliniowe procesy Markowa i ich interpretacja cząstek średniego pola można rozszerzyć na niejednorodne czasowo modele w ogólnych mierzalnych przestrzeniach stanów.

Modele Feynmana-Kac'a

abstrakcyjne i niektóre funkcje . Z tymi dwoma obiektami wiążemy odwzorowanie

a środki Boltzmanna-Gibbsa zdefiniowane przez

K. zbiór macierzy stochastycznych indeksowanych przez podany przez

dla jakiegoś parametru . Łatwo sprawdzić, czy równanie ( 2 ) jest spełnione. Ponadto możemy również pokazać (por. np.), że rozwiązanie ( 1 ) jest dane wzorem Feynmana-Kac

z łańcuchem początkowym rozkładem przejściem M

Dla dowolnej funkcji mamy

Jeśli jest funkcją jednostkową i , mamy

A równanie ( 2 ) sprowadza się do równania Chapmana-Kołmogorowa

Średnia interpretacja cząstek pola tego modelu Feynmana-Kaca jest definiowana przez próbkowanie sekwencyjne N warunkowo niezależnych zmiennych losowych . z rozkładem prawdopodobieństwa

Innymi słowy, z prawdopodobieństwem _ ewoluuje do nowego stanu losowo wybrany z rozkładem prawdopodobieństwa ; w przeciwnym razie przeskakuje do nowej lokalizacji losowo wybranych z prawdopodobieństwem proporcjonalnym do i ewoluuje do nowego stanu losowo wybrany z rozkładem prawdopodobieństwa Jeśli funkcją jednostkową i , znika, a model cząstki redukuje się do sekwencji niezależnych sol kopie łańcucha Markowa . Kiedy opisany powyżej model cząstek średniego pola redukuje się do prostego algorytmu genetycznego selekcji mutacji z funkcją dopasowania G i przejście mutacji M . Te nieliniowe modele łańcuchów Markowa i ich interpretacja cząstek pola średniego mogą zostać rozszerzone na modele niejednorodne w czasie w ogólnych mierzalnych przestrzeniach stanów (w tym stany przejściowe, przestrzenie ścieżek i przestrzenie losowych wycieczek) oraz modele czasu ciągłego.

Gaussowskie nieliniowe modele przestrzeni stanów

Rozważamy sekwencję zmiennych losowych o wartościach rzeczywistych zdefiniowane sekwencyjnie przez równania

 

 

 

 

()

ze zbiorem standardowych zmiennych losowych Gaussa , dodatnim parametrem σ , niektórymi funkcjami i jakiś standardowy początkowy losowy stan Gaussa . η być rozkładem prawdopodobieństwa stanu losowego ; to znaczy dla dowolnej ograniczonej mierzalnej funkcji f mamy

z

Całka jest całką Lebesgue'a , a dx oznacza nieskończenie małe sąsiedztwo stanu x . Przejście Markowa łańcucha jest podane dla dowolnych ograniczonych mierzalnych funkcji f za pomocą wzoru

z

Korzystając z własności wieży oczekiwań warunkowych , udowadniamy, że rozkłady prawdopodobieństwa spełniają równanie nieliniowe

dla dowolnych ograniczonych mierzalnych funkcji f . To równanie jest czasami zapisywane w bardziej syntetycznej formie

Średnia interpretacja cząstek pola tego modelu jest zdefiniowana przez łańcuch Markowa

w przestrzeni produktu przez

Gdzie

oznacza N niezależnych kopii i odpowiednio Dla modeli regularnych (np. dla ograniczonych funkcji Lipschitza a , b , c ) mamy prawie pewną zbieżność

z miarą empiryczną

dla dowolnych ograniczonych mierzalnych funkcji f (por. np. ). Na powyższym miarę Diraca w x .

Modele pól średnich w czasie ciągłym

Rozważamy standardowy ruch Browna znany również jako proces Wienera sekwencji siatki z danym krokiem czasu . Do w równaniu ( 1 ) zastępujemy i σ przez i i piszemy zamiast wartości stanów losowych Przypominając, że są niezależnymi, wyśrodkowanymi zmiennymi losowymi Gaussa o wariancji otrzymane równanie można przepisać w następującej postaci

 

 

 

 

()

Gdy h → 0, powyższe równanie zbiega się do nieliniowego procesu dyfuzji

Model czasu ciągłego pola średniego związany z tymi nieliniowymi dyfuzjami to (oddziałujący) proces dyfuzji R zdefiniowany przez

Gdzie

N niezależnymi kopiami i Dla regularnych modeli (na przykład dla ograniczonych funkcji Lipschitza a , b ) mamy prawie pewną zbieżność

,

z empiryczne mierzyć

dla dowolnych ograniczonych mierzalnych funkcji f (por. np.). Te nieliniowe procesy Markowa i ich interpretacja cząstek pola średniego można rozszerzyć na interakcje procesów dyfuzji skokowej

Linki zewnętrzne