Przybliżenie Vecchia

Przybliżenie Vecchia to technika aproksymacji procesów Gaussa , pierwotnie opracowana przez Aldo Vecchię, statystyka z United States Geological Survey . Jest to jedna z najwcześniejszych prób wykorzystania procesów Gaussa w ustawieniach wielowymiarowych. Od tego czasu został szeroko uogólniony, dając początek wielu współczesnym przybliżeniom.

Intuicja

Wspólny rozkład prawdopodobieństwa dla zdarzeń oznaczonych można wyrazić Jak

Przybliżenie Vecchii ma postać np.

dokładny, gdy zdarzenia są bliskie warunkowo niezależnej, biorąc pod uwagę wiedzę o . Oczywiście można było alternatywnie wybrać przybliżenie

więc użycie przybliżenia wymaga pewnej wiedzy o tym, które zdarzenia są bliskie warunkowo niezależnych, biorąc pod uwagę inne. Co więcej, mogliśmy wybrać na przykład inną kolejność

Na szczęście w wielu przypadkach istnieją dobre heurystyki, które decydują o tym, jak skonstruować przybliżenie.

Mówiąc bardziej technicznie, ogólne wersje przybliżenia prowadzą do rzadkiego czynnika Cholesky'ego w macierzy precyzji. Użycie standardowej faktoryzacji Cholesky'ego daje wpisy, które można interpretować jako korelacje warunkowe z zerami wskazującymi na brak niezależności (ponieważ model jest gaussowski). Te relacje niezależności można alternatywnie wyrazić za pomocą modeli graficznych i istnieją twierdzenia łączące strukturę grafu i uporządkowanie wierzchołków z zerami we współczynniku Cholesky'ego. W szczególności wiadomo, że zależności zakodowane w grafie moralnym prowadzą do czynników Cholesky'ego macierzy precyzji, które nie mają wypełnienia .

Opis formalny

Problem

Niech procesem Gaussa indeksowanym przez funkcję funkcję kowariancji . Załóżmy, że jest skończonym podzbiorem S {\ Displaystyle {\ mathcal {S x wektorem wartości oceniane na , . dla . Załóżmy dalej, że obserwuje się gdzie z . W tym kontekście dwa najczęstsze zadania wnioskowania obejmują ocenę prawdopodobieństwa

lub przewidywanie wartości dla s i } czyli obliczenie

Oryginalna receptura

Oryginalna metoda Vecchia zaczyna się od obserwacji, że wspólna gęstość obserwacji można zapisać jako iloczyn rozkładów warunkowych

Przybliżenie Vecchia zakłada zamiast tego, że dla niektórych

Vecchia zasugerował również, aby powyższe przybliżenie zastosować do obserwacji, które są uporządkowane leksykograficznie przy użyciu ich współrzędnych przestrzennych. Chociaż jego prosta metoda ma wiele słabości, zmniejszyła złożoność obliczeniową do . Wiele z jego braków zostało rozwiązanych przez późniejsze uogólnienia.

Ogólne sformułowanie

Choć koncepcyjnie proste, założenie przybliżenia Vecchii często okazuje się dość restrykcyjne i niedokładne. To zainspirowało ważne uogólnienia i ulepszenia wprowadzone w wersji podstawowej na przestrzeni lat: włączenie ukrytych zmiennych, bardziej wyrafinowane warunkowanie i lepsze uporządkowanie. Różne szczególne przypadki ogólnego przybliżenia Vecchia można opisać w kategoriach sposobu wybierania tych trzech elementów.

Zmienne ukryte

rozszerzenia metody Vecchia w jej z tak jak w poprzedniej sekcji

ponieważ biorąc pod uwagę zmienne są niezależne od .

Zamawianie

Powszechnie zauważono, że oryginalne uporządkowanie leksykograficzne oparte na współrzędnych, gdy , daje słabe wyniki. Niedawno zaproponowano inne uporządkowania, z których niektóre zapewniają, że punkty są uporządkowane w sposób quasi-losowy. Wysoce skalowalne, wykazano również, że drastycznie poprawiają dokładność.

Kondycjonowanie

Podobnie jak w wersji podstawowej opisanej powyżej, dla danego uporządkowania ogólne przybliżenie Vecchia można zdefiniować jako

gdzie . Ponieważ wynika, że wyrazy zastąpić . Okazuje się jednak, że czasami warunkowanie niektórych obserwacji rzadkość czynnika Cholesky'ego macierzy precyzji . Dlatego zamiast tego można rozważyć zbiory i takie, że wyrazić jak

wyboru i _ NNGP), siatkowy proces Gaussa i podejście aproksymacji wielu rozdzielczości (MRA) przy użyciu , standardowe Vecchia przy użyciu i rzadki generał Vecchia, gdzie zarówno jak i nie są puste.

Oprogramowanie

Opracowano kilka pakietów, które implementują niektóre warianty przybliżenia Vecchia.

  • GPvecchia to pakiet R dostępny przez CRAN (język programowania R), który implementuje większość wersji przybliżenia Vecchia
  • GpGp to pakiet R dostępny przez CRAN (język programowania R) , który implementuje skalowalną metodę porządkowania problemów przestrzennych, co znacznie poprawia dokładność.
  • spNNGP to pakiet R dostępny przez CRAN (język programowania R), który implementuje ukryte przybliżenie Vecchia
  • pyMRA to pakiet Pythona dostępny przez pyPI implementujący aproksymację wielu rozdzielczości, specjalny przypadek ogólnej metody Vecchia używanej w dynamicznych modelach przestrzeni stanów
  • meshed to pakiet R dostępny przez CRAN (język programowania R) , który implementuje wielowymiarowe przestrzenne lub czasoprzestrzenne modele regresji wielowymiarowej Bayesa oparte na utajonym procesie Meshed Gaussa (MGP) przy użyciu przybliżeń Vecchia w partycjonowanych domenach

Notatki