Przybliżenie Vecchia
Przybliżenie Vecchia to technika aproksymacji procesów Gaussa , pierwotnie opracowana przez Aldo Vecchię, statystyka z United States Geological Survey . Jest to jedna z najwcześniejszych prób wykorzystania procesów Gaussa w ustawieniach wielowymiarowych. Od tego czasu został szeroko uogólniony, dając początek wielu współczesnym przybliżeniom.
Intuicja
Wspólny rozkład prawdopodobieństwa dla zdarzeń oznaczonych można wyrazić Jak
Przybliżenie Vecchii ma postać np.
dokładny, gdy zdarzenia są bliskie warunkowo niezależnej, biorąc pod uwagę wiedzę o . Oczywiście można było alternatywnie wybrać przybliżenie
więc użycie przybliżenia wymaga pewnej wiedzy o tym, które zdarzenia są bliskie warunkowo niezależnych, biorąc pod uwagę inne. Co więcej, mogliśmy wybrać na przykład inną kolejność
Na szczęście w wielu przypadkach istnieją dobre heurystyki, które decydują o tym, jak skonstruować przybliżenie.
Mówiąc bardziej technicznie, ogólne wersje przybliżenia prowadzą do rzadkiego czynnika Cholesky'ego w macierzy precyzji. Użycie standardowej faktoryzacji Cholesky'ego daje wpisy, które można interpretować jako korelacje warunkowe z zerami wskazującymi na brak niezależności (ponieważ model jest gaussowski). Te relacje niezależności można alternatywnie wyrazić za pomocą modeli graficznych i istnieją twierdzenia łączące strukturę grafu i uporządkowanie wierzchołków z zerami we współczynniku Cholesky'ego. W szczególności wiadomo, że zależności zakodowane w grafie moralnym prowadzą do czynników Cholesky'ego macierzy precyzji, które nie mają wypełnienia .
Opis formalny
Problem
Niech procesem Gaussa indeksowanym przez funkcję funkcję kowariancji . Załóżmy, że jest skończonym podzbiorem S {\ Displaystyle {\ mathcal {S x wektorem wartości oceniane na , . dla . Załóżmy dalej, że obserwuje się gdzie z . W tym kontekście dwa najczęstsze zadania wnioskowania obejmują ocenę prawdopodobieństwa
lub przewidywanie wartości dla s i } czyli obliczenie
Oryginalna receptura
Oryginalna metoda Vecchia zaczyna się od obserwacji, że wspólna gęstość obserwacji można zapisać jako iloczyn rozkładów warunkowych
Przybliżenie Vecchia zakłada zamiast tego, że dla niektórych
Vecchia zasugerował również, aby powyższe przybliżenie zastosować do obserwacji, które są uporządkowane leksykograficznie przy użyciu ich współrzędnych przestrzennych. Chociaż jego prosta metoda ma wiele słabości, zmniejszyła złożoność obliczeniową do . Wiele z jego braków zostało rozwiązanych przez późniejsze uogólnienia.
Ogólne sformułowanie
Choć koncepcyjnie proste, założenie przybliżenia Vecchii często okazuje się dość restrykcyjne i niedokładne. To zainspirowało ważne uogólnienia i ulepszenia wprowadzone w wersji podstawowej na przestrzeni lat: włączenie ukrytych zmiennych, bardziej wyrafinowane warunkowanie i lepsze uporządkowanie. Różne szczególne przypadki ogólnego przybliżenia Vecchia można opisać w kategoriach sposobu wybierania tych trzech elementów.
Zmienne ukryte
rozszerzenia metody Vecchia w jej z tak jak w poprzedniej sekcji
ponieważ biorąc pod uwagę zmienne są niezależne od .
Zamawianie
Powszechnie zauważono, że oryginalne uporządkowanie leksykograficzne oparte na współrzędnych, gdy , daje słabe wyniki. Niedawno zaproponowano inne uporządkowania, z których niektóre zapewniają, że punkty są uporządkowane w sposób quasi-losowy. Wysoce skalowalne, wykazano również, że drastycznie poprawiają dokładność.
Kondycjonowanie
Podobnie jak w wersji podstawowej opisanej powyżej, dla danego uporządkowania ogólne przybliżenie Vecchia można zdefiniować jako
gdzie . Ponieważ wynika, że wyrazy zastąpić . Okazuje się jednak, że czasami warunkowanie niektórych obserwacji rzadkość czynnika Cholesky'ego macierzy precyzji . Dlatego zamiast tego można rozważyć zbiory i takie, że wyrazić jak
wyboru i _ NNGP), siatkowy proces Gaussa i podejście aproksymacji wielu rozdzielczości (MRA) przy użyciu , standardowe Vecchia przy użyciu i rzadki generał Vecchia, gdzie zarówno jak i nie są puste.
Oprogramowanie
Opracowano kilka pakietów, które implementują niektóre warianty przybliżenia Vecchia.
- GPvecchia to pakiet R dostępny przez CRAN (język programowania R), który implementuje większość wersji przybliżenia Vecchia
- GpGp to pakiet R dostępny przez CRAN (język programowania R) , który implementuje skalowalną metodę porządkowania problemów przestrzennych, co znacznie poprawia dokładność.
- spNNGP to pakiet R dostępny przez CRAN (język programowania R), który implementuje ukryte przybliżenie Vecchia
- pyMRA to pakiet Pythona dostępny przez pyPI implementujący aproksymację wielu rozdzielczości, specjalny przypadek ogólnej metody Vecchia używanej w dynamicznych modelach przestrzeni stanów
- meshed to pakiet R dostępny przez CRAN (język programowania R) , który implementuje wielowymiarowe przestrzenne lub czasoprzestrzenne modele regresji wielowymiarowej Bayesa oparte na utajonym procesie Meshed Gaussa (MGP) przy użyciu przybliżeń Vecchia w partycjonowanych domenach