Uogólniony funkcjonalny model liniowy
Uogólniony funkcjonalny model liniowy ( GFLM ) jest rozszerzeniem uogólnionego liniowego modelu (GLM), który pozwala na regresję jednowymiarowych odpowiedzi różnych typów (ciągłych lub dyskretnych) na predyktory funkcjonalne, które są w większości losowymi trajektoriami generowanymi przez całkowalny kwadratowo stochastyczny procesy . Podobnie jak w przypadku GLM, funkcja łączenia wiąże oczekiwaną wartość zmiennej odpowiedzi z predyktorem liniowym, który w przypadku GFLM uzyskuje się przez utworzenie iloczynu skalarnego funkcji predyktora losowego funkcją . Funkcjonalna regresja liniowa, funkcjonalna regresja Poissona i funkcjonalna regresja dwumianowa, w tym ważna funkcjonalna regresja logistyczna, to szczególne przypadki GFLM. Zastosowania GFLM obejmują klasyfikację i dyskryminację procesów stochastycznych oraz danych funkcjonalnych .
Przegląd
Kluczowym aspektem GFLM jest oszacowanie i wnioskowanie dla gładkiej funkcji parametru, zwykle uzyskuje się przez wymiarów nieskończonego wymiarowego predyktora funkcyjnego. Powszechną 2 , metodą jest rozwinięcie funkcji predykcyjnej bazie ortonormalnej L przestrzeni Hilberta funkcji całkowalnych do kwadratu z jednoczesnym rozwinięciem funkcji parametru na tej samej podstawie . Ta reprezentacja jest następnie łączona z krokiem obcinania, aby zmniejszyć udział funkcji parametru liniowym do skończonej liczby współczynników regresji. Funkcjonalna analiza głównych składowych (FPCA), która wykorzystuje rozwinięcie Karhunena-Loève'a, jest powszechnym i oszczędnym podejściem do osiągnięcia tego celu. Inne rozwinięcia ortogonalne, takie jak rozwinięcia Fouriera i rozwinięcia B-sklejane, mogą być również zastosowane w etapie redukcji wymiarów. Kryterium informacyjne Akaike (AIC) może być wykorzystane do wyboru liczby uwzględnionych komponentów. Minimalizacja walidacji krzyżowej to kolejne kryterium często stosowane w aplikacjach klasyfikacyjnych. Po zmniejszeniu wymiaru procesu predyktora uproszczony predyktor liniowy pozwala na wykorzystanie GLM i quasi-wiarygodności w celu uzyskania oszacowań współczynników regresji skończenie wymiarowej, które z kolei zapewniają oszacowanie funkcji w GFLM.
Elementy modelu
Predyktor liniowy
Funkcje predykcyjne rzeczywistym funkcją gładkiego parametru , zakłada się, że jest całkowalny do kwadratu na . Biorąc uwagę rzeczywistą miarę predyktor liniowy jest dany przez { X to wyśrodkowany proces predykcyjny, a to skalar, który służy jako punkt przecięcia.
Zmienna odpowiedzi i funkcja wariancji
Wynik jest zazwyczaj zmienną losową o wartości rzeczywistej, która może być ciągła lub Często rozkład warunkowy, pod uwagę proces predykcyjny, jest określony w wykładniczej . Jednak wystarczy również rozważyć układ funkcjonalnej quasi-wiarygodności, w którym zamiast rozkładu odpowiedzi określa się warunkową funkcję wariancji , jako funkcja średniej warunkowej .
Funkcja łącza
Funkcja łączenia funkcją odwracalną, która odnosi średnią warunkową odpowiedzi z predyktorem liniowym . Zależność jest określona przez .
Sformułowanie
Aby zaimplementować niezbędną redukcję wymiarów, wyśrodkowany proces predykcyjny parametru rozszerzane jako ,
gdzie jest bazą ortonormalną przestrzeni funkcyjnej takie, że gdzie jeśli i inaczej.
jot są podane przez i współczynniki jak dla .
i i oznaczające więc .
ortonormalności funkcji bazowych od razu, .
do przez dobranego punkt obcięcia .
FPCA daje najbardziej oszczędne przybliżenie predyktora liniowego dla danej liczby funkcji bazowych, ponieważ podstawa funkcji własnej wyjaśnia więcej zmienności niż jakikolwiek inny zestaw funkcji bazowych.
pierwszą pochodną błąd aproksymacji modelu -obciętego, pierwszych składników, jest stałą wielokrotnością .
Heurystyczna motywacja dla strategii obcinania wywodzi się z faktu, że co jest konsekwencją nierówności Cauchy'ego-Schwarza i zauważając, że prawa strona ostatniej nierówności zbiega się do 0, ponieważ ponieważ oba i są skończone.
W szczególnym przypadku podstawy funkcji własnej sekwencja odpowiada sekwencji sol .
Dla danych z ustawienie , \ i , przybliżone predyktory liniowe można przedstawić jako przez .
Oszacowanie
Głównym celem jest oszacowanie funkcji parametru .
Po , standardowe metody GLM i metody quasi-wiarygodności mogą być użyte dla modelu w celu oszacowania szacowania lub równanie wyniku
U , który zależy od przez η {\ .
Podobnie jak w GLM, równanie przy użyciu metod iteracyjnych, takich jak Newton-Raphson ( ) lub punktacja Fishera (FS) lub ponownie ważonych metodą najmniejszych kwadratów ) do oszacowanie współczynników regresji do oszacowania funkcji parametru . W przypadku korzystania z łącza kanonicznego te metody są równoważne.
Wyniki są dostępne w literaturze -obciętych jako a także testy asymptotyczne p {\ displaystyle p} dla efektów regresji i asymptotycznych regionów ufności .
Wykładnicza odpowiedź rodziny
Jeśli zmienna odpowiedzi , biorąc pod uwagę rodziną jednego parametru, to jego funkcja gęstości prawdopodobieństwa lub funkcja masy prawdopodobieństwa (w zależności od przypadku) jest
i do {\ displaystyle , gdzie jest parametrem kanonicznym, a jest parametrem dyspersji, który jest zazwyczaj przyjmuje się, że jest dodatni.
do oraz z własności rodziny wykładniczej,
Stąd służy jako funkcja kanoniczną funkcją łączenia
jest odpowiednią funkcją wariancji i dyspersji
Przypadki specjalne
Funkcjonalna regresja liniowa (FLR)
Funkcjonalna regresja liniowa, jedno z najbardziej użytecznych narzędzi funkcjonalnej analizy danych, jest przykładem GFLM, w którym zmienna odpowiedzi jest ciągła i często zakłada się, że ma rozkład normalny . Funkcja wariancji jest funkcją stałą, a funkcją łączenia jest tożsamość. Przy tych założeniach GFLM redukuje się do FLR,
Bez założenia o normalności funkcja stałej wariancji motywuje do stosowania technik quasi-normalnych.
Funkcjonalna regresja binarna
Gdy zmienna odpowiedzi ma wyniki binarne, tj. 0 lub 1, rozkład jest zwykle wybierany jako Bernoulliego , a następnie . Popularnymi funkcjami łączącymi są funkcja expit, która jest odwrotnością funkcji logit (funkcjonalna regresja logistyczna) i funkcji probit (funkcjonalna regresja probit). Każda skumulowana funkcja dystrybucji F ma zakres [0,1] , który jest zakresem średniej dwumianowej, a zatem może być wybrana jako funkcja łącząca. Inną funkcją łączenia w tym kontekście jest komplementarna funkcja log-log , która jest łączem asymetrycznym. Funkcja wariancji dla danych binarnych jest dana przez gdzie parametr dyspersji się jako 1 lub alternatywnie stosuje się podejście quasi-wiarygodności.
Funkcjonalna regresja Poissona
Inny szczególny przypadek GFLM występuje, gdy liczy się wyniki, więc zakłada się, że rozkład odpowiedzi to Poissona . Średnia zwykle połączona z predyktorem liniowym za pośrednictwem łącza logarytmicznego, które Funkcja wariancji to , gdzie parametr dyspersji wynosi 1, z wyjątkiem sytuacji, gdy dane mogą być nadmiernie rozproszone, czyli gdy stosuje się podejście quasi-Poissona.
Rozszerzenia
Zaproponowano rozszerzenia GFLM dla przypadków, w których istnieje wiele funkcji predykcyjnych. Inne uogólnienie nosi nazwę półparametrycznej regresji quasi-wiarygodności (SPQR), która uwzględnia sytuację, w której związek i funkcje wariancji są nieznane i są szacowane nieparametrycznie na podstawie danych. Sytuację tę można również obsłużyć za pomocą modeli z jednym lub wieloma indeksami, stosując na przykład regresję odwrotną Sliced Inverse Regression (SIR).
Innym rozszerzeniem w tej domenie jest Functional Generalized Additive Model (FGAM)), który jest uogólnieniem uogólnionego modelu addytywnego (GAM), gdzie
gdzie są współczynnikami rozszerzenia losowej funkcji predyktora i każda nieznaną gładką funkcją, którą należy oszacować X { i gdzie }
Ogólnie rzecz biorąc, oszacowanie w FGAM wymaga połączenia IWLS z dopasowaniem wstecznym . Jeśli jednak współczynniki ekspansji zostaną uzyskane jako główne składowe funkcjonalne, to w niektórych przypadkach (np. funkcja predyktora Gaussa będą one niezależne, w którym to przypadku dopasowanie wsteczne nie jest potrzebne i można użyć popularnych metod wygładzania dla oszacowanie nieznanych funkcji parametrów .
Aplikacja
Popularny zestaw danych, który był używany do wielu analiz w dziedzinie analizy danych funkcjonalnych, obejmuje liczbę jaj złożonych dziennie aż do śmierci 1000 śródziemnomorskich muszek owocówek (lub w skrócie meszków) [1] [ 2 ] . Poniższy wykres pokazuje trajektorie składania jaj w ciągu pierwszych 25 dni życia około 600 samic meszkówek (tych, które mają co najmniej 20 pozostałych jaj w swoim życiu). Krzywe w kolorze czerwonym należą do much, które złożą mniej niż mediana liczby pozostałych jaj, podczas gdy krzywe w kolorze niebieskim dotyczą much, które złożą więcej niż mediana liczby pozostałych jaj po 25 roku życia. Powiązany problem z klasyfikacją meszkówek jako długowieczne lub krótkotrwałe na podstawie początkowych trajektorii składania jaj jako predyktorów i późniejszej długowieczności much jako odpowiedzi badano za pomocą GFLM