Model pierwszego uderzenia
Zdarzenia są często wyzwalane, gdy proces stochastyczny lub losowy po raz pierwszy napotka próg. Próg może być barierą, granicą lub określonym stanem systemu. Czas potrzebny procesowi stochastycznemu , rozpoczynającemu się od pewnego stanu początkowego, do napotkania progu po raz pierwszy, jest różnie nazywany czasem pierwszego uderzenia . W statystyce modele pierwszego uderzenia są podklasą modeli przetrwania . Czas pierwszego uderzenia, zwany także pierwszego przejścia zestawu barier w odniesieniu do przypadku procesu stochastycznego to czas do pierwszego wejścia .
Mówiąc bardziej potocznie, czas pierwszego przejścia w systemie stochastycznym to czas, w którym zmienna stanu osiąga określoną wartość. Zrozumienie tego miernika pozwala lepiej zrozumieć obserwowany system fizyczny i jako taki był tematem badań w bardzo różnych dziedzinach, od ekonomii po ekologię .
Pomysł, że czas pierwszego uderzenia procesu stochastycznego może opisywać czas do wystąpienia zdarzenia, ma długą historię, począwszy od zainteresowania czasem pierwszego przejścia procesów dyfuzji Wienera w ekonomii, a następnie w fizyce na początku XX wieku. Modelowanie prawdopodobieństwa ruiny finansowej jako pierwszego okresu przejścia było wczesnym zastosowaniem w dziedzinie ubezpieczeń. Zainteresowanie matematycznymi właściwościami czasów pierwszego uderzenia oraz modelami statystycznymi i metodami analizy danych dotyczących przeżycia pojawiało się stale od połowy do końca XX wieku.
Przykłady
Typowym przykładem modelu pierwszego trafienia jest problem ruiny , taki jak ruina hazardzisty . W tym przykładzie podmiot (często opisywany jako hazardzista lub firma ubezpieczeniowa) ma pewną ilość pieniędzy, która zmienia się losowo w czasie, być może z pewnym dryfem . Model uwzględnia zdarzenie, w którym ilość pieniędzy osiągnie 0, co oznacza bankructwo. Model może odpowiadać na pytania, takie jak prawdopodobieństwo, że nastąpi to w skończonym czasie lub średni czas, do którego to nastąpi.
Modele pierwszego uderzenia można zastosować do oczekiwanego czasu życia pacjentów lub urządzeń mechanicznych. Gdy proces po raz pierwszy osiąga niekorzystny stan progowy, pacjent umiera lub urządzenie się psuje.
Czas pierwszego przejścia jednowymiarowej cząstki Browna
Jednym z najprostszych i wszechobecnych systemów stochastycznych jest układ cząstki Browna w jednym wymiarze. Układ ten opisuje ruch cząstki, która porusza się stochastycznie w przestrzeni jednowymiarowej, z jednakowym prawdopodobieństwem ruchu w lewo lub w prawo. Biorąc pod uwagę, że ruchy Browna są często używane jako narzędzie do zrozumienia bardziej złożonych zjawisk, ważne jest zrozumienie prawdopodobieństwa pierwszego przejścia cząstki Browna do miejsca oddalonego od jej położenia początkowego. Odbywa się to za pomocą następujących środków.
Funkcję gęstości prawdopodobieństwa (PDF) dla cząstki w jednym wymiarze można znaleźć, rozwiązując jednowymiarowe równanie dyfuzji . (To równanie stwierdza, że gęstość prawdopodobieństwa pozycji dyfunduje na zewnątrz w czasie. Można powiedzieć, że śmietanka w filiżance kawy była początkowo zawarta w jakimś małym miejscu. Po długim czasie śmietanka rozproszyła się w całym napoju równomiernie.) Mianowicie,
p ; gdzie jest pozycją cząstki w określonym czasie, początkową pozycją oznakowanej cząstki, a jest dyfuzją jednostkami SI pośrednia miara prędkości Słupek w argumencie prawdopodobieństwa chwilowego odnosi się do prawdopodobieństwa warunkowego. Równanie dyfuzji stwierdza, że szybkość zmiany w czasie prawdopodobieństwa znalezienia cząstki w drodze takiego prawdopodobieństwa w tej
Można wykazać, że jednowymiarowy plik PDF jest
że prawdopodobieństwo znalezienia cząstki w jest Gaussa, a szerokość Gaussa jest zależna od Dokładniej, Full Width at Half Maximum (FWHM) – technicznie rzecz biorąc, jest to właściwie Full Duration at Half Maximum, ponieważ zmienną niezależną jest czas – skale takie jak
Korzystając z pliku PDF, można wyprowadzić średnią danej funkcji w czasie L
gdzie średnia jest przejmowana przez całą przestrzeń (lub dowolną odpowiednią zmienną).
Gęstość czasu pierwszego przejścia (FPTD) to prawdopodobieństwo, że cząstka po raz pierwszy osiągnęła punkt dokładnie w czasie nie w pewnym momencie w przedziale do t {\ ). Tę gęstość prawdopodobieństwa można obliczyć na podstawie prawdopodobieństwa przeżycia (bardziej powszechna miara prawdopodobieństwa w statystykach). Rozważ absorbujący warunek brzegowy (indeks dolny c dla punktu absorpcji jest skrótem dla cliff used in many texts as an analogy to an absorption point). The PDF satisfying this boundary condition is given by
dla . że cząstka pozostawała w pozycji przez cały czas aż do
gdzie jest funkcją błędu . Zależność między FPTD jest następująca: prawdopodobieństwo, że cząstka osiągnęła punkt absorpcji między czasami a t wynosi . Jeśli użyje się przybliżenia Taylora pierwszego rzędu, definicja FPTD jest następująca):
Używając równania dyfuzji i całkując, jawny FPTD jest
Czas pierwszego przejścia cząstki Browna jest zatem zgodny z rozkładem Lévy'ego .
Z powyższego wynika, że
gdzie . To równanie stwierdza, że prawdopodobieństwo, że cząstka Browna dokona pierwszego przejścia w pewnym długim czasie (zdefiniowanym w powyższym akapicie) staje się coraz mniejsze, ale zawsze skończone .
Pierwszy moment FPTD jest rozbieżny (ponieważ jest to tzw. rozkład z grubym ogonem ), dlatego nie można obliczyć średniego FPT, więc zamiast tego można obliczyć typowy czas , czas, w którym FPTD osiąga maksimum ( ), tj.
Zastosowania po raz pierwszy w wielu rodzinach procesów stochastycznych
Czasy pierwszego uderzenia są głównymi cechami wielu rodzin procesów stochastycznych, w tym procesów Poissona , procesów Wienera , procesów gamma i łańcuchów Markowa , by wymienić tylko kilka. Stan procesu stochastycznego może reprezentować na przykład siłę systemu fizycznego, stan zdrowia jednostki lub kondycję finansową firmy. System, osoba lub firma zawodzi lub doświadcza innego krytycznego punktu końcowego, gdy proces po raz pierwszy osiąga stan progowy. Krytycznym zdarzeniem może być zdarzenie niepożądane (takie jak awaria sprzętu, zastoinowa niewydolność serca lub rak płuc) lub zdarzenie pozytywne (takie jak powrót do zdrowia po chorobie, wypis ze szpitala, narodziny dziecka lub powrót do pracy po urazie). Upływ czasu do wystąpienia tego krytycznego zdarzenia jest zwykle ogólnie interpretowany jako „czas przeżycia”. W niektórych zastosowaniach próg jest zbiorem wielu stanów, więc bierze się pod uwagę konkurencyjne czasy pierwszego uderzenia w celu osiągnięcia pierwszego progu w zestawie, jak ma to miejsce w przypadku rozważania konkurencyjnych przyczyn awarii sprzętu lub śmierci pacjenta.
Regresja progowa: regresja pierwszego trafienia
Praktyczne zastosowania modeli teoretycznych dla czasów pierwszego trafienia często obejmują struktury regresji . Kiedy modele czasu pierwszego trafienia są wyposażone w struktury regresji uwzględniające dane współzmiennych, taką strukturę regresji nazywamy regresją progową struktury regresji . Stan progowy, parametry procesu, a nawet skala czasu mogą zależeć od odpowiednich współzmiennych. Regresja progowa zastosowana do danych dotyczących czasu do zdarzenia pojawiła się od początku tego stulecia i gwałtownie wzrosła, jak opisano w artykule z ankiety z 2006 roku i jego odniesieniach. Zbadano powiązania między modelami regresji progowej wywodzącymi się z czasów pierwszego trafienia a wszechobecnym modelem regresji proporcjonalnego hazardu Coxa. Zastosowania regresji progowej obejmują wiele dziedzin, w tym nauki fizyczne i przyrodnicze, inżynierię, nauki społeczne, ekonomię i biznes, rolnictwo, zdrowie i medycyna.
Utajone vs obserwowalne
W wielu rzeczywistych zastosowaniach model pierwszego uderzenia (FHT) ma trzy podstawowe komponenty: (1) nadrzędny proces stochastyczny , który może być ukryty, (2) próg (lub bariera) i (3) skala czasu . Czas pierwszego uderzenia definiuje się jako czas, w którym proces stochastyczny po raz pierwszy osiąga wartość progową. Bardzo ważne jest rozróżnienie, czy ścieżka próbki procesu macierzystego jest ukryta (tj. nieobserwowalna), czy obserwowalna, a takie rozróżnienie jest charakterystyczne dla modelu FHT. Zdecydowanie najczęściej występują procesy utajone. Jako możemy Taki proces Wienera można zdefiniować za pomocą parametru średniego, wariancji i wartości początkowej .
Operacyjna lub analityczna skala czasu
Skalą czasu procesu stochastycznego może być czas kalendarzowy lub zegarowy lub bardziej operacyjna miara postępu czasu, taka jak przebieg samochodu, skumulowane zużycie elementu maszyny lub skumulowana ekspozycja na toksyczne opary. W wielu zastosowaniach proces stochastyczny opisujący stan systemu jest ukryty lub nieobserwowalny, a jego właściwości należy wywnioskować pośrednio z cenzurowanych danych czasu do zdarzenia i/lub odczytów wykonanych w czasie na skorelowanych procesach, takich jak procesy znaczników. Słowo „regresja” w regresji progowej odnosi się do modeli pierwszego trafienia, w których do modelu wstawia się jedną lub więcej struktur regresji w celu połączenia parametrów modelu ze zmiennymi objaśniającymi lub współzmiennymi. Parametrami struktur regresji mogą być parametry procesu stochastycznego, stan progowy i/lub sama skala czasowa.
Zobacz też
- Whitmore, GA (1986). „Modele czasu pierwszego przejścia dla struktur regresji danych dotyczących czasu trwania i konkurencyjnych ryzyk”. Statystyk . 35 (2): 207–219. doi : 10.2307/2987525 . JSTOR 2987525 .
- Whitmore, GA (1995). „Szacowanie degradacji w procesie dyfuzji Wienera z błędem pomiaru”. Analiza danych w ciągu całego życia . 1 (3): 307–319. doi : 10.1007/BF00985762 . PMID 9385107 . S2CID 28077957 .
- Whitmore, Georgia; Crowder, MJ; Bezprawia, JF (1998). „Wnioskowanie o błędach z procesu znacznikowego opartego na dwuwymiarowym modelu Wienera”. Analiza danych w ciągu całego życia . 4 (3): 229–251. doi : 10.1023/A:1009617814586 . PMID 9787604 . S2CID 43301120 .
- Redner, S. (2001). Przewodnik po procesach pierwszego przejścia . Wydawnictwo Uniwersytetu Cambridge. ISBN 0-521-65248-0 .
- Lee, M.-LT; Whitmore, Georgia (2006). „Regresja progowa do analizy przeżycia: modelowanie czasów zdarzeń za pomocą procesu stochastycznego”. Nauka statystyczna . 21 (4): 501–513. ar Xiv : 0708.0346 . doi : 10.1214/088342306000000330 . S2CID 88518120 .
- Bachelier, L. (1900). „Teoria spekulacji” . Annales Scientifiques de l'École Normale Supérieure . 3 (17): 21–86. doi : 10.24033/asens.476 .
- Schrodinger, E. (1915). „Zur Theorie der Fall-und Steigversuche an Teilchen mit Brownscher Bewegung”. Physikalische Zeitschrift . 16 : 289–295.
- Smoluchowski, MV (1915). „Notiz über die Berechnung der Brownschen Molekularbewegung bei der Ehrenhaft-millikanschen Versuchsanordnung”. Physikalische Zeitschrift . 16 : 318–321.
- Lundberg F. (1903). Approximerad Framställning av Sannolikehetsfunktionen, Återförsäkering av Kollektivrisker . Almqvist & Wiksell, Uppsala.
- Tweedie, MCK (1945). „Odwrotne zmienne statystyczne” . Natura . 155 (3937): 453. Bibcode : 1945Natur.155..453T . doi : 10.1038/155453a0 .
- Tweedie, MCK (1957). „Właściwości statystyczne odwrotnych rozkładów Gaussa - I” . Roczniki statystyki matematycznej . 28 (2): 362–377. doi : 10.1214/aoms/1177706964 .
- Tweedie, MCK (1957). „Właściwości statystyczne odwrotnych rozkładów Gaussa - II” . Roczniki statystyki matematycznej . 28 (3): 696–705. doi : 10.1214/aoms/1177706881 .
- Whitmore, Georgia; Neufeldt, AH (1970). „Zastosowanie modeli statystycznych w badaniach nad zdrowiem psychicznym”. Byk. Matematyka Biofiza . 32 (4): 563–579. doi : 10.1007/BF02476771 . PMID 5513393 .
- Lancaster, T. (1972). „Model stochastyczny na czas trwania strajku”. J. Roy. Statystyk. soc. Ser. A. _ 135 : 257–271. doi : 10.2307/2344321 . JSTOR 2344321 .
- Cox, DR (1972). „Modele regresji i tablice życia (z dyskusją)” . JR Stat Soc Ser B. 187 : 187–230.
- Lee, M.-LT; Whitmore, GA (2010). „Prógowe proporcjonalne hazardy i regresja progowa: ich teoretyczne i praktyczne powiązania” . Analiza danych w ciągu całego życia . 16 (2): 196–214. doi : 10.1007/s10985-009-9138-0 . PMC 6447409 . PMID 19960249 .
- Aaron, SD; Ramsay, T.; Vandemheen, K.; Whitmore, GA (2010). „Model regresji progowej dla nawracających zaostrzeń przewlekłej obturacyjnej choroby płuc”. Journal of Clinical Epidemiology . 63 (12): 1324–1331. doi : 10.1016/j.jclinepi.2010.05.007 . PMID 20800447 .
- Chambaz, A.; Choudat, D.; Huber, C.; Pairon, J.; Van der Lann, MJ (2014). „Analiza narażenia zawodowego na azbest na podstawie modelowania regresji progowej danych kliniczno-kontrolnych” . Biostatystyka . 15 (2): 327–340. doi : 10.1093/biostatistics/kxt042 . PMID 24115271 .
- Aaron, SD; Stephensona, AL; Cameron, DW; Whitmore, GA (2015). „Model statystyczny do przewidywania rocznego ryzyka zgonu u pacjentów z mukowiscydozą”. Journal of Clinical Epidemiology . 68 (11): 1336-1345. doi : 10.1016/j.jclinepi.2014.12.010 . PMID 25655532 .
- On, X.; Whitmore, Georgia; Loo, GY; Hochberg, MC; Lee, M.-LT (2015). „Model czasu do złamania ze strumieniem uderzeniowym nałożonym na postępującą degradację: badanie złamań osteoporotycznych” . Statystyka w medycynie . 34 (4): 652–663. doi : 10.1002/sym.6356 . PMC 4314426 . PMID 25376757 .
- Hou, W.-H.; Chuang, HY-Y; Lee, M.-LT (2016). „Model regresji progowej do przewidywania powrotu do pracy po urazie kończyny”. uraz . 47 (2): 483–489. doi : 10.1016/j.injury.2015.11.032 . PMID 26746983 .