Absorbujący łańcuch Markowa

Przykładem absorbującego łańcucha Markowa jest chód (skończonego) pijaka .

W matematycznej teorii prawdopodobieństwa łańcuch Markowa pochłaniający to łańcuch Markowa , w którym każdy stan może osiągnąć stan pochłaniający. Stan absorbujący to stan, w który raz wkroczy się i nie można go opuścić.

Podobnie jak ogólne łańcuchy Markowa, mogą istnieć łańcuchy Markowa pochłaniające czas ciągły z nieskończoną przestrzenią stanów. Jednak ten artykuł koncentruje się na przypadku dyskretnej przestrzeni stanów w czasie dyskretnym.

Definicja formalna

Łańcuch Markowa jest łańcuchem absorbującym, jeśli

  1. istnieje co najmniej jeden stan absorbujący i
  2. możliwe jest przejście z dowolnego stanu do co najmniej jednego stanu pochłaniającego w skończonej liczbie kroków.

W absorbującym łańcuchu Markowa stan, który nie jest absorbujący, nazywany jest przejściowym.

Forma kanoniczna

Niech absorbujący łańcuch Markowa z macierzą przejść P ma t stanów przejściowych i r stanów absorbujących. W przeciwieństwie do typowej macierzy przejść, wiersze P reprezentują źródła, podczas gdy kolumny reprezentują miejsca docelowe. Następnie

0 gdzie Q jest macierzą t -by- t , R jest niezerową macierzą t -by- r , jest macierzą r -by- t zero, a I r jest macierzą tożsamości r -by- r . Zatem Q opisuje prawdopodobieństwo przejścia z jednego stanu przejściowego do innego, podczas gdy R opisuje prawdopodobieństwo przejścia z pewnego stanu przejściowego do stanu pochłaniającego.

Prawdopodobieństwo przejścia z i do j w dokładnie k krokach to ( i , j ) -wejściowa Pk , obliczona dalej poniżej. Biorąc pod uwagę tylko stany przejściowe, prawdopodobieństwo znalezione w lewym górnym rogu P k , wejście ( i , j ) Q k .

Matryca fundamentalna

Oczekiwana liczba wizyt w stanie przejściowym

Podstawową właściwością absorbującego łańcucha Markowa jest oczekiwana liczba odwiedzin stanu przejściowego j, począwszy od stanu przejściowego i (przed wchłonięciem). Można to ustalić na podstawie wpisu ( i , j ) tzw. macierzy fundamentalnej N , otrzymanej przez zsumowanie Q k dla wszystkich k (od 0 do ∞). Można to udowodnić

gdzie I t jest t -bajtową macierzą identyczności. Obliczenie tego wzoru jest macierzystym odpowiednikiem szeregu geometrycznego skalarów:

Mając w ręku macierz N , można łatwo uzyskać także inne własności łańcucha Markowa.

Oczekiwana liczba kroków przed wchłonięciem

Oczekiwaną liczbę kroków przed wchłonięciem w dowolnym stanie pochłaniania, gdy rozpoczyna się stan przejściowy i, można obliczyć za pomocą sumy stanów przejściowych. Wartość jest podawana w i- tym wpisie wektora

gdzie 1 to wektor kolumnowy długości- t , którego wszystkie wpisy są równe 1.

Absorpcja prawdopodobieństw

przez indukcję,

Prawdopodobieństwo ostatecznego pochłonięcia w stanie pochłaniania j , gdy zaczyna się od stanu przejściowego i, jest określone przez wejście ( i , j ) macierzy

.

Liczba kolumn tej macierzy jest równa liczbie stanów absorbujących r .

Przybliżenie tych prawdopodobieństw można również uzyskać bezpośrednio z wejścia ( ja , jot dla wystarczająco dużej wartości k , kiedy i indeksem stanu przejściowego, a wskaźnik stanu absorbującego. To dlatego, że

.

Przejściowe prawdopodobieństwa odwiedzin

Prawdopodobieństwo przejścia do stanu przejściowego j przy rozpoczynaniu od stanu przejściowego i to wejście ( i , j ) macierzy

gdzie N dg jest macierzą diagonalną o tej samej przekątnej co N .

Wariancja liczby wizyt przejściowych

Wariancja liczby wejść do stanu przejściowego j rozpoczynającego się od stanu przejściowego i (przed wchłonięciem) to ( i , j )-wejście macierzy

gdzie N sq jest iloczynem Hadamarda N z samym sobą (tj. każdy wpis N jest podniesiony do kwadratu).

Różnice w liczbie kroków

Wariancja liczby kroków przed wchłonięciem, gdy startuje się ze stanu przejściowego i, to i- ta pozycja wektora

gdzie t sq jest iloczynem Hadamarda t z samym sobą (tj. tak jak w przypadku N sq , każdy wpis t jest podniesiony do kwadratu).

Przykłady

Generowanie ciągów

Rozważ proces wielokrotnego rzucania uczciwą monetą , aż pojawi się sekwencja (orzeł, reszka, orzeł). Proces ten jest modelowany przez absorbujący łańcuch Markowa z macierzą przejść

Pierwszy stan reprezentuje pusty ciąg znaków , drugi stan łańcucha „H”, trzeci stan łańcucha „HT”, a czwarty stan łańcucha „HTH”. Chociaż w rzeczywistości rzuty monetą ustają po wygenerowaniu ciągu „HTH”, perspektywa absorbującego łańcucha Markowa jest taka, że ​​proces przeszedł do stanu pochłaniania reprezentującego ciąg „HTH” i dlatego nie może wyjść.

Dla tego absorbującego łańcucha Markowa podstawową macierzą jest

Oczekiwana liczba kroków rozpoczynających się od każdego ze stanów przejściowych wynosi

Dlatego oczekiwana liczba rzutów monetą przed obserwacją sekwencji (orzeł, reszka, orzeł) wynosi 10, wpis dla stanu reprezentującego pusty ciąg.

Skumulowane prawdopodobieństwo zakończenia gry Snakes and Ladders po kolei N

Gry losowe

Gry całkowicie oparte na przypadku mogą być modelowane przez absorbujący łańcuch Markowa. Klasycznym tego przykładem jest starożytna indyjska gra planszowa Węże i drabiny . Wykres po lewej przedstawia masę prawdopodobieństwa w samotnym stanie pochłaniania, który reprezentuje ostatni kwadrat, gdy macierz przejścia jest podnoszona do coraz większych potęg. Aby określić oczekiwaną liczbę tur wymaganych do zakończenia gry, oblicz wektor t w sposób opisany powyżej i zbadaj t start , które wynosi w przybliżeniu 39,2.

Testy na choroby zakaźne

Testy na choroby zakaźne, czy to produktów krwiopochodnych, czy w klinikach medycznych, są często nauczane jako przykład absorbującego łańcucha Markowa. Na przykład publiczny model Amerykańskich Centrów Kontroli i Prewencji Chorób (CDC) dotyczący HIV i wirusowego zapalenia wątroby typu B ilustruje właściwość polegającą na tym, że wchłanianie łańcuchów Markowa może prowadzić do wykrycia choroby, w przeciwieństwie do utraty wykrycia za pomocą innych środków.

W standardowym modelu CDC łańcuch Markowa ma pięć stanów, stan, w którym osoba jest niezainfekowana, następnie stan z zainfekowanym, ale niewykrywalnym wirusem, stan z wykrywalnym wirusem i absorbujące stany wyjścia/zagubienia z kliniki, lub wykrycia (cel). Typowe szybkości przejść między stanami Markowa to prawdopodobieństwo p na jednostkę czasu zarażenia wirusem, w dla szybkości usuwania okresu okna (czas do wykrycia wirusa), q dla szybkości opuszczania/utraty z systemu oraz d do wykrywania, zakładając typową szybkość, zdrowotnej przeprowadza testy danego produktu krwiopochodnego lub pacjentów.

Klasyczny przykład modelu badań przesiewowych w kierunku HIV lub wirusa zapalenia wątroby

Wynika z tego, że możemy „spacerować” po modelu Markowa, aby określić ogólne prawdopodobieństwo wykrycia osoby startującej jako niewykrytej, mnożąc prawdopodobieństwa przejścia do każdego kolejnego stanu modelu jako:

.

Późniejsza całkowita bezwzględna liczba fałszywie ujemnych testów – główny problem CDC – byłaby wtedy wskaźnikiem testów pomnożonym przez prawdopodobieństwo osiągnięcia zainfekowanego, ale niewykrywalnego stanu, razy czas pozostawania w zainfekowanym, niewykrywalnym stanie:

.

Zobacz też

Linki zewnętrzne