Proces Galtona-Watsona
Proces Galtona-Watsona to rozgałęziony proces stochastyczny wynikający ze statystycznego badania Francisa Galtona dotyczącego wymierania nazwisk . Proces modeluje nazwiska rodowe jako patrylinearne (przekazywane z ojca na syna), podczas gdy potomstwo jest losowo płci męskiej lub żeńskiej, a imiona wygasają, jeśli linia nazwiska rodowego wymiera (posiadacze nazwiska rodowego umierają bez męskich potomków). Jest to dokładny opis chromosomu Y w genetyce, a zatem model jest przydatny do zrozumienia haplogrupy DNA ludzkiego chromosomu Y. Podobnie, ponieważ mitochondria są dziedziczone tylko w linii matczynej, to samo sformułowanie matematyczne opisuje transmisję mitochondriów. Formuła ma ograniczoną przydatność w zrozumieniu rzeczywistych rozkładów nazwisk, ponieważ w praktyce nazwiska zmieniają się z wielu innych powodów, a wymieranie linii nazwisk to tylko jeden z czynników.
Historia
Wiktoriańczycy obawiali się , że arystokratyczne nazwiska [ potrzebny przykład ] wymierają. Galton pierwotnie zadał matematyczne pytanie dotyczące rozmieszczenia nazwisk w wyidealizowanej populacji w wydaniu The Educational Times z 1873 roku , a wielebny Henry William Watson odpowiedział rozwiązaniem. Następnie razem napisali artykuł z 1874 roku zatytułowany „O prawdopodobieństwie wyginięcia rodzin” w Journal of the Anthropological Institute of Great Britain and Ireland (obecnie Journal of the Royal Anthropological Institute ). Wydaje się, że Galton i Watson wyprowadzili swój proces niezależnie od wcześniejszej pracy IJ Bienaymé ; zob. Heyde i Seneta 1977. Szczegółową historię zob. Kendall (1966 i 1975).
koncepcje
Załóżmy, na potrzeby modelu, że nazwiska są przekazywane wszystkim dzieciom płci męskiej przez ich ojca. Załóżmy, że liczba synów człowieka jest zmienną losową o rozkładzie na zbiorze { 0, 1, 2, 3, ... }. Załóżmy dalej, że liczba synów różnych mężczyzn jest niezależnymi zmiennymi losowymi, z których wszystkie mają ten sam rozkład.
Zatem najprostszym istotnym wnioskiem matematycznym jest to, że jeśli średnia liczba synów człowieka wynosi 1 lub mniej, to ich nazwisko prawie na pewno wymrze, a jeśli jest więcej niż 1, to istnieje większe niż zero prawdopodobieństwo, że przetrwa dowolnej liczby pokoleń.
obejmują prawdopodobieństwo przeżycia nowego zmutowanego genu lub zainicjowanie jądrowej reakcji łańcuchowej , dynamikę wybuchów chorób w pierwszych pokoleniach ich rozprzestrzeniania się lub szanse wyginięcia małej populacji organizmów ; a także wyjaśnienie (być może najbliższe pierwotnym zainteresowaniom Galtona), dlaczego tylko garstka mężczyzn w głębokiej przeszłości ludzkości ma teraz jakichkolwiek ocalałych potomków linii męskiej, co znajduje odzwierciedlenie w raczej niewielkiej liczbie charakterystycznych haplogrupy DNA ludzkiego chromosomu Y.
Konsekwencją wysokiego prawdopodobieństwa wyginięcia jest to, że jeśli linia przetrwała , prawdopodobnie doświadczyła, wyłącznie przez przypadek, niezwykle wysokiego tempa wzrostu we wczesnych pokoleniach, przynajmniej w porównaniu z resztą populacji.
Definicja matematyczna
0 Proces Galtona-Watsona to proces stochastyczny { X n }, który ewoluuje zgodnie ze wzorem nawrotu X = 1 i
gdzie zbiorem niezależnych oraz identycznie rozłożone zmienne losowe o wartościach liczb naturalnych.
W analogii z nazwiskami rodowymi X n można traktować jako liczbę potomków (wzdłuż linii męskiej) w n -tym pokoleniu i można traktować jako liczbę (męskich) dzieci j-tego z tych potomków. Relacja powtarzalności mówi, że liczba potomków w n + 1. pokoleniu jest sumą wszystkich potomków n- tego pokolenia liczby dzieci tego potomka.
Prawdopodobieństwo wyginięcia (tj. prawdopodobieństwo ostatecznego wyginięcia) jest określone wzorem
Jest to wyraźnie równe zeru, jeśli każdy członek populacji ma dokładnie jednego potomka. Wyłączając ten przypadek (zwykle nazywany przypadkiem trywialnym) istnieje prosty warunek konieczny i wystarczający, który jest podany w następnej sekcji.
Kryterium ekstynkcji dla procesu Galtona-Watsona
W przypadku nietrywialnym prawdopodobieństwo ostatecznego wyginięcia jest równe 1, jeśli E { ξ 1 } ≤ 1 i ściśle mniejsze niż 1, jeśli E { ξ 1 } > 1.
Proces ten można traktować analitycznie, stosując metodę funkcji generujących prawdopodobieństwo .
Jeśli liczba dzieci ξ j w każdym węźle jest zgodna z rozkładem Poissona z parametrem λ, można znaleźć szczególnie prostą rekurencję dla całkowitego prawdopodobieństwa wyginięcia x n dla procesu rozpoczynającego się od pojedynczego osobnika w czasie n = 0:
podając powyższe krzywe.
Biseksualny proces Galtona-Watsona
W opisanym powyżej klasycznym procesie nazwiska rodowego Galtona-Watsona należy wziąć pod uwagę tylko mężczyzn, ponieważ tylko mężczyźni przekazują swoje nazwisko rodowe potomkom. To skutecznie oznacza, że rozmnażanie można modelować jako bezpłciowe. (Podobnie, jeśli analizuje się transmisję mitochondrialną, należy wziąć pod uwagę tylko kobiety, ponieważ tylko kobiety przekazują swoje mitochondria potomkom.)
Modelem bardziej zbliżonym do rzeczywistego rozmnażania płciowego jest tak zwany „ biseksualny proces Galtona – Watsona ”, w którym rozmnażają się tylko pary. [ potrzebne źródło ] ( Biseksualizm w tym kontekście odnosi się do liczby zaangażowanych płci, a nie do orientacji seksualnej .) W tym procesie każde dziecko jest uważane za mężczyznę lub kobietę, niezależnie od siebie, z określonym prawdopodobieństwem, a tzw. „funkcja kojarzenia” określa, ile par utworzy się w danym pokoleniu. Tak jak poprzednio, reprodukcję różnych par uważa się za niezależną od siebie. Teraz analogia trywialnego przypadku odpowiada przypadkowi, w którym każdy samiec i samica rozmnażają się dokładnie w jednej parze, mając jednego potomka samca i jedną samicę, a funkcja kojarzenia przyjmuje wartość minimum liczby samców i samic (co są wtedy takie same od następnej generacji).
Ponieważ całkowita reprodukcja w ciągu pokolenia zależy teraz silnie od funkcji kojarzenia, generalnie nie istnieje prosty warunek konieczny i wystarczający do ostatecznego wyginięcia, jak ma to miejsce w klasycznym procesie Galtona-Watsona. [ potrzebne źródło ] Jednakże, wyłączając przypadek nietrywialny, koncepcja uśrednionej średniej reprodukcji (Bruss (1984)) dopuszcza ogólny warunek wystarczający dla ostatecznego wyginięcia, omówiony w następnej sekcji.
Kryterium ekstynkcji
Jeśli w nietrywialnym przypadku uśredniona średnia reprodukcji na parę pozostaje ograniczona przez wszystkie pokolenia i nie przekroczy 1 dla wystarczająco dużej liczebności populacji, to prawdopodobieństwo ostatecznego wyginięcia wynosi zawsze 1.
Przykłady
Przytaczanie historycznych przykładów procesu Galtona-Watsona jest skomplikowane ze względu na historię nazwisk często znacznie odbiegających od modelu teoretycznego. Warto zauważyć, że można tworzyć nowe nazwiska, istniejące można zmieniać przez całe życie, a ludzie w przeszłości często przyjmowali imiona osób niepowiązanych, zwłaszcza szlachty. Tak więc niewielka liczba nazwisk obecnie sama w sobie nie jest dowodem na to, że nazwiska wymarły z czasem lub że wymarły one z powodu wymarcia linii rodowych – wymaga to, aby nazwisk było więcej w przeszłości i że wymierają z powodu wymarcia linii, a nie zmiany nazwy z innych powodów, takich jak przyjęcie przez wasali imienia ich pana.
Chińskie imiona są dobrze zbadanym przykładem wymierania nazwisk: obecnie w Chinach używa się tylko około 3100 nazwisk, w porównaniu z blisko 12 000 zarejestrowanymi w przeszłości, przy czym 22% populacji nosi imiona Li , Wang i Zhang ( liczba blisko 300 milionów osób) oraz 200 najpopularniejszych nazw obejmujących 96% populacji. Imiona zmieniły się lub wymarły z różnych powodów, takich jak ludzie przyjmujący imiona swoich władców, uproszczenia ortograficzne, tabu przeciwko używaniu znaków z imienia cesarza , pośród innych. Chociaż wymieranie linii rodowych może być czynnikiem wymierania nazwisk, nie jest to bynajmniej jedyny, ani nawet znaczący czynnik. Rzeczywiście, najbardziej znaczącym czynnikiem wpływającym na częstotliwość nazwisk są inne grupy etniczne identyfikujące się jako Han i przyjmujące imiona Han. Co więcej, chociaż z różnych powodów pojawiły się nowe nazwy, przeważyło nad tym zniknięcie starych nazw.
Z kolei niektóre narody dopiero niedawno przyjęły nazwiska rodowe. Oznacza to zarówno, że przez dłuższy czas nie doświadczyli wymarcia nazwisk, jak i że imiona zostały przyjęte, gdy naród miał stosunkowo dużą populację, a nie mniejsze populacje z czasów starożytnych. Co więcej, nazwy te były często wybierane twórczo i są bardzo różnorodne. Przykłady obejmują:
- Japońskie imiona , które w powszechnym użyciu datowane są dopiero na okres restauracji Meiji pod koniec XIX wieku (kiedy populacja wynosiła ponad 30 000 000), mają ponad 100 000 nazwisk rodowych, nazwiska są bardzo zróżnicowane, a rząd ogranicza pary małżeńskie do używania tego samego nazwiska.
- Wiele nazwisk holenderskich zawiera formalne nazwisko rodowe dopiero od czasów wojen napoleońskich na początku XIX wieku. Wcześniej nazwiska pochodziły od patronimów (np. Jansen = syn Jana), cech osobistych (np. de Rijke = bogaty), położenia geograficznego (np. van Rotterdam) i zawodów (np. Visser = rybak), czasem nawet połączone (np. Jan Jansz van Rotterdam). Istnieje ponad 68 000 holenderskich nazwisk.
- Nazwiska tajskie zawierają nazwisko rodowe dopiero od 1920 r. I tylko jedna rodzina może używać danego nazwiska rodowego; stąd istnieje duża liczba tajskich imion. Ponadto Tajowie z pewną częstotliwością zmieniają nazwiska rodowe, co komplikuje analizę.
Z drugiej strony, niektóre przykłady dużej koncentracji nazwisk nie wynikają głównie z procesu Galtona – Watsona:
- Nazwy wietnamskie mają około 100 nazwisk, przy czym 60% populacji ma trzy nazwiska. Szacuje się, że sama nazwa Nguyễn jest używana przez prawie 40% populacji Wietnamu, a 90% ma 15 imion. Jednak, jak pokazuje historia nazwy Nguyễn , jest to w dużej mierze spowodowane imionami narzuconymi ludziom lub przyjętymi z powodów niezwiązanych z pokrewieństwem genetycznym.
Zobacz też
Dalsza lektura
- F. Thomasa Brussa (1984). „Uwaga na temat kryteriów wymierania dla biseksualnych procesów Galtona-Watsona”. Journal of Applied Probability 21 : 915–919.
- CC Heyde i E Seneta (1977). IJ Bienayme: Przewidywana teoria statystyczna . Berlin, Niemcy.
- Kendall, DG (1966). „Procesy rozgałęzienia od 1873 roku”. Journal of London Mathematical Society . s1-41: 385-406. doi : 10.1112/jlms/s1-41.1.385 . ISSN 0024-6107 .
- Kendall, DG (1975). „Genealogia procesów rozgałęziania genealogii przed (i po) 1873”. Biuletyn Londyńskiego Towarzystwa Matematycznego . 7 (3): 225–253. doi : 10.1112/blms/7.3.225 . ISSN 0024-6093 .