Ludzki mitochondrialny zegar molekularny

Ludzki zegar molekularny mitochondrialny to tempo, w jakim mutacje gromadziły się w genomie mitochondrialnym hominidów podczas ewolucji człowieka . Archeologiczny zapis działalności człowieka z wczesnych okresów ludzkiej prehistorii jest stosunkowo ograniczony, a jego interpretacja budzi kontrowersje. Ze względu na niepewność wynikającą z zapisów archeologicznych naukowcy zwrócili się ku technikom datowania molekularnego, aby uściślić oś czasu ewolucji człowieka. Głównym celem naukowców w tej dziedzinie jest opracowanie dokładnego mitochondrialnego zegara molekularnego hominidów, który mógłby być następnie wykorzystany do pewnego datowania wydarzeń, które miały miejsce w trakcie ewolucji człowieka.

Szacunki dotyczące tempa mutacji ludzkiego mitochondrialnego DNA (mtDNA) różnią się znacznie w zależności od dostępnych danych i metody zastosowanej do oszacowania. Dwie główne metody szacowania, metody oparte na filogenezie i metody oparte na rodowodzie, dały wskaźniki mutacji, które różnią się prawie o rząd wielkości. Bieżące badania koncentrowały się na rozwiązaniu problemu wysokiej zmienności uzyskanej z różnych szacunków stóp procentowych.

Zmienność kursu

Głównym założeniem teorii zegara molekularnego jest to, że mutacje w obrębie określonego systemu genetycznego zachodzą ze statystycznie jednakową szybkością i tę jednolitą szybkość można wykorzystać do datowania zdarzeń genetycznych. W praktyce założenie jednolitej stawki jest nadmiernym uproszczeniem. Chociaż często stosuje się pojedynczą częstość mutacji, często jest to połączenie lub średnia z kilku różnych częstości mutacji. Wiele czynników wpływa na obserwowane tempo mutacji , a czynniki te obejmują rodzaj próbek, badany region genomu i badany okres czasu.

Rzeczywiste vs. obserwowane stawki

, że tempo, w jakim mutacje występują podczas reprodukcji, wskaźnik mutacji linii płciowej , jest wyższy niż wszystkie zaobserwowane wskaźniki mutacji, ponieważ nie wszystkie mutacje są pomyślnie przekazywane kolejnym pokoleniom. mtDNA jest przekazywane tylko wzdłuż linii matrylinearnej, dlatego mutacje przekazywane synom są tracone. Losowy dryf genetyczny może również powodować utratę mutacji. Z tych powodów rzeczywisty wskaźnik mutacji nie będzie równoważny wskaźnikowi mutacji obserwowanemu z próbki populacji.

Wielkość populacji

Uważa się, że dynamika populacji wpływa na obserwowane wskaźniki mutacji. Gdy populacja się powiększa, w populacji zachowuje się więcej mutacji germinalnych . W rezultacie obserwowane wskaźniki mutacji mają tendencję do wzrostu w rosnącej populacji. Kiedy populacje kurczą się, jak w przypadku wąskiego gardła populacji , więcej mutacji germinalnych zostaje utraconych. Wąskie gardła populacji mają zatem tendencję do spowalniania obserwowanych wskaźników mutacji. Od czasu pojawienia się gatunku homo sapiens około 200 000 lat temu populacja ludzka powiększyła się z kilku tysięcy osobników żyjących w Afryce do ponad 6,5 miliarda na całym świecie. Jednak ekspansja nie była jednolita, więc historia populacji ludzkich może składać się zarówno z wąskich gardeł, jak i ekspansji.

Zmienność strukturalna

Szybkość mutacji w całym genomie mitochondrialnym nie jest równomiernie rozłożona. Wiadomo, że niektóre regiony genomu mutują szybciej niż inne. regiony hiperzmienne są wysoce polimorficzne w stosunku do innych części genomu.

Szybkość gromadzenia się mutacji w regionach kodujących i niekodujących genomu jest również różna, ponieważ mutacje w regionie kodującym podlegają selekcji oczyszczającej . Z tego powodu niektóre badania unikają kodowania regionu lub mutacji niesynonimicznych podczas kalibracji zegara molekularnego. Loogvali i in. (2009) rozważają tylko mutacje synonimiczne, ponownie skalibrowali zegar molekularny ludzkiego mtDNA na 7990 lat na mutację synonimiczną w genomie mitochondrialnym. Soares i in. (2009) rozważ zarówno mutacje regionu kodującego, jak i niekodującego, aby osiągnąć wskaźnik pojedynczej mutacji, ale zastosuj współczynnik korekcji, aby uwzględnić selekcję w regionie kodującym.

Zmienność czasowa

Zaobserwowano, że tempo mutacji zmienia się w czasie. Tempo mutacji w obrębie gatunku ludzkiego jest szybsze niż obserwowane w linii małp człekokształtnych. Uważa się również, że tempo mutacji jest szybsze w ostatnich czasach, od początku holocenu 11 000 lat temu.

Mutacje równoległe i nasycenie

Mutacja równoległa (czasami określana jako homoplazja) lub ewolucja zbieżna występuje, gdy oddzielne linie mają tę samą mutację, niezależnie występują w tym samym miejscu w genomie. Nasycenie występuje, gdy jedno miejsce doświadcza wielu mutacji. Mutacje równoległe i nasycenie powodują niedoszacowanie tempa mutacji, ponieważ prawdopodobnie zostaną przeoczone.

Heteroplazmia

Osoby dotknięte heteroplazmią mają mieszankę typów mtDNA, niektóre z nowymi mutacjami, a niektóre bez. Nowe mutacje mogą, ale nie muszą, być przekazywane kolejnym pokoleniom. Zatem obecność osobników heteroplazmatycznych w próbce może skomplikować obliczenie wskaźników mutacji.

Metody

Oparte na rodowodzie

Metody rodowodowe szacują częstość mutacji, porównując sekwencje mtDNA próbki par rodzic/potomstwo lub analizując sekwencje mtDNA osobników z głęboko zakorzenionej genealogii. Liczba nowych mutacji w próbce jest liczona i dzielona przez całkowitą liczbę zdarzeń transmisji DNA z rodzica na dziecko, aby uzyskać wskaźnik mutacji.

Oparte na filogenezie

Metody oparte na filogenezie szacuje się, najpierw rekonstruując haplotyp ostatniego wspólnego przodka (MRCA) próbki dwóch lub więcej linii genetycznych. Wymagane jest, aby czas do ostatniego wspólnego przodka ( TMRCA ) próbki rodowodów był już znany z innych niezależnych źródeł, zwykle z zapisu archeologicznego. Średnia liczba mutacji, które nagromadziły się od czasu MRCA jest następnie obliczany i dzielony przez TMRCA, aby uzyskać wskaźnik mutacji. Szybkość mutacji u ludzi jest zwykle szacowana poprzez porównanie sekwencji współczesnych ludzi i szympansów, a następnie rekonstrukcję haplotypu przodków wspólnego przodka szympansa i człowieka. Według zapisów paleontologicznych ostatni wspólny przodek człowieka mógł żyć około 6 milionów lat temu.

Porównanie rodowodu z filogenezą

Wskaźniki uzyskane metodami rodowodowymi są około 10 razy szybsze niż te uzyskane metodami filogenetycznymi. Za tę różnicę może odpowiadać kilka czynników działających łącznie. Ponieważ metody rodowodowe rejestrują mutacje u żywych osobników, wskaźniki mutacji z badań rodowodowych są bliższe wskaźnikowi mutacji w linii zarodkowej. Badania rodowodowe wykorzystują genealogie, które są głębokie tylko na kilka pokoleń, podczas gdy metody oparte na filogenezie wykorzystują skale czasowe sięgające tysięcy lub milionów lat. Według Henna i in. 2009, metody oparte na filogenezie uwzględniają zdarzenia, które występują w długich skalach czasowych, a zatem fluktuacje stochastyczne mają na nie mniejszy wpływ. Howell i in. 2003 sugeruje, że selekcja, nasycenie, mutacje równoległe i dryf genetyczny są odpowiedzialne za obserwowane różnice między metodami opartymi na rodowodzie a metodami opartymi na filogenezie.

Szacowanie na podstawie archeologii AMH

Metody/parametry szacowanych archeologicznie dat mitochondrialnej Ewy
Badanie Typ sekwencji

Kotwica T (lokalizacja)

Metoda referencyjna (metoda korekcyjna)
Cann, Stoneking i Wilson (1987) Fragmenty restrykcyjne
40, 30 i 12 Ka

(Australia, Nowa Gwinea , Nowy Świat)


archeologicznie zdefiniowane migracje dopasowane do szacowanych wskaźników rozbieżności sekwencji
Endicott i Ho (2008) Genomowy


40 do 55 Ka (Papua-Nowa Gwinea) 14,5 do 21,5 Ka (Haps H1 i H3)

PNG po haplogrupie P

Anatomiczny współczesny człowiek (AMH) rozprzestrzenił się z Afryki i na dużym obszarze Eurazji i pozostawił artefakty wzdłuż północnego wybrzeża Azji Południowo-Zachodniej, Południowej, Południowo-Wschodniej i Wschodniej. Cann, Stoneking i Wilson (1987) nie opierali się na przewidywanym TCHLCA w celu oszacowania wskaźników polimorfizmu pojedynczego nukleotydu (SNP). Zamiast tego wykorzystali dowody kolonizacji w Azji Południowo-Wschodniej i Oceanii, aby oszacować wskaźniki mutacji. Ponadto wykorzystali technologię RFLP ( polimorfizm długości fragmentów restrykcyjnych ) do zbadania różnic między DNA. Korzystając z tych technik, ta grupa wymyśliła T MRCA od 140 000 do 290 000 lat. Cann i in. (1987) oszacowali TMRCA ludzi na około 210 tys., a najnowsze szacunki Soares et al. 2009 (przy użyciu ludzkiego mtDNA MRCA szympansa sprzed 7 milionów lat) różnią się tylko o 9%, co jest stosunkowo bliskie, biorąc pod uwagę szeroki zakres ufności zarówno dla szacunków, jak i wezwań do bardziej starożytnego T CHLCA .

Endicott i Ho (2008) dokonali ponownej oceny przewidywanych migracji na całym świecie i porównali je z faktycznymi dowodami. Ta grupa używała regionów kodujących sekwencje. Postulują, że zegar molekularny oparty na porównaniach szympansów i ludzi nie jest wiarygodny, szczególnie w przewidywaniu niedawnych migracji, takich jak migracje założycieli do Europy, Australii i Amerykanów. Dzięki tej technice ta grupa wymyśliła T MRCA od 82 000 do 134 000 lat.

Szacowanie na podstawie CHLCA

Ponieważ szympansy i ludzie mają wspólnego matrylinearnego przodka, ustalenie wieku geologicznego tego ostatniego przodka pozwala oszacować tempo mutacji. Ostatni wspólny przodek człowieka i szympansa (CHLCA) jest często stosowany jako kotwica w badaniach mt-T MRCA z cytowanymi w literaturze zakresami od 4 do 13 milionów lat. Jest to jedno ze źródeł zmienności szacunków czasu. Inną słabością jest niezgodna z zegarem akumulacja SNP, która sprawia, że ​​nowsze gałęzie wyglądają na starsze niż są w rzeczywistości.

Wskaźniki SNP opisane przez Soaresa i in. (2009)
Regiony
Subregiony (lub miejsce w kodonie)

Wskaźnik SNP (na witrynę * rok)
Region kontrolny
HVR I 1,6 × 10-7
HVR II 2,3 × 10-7
pozostały 1,5 × 10-8
Kodowanie białek
( 1. i 2. ) 8,8 × 10-9
( 3. miejsce ) 1,9 × 10-8
DNA kodujący rRNA (rDNA) 8,2 × 10-9
DNA kodujący tRNA (tDNA) 6,9 × 10-9
Inny 2,4 × 10-8
T CHLCA przyjęto 6,5 mA, względną częstość w stosunku do 1. i 2. kodonów

Te dwa źródła mogą się równoważyć lub wzmacniać w zależności od kierunku T CHLCA błąd. Istnieją dwa główne powody, dla których ta metoda jest szeroko stosowana. Po pierwsze, wskaźniki oparte na rodowodzie są nieodpowiednie do oszacowań dla bardzo długich okresów czasu. Po drugie, podczas gdy wskaźniki zakotwiczone w archeologii reprezentują zakres pośredni, archeologiczne dowody kolonizacji przez ludzi często pojawiają się długo po kolonizacji. Na przykład uważa się, że kolonizacja Eurazji z zachodu na wschód miała miejsce wzdłuż Oceanu Indyjskiego. Jednak najstarsze stanowiska archeologiczne, które pokazują również anatomicznie współczesnych ludzi (AMH), znajdują się w Chinach i Australii i mają ponad 42 000 lat. Jednak najstarsze indyjskie stanowisko ze szczątkami AMH pochodzi sprzed 34 000 lat, a inne stanowisko z archeologią zgodną z AMH ma ponad 76 000 lat. Dlatego zastosowanie kotwicy jest subiektywną interpretacją tego, kiedy ludzie byli po raz pierwszy obecni.

Prostą miarą rozbieżności sekwencji między ludźmi i szympansami można ustalić, obserwując SNP. Biorąc pod uwagę, że mitogenom ma długość około 16553 par zasad (każda para zasad, którą można dopasować do znanych odniesień, nazywana jest miejscem), wzór jest następujący:

„2” w mianowniku pochodzi od dwóch linii, ludzkiej i szympansiej, które oddzieliły się od CHLCA. Idealnie reprezentuje akumulację mutacji w obu liniach, ale w różnych pozycjach (SNP). Tak długo, jak liczba obserwowanych SNP jest zbliżona do liczby mutacji, ta formuła działa dobrze. Jednak w szybko rozwijających się miejscach mutacje są przesłonięte efektami nasycenia. Sortowanie pozycji w mitogenomie według szybkości i kompensacja nasycenia to podejścia alternatywne.

Ponieważ T CHLCA podlega zmianom wraz z większą liczbą informacji paleontologicznych, równanie opisane powyżej umożliwia porównanie TMRCA z różnych badań.

Metody/parametry szacowania daty mitochondrialnej Ewy
Badanie Typ sekwencji

T CHLCA (czas sortowania)

Metoda referencyjna (metoda korekcyjna)
Czujny i in. (1991) HVR 4 do 6 Ma
Transwersje CH, (przejście 15: 1: transwersja)
Ingmana i in. (2000)
genomowy (nie HVR)
5 maja Porównanie genomu CH
Endicott i Ho (2008)
genomowy (nie HVR)
5 do 7,5 mA
CH (zrelaksowana stawka, zdefiniowana klasa stawek)
Gonder i in. (2007)
genomowy (nie HVR)

6,0 mln lat (+ 0,5 mln lat)

CH (zdefiniowana klasa stawek)
Miszmar i in. (2003)
genomowy (nie HVR)

6,5 mln lat (+ 0,5 mln lat)

CH (zdefiniowana klasa stawek)
Soares i in. (2009) genomowy
6,5 mln lat (+ 0,5 mln lat)
CHLCA zakotwiczony,
(zbadany wybór według Ka/(Ks + k))
Szympans do człowieka = CH, LCA = ostatni wspólny przodek

Wczesne, HVR, metody oparte na sekwencjach

Aby przezwyciężyć skutki nasycenia , analiza HVR oparła się na odległości transwersyjnej między ludźmi a szympansami. Do tej odległości zastosowano współczynnik przejścia do transwersji, aby oszacować rozbieżność sekwencji w HVR między szympansami i ludźmi, i podzielono przez zakładany T CHLCA wynoszący od 4 do 6 milionów lat. Opierając się na 26,4 podstawieniach między szympansem a człowiekiem i stosunku 15:1, oszacowano, że 396 przejść w ciągu 610 par zasad wykazało rozbieżność sekwencji na poziomie 69,2% (współczynnik * T CHLCA 0,369), dając współczynniki rozbieżności wynoszące około 11,5% do 17,3% na milion lat .

HVR jest wyjątkowo podatny na nasycenie, co prowadzi do niedoszacowania wskaźnika SNP przy porównywaniu bardzo odległych linii

Czujny i in. (1991) oszacowali również współczynnik rozbieżności sekwencji dla miejsc w szybko rozwijających się regionach HVR I i HVR II. Jak zauważono w powyższej tabeli, tempo ewolucji jest tak wysokie, że w bezpośrednich porównaniach szympansów i ludzi dochodzi do nasycenia miejsc. W związku z tym w tym badaniu wykorzystano transwersje, które ewoluują wolniej niż bardziej powszechne polimorfizmy przejściowe. Porównując mitogenomy szympansa i człowieka, odnotowali 26,4 transwersji w regionach HVR, jednak nie dokonali korekty nasycenia. Ponieważ po tym badaniu uzyskano więcej sekwencji HVR, zauważono, że miejsce dinukleotydowe CRS: 16181-16182 doświadczyło licznych transwersji w analizie oszczędności, z których wiele uznano za błędy sekwencjonowania. Jednak sekwencjonowanie Feldhofer I Neanderthal ujawnił, że w tym miejscu doszło również do transwersji między ludźmi a neandertalczykami. Ponadto Soares i in. (2009) odnotowali trzy miejsca, w których występowały powtarzające się transwersje w liniach ludzkich, z których dwa znajdują się w HVR I, 16265 (12 przypadków) i 16318 (8 przypadków). Dlatego 26,4 transwersji było niedoszacowaniem prawdopodobnej liczby zdarzeń transwersji. W badaniu z 1991 roku wykorzystano również stosunek przejścia do transwersji z badania małp starego świata wynoszący 15: 1. [ potrzebne źródło ] Jednak badanie HVR szympansów i goryli ujawnia wskaźnik, który jest niższy, a badanie ludzi wskazuje na wskaźnik 34: 1. Dlatego w tym badaniu nie doceniono tego poziomu rozbieżności sekwencji między szympansem a człowiekiem. Oszacowana rozbieżność sekwencji 0,738/miejsce (w tym transwersje) jest znacznie niższa niż ~2,5 na miejsce sugerowane przez Soaresa i in. (2009). Te dwa błędy spowodowałyby przeszacowanie ludzkiego mitochondrialnego TMRCA. Jednak nie udało im się wykryć podstawowej linii L0 w analizie, a także nie wykryli powtarzających się przejść w wielu liniach, które również nie doceniają TMRCA. Również Vigilant i in. (1991) użyli nowszej kotwicy CHLCA sprzed 4 do 6 milionów lat.

Metody oparte na sekwencji regionu kodującego

Afrykańskie haplogrupy mtDNA
L0

L0d

L0k

L0f

L0b

L0a

L1

L1b

L1c

L5

L2

L6

L3

L4

Częściowa sekwencja regionu kodującego pierwotnie uzupełniała badania HVR, ponieważ pełna sekwencja regionu kodującego była rzadkością. Pojawiły się podejrzenia, że ​​badania HVR pominęły główne gałęzie na podstawie niektórych wcześniejszych badań RFLP i regionu kodującego. Ingmana i in. (2000) było pierwszym badaniem porównującym sekwencje genomowe do analizy koalescencji. Sekwencja regionu kodującego rozróżniała haplogrupy M i N oraz makrohaplogrupy L0 i L1 . Ponieważ sekwencjonowanie genomowego DNA rozwiązało dwie najgłębsze gałęzie, poprawiło niektóre aspekty szacowania TMRCA na podstawie samej sekwencji HVR. Z wyłączeniem D-loop i używając 5-milionowej T CHLCA , Ingman et al. (2000) oszacowali częstość mutacji na 1,70 × 10-8 na miejsce rocznie (współczynnik * T CHLCA = 0,085, 15 435 miejsc).

Jednak region kodujący DNA został zakwestionowany, ponieważ sekwencje kodujące albo podlegają selekcji oczyszczającej w celu utrzymania struktury i funkcji, albo selekcji regionalnej w celu wyewoluowania nowych zdolności. Problem z mutacjami w regionie kodującym został opisany w następujący sposób: mutacje występujące w regionie kodującym, które nie są śmiertelne dla mitochondriów, mogą się utrzymywać, ale są ujemnie selektywne do gospodarza; przez kilka pokoleń będą się utrzymywać, ale przez tysiące pokoleń są one powoli usuwane z populacji, pozostawiając SNP. Jednak przez tysiące pokoleń regionalnie selektywne mutacje nie mogą być odróżnione od tych przejściowych mutacji regionu kodującego. Problem z rzadkimi mutacjami w ludzkich mitogenomach jest na tyle istotny, że skłonił go do przeprowadzenia ostatnich pół tuzina badań na ten temat.

Ingmana i in. (2000) oszacowali ewolucję regionu pętli innej niż D 1,7 × 10-8 rocznie na miejsce w oparciu o 53 nieidentyczne sekwencje genomowe nadreprezentujące Afrykę w globalnej próbce. Pomimo tej nadreprezentacji brakowało rozdzielczości podgałęzi L0 i znaleziono jeszcze jedną głęboką gałąź L1. Pomimo tych ograniczeń pobieranie próbek było odpowiednie do badania cech charakterystycznych. Obecnie L0 ogranicza się do populacji afrykańskich, podczas gdy L1 jest haplogrupą przodków wszystkich nie-Afrykanów, a także większości Afrykanów. Sekwencję mitochondrialnej Ewy można przybliżyć, porównując sekwencję z L0 z sekwencją z L1. Poprzez pogodzenie mutacji w L0 i L1. Sekwencje mtDNA współczesnych populacji ludzkich będą generalnie różnić się od sekwencji mitochondrialnej Ewy o około 50 mutacji. Wskaźniki mutacji nie zostały sklasyfikowane według miejsca (poza wyłączeniem regionów HVR). T CHLCA zastosowana w badaniu z 2000 r. 5 mA była również niższa niż wartości stosowane w najnowszych badaniach.

Szacunki ze starożytnego DNA

Odkąd stało się możliwe sekwencjonowanie dużej liczby starożytnych mitogenomów, w kilku badaniach oszacowano tempo mutacji mitochondrialnych, mierząc, o ile więcej mutacji nagromadziło się średnio we współczesnych (lub późniejszych) genomach w porównaniu do starożytnych (lub wcześniejszych) genomów wywodzących się z tego samego węzeł filogenetyczny. Badania te dały podobne wyniki: centralne szacunki dla całego chromosomu, w podstawieniach na miejsce na rok: 2,47 × 10-8 ; 2,14 × 10-8 ; 2,53 × 10-8 ; i 2,74 × 10-8 .

Porównywanie stawek i badań

Taktowanie molekularne mitochondrialnego DNA było krytykowane z powodu niespójnego zegara molekularnego. Retrospektywna analiza każdego pionierskiego procesu ujawni niedociągnięcia. W przypadku mitochondriów niedociągnięcia są argumentem wynikającym z nieznajomości zmienności tempa i nadmiernej pewności co do T CHLCA wynoszącej 5 mA. Brak perspektywy historycznej może wyjaśnić drugą kwestię, problem zmienności szybkości jest czymś, co można rozwiązać jedynie poprzez masowe badania mitochondriów, które nastąpiły później. Liczba sekwencji HVR, które zgromadziły się w latach 1987-2000, wzrosła o wielkość. Soares i in. (2009) wykorzystali 2196 sekwencji mitogenomicznych i odkryli 10 683 przypadków substytucji w tych sekwencjach. Jedenaście z 16560 miejsc w mitogenomie wytworzyło ponad 11% wszystkich podstawień ze statystycznie istotną zmiennością szybkości w obrębie 11 miejsc. Twierdzą, że istnieje tempo mutacji w miejscu neutralnym, które jest o wielkość wolniejsze niż tempo obserwowane dla najszybszego miejsca, CRS 16519. W konsekwencji, pomijając selekcję oczyszczającą, samo tempo mutacji różni się w zależności od miejsca, przy czym kilka miejsc jest znacznie bardziej skłonnych do ulegają nowym mutacjom w stosunku do innych. Soares i in. (2009) zauważyli dwa przęsła DNA, CRS 2651-2700 i 3028-3082, które nie miały SNP w obrębie 2196 sekwencji mitogenomicznych.

Drzewo filogenetyczne haplogrup ludzkiego mitochondrialnego DNA (mtDNA)

  Mitochondrialna Ewa ( L )    
L0 L1–6  
L1 L2   L3     L4 L5 L6
M N  
CZ D mi G Q   O A S R   I W X Y
C Z B F R0   przed JT   P   u
WN JT k
H V J T

Notatki

przypisy