Ewolucja genomu

Ewolucja genomu to proces, w wyniku którego genom zmienia się w czasie pod względem struktury (sekwencji) lub rozmiaru. Badanie ewolucji genomu obejmuje wiele dziedzin, takich jak analiza strukturalna genomu, badanie pasożytów genomowych, duplikacje genów i starożytnych genomów, poliploidia i genomika porównawcza . Ewolucja genomu to stale zmieniająca się i ewoluująca dziedzina ze względu na stale rosnącą liczbę zsekwencjonowanych genomów, zarówno prokariotycznych, jak i eukariotycznych, dostępnych dla społeczności naukowej i ogółu społeczeństwa.

Okrągła reprezentacja genomu Mycobacterium leprae utworzona przy użyciu internetowych narzędzi genomowych JCVI.

Historia

Odkąd pierwsze zsekwencjonowane genomy stały się dostępne pod koniec lat 70. XX wieku, naukowcy wykorzystują genomikę porównawczą do badania różnic i podobieństw między różnymi genomami. Z biegiem czasu sekwencjonowanie genomu postępuje, obejmując coraz bardziej złożone genomy, w tym ostateczne sekwencjonowanie całego ludzkiego genomu w 2001 r. Porównując genomy zarówno bliskich krewnych, jak i odległych przodków, zaczęły pojawiać się wyraźne różnice i podobieństwa między gatunkami, a także mechanizmy dzięki którym genomy mogą ewoluować w czasie.

Genomy prokariotyczne i eukariotyczne

Prokarionty

Główne siły ewolucji u prokariotów i ich wpływ na genomy archeonów i bakterii . Linia pozioma przedstawia rozmiar genomu archeonów i bakterii w skali logarytmicznej (w megaparach zasad ) oraz przybliżoną odpowiadającą im liczbę genów (w nawiasach). Efekty głównych sił ewolucji genomu prokariotycznego są oznaczone trójkątami, które są ustawione mniej więcej , w zakresach wielkości genomu, dla których uważa się, że odpowiednie efekty są najbardziej wyraźne.

prokariotyczne mają dwa główne mechanizmy ewolucji: mutację i poziomy transfer genów . Trzeci mechanizm, rozmnażanie płciowe , jest widoczny u eukariontów i występuje również u bakterii. Prokarionty mogą uzyskiwać nowy materiał genetyczny w procesie koniugacji bakteryjnej , w którym zarówno plazmidy, jak i całe chromosomy mogą być przekazywane między organizmami. Często cytowanym przykładem tego procesu jest przenoszenie oporności na antybiotyki z wykorzystaniem plazmidowego DNA. Inny mechanizm ewolucji genomu zapewnia transdukcja , w której bakteriofagi wprowadzają nowy DNA do genomu bakteryjnego. Głównym mechanizmem interakcji płciowych jest naturalna transformacja genetyczna , która obejmuje przeniesienie DNA z jednej komórki prokariotycznej do drugiej przez pośredniczące medium. Transformacja jest powszechnym sposobem przenoszenia DNA i wiadomo, że co najmniej 67 gatunków prokariotycznych jest zdolnych do transformacji.

Ewolucja genomu u bakterii jest dobrze poznana ze względu na tysiące dostępnych całkowicie zsekwencjonowanych genomów bakteryjnych. Zmiany genetyczne mogą prowadzić zarówno do zwiększenia, jak i zmniejszenia złożoności genomu z powodu adaptacyjnego usprawnienia genomu i selekcji oczyszczającej. Ogólnie rzecz biorąc, wolno żyjące bakterie wyewoluowały większe genomy z większą liczbą genów, dzięki czemu mogą łatwiej przystosować się do zmieniających się warunków środowiskowych. Dla kontrastu, większość bakterii pasożytniczych ma zredukowane genomy, ponieważ ich gospodarze dostarczają wielu, jeśli nie większość składników odżywczych, więc ich genom nie musi kodować enzymów, które same wytwarzają te składniki odżywcze. [ potrzebna strona ]

Charakterystyka Genom E. coli Ludzki genom
Rozmiar genomu ( pary zasad ) 4,6 MB 3,2 GB
Struktura genomu Okólnik Liniowy
Liczba chromosomów 1 46
Obecność plazmidów Tak NIE
Obecność histonów NIE Tak
DNA segregowane w jądrze NIE Tak
Liczba genów 4288 20 000
Obecność intronów NIE* Tak
Średni rozmiar genu 700 pz 27 000 pz
* E. coli w większości zawiera tylko egzony w genach. Zawiera jednak niewielką ilość samosplatających się intronów (grupa II).

eukarionty

Genomy eukariotyczne są na ogół większe niż genomy prokariotów. Podczas gdy E. coli ma około 4,6 Mb długości, dla porównania genom ludzki jest znacznie większy i ma rozmiar około 3,2 Gb. Genom eukariotyczny jest liniowy i może składać się z wielu chromosomów upakowanych w jądrze komórki. Niekodujące części genu, znane jako introny , które w dużej mierze nie występują u prokariotów, są usuwane przez splicing RNA, zanim może nastąpić translacja białka. Genomy eukariotyczne ewoluują w czasie poprzez wiele mechanizmów, w tym rozmnażanie płciowe, które wprowadza znacznie większą różnorodność genetyczną potomstwa niż zwykły prokariotyczny proces replikacji, w którym potomstwo jest teoretycznie genetycznymi klonami komórki rodzicielskiej.

Rozmiar genomu

Rozmiar genomu jest zwykle mierzony w parach zasad (lub zasadach w jednoniciowym DNA lub RNA ). Wartość C to kolejna miara wielkości genomu. Badania nad genomami prokariotycznymi pokazują, że istnieje znacząca dodatnia korelacja między wartością C prokariotów a ilością genów, które składają się na genom. Wskazuje to, że liczba genów jest głównym czynnikiem wpływającym na wielkość genomu prokariotycznego. W eukariotycznych obserwuje się paradoks polegający na tym, że liczba genów tworzących genom nie koreluje z jego wielkością. Innymi słowy, rozmiar genomu jest znacznie większy, niż można by się spodziewać, biorąc pod uwagę całkowitą liczbę genów kodujących białka.

Wielkość genomu może wzrosnąć przez duplikację , insercję lub poliploidyzację . Rekombinacja może prowadzić zarówno do utraty, jak i do wzmocnienia DNA. Genomy mogą się również kurczyć z powodu delecji . Znanym przykładem takiego rozpadu genów jest genom Mycobacterium leprae , czynnika wywołującego trąd . M. leprae utracił z czasem wiele niegdyś funkcjonalnych genów z powodu tworzenia się pseudogenów . Jest to oczywiste, gdy patrzy się na jego najbliższego przodka Mycobacterium tuberculosis . M. leprae żyje i replikuje się wewnątrz żywiciela, a dzięki takiemu układowi nie potrzebuje wielu genów, które kiedyś nosił, co pozwalało mu żyć i prosperować poza żywicielem. Tak więc z biegiem czasu geny te utraciły swoją funkcję poprzez mechanizmy, takie jak mutacja, powodująca, że ​​​​stają się pseudogenami. Pozbycie się zbędnych genów jest korzystne dla organizmu, ponieważ znacznie przyspiesza replikację DNA i wymaga mniej energii.

Przykładem wzrostu wielkości genomu w czasie są patogeny roślin nitkowatych. Te genomy patogenów roślin rosły przez lata z powodu ekspansji opartej na powtórzeniach. Regiony bogate w powtórzenia zawierają geny kodujące białka interakcji gospodarza. Wraz z dodawaniem coraz większej liczby powtórzeń do tych regionów rośliny zwiększają możliwość rozwoju nowych czynników wirulencji poprzez mutacje i inne formy rekombinacji genetycznej. W ten sposób korzystne jest, aby te patogeny roślin miały większe genomy.

Ewolucja chromosomów

Fuzja chromosomów, prowadząca do zmniejszenia liczby chromosomów (tutaj fuzja ludzkiego chromosomu 2 , przy czym 2 oddzielne chromosomy nadal występują u szympansów i innych małp człekokształtnych ).

Ewolucję genomów można w imponujący sposób pokazać poprzez zmianę liczby i struktury chromosomów w czasie. Na przykład chromosomy przodków odpowiadające chromosomom 2A i 2B szympansa połączyły się, tworząc ludzki chromosom 2 . Podobnie chromosomy bardziej spokrewnionych gatunków wykazują chromosomy, które zostały podzielone na więcej części w trakcie ewolucji. Można to wykazać za pomocą fluorescencyjnej hybrydyzacji in situ .

Mechanizmy

Duplikacja genów

Duplikacja genu to proces, w którym region DNA kodujący gen jest powielany. Może to nastąpić w wyniku błędu w rekombinacji lub w wyniku zdarzenia retrotranspozycji . Zduplikowane geny są często odporne na presję selekcyjną, pod którą normalnie istnieją geny. W rezultacie w zduplikowanym kodzie genu może gromadzić się duża liczba mutacji. Może to spowodować, że gen przestanie działać lub w niektórych przypadkach przyniesie pewne korzyści organizmowi.

Duplikacja całego genomu

Podobnie jak w przypadku duplikacji genów, duplikacja całego genomu jest procesem, w którym cała informacja genetyczna organizmu jest kopiowana jednorazowo lub wielokrotnie, co jest znane jako poliploidia . Może to zapewnić organizmowi korzyść ewolucyjną, dostarczając mu wiele kopii genu, tworząc w ten sposób większe możliwości funkcjonalnych i selektywnie uprzywilejowanych genów. Jednak testy zwiększonego tempa i innowacji u teleoste ze zduplikowanymi genomami w porównaniu z ich bliskimi krewnymi rybami holostejskimi (bez zduplikowanych genomów) wykazały, że przez pierwsze 150 milionów lat ich ewolucji istniała między nimi niewielka różnica.

W 1997 roku firma Wolfe & Shields dostarczyła dowodów na starożytną duplikację genomu Saccharomyces cerevisiae ( drożdży ). Początkowo zauważono, że ten genom drożdży zawierał wiele pojedynczych duplikacji genów. Wolfe & Shields postawili hipotezę, że w rzeczywistości było to wynikiem duplikacji całego genomu w odległej historii ewolucji drożdży. Znaleźli 32 pary homologicznych regionów chromosomalnych, które stanowią ponad połowę genomu drożdży. Zauważyli również, że chociaż homologi były obecne, często znajdowały się na różnych chromosomach . Na podstawie tych obserwacji ustalili, że Saccharomyces cerevisiae przeszedł duplikację całego genomu wkrótce po jego ewolucyjnym oddzieleniu od Kluyveromyces , rodzaju drożdży ascomycetous. Z biegiem czasu wiele zduplikowanych genów zostało usuniętych i przestało funkcjonować. Szereg rearanżacji chromosomów rozbiło oryginalne zduplikowane chromosomy na obecną manifestację homologicznych regionów chromosomów. Pomysł ten został dodatkowo ugruntowany w analizie genomu bliskiego krewnego drożdży, Ashbya gossypii . Duplikacja całego genomu jest powszechna zarówno u grzybów, jak i gatunków roślin. Przykład ekstremalnej duplikacji genomu jest reprezentowany przez Cordgrass pospolity ( Spartina anglica ), który jest dodekaloidem, co oznacza, że ​​zawiera 12 zestawów chromosomów, w przeciwieństwie do struktury diploidalnej człowieka, w której każdy osobnik ma tylko dwa zestawy po 23 chromosomy.

Elementy transpozycyjne

Elementy transpozycyjne to regiony DNA, które można wstawić do kodu genetycznego za pomocą jednego z dwóch mechanizmów. Mechanizmy te działają podobnie do funkcji „wytnij i wklej” oraz „kopiuj i wklej” w edytorach tekstu. Mechanizm „wytnij i wklej” polega na wycinaniu DNA z jednego miejsca w genomie i wstawianiu go w inne miejsce w kodzie. Mechanizm „kopiuj i wklej” polega na wykonaniu genetycznej kopii lub kopii określonego regionu DNA i wstawieniu tych kopii w inne miejsce kodu. Najbardziej powszechnym elementem transpozycyjnym w ludzkim genomie jest sekwencja Alu , która jest obecna w genomie ponad milion razy.

Mutacja

spontaniczne mutacje , które mogą powodować różne zmiany w genomie. Mutacje mogą albo zmienić tożsamość jednego lub więcej nukleotydów, albo spowodować dodanie lub usunięcie jednej lub więcej zasad nukleotydowych . Takie zmiany mogą prowadzić do mutacji przesunięcia ramki , powodując odczytanie całego kodu w innej kolejności niż oryginał, co często powoduje, że białko staje się niefunkcjonalne. Mutacja w regionie promotora , regionie wzmacniacza lub regionie wiążącym czynnik transkrypcyjny może również skutkować albo utratą funkcji, albo regulacją w górę lub w dół w transkrypcji genu , na który ukierunkowane są te elementy regulatorowe. Mutacje stale zachodzą w genomie organizmu i mogą powodować efekt negatywny, pozytywny lub neutralny (brak jakiegokolwiek efektu).

Pseudogenes

Loci proS w Mycobacterium leprae i M. tuberculosis , przedstawiające 3 pseudogeny (oznaczone krzyżykami) w M. leprae , które nadal reprezentują funkcjonalne geny w M. tuberculosis . Homologiczne geny są oznaczone identycznymi kolorami i pionowymi kreskowanymi paskami. Zmodyfikowany po Cole et al. 2001.

Często w wyniku spontanicznej mutacji pseudogeny są dysfunkcyjnymi genami pochodzącymi od wcześniej funkcjonujących krewnych genów . Istnieje wiele mechanizmów, dzięki którym funkcjonalny gen może stać się pseudogenem, w tym delecja lub insercja jednego lub wielu nukleotydów . Może to spowodować przesunięcie ramki odczytu , powodując, że gen nie będzie już kodował oczekiwanego białka, wprowadzić przedwczesny kodon stop lub mutację w regionie promotora .

Często cytowane przykłady pseudogenów w ludzkim genomie obejmują niegdyś funkcjonalne rodziny genów węchowych . Z biegiem czasu wiele genów węchowych w ludzkim genomie stało się pseudogenami i nie było już w stanie wytwarzać funkcjonalnych białek, co wyjaśnia słaby węch, jaki posiadają ludzie w porównaniu z ich krewnymi ssaków.

Podobnie, pseudogeny bakteryjne zwykle powstają w wyniku adaptacji wolno żyjących bakterii do pasożytniczego trybu życia, tak że wiele genów metabolicznych staje się zbędnych, gdy gatunki te przystosowują się do gospodarza. Gdy pasożyt uzyska składniki odżywcze (takie jak aminokwasy lub witaminy ) od żywiciela, nie musi sam wytwarzać tych składników odżywczych i często traci geny potrzebne do ich wytwarzania.

Tasowanie egzonów

Tasowanie eksonów to mechanizm, dzięki któremu tworzone są nowe geny. Może się to zdarzyć, gdy dwa lub więcej eksonów z różnych genów zostanie połączonych lub gdy egzony zostaną zduplikowane. Tasowanie eksonów skutkuje powstaniem nowych genów poprzez zmianę obecnej struktury intron-ekzon. Może to nastąpić w wyniku dowolnego z następujących procesów: transpozonów , rekombinacja płciowa lub rekombinacja niehomologiczna (zwana także rekombinacją nielegalną ). Tasowanie eksonów może wprowadzić do genomu nowe geny, które można poddać selekcji i usunąć lub selektywnie faworyzować i konserwować.

Redukcja genomu i utrata genów

Wiele gatunków wykazuje redukcję genomu, gdy podzbiory ich genów nie są już potrzebne. Zwykle dzieje się tak, gdy organizmy przystosowują się do pasożytniczego trybu życia, np. gdy ich składniki odżywcze są dostarczane przez żywiciela. W konsekwencji tracą geny potrzebne do produkcji tych składników odżywczych. W wielu przypadkach można porównać zarówno gatunki wolno żyjące, jak i pasożytnicze, a także zidentyfikować ich utracone geny. Dobrymi przykładami są genomy Mycobacterium tuberculosis i Mycobacterium leprae , z których ten ostatni ma znacznie zredukowany genom (patrz rysunek pod pseudogenami powyżej).

Innym pięknym przykładem są gatunki endosymbiontów . Na przykład Polynucleobacter necessarius został po raz pierwszy opisany jako cytoplazmatyczny endosymbiont orzęsków Euplotes aediculatus . Ten ostatni gatunek umiera wkrótce po wyleczeniu z endosymbiontu. W nielicznych przypadkach, w których P. necessarius nie jest obecny, inna i rzadsza bakteria najwyraźniej spełnia tę samą funkcję. Żadna próba wyhodowania symbiotycznego P. necessarius poza ich gospodarzami nie zakończyła się sukcesem, co zdecydowanie sugeruje, że związek jest obowiązkowy dla obojga partnerów. Jednak zidentyfikowano blisko spokrewnionych wolno żyjących krewnych P. necessarius. Endosymbionty mają znacznie zredukowany genom w porównaniu z ich żyjącymi na wolności krewnymi (1,56 Mbp vs. 2,16 Mbp).

Specjacja

Pielęgnice, takie jak Tropheops tropheops z jeziora Malawi, dostarczają modeli ewolucji genomu.

Głównym pytaniem biologii ewolucyjnej jest to, w jaki sposób genomy zmieniają się, tworząc nowe gatunki. Specjacja wymaga zmian w zachowaniu , morfologii , fizjologii lub metabolizmie (lub ich kombinacjach). Ewolucja genomów podczas specjacji była badana dopiero niedawno dzięki dostępności sekwencjonowania nowej generacji . Na przykład pielęgnice w jeziorach afrykańskich różnią się zarówno morfologicznie, jak i zachowaniem. Genomy 5 gatunków ujawniły, że zarówno sekwencje, jak i wzór ekspresji wielu genów zmieniły się szybko w stosunkowo krótkim czasie (100 000 do kilku milionów lat). Warto zauważyć, że 20% zduplikowanych par genów uzyskało zupełnie nowy tkankowo specyficzny wzór ekspresji, co wskazuje, że te geny również uzyskały nowe funkcje. Biorąc pod uwagę, że ekspresja genów jest napędzana przez krótkie sekwencje regulatorowe , pokazuje to, że do napędzania specjacji potrzeba stosunkowo niewielu mutacji. Genomy pielęgnic wykazały również zwiększone tempo ewolucji mikroRNA , które biorą udział w ekspresji genów.

Ekspresja genu

Mutacje mogą prowadzić do zmiany funkcji genów lub prawdopodobnie częściej do zmiany wzorców ekspresji genów. W rzeczywistości badanie przeprowadzone na 12 gatunkach zwierząt dostarczyło mocnych dowodów na to, że tkankowo specyficzna ekspresja genów była w dużej mierze zachowana między ortologami różnych gatunków. Jednak paralogi w obrębie tego samego gatunku często mają inny wzór ekspresji. Oznacza to, że po zduplikowaniu genów często zmieniają swój wzorzec ekspresji, na przykład ulegając ekspresji w innej tkance i tym samym przyjmując nowe role.

Skład nukleotydów (zawartość GC)

Kod genetyczny składa się z sekwencji czterech zasad nukleotydowych : adeniny , guaniny , cytozyny i tyminy , powszechnie określanych jako A, G, C i T. Zawartość GC to procent zasad G i C w genomie. Zawartość GC różni się znacznie między różnymi organizmami. Wykazano, że regiony kodujące geny mają wyższą zawartość GC, a im dłuższy jest gen, tym większy jest procent obecnych zasad G i C. Wyższa zawartość GC jest korzystna, ponieważ wiązanie guanina-cytozyna składa się z trzech wiązań wodorowych , podczas gdy wiązanie adenina-tymina składa się tylko z dwóch. W ten sposób trzy wiązania wodorowe zapewniają większą stabilność nici DNA. Nic więc dziwnego, że ważne geny często mają wyższą zawartość GC niż inne części genomu organizmu. Z tego powodu wiele gatunków żyjących w bardzo wysokich temperaturach, takich jak ekosystemy otaczające kominy hydrotermalne, ma bardzo wysoką zawartość GC. Wysoka zawartość GC jest również widoczna w sekwencjach regulatorowych, takich jak promotory, które sygnalizują początek genu. Wiele promotorów zawiera wyspy CpG , obszary genomu, w których nukleotyd cytozyny występuje obok nukleotydu guaniny w większej proporcji. Wykazano również, że szeroka dystrybucja zawartości GC między gatunkami w obrębie rodzaju wskazuje na bardziej starożytne pochodzenie. Ponieważ gatunki miały więcej czasu na ewolucję, ich zawartość GC bardziej się od siebie różniła. [ potrzebne źródło ]

Ewoluująca translacja kodu genetycznego

Aminokwasy składają się z kodonów o długości trzech zasad , a zarówno glicyna , jak i alanina charakteryzują się kodonami z wiązaniami guanina-cytozyna w pierwszych dwóch pozycjach zasad kodonów. To wiązanie GC zapewnia większą stabilność struktury DNA. Postawiono hipotezę, że gdy pierwsze organizmy ewoluowały w środowisku o wysokiej temperaturze i ciśnieniu, potrzebowały stabilności tych wiązań GC w swoim kodzie genetycznym.

Pochodzenie genów de novo

Nowe geny mogą powstać z niekodującego DNA. Pochodzenie de novo genów (kodujących białka) wymaga tylko dwóch cech, a mianowicie wygenerowania otwartej ramki odczytu i utworzenia miejsca wiązania czynnika transkrypcyjnego . Na przykład Levine i współpracownicy opisali pochodzenie pięciu nowych genów w D. melanogaster z niekodującego DNA. Następnie pochodzenie genów de novo wykazano również w innych organizmach, takich jak drożdże , ryż i ludzie . Na przykład Wu i in. (2011) opisali 60 przypuszczalnych genów specyficznych dla człowieka de novo, z których wszystkie są krótkie i składają się z jednego eksonu (z wyjątkiem jednego). U bakterii „uziemione” profagi (tj. zintegrowane fagi, które nie mogą wytwarzać nowych fagów) są strefami buforowymi, które tolerowałyby zmiany, zwiększając w ten sposób prawdopodobieństwo tworzenia się genów de novo. Te ugruntowane profagi i inne tego typu elementy genetyczne są miejscami, w których geny można pozyskać poprzez horyzontalny transfer genów (HGT).

Pochodzenie życia i pierwsze genomy

Aby zrozumieć, w jaki sposób powstał genom, wymagana jest wiedza o szlakach chemicznych, które umożliwiają tworzenie kluczowych elementów budulcowych genomu w prawdopodobnych warunkach prebiotycznych . Zgodnie z świata RNA w prymitywnej zupie były obecne swobodnie pływające rybonukleotydy. Były to podstawowe cząsteczki, które połączyły się szeregowo, tworząc oryginalny RNA . Cząsteczki tak złożone jak RNA musiały powstać z małych cząsteczek, których reaktywność była regulowana przez procesy fizykochemiczne. RNA składa się z purynowych i pirymidynowych , które są niezbędne do niezawodnego przekazywania informacji, a tym samym darwinowskiej selekcji naturalnej i ewolucji . Nam i in. wykazali bezpośrednią kondensację zasad nukleinowych z rybozą w celu uzyskania rybonukleozydów w wodnych mikrokropelkach, co jest kluczowym etapem prowadzącym do powstania genomu RNA. Również prawdopodobny prebiotyczny proces syntezy rybonukleotydów pirymidynowych i purynowych prowadzący do tworzenia genomu przy użyciu cykli mokro-suchy został przedstawiony przez Beckera i in.

Zobacz też