Duplikacja genów
Duplikacja genów (lub duplikacja chromosomów lub amplifikacja genów ) jest głównym mechanizmem, dzięki któremu nowy materiał genetyczny jest generowany podczas ewolucji molekularnej . Można go zdefiniować jako dowolną duplikację regionu DNA zawierającego gen . Duplikacje genów mogą powstawać jako produkty kilku rodzajów błędów w i naprawie DNA , jak również w wyniku przypadkowego przechwycenia przez samolubne elementy genetyczne. Typowe źródła duplikacji genów obejmują rekombinację ektopową zdarzenie retrotranspozycji , aneuploidia , poliploidia i poślizg replikacji .
Mechanizmy powielania
Rekombinacja ektopowa
Duplikacje powstają w wyniku zdarzenia zwanego nierównym przejściem , które występuje podczas mejozy między nierównymi chromosomami homologicznymi. Szansa na to jest funkcją stopnia współdzielenia powtarzalnych elementów między dwoma chromosomami. Produktami tej rekombinacji są duplikacja w miejscu wymiany i wzajemna delecja. W rekombinacji ektopowej zazwyczaj pośredniczy podobieństwo sekwencji w zduplikowanych punktach przerwania, które tworzą bezpośrednie powtórzenia. Powtarzalne elementy genetyczne, takie jak transpozycje elementy oferują jedno źródło powtarzalnego DNA, które może ułatwić rekombinację, i często znajdują się w punktach przerwania duplikacji u roślin i ssaków.
Poślizg replikacji
Poślizg replikacji to błąd w replikacji DNA, który może powodować duplikacje krótkich sekwencji genetycznych. Podczas replikacji polimeraza DNA zaczyna kopiować DNA. W pewnym momencie procesu replikacji polimeraza dysocjuje od DNA i stoisk replikacyjnych. Kiedy polimeraza ponownie przyłącza się do nici DNA, ustawia replikującą się nić w nieprawidłowej pozycji i przypadkowo kopiuje tę samą sekcję więcej niż jeden raz. Poślizg replikacji jest często ułatwiony przez powtarzające się sekwencje, ale wymaga tylko kilku zasad podobieństwa. [ potrzebne źródło ]
Retrotranspozycja
Retrotranspozony , głównie L1 , mogą czasami oddziaływać na komórkowy mRNA. Transkrypty są poddawane odwrotnej transkrypcji do DNA i wstawiane w losowe miejsca w genomie, tworząc retrogeny. Powstała sekwencja zwykle nie zawiera intronów i często zawiera sekwencje poli, które są również zintegrowane z genomem. Wiele retrogenów wykazuje zmiany w regulacji genów w porównaniu z ich sekwencjami genów rodzicielskich, co czasami skutkuje nowymi funkcjami. Retrogeny mogą przemieszczać się między różnymi chromosomami, aby kształtować ewolucję chromosomów.
Aneuploidia
Aneuploidia występuje, gdy nondysjunkcja na pojedynczym chromosomie skutkuje nieprawidłową liczbą chromosomów. Aneuploidia jest często szkodliwa i u ssaków regularnie prowadzi do samoistnych poronień (poronień). Niektóre osobniki aneuploidalne są zdolne do życia, na przykład trisomia 21 u ludzi, co prowadzi do zespołu Downa . Aneuploidia często zmienia dawkę genu w sposób szkodliwy dla organizmu; dlatego jest mało prawdopodobne, aby rozprzestrzeniał się w populacjach.
poliploidia
Poliploidia lub duplikacja całego genomu jest produktem nondysjunkcji podczas mejozy, co skutkuje dodatkowymi kopiami całego genomu. Poliploidia jest powszechna u roślin, ale występowała również u zwierząt, z dwiema rundami duplikacji całego genomu ( zdarzenie 2R ) w linii kręgowców prowadzącej do ludzi. Wystąpił również u drożdży hemiascomycete ~ 100 milionów lat temu.
Po duplikacji całego genomu następuje stosunkowo krótki okres niestabilności genomu, rozległa utrata genów, podwyższony poziom substytucji nukleotydów i zmiana okablowania sieci regulacyjnej. Ponadto istotną rolę odgrywają efekty dawkowania genów. Tak więc większość duplikatów jest tracona w krótkim czasie, jednak znaczna część duplikatów przeżywa. Co ciekawe, geny zaangażowane w regulację są preferencyjnie zatrzymywane. Ponadto zachowanie genów regulatorowych, w szczególności genów Hox , doprowadziło do innowacji adaptacyjnych.
Zaobserwowano szybką ewolucję i dywergencję funkcjonalną na poziomie transkrypcji zduplikowanych genów, zwykle przez mutacje punktowe w krótkich motywach wiążących czynniki transkrypcyjne. Ponadto szybka ewolucja motywów fosforylacji białek, zwykle osadzonych w szybko ewoluujących wewnętrznie nieuporządkowanych regionach, jest kolejnym czynnikiem przyczyniającym się do przeżycia i szybkiej adaptacji / neofunkcjonalizacji zduplikowanych genów. Wydaje się zatem, że istnieje związek między regulacją genów (przynajmniej na poziomie potranslacyjnym) a ewolucją genomu.
Poliploidia jest również dobrze znanym źródłem specjacji, ponieważ potomstwo, które ma inną liczbę chromosomów w porównaniu z gatunkami rodzicielskimi, często nie jest w stanie krzyżować się z organizmami niepoliploidalnymi. Uważa się, że duplikacje całego genomu są mniej szkodliwe niż aneuploidia, ponieważ względne dawki poszczególnych genów powinny być takie same.
Jako wydarzenie ewolucyjne
Szybkość duplikacji genów
Porównania genomów pokazują, że duplikacje genów są powszechne u większości badanych gatunków. Wskazują na to zmienne liczby kopii ( zmienność liczby kopii ) w genomie człowieka lub muszki owocowej. Jednak trudno było zmierzyć tempo, w jakim takie duplikacje występują. Ostatnie badania dały pierwsze bezpośrednie oszacowanie tempa duplikacji genów w całym genomie C. elegans , pierwszego wielokomórkowego eukariota, dla którego takie oszacowanie stało się dostępne. Szybkość duplikacji genów u C. elegans jest rzędu 10-7 duplikacje/gen/pokolenie, czyli w populacji 10 milionów robaków jeden będzie miał duplikację genu na pokolenie. Szybkość ta jest o dwa rzędy wielkości większa niż spontaniczna szybkość mutacji punktowych na miejsce nukleotydowe u tego gatunku. Starsze (pośrednie) badania wykazały, że współczynniki duplikacji specyficzne dla locus u bakterii, Drosophila i ludzi wahają się od 10-3 do 10-7 / gen/pokolenie.
Neofunkcjonalizacja
Duplikacje genów są istotnym źródłem nowości genetycznych, które mogą prowadzić do innowacji ewolucyjnych. Duplikacja tworzy genetyczną redundancję, w której druga kopia genu jest często wolna od presji selekcyjnej — czyli mutacji nie ma szkodliwego wpływu na organizm żywiciela. Jeśli jedna kopia genu ulegnie mutacji, która wpłynie na jej pierwotną funkcję, druga kopia może służyć jako „część zamienna” i nadal prawidłowo funkcjonować. Zatem zduplikowane geny akumulują mutacje szybciej niż funkcjonalny gen z pojedynczą kopią, przez pokolenia organizmów, i możliwe jest, że jedna z dwóch kopii rozwinie nową i inną funkcję. Niektóre przykłady takiej neofunkcjonalizacji to pozorna mutacja zduplikowanego genu trawiennego w rodzinie ryb lodowych w gen przeciw zamarzaniu i duplikacja prowadząca do nowego genu jadu węża i syntezy 1 beta-hydroksytestosteronu u świń.
Uważa się, że duplikacja genów odgrywa główną rolę w ewolucji ; stanowisko to jest prezentowane przez członków społeczności naukowej od ponad 100 lat. Susumu Ohno był jednym z najbardziej znanych twórców tej teorii w swojej klasycznej książce Ewolucja przez duplikację genów (1970). Ohno argumentował, że duplikacja genów jest najważniejszą siłą ewolucyjną od czasu pojawienia się uniwersalnego wspólnego przodka . Główne duplikacji genomu mogą być dość powszechne. Uważa się, że cały genom drożdży uległ duplikacji około 100 milionów lat temu. Rośliny są najbardziej płodnymi powielaczami genomu. Na przykład pszenica jest heksaploidalna (rodzaj poliploidalnej ), co oznacza, że ma sześć kopii swojego genomu.
Subfunkcjonalizacja
Innym możliwym losem zduplikowanych genów jest to, że obie kopie mają taką samą swobodę gromadzenia mutacji zwyrodnieniowych, o ile wszelkie defekty są uzupełniane przez drugą kopię. Prowadzi to do neutralnej „ subfunkcjonalizacji ” (proces konstruktywnej neutralnej ewolucji ) lub modelu DDC (duplikacja-degeneracja-komplementacja), w którym funkcjonalność oryginalnego genu jest rozdzielona między dwie kopie. Żaden gen nie może zostać utracony, ponieważ oba pełnią teraz ważne, zbędne funkcje, ale ostatecznie żaden z nich nie jest w stanie osiągnąć nowej funkcjonalności.
Subfunkcjonalizacja może zachodzić poprzez neutralne procesy, w których mutacje gromadzą się bez szkodliwych lub korzystnych skutków. Jednak w niektórych przypadkach może wystąpić subfunkcjonalizacja z wyraźnymi korzyściami adaptacyjnymi. Jeśli gen przodków jest plejotropowy i pełni dwie funkcje, często żadnej z tych dwóch funkcji nie można zmienić bez wpływu na drugą funkcję. W ten sposób podział funkcji przodków na dwa oddzielne geny może pozwolić na adaptacyjną specjalizację podfunkcji, zapewniając w ten sposób korzyść adaptacyjną.
Strata
Często wynikająca z tego zmienność genomowa prowadzi do zaburzeń neurologicznych zależnych od dawki genu, takich jak zespół podobny do Retta i choroba Pelizaeusa-Merzbachera . Takie szkodliwe mutacje prawdopodobnie zostaną utracone z populacji i nie zostaną zachowane ani nie rozwiną nowych funkcji. Jednak wiele duplikacji w rzeczywistości nie jest szkodliwych ani korzystnych, a te neutralne sekwencje mogą zostać utracone lub mogą rozprzestrzenić się w populacji poprzez przypadkowe fluktuacje poprzez dryf genetyczny .
Identyfikacja duplikacji w zsekwencjonowanych genomach
Kryteria i skany pojedynczego genomu
Dwa geny, które istnieją po zdarzeniu duplikacji genu, nazywane są paralogami i zazwyczaj kodują białka o podobnej funkcji i/lub strukturze. Z kolei ortologiczne występują u różnych gatunków, z których każdy pierwotnie pochodzi z tej samej sekwencji przodków. (Patrz Homologia sekwencji w genetyce ).
W badaniach biologicznych ważne jest (ale często trudne) odróżnienie paralogów od ortologów. Eksperymenty nad funkcją ludzkiego genu można często przeprowadzać na innych gatunkach , jeśli w genomie tego gatunku można znaleźć homolog ludzkiego genu, ale tylko wtedy, gdy homolog jest ortologiczny. Jeśli są paralogami i powstały w wyniku zdarzenia duplikacji genów, ich funkcje prawdopodobnie będą zbyt różne. Na jedną lub więcej kopii zduplikowanych genów, które tworzą rodzinę genów, może mieć wpływ wstawienie elementów ulegających transpozycji , co powoduje znaczną różnicę między nimi w ich sekwencji i ostatecznie może stać się odpowiedzialne za rozbieżna ewolucja . Może to również oznaczać szanse i szybkość konwersji genów między homologami duplikatów genów z powodu mniejszego lub braku podobieństwa w ich sekwencjach.
Paralogi można zidentyfikować w pojedynczych genomach poprzez porównanie sekwencji wszystkich modeli genów z adnotacjami względem siebie. Takie porównanie można przeprowadzić na sekwencjach aminokwasów poddanych translacji (np. BLASTp, tBLASTx) w celu zidentyfikowania dawnych duplikacji lub na sekwencjach nukleotydów DNA (np. BLASTn, megablast) w celu zidentyfikowania nowszych duplikacji. Większość badań mających na celu identyfikację duplikacji genów wymaga wzajemnych najlepszych trafień lub rozmytych wzajemnych najlepszych trafień, gdzie każdy paralog musi być najlepszym dopasowaniem drugiego w porównaniu sekwencji.
Większość duplikacji genów występuje jako powtórzenia o małej liczbie kopii (LCR), raczej wysoce powtarzalne sekwencje, takie jak elementy transpozycyjne. Występują głównie w pericentronomicznych , subtelomerycznych i śródmiąższowych chromosomu. Wiele LCR, ze względu na swój rozmiar (> 1 KB), podobieństwo i orientację, jest bardzo podatnych na duplikacje i delecje.
Mikromacierze genomowe wykrywają duplikaty
Technologie takie jak mikromacierze genomowe , zwane także macierzową porównawczą hybrydyzacją genomową (array CGH), są wykorzystywane do wykrywania nieprawidłowości chromosomalnych, takich jak mikroduplikacje, z dużą przepustowością z próbek genomowego DNA. W szczególności technologia mikromacierzy DNA może jednocześnie monitorować poziomy ekspresji tysięcy genów w wielu zabiegach lub warunkach eksperymentalnych, znacznie ułatwiając ewolucyjne badania regulacji genów po duplikacji lub specjacji genów .
Sekwencjonowanie nowej generacji
Duplikacje genów można również zidentyfikować za pomocą platform sekwencjonowania nowej generacji. Najprostszym sposobem identyfikacji duplikatów w danych ponownego sekwencjonowania genomu jest użycie odczytów sekwencjonowania sparowanych końców. Duplikacje tandemowe są wskazywane przez sekwencjonowanie par odczytów, które mapują w nienormalnych orientacjach. Dzięki połączeniu zwiększonego pokrycia sekwencji i nieprawidłowej orientacji mapowania możliwe jest zidentyfikowanie duplikatów w danych sekwencjonowania genomowego.
Nomenklatura
International System for Human Cytogenomic Nomenclature (ISCN) to międzynarodowy standard nomenklatury ludzkich chromosomów , który obejmuje nazwy pasm, symbole i skróty używane w opisie ludzkiego chromosomu i nieprawidłowości chromosomowych. Skróty obejmują dup dla duplikacji części chromosomu. Na przykład dup (17p12) powoduje chorobę Charcota-Mariego-Tootha typu 1A.
Jako wzmocnienie
Duplikacja genów niekoniecznie oznacza trwałą zmianę w genomie gatunku. W rzeczywistości takie zmiany często nie trwają dłużej niż pierwotny organizm żywiciela. Z perspektywy genetyki molekularnej amplifikacja genu jest jednym z wielu sposobów nadekspresji genu . Amplifikacja genetyczna może zachodzić sztucznie, na przykład przy użyciu techniki reakcji łańcuchowej polimerazy do amplifikacji krótkich nici DNA in vitro przy użyciu enzymów lub może wystąpić naturalnie, jak opisano powyżej. Jeśli jest to naturalna duplikacja, nadal może mieć miejsce w komórce somatycznej , a nie w komórce linii zarodkowej (co byłoby konieczne do trwałej zmiany ewolucyjnej).
Rola w raku
Duplikacje onkogenów są częstą przyczyną wielu typów nowotworów . W takich przypadkach duplikacja genetyczna zachodzi w komórce somatycznej i wpływa tylko na genom samych komórek nowotworowych, a nie na cały organizm, a tym bardziej na późniejsze potomstwo. Niedawna kompleksowa klasyfikacja na poziomie pacjentów i kwantyfikacja zdarzeń kierujących w kohortach TCGA ujawniła, że na guz przypada średnio 12 zdarzeń kierujących, z czego 1,5 to amplifikacje onkogenów.
Rodzaj raka |
Powiązane amplifikacje genów |
Rozpowszechnienie amplifikacji w typie raka (w procentach) |
---|---|---|
Rak piersi | MOJA C | 20% |
ERBB2 ( HER2 ) | 20% | |
CCND1 ( Cyklina D1 ) | 15–20% | |
FGFR1 | 12% | |
FGFR2 | 12% | |
Rak szyjki macicy | MOJA C | 25–50% |
ERBB2 | 20% | |
Rak jelita grubego | HRAS | 30% |
KRAS | 20% | |
MOJE B | 15–20% | |
Rak przełyku | MOJA C | 40% |
CCND1 | 25% | |
MDM2 | 13% | |
Rak żołądka | CCNE ( cyklina E ) | 15% |
KRAS | 10% | |
SPOTKAŁ | 10% | |
glejaka wielopostaciowego | ERBB1 ( EGFR ) | 33–50% |
CDK4 | 15% | |
Rak głowy i szyi | CCND1 | 50% |
ERBB1 | 10% | |
MOJA C | 7–10% | |
Rak wątrobowokomórkowy | CCND1 | 13% |
Nerwiak zarodkowy : neuroblastoma | MYCN | 20–25% |
Rak jajnika | MOJA C | 20–30% |
ERBB2 | 15–30% | |
AKT2 | 12% | |
Mięsak | MDM2 | 10–30% |
CDK4 | 10% | |
Rak drobnokomórkowy płuca | MOJA C | 15–20% |