Zmienność strukturalna

Genomowa zmienność strukturalna to zmienność struktury chromosomu organizmu . Składa się z wielu rodzajów zmian w genomie jednego gatunku i zwykle obejmuje typy mikroskopowe i submikroskopowe, takie jak delecje, duplikacje, warianty liczby kopii , insercje, inwersje i translokacje . Pierwotnie zmienność struktury wpływa na długość sekwencji od około 1 kb do 3 Mb, która jest większa niż SNP i mniejsza niż nieprawidłowość chromosomowa (chociaż definicje w pewnym stopniu się pokrywają). Jednak zakres operacyjny wariantów strukturalnych poszerzył się o zdarzenia > 50 pb. Definicja zmienności strukturalnej nie implikuje nic na temat częstotliwości lub efektów fenotypowych. Wiele wariantów strukturalnych jest związanych z chorobami genetycznymi , jednak wiele z nich nie. Ostatnie badania dotyczące SV wskazują, że SV są trudniejsze do wykrycia niż SNP. Około 13% ludzkiego genomu jest zdefiniowane jako warianty strukturalne w normalnej populacji, a istnieje co najmniej 240 genów, które istnieją jako homozygotyczne polimorfizmy delecyjne w populacjach ludzkich, co sugeruje, że te geny są zbędne u ludzi. Szybko gromadzące się dowody wskazują, że zmiany strukturalne mogą obejmować miliony nukleotydów heterogeniczności w każdym genomie i prawdopodobnie wniosą istotny wkład w różnorodność ludzi i podatność na choroby.

Mikroskopijna zmienność strukturalna

Mikroskopijny oznacza, że ​​można go wykryć za pomocą mikroskopów optycznych , takich jak aneuploidie , chromosom markerowy , duże rearanżacje i zmienność wielkości chromosomu. Uważa się, że częstość występowania w populacji ludzkiej jest niedoszacowana ze względu na fakt, że niektóre z nich nie są w rzeczywistości łatwe do zidentyfikowania. Według domniemanych informacji te nieprawidłowości strukturalne występują u 1 na 375 żywych urodzeń.

Submikroskopowa zmienność strukturalna

Submikroskopowe warianty strukturalne są znacznie trudniejsze do wykrycia ze względu na ich mały rozmiar. Pierwsze badanie przeprowadzone w 2004 r., w którym wykorzystano mikromacierze DNA, pozwoliło wykryć dziesiątki loci genetycznych , które wykazywały zmienność liczby kopii , delecje i duplikacje , większe niż 100 kilozasad w ludzkim genomie. Jednak do 2015 roku badania sekwencjonowania całego genomu mogą wykryć około 5000 wariantów strukturalnych o wielkości zaledwie 100 par zasad obejmujących około 20 megabaz w każdym pojedynczym genomie. Te warianty strukturalne obejmują delecje, duplikacje tandemowe, inwersje , insercje elementów ruchomych . Wskaźnik mutacji jest również znacznie wyższy niż w przypadku mikroskopijnych wariantów strukturalnych, oszacowany w dwóch badaniach odpowiednio na 16% i 20%, z których oba są prawdopodobnie niedoszacowane ze względu na wyzwania związane z dokładnym wykryciem wariantów strukturalnych. Wykazano również, że generowanie spontanicznych wariantów strukturalnych znacznie zwiększa prawdopodobieństwo generowania dalszych spontanicznych wariantów pojedynczych nukleotydów lub indeli w promieniu 100 kilozasad zdarzenia zmienności strukturalnej.

Odmiana numeru kopii

Zmienność liczby kopii (CNV) to duża kategoria zmienności strukturalnej, która obejmuje wstawienia , usunięcia i duplikacje . W ostatnich badaniach zmiany liczby kopii są testowane na osobach, które nie mają chorób genetycznych, przy użyciu metod stosowanych do ilościowego genotypowania SNP. Wyniki pokazują, że 28% podejrzanych regionów u osobników faktycznie zawiera zmiany liczby kopii. Ponadto CNV w ludzkim genomie wpływają na więcej nukleotydów niż polimorfizm pojedynczego nukleotydu (SNP). Warto również zauważyć, że wiele CNV nie znajduje się w regionach kodujących. Ponieważ CNV są ​​zwykle spowodowane przez nierówna rekombinacja , rozpowszechnione podobne sekwencje, takie jak LINE i SINE , mogą być powszechnym mechanizmem tworzenia CNV.

Inwersja

Znanych jest kilka inwersji związanych z chorobami ludzkimi. Na przykład powtarzająca się inwersja 400 kb w genie czynnika VIII jest częstą przyczyną hemofilii A , a mniejsze inwersje wpływające na 2-sulfatazę idunoranu (IDS) spowodują zespół Huntera . Więcej przykładów obejmuje zespół Angelmana i zespół Sotosa . Jednak ostatnie badania pokazują, że jedna osoba może mieć 56 domniemanych inwersji, a zatem inwersje niezwiązane z chorobą są bardziej powszechne niż wcześniej przypuszczano. Również w tym badaniu wskazano, że punkty przerwania inwersji są często związane z duplikacjami segmentowymi. Jedna inwersja 900 kb w pliku chromosom 17 jest w trakcie pozytywnej selekcji i przewiduje się, że zwiększy swoją częstość występowania w populacji europejskiej.

Inne warianty konstrukcyjne

Mogą wystąpić bardziej złożone warianty strukturalne, które obejmują kombinację powyższych w jednym zdarzeniu. Najczęstszym typem złożonej zmienności strukturalnej są duplikacje nietandemowe, w których sekwencja jest powielana i wstawiana w odwróconej lub bezpośredniej orientacji do innej części genomu. Inne klasy złożonych wariantów strukturalnych obejmują delecje-inwersje-delecje, duplikacje-inwersje-duplikacje i duplikacje tandemowe z zagnieżdżonymi delecjami. Istnieją również tajemnicze translokacje i segmentalna disomia jednorodzicielska (UPD). Jest coraz więcej doniesień o tych odmianach, ale są one trudniejsze do wykrycia niż tradycyjne odmiany, ponieważ te odmiany są zrównoważone i oparte na tablicach lub PCR nie są w stanie ich zlokalizować.

Zmienność strukturalna i fenotypy

niektóre choroby genetyczne są spowodowane zmianami strukturalnymi, ale związek nie jest bardzo pewny. Nie jest rozsądne dzielenie tych wariantów na dwie klasy jako „normalne” lub „chorobowe”, ponieważ rzeczywista produkcja tego samego wariantu również będzie się różnić. Ponadto kilka wariantów jest faktycznie pozytywnie wybranych (wspomnianych powyżej). Szereg badań wykazało, że spontaniczne ( de novo ) CNV zakłócające geny zakłócają geny około cztery razy częściej u osób z autyzmem niż u osób z grupy kontrolnej i stanowią około 5–10% przypadków. Odziedziczone warianty również przyczyniają się do około 5–10% przypadków autyzmu.

Zmiany strukturalne mają również swoją funkcję w genetyce populacji. Różna częstość tej samej zmienności może być wykorzystana jako znak genetyczny do wnioskowania o związku między populacjami na różnych obszarach. Pełne porównanie zmienności strukturalnej człowieka i szympansa również sugerowało, że niektóre z nich mogą być utrwalone w jednym gatunku ze względu na jego funkcję adaptacyjną. Istnieją również skreślenia związane z odpornością na malarię i AIDS . Uważa się również, że niektóre bardzo zmienne segmenty są spowodowane doborem równoważącym, ale istnieją również badania przeciwko tej hipotezie.

Baza danych zmienności strukturalnej

Niektóre przeglądarki genomu i bioinformatyczne bazy danych zawierają listę zmian strukturalnych ludzkiego genomu z naciskiem na CNV i mogą wyświetlać je na stronie przeglądania genomu, na przykład UCSC Genome Browser . Pod stroną wyświetlającą część genomu znajdują się „Common Cell CNVs” i „Structural Var”, które można włączyć. W NCBI dostępna jest specjalna strona poświęcona zmianom strukturalnym. W tym systemie pokazane są zarówno współrzędne „wewnętrzne”, jak i „zewnętrzne”; oba nie są faktycznymi punktami przerwania, ale przypuszczalnym minimalnym i maksymalnym zakresem sekwencji, na który ma wpływ zmienność strukturalna. Typy są klasyfikowane jako wstawienie, utrata, wzmocnienie, inwersja, LOH, wywinięcie, transchr i UPD. [ potrzebne źródło ]

Metody wykrywania

Sygnatury i wzorce SV do usunięcia (A), wstawienia nowej sekwencji (B), inwersji (C) i duplikacji tandemowej (D) w liczbie odczytów (RC), parze odczytu (RP), odczycie dzielonym (SR), i metody montażu de novo (AS).

Opracowano nowe metody analizy genetycznej zmienności strukturalnej człowieka w wysokiej rozdzielczości. Metody stosowane do testowania genomu są albo w sposób ukierunkowany, albo w sposób obejmujący cały genom. W przypadku testów całego genomu metody hybrydyzacji porównawczej genomu oparte na macierzach zapewniają najlepsze skany całego genomu w celu znalezienia nowych wariantów liczby kopii. Techniki te wykorzystują fragmenty DNA, które są znakowane z genomu będącego przedmiotem zainteresowania i są hybrydyzowane, z innym genomem znakowanym inaczej, z macierzami pokrytymi sklonowanymi fragmentami DNA. Ujawnia to różnice w liczbie kopii między dwoma genomami.

W przypadku ukierunkowanych badań genomu najlepsze testy do sprawdzania określonych obszarów genomu opierają się głównie na PCR. Najlepiej znaną metodą opartą na PCR jest ilościowa reakcja łańcuchowa polimerazy w czasie rzeczywistym (qPCR). Innym podejściem jest szczegółowe sprawdzenie pewnych obszarów otaczających znane duplikacje segmentowe, ponieważ są to zwykle obszary zmienności liczby kopii. Metodę genotypowania SNP, która oferuje niezależne intensywności fluorescencji dla dwóch alleli, można zastosować do celowania w nukleotydy pomiędzy dwiema kopiami segmentowej duplikacji. Na tej podstawie można zaobserwować wzrost intensywności jednego z alleli w porównaniu z drugim.

Wraz z rozwojem technologii sekwencjonowania nowej generacji (NGS) zgłoszono cztery klasy strategii wykrywania wariantów strukturalnych za pomocą danych NGS, z których każda opiera się na wzorcach diagnostycznych różnych klas SV.

  • Metody głębokości odczytu lub liczby odczytów zakładają losowy rozkład (np. rozkład Poissona ) odczytów z krótkiej sekwencji odczytów. Badana jest rozbieżność z tą dystrybucją w celu wykrycia duplikatów i usunięć. Regiony z duplikatami będą wykazywać większą głębokość odczytu, podczas gdy te z usunięciem spowodują niższą głębokość odczytu.
  • Metody odczytu podzielonego umożliwiają wykrywanie insercji (w tym insercji elementów ruchomych ) i delecji z dokładnością do pojedynczej pary zasad. Obecność SV jest identyfikowana na podstawie nieciągłego dopasowania do genomu odniesienia. Luka w odczycie oznacza usunięcie, aw odnośniku – wstawienie.
  • Metody parowania odczytu sprawdzają długość i orientację odczytów sparowanych końców z danych sekwencjonowania krótkich odczytów. Na przykład odczytane pary dalej od siebie niż oczekiwano wskazują na usunięcie. Translokacje, inwersje i duplikacje tandemowe można również wykryć za pomocą par odczytu.
  • de novo można zastosować z odczytami, które są wystarczająco dokładne. Podczas gdy w praktyce stosowanie tej metody jest ograniczone długością odczytów sekwencji, zespoły genomu oparte na długich odczytach oferują wykrywanie zmian strukturalnych dla klas, takich jak insercje, które wymykają się wykryciu przy użyciu innych metod.

Zobacz też

Linki zewnętrzne