Krzywa Z

Krzywa Z chromosomu III C.elegans

Metoda krzywej Z (lub krzywej Z ) to algorytm bioinformatyczny do analizy genomu . Krzywa Z jest trójwymiarową krzywą , która stanowi unikalną reprezentację sekwencji DNA , tj. dla krzywej Z i danej sekwencji DNA można w unikalny sposób zrekonstruować z drugiej . Powstała krzywa ma kształt zygzaka, stąd nazwa krzywej Z.

Tło

0 Metoda Z Curve została po raz pierwszy stworzona w 1994 roku jako sposób wizualnego mapowania sekwencji DNA lub RNA. Różne właściwości krzywej Z, takie jak jej symetria i okresowość, mogą dostarczyć unikalnych informacji o sekwencji DNA. Krzywa Z jest generowana z szeregu węzłów P , P 1 ,...P N , o współrzędnych x n , y n , oraz z n (n=0,1,2...N, gdzie N jest długość sekwencji DNA). Krzywa Z jest tworzona przez sekwencyjne łączenie każdego z węzłów.

Aplikacje

Informacje o rozmieszczeniu nukleotydów w sekwencji DNA można określić na podstawie krzywej Z. Cztery nukleotydy są połączone w sześć różnych kategorii. Nukleotydy są umieszczane w każdej kategorii według pewnych cech definiujących, a każda kategoria jest oznaczona literą.

Puryna R = A, G Amino M = A, C Słabe wiązania wodorowe W = A, T
Pirymidyna Y = C, T Keto K = G, T Silne wiązania wodorowe S = G, C

Składowe x, y i z krzywej Z przedstawiają rozkład każdej z tych kategorii zasad dla badanej sekwencji DNA. Składnik x reprezentuje rozkład purynowych i pirymidynowych (R/Y). Składnik y przedstawia rozmieszczenie zasad aminowych i ketonowych (M/K), a składnik z przedstawia rozkład silnych wiązań H i słabych zasad wiążących H (S/W) w sekwencji DNA.

Metoda krzywej Z była stosowana w wielu różnych obszarach badań genomu , takich jak identyfikacja miejsca startu replikacji , przewidywanie genów ab initio , identyfikacja izochorów , identyfikacja wysp genomowych i genomika porównawcza . Wykazano również, że analiza krzywej Z jest w stanie przewidzieć, czy gen zawiera introny ,

Badania

Eksperymenty wykazały, że krzywą Z można wykorzystać do identyfikacji miejsca startu replikacji w różnych organizmach. W jednym badaniu przeanalizowano krzywą Z dla wielu gatunków Archaea i stwierdzono, że oriC znajduje się na ostrym szczycie krzywej, po którym następuje szeroka podstawa. Region ten był bogaty w zasady AT i miał wiele powtórzeń, co jest oczekiwane w przypadku miejsc pochodzenia replikacji. To i inne podobne badania wykorzystano do wygenerowania programu, który mógłby przewidzieć początek replikacji za pomocą krzywej Z.

Krzywa Z została również wykorzystana eksperymentalnie do określenia zależności filogenetycznych. W jednym z badań nowy koronawirus w Chinach został przeanalizowany przy użyciu analizy sekwencji i metody krzywej Z w celu określenia jego związku filogenetycznego z innymi koronawirusami. Ustalono, że podobieństwa i różnice między spokrewnionymi gatunkami można szybko określić, badając wizualnie ich krzywe Z. Stworzono algorytm do identyfikacji środka geometrycznego i innych trendów na krzywej Z 24 gatunków koronawirusów. Dane posłużyły do ​​stworzenia drzewa filogenetycznego. Wyniki pasowały do ​​drzewa, które zostało wygenerowane za pomocą analizy sekwencji. Metoda krzywej Z okazała się lepsza, ponieważ podczas gdy analiza sekwencji tworzy drzewo filogenetyczne oparte wyłącznie na sekwencjach kodujących w genomie, metoda krzywej Z analizowała cały genom.

Linki zewnętrzne