Krzywa Z
Metoda krzywej Z (lub krzywej Z ) to algorytm bioinformatyczny do analizy genomu . Krzywa Z jest trójwymiarową krzywą , która stanowi unikalną reprezentację sekwencji DNA , tj. dla krzywej Z i danej sekwencji DNA można w unikalny sposób zrekonstruować z drugiej . Powstała krzywa ma kształt zygzaka, stąd nazwa krzywej Z.
Tło
0 Metoda Z Curve została po raz pierwszy stworzona w 1994 roku jako sposób wizualnego mapowania sekwencji DNA lub RNA. Różne właściwości krzywej Z, takie jak jej symetria i okresowość, mogą dostarczyć unikalnych informacji o sekwencji DNA. Krzywa Z jest generowana z szeregu węzłów P , P 1 ,...P N , o współrzędnych x n , y n , oraz z n (n=0,1,2...N, gdzie N jest długość sekwencji DNA). Krzywa Z jest tworzona przez sekwencyjne łączenie każdego z węzłów.
Aplikacje
Informacje o rozmieszczeniu nukleotydów w sekwencji DNA można określić na podstawie krzywej Z. Cztery nukleotydy są połączone w sześć różnych kategorii. Nukleotydy są umieszczane w każdej kategorii według pewnych cech definiujących, a każda kategoria jest oznaczona literą.
Puryna | R = A, G | Amino | M = A, C | Słabe wiązania wodorowe | W = A, T |
Pirymidyna | Y = C, T | Keto | K = G, T | Silne wiązania wodorowe | S = G, C |
Składowe x, y i z krzywej Z przedstawiają rozkład każdej z tych kategorii zasad dla badanej sekwencji DNA. Składnik x reprezentuje rozkład purynowych i pirymidynowych (R/Y). Składnik y przedstawia rozmieszczenie zasad aminowych i ketonowych (M/K), a składnik z przedstawia rozkład silnych wiązań H i słabych zasad wiążących H (S/W) w sekwencji DNA.
Metoda krzywej Z była stosowana w wielu różnych obszarach badań genomu , takich jak identyfikacja miejsca startu replikacji , przewidywanie genów ab initio , identyfikacja izochorów , identyfikacja wysp genomowych i genomika porównawcza . Wykazano również, że analiza krzywej Z jest w stanie przewidzieć, czy gen zawiera introny ,
Badania
Eksperymenty wykazały, że krzywą Z można wykorzystać do identyfikacji miejsca startu replikacji w różnych organizmach. W jednym badaniu przeanalizowano krzywą Z dla wielu gatunków Archaea i stwierdzono, że oriC znajduje się na ostrym szczycie krzywej, po którym następuje szeroka podstawa. Region ten był bogaty w zasady AT i miał wiele powtórzeń, co jest oczekiwane w przypadku miejsc pochodzenia replikacji. To i inne podobne badania wykorzystano do wygenerowania programu, który mógłby przewidzieć początek replikacji za pomocą krzywej Z.
Krzywa Z została również wykorzystana eksperymentalnie do określenia zależności filogenetycznych. W jednym z badań nowy koronawirus w Chinach został przeanalizowany przy użyciu analizy sekwencji i metody krzywej Z w celu określenia jego związku filogenetycznego z innymi koronawirusami. Ustalono, że podobieństwa i różnice między spokrewnionymi gatunkami można szybko określić, badając wizualnie ich krzywe Z. Stworzono algorytm do identyfikacji środka geometrycznego i innych trendów na krzywej Z 24 gatunków koronawirusów. Dane posłużyły do stworzenia drzewa filogenetycznego. Wyniki pasowały do drzewa, które zostało wygenerowane za pomocą analizy sekwencji. Metoda krzywej Z okazała się lepsza, ponieważ podczas gdy analiza sekwencji tworzy drzewo filogenetyczne oparte wyłącznie na sekwencjach kodujących w genomie, metoda krzywej Z analizowała cały genom.
Linki zewnętrzne
- Baza danych krzywej Z
- „Wyszukiwarka Ori” . Centrum Bioinformatyki Uniwersytetu Tianjin (TUBIC). — darmowy program internetowy do przewidywania „początków replikacji” za pomocą krzywych Z.
- Eksplorator wątków ENCODE Trójwymiarowe połączenia w całym genomie. Natura (czasopismo)
- Krzywa Z
- Wprowadzenie do krzywych Z. http://tubic.tju.edu.cn/zcurve/introduce.php
- Zidentyfikuj miejsca startu genu za pomocą krzywych Z. http://tubic.tju.edu.cn/GS-Finder/