BAli-Phy

BAli-Phy
Deweloperzy Benjamina Redelingsa
Wersja stabilna
3.6.0 / 5 21 lutego ; 2 lata temu ( 21.02.05 )
Napisane w C++
System operacyjny Windows , macOS , UNIX , Linux
Typ Narzędzie bioinformatyczne
Licencja GPLv2
Strona internetowa bali-phy .org

BAli-Phy to darmowy program do jednoczesnego szacowania dopasowania wielu sekwencji i jego drzewa filogenetycznego . BAli-Phy osiąga wysoką dokładność w szacowaniu wyrównania, wykorzystując informacje ze współoszacowanej filogenezy. BAli-Phy bierze pod uwagę niepewność dopasowania podczas szacowania filogenezy poprzez uśrednienie możliwych dopasowań. W przeciwieństwie do większości programów do wnioskowania o filogenezie, sekwencje wejściowe nie muszą być wcześniej wyrównywane. Różni się to od tradycyjnych podejść do szacowania wyrównania i filogenezy, które najpierw szacują wyrównanie bez oszacowania drzewa wysokiej jakości, a następnie szacują drzewo na podstawie wyrównania.

BAli-Phy tworzy dystrybucję bayesowską a posteriori zarówno na wyrównaniach, jak i na drzewie. Oprogramowanie pokazuje niepewność zarówno w wyrównaniu, jak iw drzewie. BAli-Phy wykorzystuje Monte Carlo łańcucha Markowa do oszacowania. Uruchomienie może zająć kilka dni.

Niepewność wyrównania

Niepewność wyrównania wynika z dwóch głównych źródeł: wyrównania bliskiego optymalnemu i niepewności parametrów ewolucyjnych. Parametry ewolucyjne obejmują długości gałęzi, współczynniki substytucji, współczynniki insercji / delecji i samą filogenezę. Jeśli dokładna wartość tych parametrów jest nieznana, a oszacowanie wyrównania jest wrażliwe na parametr, to wyrównanie nie może być znane z pewnością.

Nawet jeśli parametry ewolucyjne są w pełni znane, wiele różnych dopasowań może być optymalnych lub prawie optymalnych. W takim przypadku badacz nie może ufać żadnemu pojedynczemu dopasowaniu, ale musi uśrednić w chmurze prawie optymalnych dopasowań.

BAli-Phy może obsłużyć zarówno niemal optymalną niepewność wyrównania, jak i ewolucyjną niepewność parametrów poprzez całkowanie po możliwych wyrównaniach i wartościach parametrów.

Wejście i wyjście

BAli-Phy akceptuje sekwencje nukleotydów , aminokwasów i kodonów w formacie FASTA . Sekwencje wejściowe nie muszą być wyrównane. Obsługiwane są niejednoznaczne nukleotydy, takie jak R i Y, podobnie jak niejednoznaczne aminokwasy B, Z i J.

Drzewa są wyprowadzane w formacie Newick . Linie trasowania są wyprowadzane w formacie FASTA. Dopasowania wyjściowe obejmują informacje o homologii dla sekwencji w wewnętrznych węzłach drzewa.

Zobacz też

Linki zewnętrzne