BAli-Phy
Deweloperzy | Benjamina Redelingsa |
---|---|
Wersja stabilna | 3.6.0 / 5 21 lutego
|
Napisane w | C++ |
System operacyjny | Windows , macOS , UNIX , Linux |
Typ | Narzędzie bioinformatyczne |
Licencja | GPLv2 |
Strona internetowa |
BAli-Phy to darmowy program do jednoczesnego szacowania dopasowania wielu sekwencji i jego drzewa filogenetycznego . BAli-Phy osiąga wysoką dokładność w szacowaniu wyrównania, wykorzystując informacje ze współoszacowanej filogenezy. BAli-Phy bierze pod uwagę niepewność dopasowania podczas szacowania filogenezy poprzez uśrednienie możliwych dopasowań. W przeciwieństwie do większości programów do wnioskowania o filogenezie, sekwencje wejściowe nie muszą być wcześniej wyrównywane. Różni się to od tradycyjnych podejść do szacowania wyrównania i filogenezy, które najpierw szacują wyrównanie bez oszacowania drzewa wysokiej jakości, a następnie szacują drzewo na podstawie wyrównania.
BAli-Phy tworzy dystrybucję bayesowską a posteriori zarówno na wyrównaniach, jak i na drzewie. Oprogramowanie pokazuje niepewność zarówno w wyrównaniu, jak iw drzewie. BAli-Phy wykorzystuje Monte Carlo łańcucha Markowa do oszacowania. Uruchomienie może zająć kilka dni.
Niepewność wyrównania
Niepewność wyrównania wynika z dwóch głównych źródeł: wyrównania bliskiego optymalnemu i niepewności parametrów ewolucyjnych. Parametry ewolucyjne obejmują długości gałęzi, współczynniki substytucji, współczynniki insercji / delecji i samą filogenezę. Jeśli dokładna wartość tych parametrów jest nieznana, a oszacowanie wyrównania jest wrażliwe na parametr, to wyrównanie nie może być znane z pewnością.
Nawet jeśli parametry ewolucyjne są w pełni znane, wiele różnych dopasowań może być optymalnych lub prawie optymalnych. W takim przypadku badacz nie może ufać żadnemu pojedynczemu dopasowaniu, ale musi uśrednić w chmurze prawie optymalnych dopasowań.
BAli-Phy może obsłużyć zarówno niemal optymalną niepewność wyrównania, jak i ewolucyjną niepewność parametrów poprzez całkowanie po możliwych wyrównaniach i wartościach parametrów.
Wejście i wyjście
BAli-Phy akceptuje sekwencje nukleotydów , aminokwasów i kodonów w formacie FASTA . Sekwencje wejściowe nie muszą być wyrównane. Obsługiwane są niejednoznaczne nukleotydy, takie jak R i Y, podobnie jak niejednoznaczne aminokwasy B, Z i J.
Drzewa są wyprowadzane w formacie Newick . Linie trasowania są wyprowadzane w formacie FASTA. Dopasowania wyjściowe obejmują informacje o homologii dla sekwencji w wewnętrznych węzłach drzewa.