Profilowanie filogenetyczne
Profilowanie filogenetyczne to technika bioinformatyczna , w której łączna obecność lub łączna nieobecność dwóch cech u dużej liczby gatunków jest wykorzystywana do wnioskowania o znaczącym związku biologicznym, takim jak udział dwóch różnych białek w tym samym szlaku biologicznym . Wraz z badaniem konserwatywnej syntenii , konserwowanej struktury operonu lub fuzji domen „Rosetta Stone” , porównywanie profili filogenetycznych jest określaną techniką „post-homologiczną”, w której obliczenia niezbędne dla tej metody rozpoczynają się po ustaleniu, które białka są homologiczne do których. Wiele z tych technik zostało opracowanych przez Davida Eisenberga i współpracowników; porównanie profili filogenetycznych zostało wprowadzone w 1999 roku przez Pellegriniego i in.
metoda
Ponad 2000 gatunków bakterii , archeonów i eukariontów jest obecnie reprezentowanych przez pełne sekwencje genomu DNA. Zazwyczaj każdy gen w genomie koduje białko , które można przypisać do określonej rodziny białek na podstawie homologii . Dla danej rodziny białek jej obecność lub brak w każdym genomie (w oryginalnym, binarnym składzie) jest reprezentowana przez 1 (obecny) lub 0 (nieobecny). W konsekwencji filogenetyka rozmieszczenie rodziny białek może być reprezentowane przez długą liczbę binarną z cyfrą dla każdego genomu; takie reprezentacje binarne można łatwo porównywać ze sobą w celu wyszukania skorelowanych rozkładów filogenetycznych. Duża liczba kompletnych genomów sprawia, że profile te są bogate w informacje. Zaletą używania tylko pełnych genomów jest to, że wartości 0, reprezentujące brak cechy, wydają się być wiarygodne.
Teoria
Należy oczekiwać, że blisko spokrewnione gatunki będą miały bardzo podobne zestawy genów. Jednak zmiany kumulują się między bardziej odlegle spokrewnionymi gatunkami w procesach obejmujących poziomy transfer genów i utratę genów. Poszczególne białka pełnią określone funkcje molekularne, np. przeprowadzają pojedynczą reakcję enzymatyczną lub służą jako podjednostka większego kompleksu białkowego. Proces biologiczny, taki jak fotosynteza , metanogeneza lub histydyna biosynteza może wymagać skoordynowanego działania wielu białek. Jeśli jakieś białko krytyczne dla procesu zostanie utracone, inne białka dedykowane temu procesowi staną się bezużyteczne; dobór naturalny sprawia, że jest mało prawdopodobne, aby te bezużyteczne białka zostały zachowane w czasie ewolucji. Dlatego też, gdyby dwie różne rodziny białek konsekwentnie były obecne lub nieobecne razem, prawdopodobną hipotezą jest to, że te dwa białka współpracują w jakimś procesie biologicznym.
Postępy i wyzwania
Profilowanie filogenetyczne doprowadziło do wielu odkryć w biologii, w tym nieznanych wcześniej enzymów w szlakach metabolicznych , czynników transkrypcyjnych , które wiążą się z konserwatywnymi miejscami regulatorowymi oraz wyjaśnień roli niektórych mutacji w chorobach człowieka . Udoskonalanie samej metody jest aktywnym obszarem badań naukowych, ponieważ sama metoda napotyka na kilka ograniczeń. Po pierwsze, współwystępowanie dwóch rodzin białek często reprezentuje niedawne wspólne pochodzenie dwóch gatunków, a nie konserwatywny związek funkcjonalny; ujednoznacznienie tych dwóch źródeł korelacji może wymagać udoskonalonych metod statystycznych. Po drugie, białka zgrupowane jako homologi mogą różnić się funkcją lub białka konserwowane pod względem funkcji mogą nie zarejestrować się jako homologi; ulepszone metody dostosowywania wielkości każdej rodziny białek w celu odzwierciedlenia konserwacji funkcjonalnej doprowadzą do lepszych wyników.
Narzędzia
Narzędzia obejmują PLEX (Protein Link Explorer). (Obecnie nieistniejący) i JGI IMG (Integrated Microbial Genomes) Phylogenetic Profiler (zarówno dla pojedynczych genów, jak i kaset genowych ).