Phyre

Phyre2
Deweloperzy
  • Lawrence'a Kelley'a
  • Boba Maccalluma
  • Benjamina Jefferysa
  • Aleksa Herberta
  • Riccardo Bennett-Lovsey
  • Michał Sternberg
Wersja stabilna
2.0 / 23 lutego 2011 ; 12 lat temu ( 23.02.2011 )
Napisane w
Dostępne w język angielski
Typ bioinformatyczne do przewidywania struktury białek
Licencja Creative Commons -2.0
Strona internetowa www.sbg.bio.ic.ac.uk/phyre2 _ _ _ _ _ _

Phyre i Phyre2 ( P rotein H omology/Analog Y Recognition Engine ; wymawiane jako „ogień”) to bezpłatne usługi internetowe do przewidywania struktury białek . Phyre jest jedną z najpopularniejszych metod przewidywania struktury białek, cytowaną ponad 1500 razy. Podobnie jak inne techniki zdalnego rozpoznawania homologii (patrz nitkowanie białek ), jest w stanie regularnie generować wiarygodne modele białek, podczas gdy inne szeroko stosowane metody, takie jak PSI-BLAST Nie mogę. Phyre2 został zaprojektowany w celu zapewnienia przyjaznego interfejsu dla użytkowników niedoświadczonych w metodach przewidywania struktury białek. Jego rozwój jest finansowany przez Radę ds. Badań Biotechnologii i Nauk Biologicznych .

Opis

Serwery Phyre i Phyre2 przewidują trójwymiarową strukturę sekwencji białek przy użyciu zasad i technik modelowania homologii . Ponieważ struktura białka jest bardziej konserwatywna podczas ewolucji niż jego sekwencja aminokwasowa, sekwencja białka będącego przedmiotem zainteresowania (cel) może być modelowana z rozsądną dokładnością na bardzo odległej sekwencji o znanej strukturze (matrycy), pod warunkiem, że zależność między celem a szablonem można rozróżnić poprzez dopasowanie sekwencji . Obecnie najpotężniejsze i najdokładniejsze metody wykrywania i dopasowywania zdalnie powiązanych sekwencji opierają się na profilach lub ukryte modele Markowa (HMM). Te profile/HMM wychwytują skłonność mutacyjną każdej pozycji w sekwencji aminokwasowej na podstawie obserwowanych mutacji w powiązanych sekwencjach i można je traktować jako „ewolucyjny odcisk palca” określonego białka.

Zazwyczaj kompiluje się sekwencje aminokwasowe reprezentatywnego zestawu wszystkich znanych trójwymiarowych struktur białkowych i sekwencje te są przetwarzane przez skanowanie w dużej bazie danych sekwencji białkowych. Rezultatem jest baza danych profili lub HMM, po jednym dla każdej znanej struktury 3D. Sekwencja użytkownika będąca przedmiotem zainteresowania jest podobnie przetwarzana w celu utworzenia profilu/HMM. Ten profil użytkownika jest następnie skanowany w bazie danych profili przy użyciu technik dopasowania profil-profil lub HMM-HMM. Te dopasowania mogą również uwzględniać wzorce przewidywanych lub znanych elementów struktury drugorzędowej i mogą być oceniane przy użyciu różnych modeli statystycznych. Zobacz przewidywanie struktury białek po więcej informacji.

macierzy punktowej każdego białka zależnej od pozycji . Serwer Phyre2 został publicznie wydany w lutym 2011 r. jako zamiennik oryginalnego serwera Phyre i zapewnia dodatkową funkcjonalność w stosunku do Phyre, bardziej zaawansowany interfejs, w pełni zaktualizowaną bibliotekę składania i wykorzystuje pakiet HHpred / HHsearch do wykrywania homologii wśród innych ulepszeń .

Standardowe użycie

Po wklejeniu sekwencji aminokwasowej białka do formularza Phyre lub Phyre2, użytkownik zazwyczaj czeka od 30 minut do kilku godzin (w zależności od czynników takich jak długość sekwencji, liczba sekwencji homologicznych oraz częstotliwość i długość insercji i delecji) na prognoza do uzupełnienia. Do użytkownika wysyłana jest wiadomość e-mail zawierająca informacje podsumowujące oraz przewidywaną strukturę w formacie PDB wraz z linkiem do strony internetowej z wynikami. Ekran wyników Phyre2 jest podzielony na trzy główne sekcje, opisane poniżej.

Struktura drugorzędowa i przewidywanie zaburzeń

Przykładowe dane wyjściowe Phyre2 do przewidywania struktury drugorzędowej i zaburzeń

Sekwencja białka przesłana przez użytkownika jest najpierw skanowana w dużej bazie danych sekwencji przy użyciu PSI-BLAST . Profil wygenerowany przez PSI-BLAST jest następnie przetwarzany przez program do przewidywania drugorzędowej struktury sieci neuronowej PsiPred i predyktor zaburzeń białek Disopred. Przewidywana obecność alfa-helis, nici beta i nieuporządkowanych regionów jest przedstawiona graficznie wraz z kolorowym paskiem ufności.

Analiza domeny

Przykładowe dane wyjściowe Phyre2 przedstawiające wiele domen i wyskakującą przeglądarkę modeli

Wiele białek zawiera wiele domen białkowych . Phyre2 udostępnia tabelę dopasowań szablonów oznaczoną kolorami według pewności i wskazującą region dopasowanej sekwencji użytkownika. Może to pomóc w określeniu składu domeny białka.

Szczegółowe informacje o szablonie

Przykładowa tabela szczegółowych informacji o szablonie Phyre2

Główna tabela wyników w Phyre2 zawiera oszacowania ufności, obrazy i łącza do trójwymiarowych przewidywanych modeli i informacji pochodzących z bazy danych klasyfikacji strukturalnej białek (SCOP) lub z banku danych białek (PDB), w zależności od źródła wykrytego szablonu. Dla każdego dopasowania łącze przenosi użytkownika do szczegółowego widoku dopasowania między sekwencją użytkownika a sekwencją o znanej trójwymiarowej strukturze.

Widok wyrównania

Przykład Phyre2 szczegółowy widok dopasowania między sekwencją użytkownika a znaną strukturą białka.

Szczegółowy widok dopasowania pozwala użytkownikowi zbadać poszczególne dopasowane reszty, dopasowania między przewidywanymi i znanymi elementami struktury drugorzędowej oraz możliwość przełączania informacji dotyczących wzorców zachowania sekwencji i pewności struktury drugorzędowej. Ponadto Jmol jest używany do umożliwienia interaktywnego oglądania modelu białka w 3D.

Ulepszenia w Phyre2

Phyre2 korzysta z biblioteki folderów, która jest aktualizowana co tydzień w miarę rozwiązywania nowych struktur. Wykorzystuje bardziej aktualny interfejs i oferuje dodatkowe funkcje na serwerze Phyre, jak opisano poniżej.

Dodatkowa funkcjonalność

Przetwarzanie wsadowe

Funkcja przetwarzania wsadowego pozwala użytkownikom przesłać więcej niż jedną sekwencję do Phyre2 poprzez załadowanie pliku sekwencji w formacie FASTA . Domyślnie użytkownicy mają limit 100 sekwencji w partii. Limit ten można zwiększyć, kontaktując się z administratorem. Zadania wsadowe są przetwarzane w tle na wolnej mocy obliczeniowej, gdy tylko będzie ona dostępna. W związku z tym zadania wsadowe będą często trwać dłużej niż zadania przesyłane indywidualnie, ale jest to konieczne, aby umożliwić sprawiedliwą dystrybucję zasobów obliczeniowych wśród wszystkich użytkowników Phyre2.

Nawlekanie jeden do jednego

Wątkowanie jeden do jednego umożliwia przesłanie zarówno sekwencji, którą chcesz modelować ORAZ szablonu, na którym chcesz ją modelować. Użytkownicy czasami mają sekwencję białek, którą chcą modelować na wybranym przez siebie określonym szablonie. Może to być na przykład nowo rozwiązana struktura, której nie ma w bazie danych Phyre2 lub z powodu pewnych dodatkowych informacji biologicznych, które wskazują, że wybrany szablon dałby dokładniejszy model niż model wybrany automatycznie przez Phyre2.

Backphyre'a

Zamiast przewidywać strukturę 3D sekwencji białka, użytkownicy często mają rozwiązaną strukturę i są zainteresowani określeniem, czy w genomie będącym przedmiotem zainteresowania istnieje powiązana struktura. W Phyre2 załadowana struktura białkowa może zostać przekształcona w ukryty model Markowa, a następnie zeskanowana pod kątem zestawu genomów (ponad 20 genomów według stanu na marzec 2011 r.). Ta funkcja nosi nazwę „BackPhyre”, aby wskazać, w jaki sposób Phyre2 jest używany w odwrotnej kolejności.

Phyrealarm

Czasami Phyre2 nie może wykryć żadnych pewnych dopasowań do znanych struktur. Jednak baza danych biblioteki fałdowej powiększa się co tydzień o około 40-100 nowych struktur. Więc nawet jeśli w tym tygodniu może nie być przyzwoitych szablonów, być może pojawią się w nadchodzących tygodniach. Phyrealarm umożliwia użytkownikom przesyłanie sekwencji białek do automatycznego skanowania pod kątem nowych wpisów dodawanych do biblioteki fałd co tydzień. Jeśli zostanie wykryte pewne trafienie, użytkownik zostanie automatycznie powiadomiony e-mailem wraz z wynikami wyszukiwania Phyre2. Użytkownicy mogą również kontrolować poziom dopasowania i pewność dopasowania wymaganego do wyzwolenia alertu e-mail.

3DLiganSite

Phyre2 jest sprzężony z serwerem 3DLigandSite w celu przewidywania miejsc wiązania białek. 3DLigandSite był jednym z najlepiej działających serwerów do przewidywania miejsca wiązania w Critical Assessment of Techniques for Protein Structure Prediction (CASP) w ( CASP 8 i CASP 9). Pewne modele stworzone przez Phyre2 (pewność >90%) są automatycznie przesyłane do 3DLigandSite.

Przewidywanie topologii transbłonowej

Program memsat_svm służy do przewidywania obecności i topologii wszelkich helis transbłonowych obecnych w sekwencji białka użytkownika.

Modelowanie wielu szablonów

Phyre2 pozwala użytkownikom wybrać modelowanie „Intensywne” z głównego ekranu przesyłania. Ten tryb:

  • Analizuje listę trafień i stosuje heurystykę w celu wybrania szablonów, które maksymalizują pokrycie sekwencji i pewność.
  • Konstruuje modele dla każdego wybranego szablonu.
  • Wykorzystuje te modele, aby zapewnić ograniczenia odległości parami, które są wprowadzane do narzędzia modelowania ab initio i wielu szablonów Poing.
  • Poing syntetyzuje białko użytkownika w kontekście tych ograniczeń odległości, modelowanych przez sprężyny. Regiony, dla których nie ma informacji szablonowych, są modelowane przez ab initio Poinga.
  • Kompletny model wygenerowany przez Poing jest łączony z oryginalnymi szablonami jako dane wejściowe do MODELLER .

Aplikacje

Zastosowania Phyre i Phyre2 obejmują przewidywanie struktury białek, przewidywanie funkcji, przewidywanie domen, przewidywanie granic domen, ewolucyjną klasyfikację białek, kierowanie ukierunkowaną mutagenezą i rozwiązywanie struktur krystalicznych białek poprzez wymianę molekularną .

Istnieją dwa połączone zasoby, które wykorzystują przewidywania Phyre'a do opartej na strukturze analizy wariantów zmiany sensu, zwykle wynikających z polimorfizmów pojedynczych nukleotydów .

  • PhyreRisk to baza danych, która odwzorowuje warianty genetyczne na eksperymentalne i przewidywane przez Phyre struktury białek. Strona białka wyświetla eksperymentalne i przewidywane struktury. Użytkownicy mogą mapować warianty na podstawie współrzędnych genetycznych lub białkowych.
  • Missense3D to narzędzie, które dostarcza stereochemiczny raport na temat wpływu wariantu zmiany sensu na strukturę białka. Użytkownicy mogą przesyłać własne warianty i współrzędne, w tym zarówno struktury PDB, jak i modele przewidywane przez Phyre.

Historia

Phyre i Phyre2 są następcami systemu przewidywania struktury białek 3D-PSSM, który do tej pory ma ponad 1400 cytowań. 3D-PSSM został zaprojektowany i opracowany przez Lawrence'a Kelleya i Boba MacCalluma w laboratorium modelowania biomolekularnego w Cancer Research UK . Phyre i Phyre2 byli Lawrence Kelley w bioinformatyki strukturalnej , Imperial College London . Komponenty systemów Phyre i Phyre2 zostały opracowane przez Benjamina Jefferysa, Alexa Herberta i Riccardo Bennetta-Lovseya. Prace badawczo-rozwojowe obu serwerów nadzorował Michael Sternberg .