RAPTOR (oprogramowanie)
Oryginalni autorzy | Doktor Jinbo Xu |
---|---|
Deweloper (y) | Rozwiązania bioinformatyczne Inc. |
Wersja stabilna | 4.2 / listopad 2008
|
System operacyjny | Windowsa , Linuksa |
Typ | Przewidywanie struktury białek |
Strona internetowa |
RAPTOR to oprogramowanie do gwintowania białek używane do przewidywania struktury białek . Został on zastąpiony przez RaptorX , który jest znacznie dokładniejszy od RAPTORA.
Porównanie technik
Threading białek a modelowanie homologii
Naukowcy próbujący poznać strukturę białka rozpoczynają badania od jedynie sekwencji białka. Początkowe kroki mogą obejmować wykonanie PSI-BLAST lub PatternHunter w celu zlokalizowania podobnych sekwencji o znanej strukturze w banku danych białkowych (PDB). Jeśli istnieją bardzo podobne sekwencje o znanych strukturach, istnieje duże prawdopodobieństwo, że struktura tego białka będzie bardzo podobna do znanych struktur i funkcji. Jeżeli nie stwierdzono homologii, badacz musi wykonać krystalografię rentgenowską lub spektroskopia magnetycznego rezonansu jądrowego (NMR) , przy czym obie metody wymagają znacznego czasu i zasobów, aby uzyskać strukturę. Tam, gdzie techniki te są zbyt drogie, czasochłonne lub mają ograniczony zakres, badacze mogą wykorzystać oprogramowanie do gwintowania białek, takie jak RAPTOR, aby stworzyć wysoce niezawodny model białka.
Threading białek jest bardziej skuteczny niż modelowanie homologii, zwłaszcza w przypadku białek, które mają niewiele homologów wykrywalnych przez dopasowanie sekwencji . Obie metody przewidują strukturę białka na podstawie szablonu. Biorąc pod uwagę sekwencję białka, nawlekanie białek najpierw dopasowuje (nawleka) sekwencję do każdej matrycy w bibliotece struktur poprzez optymalizację funkcji punktacji, która mierzy dopasowanie dopasowania sekwencji do struktury. Wybrany najlepszy szablon służy do budowy modelu konstrukcji. W przeciwieństwie do modelowania homologii, które wybiera szablon wyłącznie w oparciu o informacje o homologii (dopasowania sekwencji), funkcja punktacji stosowana w gwintowaniu białek wykorzystuje zarówno informacje o homologii, jak i strukturze (dopasowania struktury sekwencji).
Jeśli w sekwencji nie znaleziono znaczącej homologii, modelowanie homologii może w tym przypadku nie dać wiarygodnych przewidywań. Bez informacji o homologii, nitkowanie białek może nadal wykorzystywać informacje o strukturze do uzyskania dobrych przewidywań. Nieudane próby uzyskania dobrego szablonu za pomocą BLAST często skutkują przetwarzaniem wyników przez użytkowników za pomocą RAPTOR.
Programowanie całkowite a programowanie dynamiczne
Podejście do programowania liczb całkowitych w RAPTOR pozwala uzyskać modele o wyższej jakości niż inne metody gwintowania białek. Większość oprogramowania do obsługi wątków wykorzystuje programowanie dynamiczne w celu optymalizacji funkcji oceniania podczas dopasowywania sekwencji do szablonu. Programowanie dynamiczne jest znacznie łatwiejsze do wdrożenia niż programowanie liczb całkowitych; jeśli jednak funkcja punktacji zawiera potencjał kontaktu parami, programowanie dynamiczne nie może globalnie zoptymalizować takiej funkcji punktacji, a zamiast tego generuje jedynie lokalne optymalne dopasowanie.
Kontakty parami są bardzo konserwatywne w strukturze białka i mają kluczowe znaczenie dla dokładności przewidywania. Programowanie liczb całkowitych może globalnie zoptymalizować funkcję punktacji z potencjałem kontaktu parami i uzyskać globalne optymalne wyrównanie.
składniki
Silniki gwintowe
NoCore, NPCore i IP to trzy różne silniki wątków zaimplementowane w RAPTOR. NoCore i NPCore opierają się na programowaniu dynamicznym i są szybsze niż IP. Różnica między nimi polega na tym, że w NPCore szablon jest analizowany na wiele „rdzeniowych” regionów. Rdzeń jest regionem strukturalnie konserwatywnym. IP to unikalny silnik wątków firmy RAPTOR oparty na programowaniu liczb całkowitych. Tworzy lepsze wyrównania i modele niż pozostałe dwa silniki gwintowania. Ludzie zawsze mogą zacząć od NoCore i NPCore. Jeśli ich przewidywania nie są wystarczająco dobre, lepszym wyborem może być IP. Po zastosowaniu wszystkich trzech metod prosty konsensus może pomóc w znalezieniu najlepszej prognozy.
Moduł modelowania konstrukcji 3D
Domyślnym narzędziem do modelowania konstrukcji 3D używanym w RAPTOR jest OWL. Trójwymiarowe modelowanie konstrukcji składa się z dwóch etapów. Pierwszym krokiem jest modelowanie pętli, które modeluje regiony w sekwencji docelowej, które nie są odwzorowane w szablonie. Po wymodelowaniu wszystkich pętli i przygotowaniu szkieletu, łańcuchy boczne są mocowane do szkieletu i pakowane. W przypadku modelowania pętli stosuje się algorytm cyklicznego zmniejszania współrzędnych, aby wypełnić pętle i uniknąć kolizji. W przypadku upakowania łańcuchów bocznych stosuje się algorytm rozkładu drzewa, aby upakować wszystkie łańcuchy boczne i uniknąć jakichkolwiek kolizji. OWL jest automatycznie wywoływany w RAPTOR w celu wygenerowania wyjścia 3D.
Jeśli badacz ma MODELLER, może także skonfigurować RAPTOR tak, aby automatycznie wywoływał MODELLER. RAPTOR może także generować pliki wejściowe ICM-Pro, za pomocą których ludzie mogą samodzielnie uruchamiać ICM-Pro.
Moduł PSI-BLAST
Aby uczynić go kompleksowym zestawem narzędzi, w RAPTOR dołączono także PSI-BLAST, który umożliwia ludziom modelowanie homologii. Każdy może samodzielnie ustawić wszystkie niezbędne parametry. Uruchomienie PSI-BLAST składa się z dwóch etapów. Pierwszym krokiem jest wygenerowanie profilu sekwencji. Na tym etapie używana jest nienadmiarowa baza danych NR. Następnym krokiem jest umożliwienie PSI-BLAST przeszukania sekwencji docelowej względem sekwencji z Banku Danych Protein. Użytkownicy mogą również określić własną bazę danych dla każdego kroku.
Przeglądarka struktury białek
Istnieje wiele różnych przeglądarek struktur. W RAPTOR Jmol służy jako przeglądarka struktury do sprawdzania wygenerowanych przewidywań.
Wyjście
Po zadaniu Threading/PSI-BLAST można zobaczyć listę rankingową wszystkich szablonów. Dla każdego szablonu ludzie mogą zobaczyć wyrównanie, wartość E i wiele innych konkretnych wyników. Udostępnione są także informacje funkcjonalne o szablonie i jego klasyfikacji SCOP . Można także wyświetlić macierz PSM sekwencji i przewidywanie struktury drugorzędowej. Jeżeli szablon został zgłoszony więcej niż jedną metodą, zostanie oznaczona liczba jego zgłoszeń. Pomaga to w określeniu najlepszego szablonu.
Wydajność w CASP
CASP , Critical Assessment of Techniques for Protein Structure Prediction, to eksperyment odbywający się co dwa lata sponsorowany przez NIH . CASP reprezentuje igrzyska olimpijskie społeczności zajmującej się przewidywaniem struktury białek i została założona w 1994 roku.
RAPTOR po raz pierwszy pojawił się w CAFASP 3 (CASP5) w 2002 roku i w tym roku zajął pierwsze miejsce w indywidualnej grupie serwerów. Od tego czasu RAPTOR aktywnie uczestniczył w każdym CASP w celu oceny i konsekwentnie zajmował najwyższe miejsca w rankingach.
Najnowsza edycja CASP8 trwała od maja 2008 r. do sierpnia 2008 r. W wydarzeniu, którego uczestnicy próbują przewidzieć strukturę 3D na podstawie sekwencji białek, zarejestrowało się ponad 80 serwerów prognostycznych i ponad 100 grup ekspertów z całego świata. Według rankingu grupy Zhanga, RAPTOR zajął 2. miejsce wśród wszystkich serwerów (metaserwerów i serwerów indywidualnych). Na tej samej liście rankingowej ROBETTA firmy Baker lab znajduje się na 5. miejscu.
Pięć najlepszych serwerów prognoz w CASP8
Ranga | Urządzenie prognozujące | Używane cele | Wynik TM | Wynik MaxSub | Wynik GDT | Wynik GHA |
---|---|---|---|---|---|---|
1 | Serwer Zhang | 171 | 120,65 | 108,78 | 114,69 | 85,55 |
2 | RAPTOR | 171 | 116.13 | 104,69 | 110,79 | 82,92 |
3 | pro-sp3-TASSER | 171 | 116.05 | 103,38 | 109,95 | 80,88 |
4 | Phyre_de_novo | 171 | 115,35 | 103,47 | 110,00 | 82,51 |
5 | BAKER-ROBETTA | 171 | 115.12 | 102,68 | 109,27 | 80,71 |
- Xu J, Li M, Kim D, Xu Y (2003). „RAPTOR: Optymalne gwintowanie białek metodą programowania liniowego, wydanie inauguracyjne”. J Bioinform Comput Biol . 1 (1): 95–117. doi : 10.1142/S0219720003000186 . PMID 15290783 .
- Xu J., Li M. (2003). „Ocena podejścia do programowania liniowego RAPTOR w CAFASP3”. Białka . 53 (Suplement 6): 579–584. doi : 10.1002/prot.10531 . PMID 14579349 .
- Xu J, Li M, Lin G, Kim D, Xu Y (2003). „Nawlekanie białek poprzez programowanie liniowe”. Biokomputer Pac Symp : 264–275. PMID 12603034 .
- Xu J. (2005). „Rozpoznawanie fałdów białek na podstawie przewidywanej dokładności wyrównania”. Trans. IEEE/ACM z biologii obliczeniowej i bioinformatyki .
- Xu J. (2005). „Szybkie pakowanie łańcuchów bocznych białek poprzez rozkład drzewa”. RECOMB .
Linki zewnętrzne
- Witryna RaptorX
- Badania autorskie RAPTOR
- Strona główna eksperymentów CASP
- Zautomatyzowana ocena przewidywania struktury białek w CASP8
- Ocena dokładności ustawienia CAFASP3