Przewiduj białko
Oryginalni autorzy | Burkhard Rost |
---|---|
Deweloperzy | Guy Yachdav Laszlo Kajan |
Pierwsze wydanie | 1992 |
Wersja stabilna | 1.0.88 |
System operacyjny | Oparte na systemie UNIX |
Typ | Bioinformatyka |
Licencja | GPLv2 |
Strona internetowa |
|
PredictProtein (PP) to automatyczna usługa, która przeszukuje aktualne publiczne bazy danych sekwencji, tworzy dopasowania i przewiduje aspekty struktury i funkcji białek. Użytkownicy wysyłają sekwencję białek i otrzymują pojedynczy plik z wynikami porównań baz danych i metod przewidywania. PP uruchomiono w 1992 r. w Europejskim Laboratorium Biologii Molekularnej ; od 1999 r. działa na Uniwersytecie Columbia , aw 2009 r. przeniósł się do Technische Universität München . Chociaż wiele serwerów zaimplementowało określone aspekty, PP pozostaje najczęściej używanym serwerem publicznym do przewidywania struktury: obsłużono ponad 1,5 miliona żądań od użytkowników ze 104 krajów; ponad 13000 użytkowników przesłało 10 lub więcej różnych zapytań. Strony internetowe PP są odzwierciedlone w 17 krajach na 4 kontynentach. System jest zoptymalizowany pod kątem wymagań eksperymentatorów bez doświadczenia w bioinformatyce. Oznaczało to, że skupiliśmy się na włączeniu tylko metod wysokiej jakości i próbowaliśmy zestawiać wyniki, pomijając mniej wiarygodne lub mniej ważne.
Próba uproszczenia danych wyjściowych poprzez włączenie hierarchii progów
Próba „wstępnego przetrawienia” jak największej ilości informacji w celu uproszczenia interpretacji wyników jest unikalnym filarem PP. Na przykład domyślnie PP zwraca tylko te białka znalezione w bazie danych, które z dużym prawdopodobieństwem mają podobną strukturę do białka zapytania. Konkretne prognozy, takie jak te dla helis błonowych, regionów cewek, peptydów sygnałowych i sygnałów lokalizacji jądrowej, nie są zwracane, jeśli okażą się poniżej określonych progów prawdopodobieństwa.
Każde żądanie uruchamia zastosowanie ponad 20 różnych metod
Użytkownicy otrzymują pojedynczy plik wyjściowy z następującymi wynikami. Wyszukiwanie w bazie danych: podobne sekwencje są zgłaszane i dopasowywane przez standardowe, parami BLAST, iterowane wyszukiwanie PSI-BLAST. Chociaż wyszukiwania BLAST parami są identyczne z tymi, które można uzyskać z witryny NCBI, iterowane PSI-BLAST jest wykonywane na dokładnie filtrowanej bazie danych, aby uniknąć gromadzenia się fałszywych alarmów podczas iteracji. Standardowe wyszukiwanie motywów funkcjonalnych w bazie PROSITE. PP identyfikuje teraz również domniemane granice domen strukturalnych za pomocą procedury CHOP. Metody przewidywania struktury: struktura drugorzędowa, dostępność rozpuszczalnika i helisy błony przewidywane przez programy PHD i PROF, nici błony przewidywane przez PROFtmb, obszary zwiniętych cewek przez COILS i kontakty między resztami przez PROFcon, regiony o niskiej złożoności są oznaczane przez SEG i długie regiony bez regularnej struktury drugorzędowej są identyfikowane przez NORSp,. Programy PHD/PROF są dostępne tylko przez PP. Szczególny sposób, w jaki PP automatycznie iteruje wyszukiwania PSI-BLAST i sposób, w jaki decydujemy, co uwzględnić w rodzinach sekwencji, jest również unikalny dla PP. Poszczególne aspekty funkcji, które są obecnie wyraźnie osadzone w PP, są w jakiś sposób związane z lokalizacją subkomórkową: wykrywamy sygnały lokalizacji jądrowej za pomocą PredictNLS, przewidujemy lokalizację niezależną od sygnałów docelowych za pośrednictwem LOCnet; i adnotacje homologii z białkami zaangażowanymi w kontrolę cyklu komórkowego.
Dostępność
Serwis internetowy
Serwis internetowy PredictProtein jest dostępny pod adresem www.predictprotein.org. Użytkownicy mogą przesłać sekwencję aminokwasów i otrzymać w zamian zestaw automatycznych adnotacji dla przesłanej sekwencji. Usługa jest wspierana przez bazę wstępnie obliczonych wyników, które przyspieszają czas interakcji.
Rozwiązanie w chmurze [ modne hasło ]
Rozwiązanie chmurowe PredictProtein [ buzzword ] opiera się na systemie operacyjnym open source Debian i zapewnia jego funkcjonalność jako zestaw bezpłatnych pakietów oprogramowania Debian. Bio-Linux to system operacyjny dla bioinformatyki i biologii obliczeniowej . Jego najnowsza wersja 7 zapewnia ponad 500 programów bioinformatycznych na bazie Ubuntu Linux. Ubuntu jest pochodną Debiana, systemem operacyjnym opartym na Debianie z własnymi dodatkami. Cloud BioLinux to kompleksowe rozwiązanie w chmurze [ modne hasło ] który wywodzi się z Bio-Linux i Ubuntu. Pochodne Debiana mogą łatwo współdzielić pakiety między sobą. Na przykład pakiety Debiana są automatycznie dołączane do Ubuntu i można ich używać również w Cloud BioLinux (procedurę opisano w ).