Przewiduj białko

Prognozuj Białko
Oryginalni autorzy Burkhard Rost
Deweloperzy Guy Yachdav Laszlo Kajan
Pierwsze wydanie 1992
Wersja stabilna
1.0.88
System operacyjny Oparte na systemie UNIX
Typ Bioinformatyka
Licencja GPLv2
Strona internetowa www .predictprotein .org  Edit this on Wikidata

PredictProtein (PP) to automatyczna usługa, która przeszukuje aktualne publiczne bazy danych sekwencji, tworzy dopasowania i przewiduje aspekty struktury i funkcji białek. Użytkownicy wysyłają sekwencję białek i otrzymują pojedynczy plik z wynikami porównań baz danych i metod przewidywania. PP uruchomiono w 1992 r. w Europejskim Laboratorium Biologii Molekularnej ; od 1999 r. działa na Uniwersytecie Columbia , aw 2009 r. przeniósł się do Technische Universität München . Chociaż wiele serwerów zaimplementowało określone aspekty, PP pozostaje najczęściej używanym serwerem publicznym do przewidywania struktury: obsłużono ponad 1,5 miliona żądań od użytkowników ze 104 krajów; ponad 13000 użytkowników przesłało 10 lub więcej różnych zapytań. Strony internetowe PP są odzwierciedlone w 17 krajach na 4 kontynentach. System jest zoptymalizowany pod kątem wymagań eksperymentatorów bez doświadczenia w bioinformatyce. Oznaczało to, że skupiliśmy się na włączeniu tylko metod wysokiej jakości i próbowaliśmy zestawiać wyniki, pomijając mniej wiarygodne lub mniej ważne.

Próba uproszczenia danych wyjściowych poprzez włączenie hierarchii progów

Próba „wstępnego przetrawienia” jak największej ilości informacji w celu uproszczenia interpretacji wyników jest unikalnym filarem PP. Na przykład domyślnie PP zwraca tylko te białka znalezione w bazie danych, które z dużym prawdopodobieństwem mają podobną strukturę do białka zapytania. Konkretne prognozy, takie jak te dla helis błonowych, regionów cewek, peptydów sygnałowych i sygnałów lokalizacji jądrowej, nie są zwracane, jeśli okażą się poniżej określonych progów prawdopodobieństwa.

Każde żądanie uruchamia zastosowanie ponad 20 różnych metod

Użytkownicy otrzymują pojedynczy plik wyjściowy z następującymi wynikami. Wyszukiwanie w bazie danych: podobne sekwencje są zgłaszane i dopasowywane przez standardowe, parami BLAST, iterowane wyszukiwanie PSI-BLAST. Chociaż wyszukiwania BLAST parami są identyczne z tymi, które można uzyskać z witryny NCBI, iterowane PSI-BLAST jest wykonywane na dokładnie filtrowanej bazie danych, aby uniknąć gromadzenia się fałszywych alarmów podczas iteracji. Standardowe wyszukiwanie motywów funkcjonalnych w bazie PROSITE. PP identyfikuje teraz również domniemane granice domen strukturalnych za pomocą procedury CHOP. Metody przewidywania struktury: struktura drugorzędowa, dostępność rozpuszczalnika i helisy błony przewidywane przez programy PHD i PROF, nici błony przewidywane przez PROFtmb, obszary zwiniętych cewek przez COILS i kontakty między resztami przez PROFcon, regiony o niskiej złożoności są oznaczane przez SEG i długie regiony bez regularnej struktury drugorzędowej są identyfikowane przez NORSp,. Programy PHD/PROF są dostępne tylko przez PP. Szczególny sposób, w jaki PP automatycznie iteruje wyszukiwania PSI-BLAST i sposób, w jaki decydujemy, co uwzględnić w rodzinach sekwencji, jest również unikalny dla PP. Poszczególne aspekty funkcji, które są obecnie wyraźnie osadzone w PP, są w jakiś sposób związane z lokalizacją subkomórkową: wykrywamy sygnały lokalizacji jądrowej za pomocą PredictNLS, przewidujemy lokalizację niezależną od sygnałów docelowych za pośrednictwem LOCnet; i adnotacje homologii z białkami zaangażowanymi w kontrolę cyklu komórkowego.

Dostępność

Serwis internetowy

Serwis internetowy PredictProtein jest dostępny pod adresem www.predictprotein.org. Użytkownicy mogą przesłać sekwencję aminokwasów i otrzymać w zamian zestaw automatycznych adnotacji dla przesłanej sekwencji. Usługa jest wspierana przez bazę wstępnie obliczonych wyników, które przyspieszają czas interakcji.

Rozwiązanie w chmurze [ modne hasło ]

Rozwiązanie chmurowe PredictProtein [ buzzword ] opiera się na systemie operacyjnym open source Debian i zapewnia jego funkcjonalność jako zestaw bezpłatnych pakietów oprogramowania Debian. Bio-Linux to system operacyjny dla bioinformatyki i biologii obliczeniowej . Jego najnowsza wersja 7 zapewnia ponad 500 programów bioinformatycznych na bazie Ubuntu Linux. Ubuntu jest pochodną Debiana, systemem operacyjnym opartym na Debianie z własnymi dodatkami. Cloud BioLinux to kompleksowe rozwiązanie w chmurze [ modne hasło ] który wywodzi się z Bio-Linux i Ubuntu. Pochodne Debiana mogą łatwo współdzielić pakiety między sobą. Na przykład pakiety Debiana są automatycznie dołączane do Ubuntu i można ich używać również w Cloud BioLinux (procedurę opisano w ).

Zobacz też