Funkcja rozpoznawania molekularnego
Cechy rozpoznawania molekularnego ( MoRF ) to małe (10-70 reszt) wewnętrznie nieuporządkowane regiony w białkach , które przechodzą przejście z nieporządku do porządku po związaniu się ze swoimi partnerami. MoRF biorą udział w interakcjach białko-białko , które służą jako początkowy etap rozpoznawania molekularnego . MoRF są nieuporządkowane przed związaniem się z partnerami, podczas gdy po interakcji z partnerami tworzą wspólną strukturę 3D . Ponieważ regiony MoRF mają tendencję do przypominania nieuporządkowanych białek z pewnymi cechami uporządkowanych białek można je sklasyfikować jako istniejące w rozszerzonym stanie półnieuporządkowanym.
Kategoryzacja
MoRF można podzielić na 4 kategorie w zależności od kształtu, jaki tworzą po związaniu ze swoimi partnerami.
Kategorie to:
- α-MoRF (gdy tworzą alfa-helisy )
- β-MoRF (gdy tworzą arkusze beta )
- nieregularne MoRF (gdy nie tworzą żadnego kształtu)
- złożone MoRF (połączenie powyższych kategorii)
Predyktory MoRF
Eksperymentalne wyznaczanie struktur białek jest procesem bardzo czasochłonnym i kosztownym. Dlatego w ostatnich latach skupiono się na metodach obliczeniowych do przewidywania struktury i cech strukturalnych białek. Niektóre aspekty struktury białek, takie jak struktura drugorzędowa i zaburzenia wewnętrzne , odniosły ogromne korzyści z zastosowania głębokiego uczenia się na obfitości danych z adnotacjami. Jednak obliczeniowe przewidywanie regionów MoRF pozostaje trudnym zadaniem ze względu na ograniczoną dostępność danych z adnotacjami i rzadkość samej klasy MoRF. Większość obecnych metod została przeszkolona i porównana na zestawach wydanych przez autorów MoRFPred w 2012 r., a także na innym zestawie wydanym przez autorów MoRFhibi w oparciu o eksperymentalnie opatrzone adnotacjami dane MoRF. Poniższa tabela, zaadaptowana z, wyszczególnia niektóre obecnie dostępne metody przewidywania MoRF (a także powiązane problemy).
Urządzenie prognozujące | Rok publikacji | Prognozy dla | Metodologia | Używa MSA |
---|---|---|---|---|
KOTWICA | 2009 | Regiony wiążące białka | Analiza skłonności i szacowania energii aminokwasów. | N |
KOTWICA2 | 2018 | Regiony wiążące białka | Analiza skłonności i szacowania energii aminokwasów. | N |
ROZPACZONY3 | 2015 | Wewnętrzne zaburzenia białek i miejsca wiązania białek | Wieloetapowe przewidywanie składowych (z wykorzystaniem sieci neuronowej, maszyny wektorów nośnych i modeli K-najbliższego sąsiada) do przewidywania zaburzeń białek. Wykorzystuje również dodatkową maszynę wektorów nośnych do interpolacji regionów wiążących z przewidywań zaburzeń. | Y |
DisoRDPbind | 2015 | Regiony wiążące RNA, DNA i białka | Modele wielokrotnej regresji logistycznej oparte na przewidywanych zaburzeniach, właściwościach aminokwasów i składzie sekwencji. Wynik jest dopasowywany do przesłanych adnotacji z bazy danych z adnotacjami funkcjonalnymi. | N |
fMoRFPred | 2016 | MoRF | Szybsza wersja MoRFPred bez użycia wielu dopasowań sekwencji. | N |
SYSTEM MoRFchibi | 2015 | MoRF | Hierarchia różnych wewnętrznych modeli predykcyjnych MoRF: MoRFchibi: Wykorzystuje regułę Bayesa do łączenia wyników dwóch pomocniczych modułów Vector Machine przy użyciu składu aminokwasów (jądro sigmoidalne) i podobieństwa sekwencji (jądro RBF). MoRFchibi_light: Wykorzystuje regułę Bayesa do hierarchicznego łączenia MoRFchibi i przewidywania zaburzeń. MoRFchibi_web: Wykorzystuje regułę Bayesa do hierarchicznego łączenia MoRFchibi, przewidywania zaburzeń i PSSM (MSA). |
Nie dotyczy |
MorRFPred | 2012 | MoRF | Maszyna wektorów nośnych oparta na przewidywanej charakterystyce sekwencji i dopasowaniu sekwencji wejściowej do znanej bazy danych MoRF. | Y |
MoRFPred-Plus | 2018 | MoRF | Połączone prognozy z dwóch maszyn wektorów nośnych, przewidujące zarówno regiony MoRF, jak i reszty MoRF. | Y |
OPAL | 2018 | MoRF | Maszyna wektorów nośnych oparta na właściwościach fizykochemicznych i przewidywanych cechach strukturalnych reszt białkowych | Y |
OPAL+ | 2019 | MoRF | Zespół maszyn wektorów nośnych szkolony indywidualnie dla regionów MoRF o określonej długości. Zawiera również inne predyktory jako metapredyktor. | Y |
SPINE-D | 2012 | Białkowe zaburzenia wewnętrzne i półzaburzenia | Sieć neuronowa do przewidywania zarówno długich, jak i krótkich regionów nieuporządkowanych. Półzaburzenie można interpolować liniowo na podstawie przewidywanych prawdopodobieństw zaburzeń (0,4<=P(D)<=0,7). | Y |
Zaburzenie SPOT | 2017 | Białkowe zaburzenia wewnętrzne i półzaburzenia | Dwukierunkowa sieć pamięci długoterminowej do przewidywania zaburzeń wewnętrznych. Częściowo nieuporządkowane regiony można interpolować liniowo na podstawie przewidywanych prawdopodobieństw zaburzeń (0,28<=P(D)<=0,69). | Y |
SPOT-MoRF | 2019 | MoRF | Przenieś naukę z narzędzia do przewidywania dużych zaburzeń SPOT-Disorder2 (które samo w sobie wykorzystuje zespół dwukierunkowych sieci pamięci długoterminowej i ResNet Inception). | Y |
Bazy danych
Baza danych Mutual Folding Induced by Binding (MFIB).