Funkcja rozpoznawania molekularnego

Cechy rozpoznawania molekularnego ( MoRF ) to małe (10-70 reszt) wewnętrznie nieuporządkowane regiony w białkach , które przechodzą przejście z nieporządku do porządku po związaniu się ze swoimi partnerami. MoRF biorą udział w interakcjach białko-białko , które służą jako początkowy etap rozpoznawania molekularnego . MoRF są nieuporządkowane przed związaniem się z partnerami, podczas gdy po interakcji z partnerami tworzą wspólną strukturę 3D . Ponieważ regiony MoRF mają tendencję do przypominania nieuporządkowanych białek z pewnymi cechami uporządkowanych białek można je sklasyfikować jako istniejące w rozszerzonym stanie półnieuporządkowanym.

Kategoryzacja

MoRF można podzielić na 4 kategorie w zależności od kształtu, jaki tworzą po związaniu ze swoimi partnerami.

Kategorie to:

  • α-MoRF (gdy tworzą alfa-helisy )
  • β-MoRF (gdy tworzą arkusze beta )
  • nieregularne MoRF (gdy nie tworzą żadnego kształtu)
  • złożone MoRF (połączenie powyższych kategorii)


Predyktory MoRF

Eksperymentalne wyznaczanie struktur białek jest procesem bardzo czasochłonnym i kosztownym. Dlatego w ostatnich latach skupiono się na metodach obliczeniowych do przewidywania struktury i cech strukturalnych białek. Niektóre aspekty struktury białek, takie jak struktura drugorzędowa i zaburzenia wewnętrzne , odniosły ogromne korzyści z zastosowania głębokiego uczenia się na obfitości danych z adnotacjami. Jednak obliczeniowe przewidywanie regionów MoRF pozostaje trudnym zadaniem ze względu na ograniczoną dostępność danych z adnotacjami i rzadkość samej klasy MoRF. Większość obecnych metod została przeszkolona i porównana na zestawach wydanych przez autorów MoRFPred w 2012 r., a także na innym zestawie wydanym przez autorów MoRFhibi w oparciu o eksperymentalnie opatrzone adnotacjami dane MoRF. Poniższa tabela, zaadaptowana z, wyszczególnia niektóre obecnie dostępne metody przewidywania MoRF (a także powiązane problemy).

Urządzenie prognozujące Rok publikacji Prognozy dla Metodologia Używa MSA
KOTWICA 2009 Regiony wiążące białka Analiza skłonności i szacowania energii aminokwasów. N
KOTWICA2 2018 Regiony wiążące białka Analiza skłonności i szacowania energii aminokwasów. N
ROZPACZONY3 2015 Wewnętrzne zaburzenia białek i miejsca wiązania białek Wieloetapowe przewidywanie składowych (z wykorzystaniem sieci neuronowej, maszyny wektorów nośnych i modeli K-najbliższego sąsiada) do przewidywania zaburzeń białek. Wykorzystuje również dodatkową maszynę wektorów nośnych do interpolacji regionów wiążących z przewidywań zaburzeń. Y
DisoRDPbind 2015 Regiony wiążące RNA, DNA i białka Modele wielokrotnej regresji logistycznej oparte na przewidywanych zaburzeniach, właściwościach aminokwasów i składzie sekwencji. Wynik jest dopasowywany do przesłanych adnotacji z bazy danych z adnotacjami funkcjonalnymi. N
fMoRFPred 2016 MoRF Szybsza wersja MoRFPred bez użycia wielu dopasowań sekwencji. N
SYSTEM MoRFchibi 2015 MoRF Hierarchia różnych wewnętrznych modeli predykcyjnych MoRF:

MoRFchibi: Wykorzystuje regułę Bayesa do łączenia wyników dwóch pomocniczych modułów Vector Machine przy użyciu składu aminokwasów (jądro sigmoidalne) i podobieństwa sekwencji (jądro RBF). MoRFchibi_light: Wykorzystuje regułę Bayesa do hierarchicznego łączenia MoRFchibi i przewidywania zaburzeń. MoRFchibi_web: Wykorzystuje regułę Bayesa do hierarchicznego łączenia MoRFchibi, przewidywania zaburzeń i PSSM (MSA).

Nie dotyczy
MorRFPred 2012 MoRF Maszyna wektorów nośnych oparta na przewidywanej charakterystyce sekwencji i dopasowaniu sekwencji wejściowej do znanej bazy danych MoRF. Y
MoRFPred-Plus 2018 MoRF Połączone prognozy z dwóch maszyn wektorów nośnych, przewidujące zarówno regiony MoRF, jak i reszty MoRF. Y
OPAL 2018 MoRF Maszyna wektorów nośnych oparta na właściwościach fizykochemicznych i przewidywanych cechach strukturalnych reszt białkowych Y
OPAL+ 2019 MoRF Zespół maszyn wektorów nośnych szkolony indywidualnie dla regionów MoRF o określonej długości. Zawiera również inne predyktory jako metapredyktor. Y
SPINE-D 2012 Białkowe zaburzenia wewnętrzne i półzaburzenia Sieć neuronowa do przewidywania zarówno długich, jak i krótkich regionów nieuporządkowanych. Półzaburzenie można interpolować liniowo na podstawie przewidywanych prawdopodobieństw zaburzeń (0,4<=P(D)<=0,7). Y
Zaburzenie SPOT 2017 Białkowe zaburzenia wewnętrzne i półzaburzenia Dwukierunkowa sieć pamięci długoterminowej do przewidywania zaburzeń wewnętrznych. Częściowo nieuporządkowane regiony można interpolować liniowo na podstawie przewidywanych prawdopodobieństw zaburzeń (0,28<=P(D)<=0,69). Y
SPOT-MoRF 2019 MoRF Przenieś naukę z narzędzia do przewidywania dużych zaburzeń SPOT-Disorder2 (które samo w sobie wykorzystuje zespół dwukierunkowych sieci pamięci długoterminowej i ResNet Inception). Y

Bazy danych

mpMoRFsDB

Baza danych Mutual Folding Induced by Binding (MFIB).