Globalny test odległości
Globalny test odległości ( GDT ), zapisany również jako GDT_TS, aby przedstawić „całkowity wynik”, jest miarą podobieństwa między dwiema strukturami białek o znanych odpowiednikach aminokwasów (np. identyczne sekwencje aminokwasów ), ale różnych strukturach trzeciorzędowych . Jest najczęściej używany do porównywania wyników przewidywania struktury białek ze strukturą określoną eksperymentalnie, zmierzoną za pomocą krystalografii rentgenowskiej , NMR białek lub, coraz częściej, mikroskopia krioelektronowa . Metryka została opracowana przez Adama Zemlę z Lawrence Livermore National Laboratory i pierwotnie wdrożona w programie Local-Global Alignment ( LGA ). Jest on pomyślany jako dokładniejszy pomiar niż metryka wspólnego odchylenia średniej kwadratowej (RMSD), która jest wrażliwa na obszary odstające utworzone na przykład przez słabe modelowanie poszczególnych regionów pętli w strukturze, która poza tym jest dość dokładna. Konwencjonalny wynik GDT_TS jest obliczany na podstawie węgla alfa atomów i jest podawany w procentach, w zakresie od 0 do 100. Ogólnie rzecz biorąc, im wyższy wynik GDT_TS, tym bardziej model zbliża się do danej struktury odniesienia.
Pomiary GDT_TS są wykorzystywane jako główne kryteria oceny podczas uzyskiwania wyników z Critical Assessment of Structure Prediction (CASP), szeroko zakrojonego eksperymentu społeczności zajmującego się przewidywaniem struktur, poświęconego ocenie aktualnych technik modelowania. Metryka została po raz pierwszy wprowadzona jako standard oceny w trzeciej iteracji przeprowadzanego co dwa lata eksperymentu (CASP3) w 1998 r. Opracowano różne rozszerzenia oryginalnej metody; zmiany, które uwzględniają pozycje łańcuchów bocznych , są znane jako globalne obliczenia odległości ( GDC ).
Obliczenie
Wynik GDT jest obliczany jako największy zestaw atomów węgla alfa reszt aminokwasowych w strukturze modelu mieszczący się w określonej odległości od ich pozycji w strukturze eksperymentalnej, po iteracyjnym nałożeniu dwóch struktur. Zgodnie z pierwotnym projektem algorytm GDT oblicza 20 punktów GDT, tj. dla każdego z 20 kolejnych punktów odcięcia odległości (0,5 Å , 1,0 Å, 1,5 Å, ... 10,0 Å). Do oceny podobieństwa struktury zamierza się wykorzystać wyniki GDT z kilku odległości odcięcia, a wyniki generalnie rosną wraz ze wzrostem odcięcia. Płaskowyż tego wzrostu może wskazywać na skrajną rozbieżność między strukturami eksperymentalnymi i przewidywanymi, tak że żadne dodatkowe atomy nie są zawarte w żadnym odcięciu rozsądnej odległości. Konwencjonalny całkowity wynik GDT_TS w CASP to średni wynik odcięcia przy 1, 2, 4 i 8 Å.
Wariacje i rozszerzenia
Oryginalny GDT_TS jest obliczany na podstawie nałożonych wyników i wyników GDT utworzonych przez program Local-Global Alignment (LGA). Wersja o „wysokiej dokładności” zwana GDT_HA jest obliczana przez wybór mniejszych odległości odcięcia (o połowę mniejszych od GDT_TS), a tym samym bardziej karze za większe odchylenia od struktury odniesienia. Był używany w kategorii wysokiej dokładności CASP7. CASP8 zdefiniował nowy „wynik TR”, który jest GDT_TS minus kara za reszty zgrupowane zbyt blisko, mający na celu ukaranie zderzeń sterycznych w przewidywanej strukturze, czasami w celu gry w miarę odcięcia GDT.
Podstawowa ocena GDT wykorzystuje tylko atomy węgla alfa . Aby zastosować punktację opartą na superpozycji do łańcuchów bocznych reszt aminokwasowych , w 2008 r. w programie LGA zaprojektowano i wdrożono punktację podobną do GDT, zwaną „obliczaniem globalnej odległości dla łańcuchów bocznych” (GDC_sc). Zamiast porównywania pozycji reszt na podstawie węgle alfa, GDC_sc wykorzystuje predefiniowany „charakterystyczny atom” w pobliżu końca każdej reszty do oceny odchyleń odległości między resztami. Wariant „wszystkie atomy” wyniku GDC (GDC_all) jest obliczany przy użyciu informacji z pełnego modelu i jest jedną ze standardowych miar stosowanych przez organizatorów i oceniających CASP do oceny dokładności przewidywanych modeli strukturalnych.
Wyniki GDT są generalnie obliczane w odniesieniu do pojedynczej struktury odniesienia. W niektórych przypadkach modele strukturalne z niższymi wynikami GDT w porównaniu ze strukturą odniesienia określoną za pomocą NMR białka są jednak lepiej dopasowane do podstawowych danych eksperymentalnych. Opracowano metody szacowania niepewności wyników GDT ze względu na elastyczność białek i niepewność struktury odniesienia.
Zobacz też
- Średnie odchylenie kwadratowe pierwiastka (bioinformatyka) — inna miara porównania struktury.
- TM-score — inna miara porównania struktury.
Linki zewnętrzne
- Wyniki CASP14 - tabele podsumowujące najnowszego eksperymentu CASP przeprowadzonego w 2020 r., w tym przykładowe wykresy wyniku GDT w funkcji odległości odcięcia
- Usługi opisu GDT, GDC, LCS i LGA oraz dokumentacja dotycząca porównywania struktur i miar podobieństwa.