Skanowanie odcisków palców na podstawie genomu
Skanowanie odcisków palców peptydów oparte na genomie (GFS) to system analizy bioinformatycznej , który próbuje zidentyfikować pochodzenie genomowe (to znaczy, z jakiego gatunku pochodzą) białek próbki poprzez skanowanie ich odcisku palca masy peptydowej w stosunku do teoretycznej translacji i trawienia proteolitycznego cały genom. Ta metoda jest ulepszeniem w stosunku do poprzednich metod, ponieważ porównuje odciski palców peptydów z całym genomem, zamiast porównywać go z genomem już opatrzonym adnotacjami. To ulepszenie może potencjalnie poprawić adnotację genomu i zidentyfikować białka z nieprawidłowymi lub brakującymi adnotacjami.
Historia i tło
GFS został zaprojektowany przez Michaela C. Giddingsa (University of North Carolina, Chapel Hill) i innych i wydany w 2003 roku. Giddings rozszerzył algorytmy GFS z wcześniejszych pomysłów. W 1993 roku opublikowano dwa artykuły wyjaśniające techniki stosowane do identyfikacji białek w bazach danych sekwencji. Metody te określały masę peptydów za pomocą spektrometrii mas , a następnie wykorzystywały masę do przeszukiwania baz danych białek w celu identyfikacji białek. W 1999 roku wydano bardziej złożony program o nazwie Mascot , który integrował trzy rodzaje przeszukiwania białek/baz danych: masy cząsteczkowe peptydów, masa tandemowa spektrometrię jednego lub większej liczby peptydów oraz kombinację danych masowych z sekwencją aminokwasową. Wadą tego szeroko stosowanego programu jest to, że nie jest on w stanie wykryć alternatywnych miejsc składania, które nie są obecnie opatrzone adnotacjami, i zazwyczaj nie jest w stanie znaleźć białek, które nie zostały opatrzone adnotacjami. Giddings oparł się na tych źródłach, aby stworzyć GFS, który porównałby dane dotyczące masy peptydów z całymi genomami w celu identyfikacji białek. System Giddings jest w stanie znaleźć nowe adnotacje genów, które nie zostały znalezione, takie jak nieudokumentowane geny i nieudokumentowane alternatywne miejsca składania.
Przykłady badań
W 2012 roku opublikowano badania, w których znaleziono geny i białka w organizmie modelowym, których nie można było znaleźć bez GFS, ponieważ nie zostały one wcześniej opatrzone adnotacjami. Planarna Schmidtea mediterranea jest wykorzystywana w badaniach od ponad 100 lat. Ten planarianin jest w stanie zregenerować brakujące części ciała i dlatego wyłania się jako potencjalny organizm modelowy do badań nad komórkami macierzystymi. Planarianie są pokryci śluzem, który pomaga w poruszaniu się, chroni je przed drapieżnikami i pomaga ich układowi odpornościowemu. Genom Schmidtea mediterranea jest zsekwencjonowany, ale w większości bez adnotacji, co czyni go głównym kandydatem do skanowania odcisków palców peptydów opartych na genomie. Gdy białka analizowano za pomocą GFS, zidentyfikowano 1604 białek. Białka te w większości nie zostały opisane, zanim zostały znalezione za pomocą GFS. Byli również w stanie znaleźć subproteom śluzu (wszystkie geny związane z produkcją śluzu). Odkryli, że ten proteom był zachowany w siostrzanym gatunku Schmidtea mansoni . Subproteom błony śluzowej jest tak konserwatywny, że u ludzi znaleziono 119 ortologów planarian. Ze względu na podobieństwo tych genów, planarian może być teraz używany jako model do badania funkcji białek śluzowych u ludzi. Jest to istotne w przypadku infekcji i chorób związanych z zaburzeniami śluzowymi, takimi jak mukowiscydoza , astma i inne choroby płuc. Tych genów nie można było znaleźć bez GFS, ponieważ nie zostały one wcześniej opisane.
W lutym 2013 r. przeprowadzono badania mapowania proteogenomicznego za pomocą ENCODE w celu zidentyfikowania regionów translacyjnych w ludzkim genomie. Zastosowali skanowanie odcisków palców peptydów i MASCOT do danych białkowych, aby znaleźć regiony, które mogły nie zostać wcześniej opisane jako przetłumaczone w ludzkim genomie. To przeszukiwanie całego genomu ujawniło, że około 4% unikalnego peptydu, który znaleźli, znajdowało się poza wcześniej opisanymi regionami. Również porównanie całego genomu wykazało o 15% więcej trafień niż z samego przeszukiwania bazy danych białek (takich jak MASCOT). GFS może być stosowany jako metoda uzupełniająca do adnotacji ze względu na fakt, że można znaleźć nowe geny lub miejsca składania, które nie były wcześniej opatrzone adnotacjami. Należy jednak pamiętać, że podejście do całego genomu stosowane przez GFS może być mniej czułe niż programy, które patrzą tylko na regiony z adnotacjami.
Linki zewnętrzne
- Dokumentacja skanowania odcisków palców peptydów (GFS) oparta na genomie
- Link na Facebooku do „Skanowania odcisków palców peptydów na podstawie genomu”
- Wyjaśnienie MS/MS w odniesieniu do MASCOT