STRUNOWY
Treść | |
---|---|
Opis | Narzędzie wyszukiwania do wyszukiwania interakcji genów/białek |
Kontakt | |
Centrum Badań | Konsorcjum Akademickie |
Cytowanie podstawowe | PMID 30476243 |
Dostęp | |
Strona internetowa | witryna STRING |
Pobierz URL | adres URL |
Adres URL usługi internetowej | odpoczynek |
Różnorodny | |
Wersja | 11,5 (sierpień 2021) |
W biologii molekularnej STRING ( narzędzie wyszukiwania do wyszukiwania interakcji genów/białek ) jest biologiczną bazą danych i zasobem internetowym zawierającym znane i przewidywane interakcje białko-białko .
Baza danych STRING zawiera informacje z wielu źródeł, w tym danych eksperymentalnych, metod przewidywania obliczeniowego i publicznych zbiorów tekstów. Jest ogólnodostępny i regularnie aktualizowany. Zasób służy również do podkreślenia wzbogacenia funkcjonalnego w dostarczonych przez użytkowników listach białek, przy użyciu wielu funkcjonalnych systemów klasyfikacji, takich jak GO , Pfam i KEGG . Najnowsza wersja 11b zawiera informacje o około 24,5 milionach białek z ponad 5000 organizmów. STRING został opracowany przez konsorcjum instytucji akademickich, w tym CPR , EMBL , KU , SIB , TUD i UZH .
Stosowanie
Sieci interakcji białko-białko są ważnym składnikiem zrozumienia procesów komórkowych na poziomie systemu. Takie sieci mogą być wykorzystywane do filtrowania i oceny danych genomiki funkcjonalnej oraz do zapewniania intuicyjnej platformy do opisywania strukturalnych, funkcjonalnych i ewolucyjnych właściwości białek. Badanie przewidywanych sieci interakcji może zasugerować nowe kierunki przyszłych badań eksperymentalnych i zapewnić międzygatunkowe prognozy w celu wydajnego mapowania interakcji.
Cechy
Dane są ważone i integrowane, a dla wszystkich interakcji białek obliczany jest wynik ufności. Wyniki różnych przewidywań obliczeniowych można przeglądać z różnych wyznaczonych widoków. Istnieją dwa tryby STRING: tryb białka i COG . Przewidywane interakcje są propagowane do białek w innych organizmach , dla których interakcja została opisana przez wnioskowanie ortologiczne . Dostępny jest interfejs sieciowy umożliwiający dostęp do danych i szybki przegląd białek i ich interakcji. Wtyczka do cytoscape do użycia danych STRING jest dostępnych. Inną możliwością dostępu do danych STRING jest użycie interfejsu programowania aplikacji (API) poprzez zbudowanie adresu URL zawierającego żądanie.
Źródła danych
Podobnie jak wiele innych baz danych, które przechowują wiedzę o asocjacjach białek, STRING importuje dane z eksperymentalnie uzyskanych interakcji białko-białko poprzez kurację literaturową. Ponadto STRING przechowuje również przewidywane obliczeniowo interakcje z: (i) eksploracji tekstu tekstów naukowych, (ii) interakcji obliczonych na podstawie cech genomowych oraz (iii) interakcji przeniesionych z organizmów modelowych w oparciu o ortologię.
Wszystkie przewidywane lub importowane interakcje są porównywane ze wspólnym odniesieniem do partnerstwa funkcjonalnego, zgodnie z adnotacją KEGG (Kyoto Encyclopedia of Genes and Genomes).
Zaimportowane dane
STRING importuje wiedzę o asocjacjach białek z baz danych interakcji fizycznych i baz danych wiedzy o wybranych ścieżkach biologicznych (MINT, HPRD , BIND , DIP , BioGRID , KEGG , Reactome , IntAct, EcoCyc , NCI-Nature Pathway Interaction Database , GO ). Dostarczane są łącza do danych źródłowych odpowiednich repozytoriów eksperymentalnych i zasobów baz danych.
Eksploracja tekstu
Duża liczba tekstów naukowych ( SGD , OMIM , FlyBase , PubMed ) jest analizowana w celu wyszukania statystycznie istotnych współwystępowań nazw genów.
Przewidywane dane
- Sąsiedztwo: podobny kontekst genomiczny u różnych gatunków sugeruje podobną funkcję białek.
- Zdarzenia fuzji i rozszczepienia: Białka, które są połączone w niektórych genomach, najprawdopodobniej będą połączone funkcjonalnie (jak w innych genomach, w których geny nie są połączone).
- Występowanie: Białka, które mają podobną funkcję lub występują w tym samym szlaku metabolicznym, muszą ulegać ekspresji razem i mieć podobny profil filogenetyczny .
- Koekspresja: przewidywany związek między genami na podstawie obserwowanych wzorców jednoczesnej ekspresji genów.
Linki zewnętrzne
- witryna STRING
- Witryna STITCH , powiązana baza danych dotycząca interakcji białek z małymi cząsteczkami