dcGO

dcGO
Treść
Opis Baza danych dcGO to kompleksowe źródło ontologii skoncentrowane na domenach dla domen białkowych.
Przechwycone typy danych
Domeny białkowe, ontologie
Kontakt
Centrum Badań Uniwersytet w Bristolu
Cytowanie podstawowe   PMID 23161684
Dostęp
Strona internetowa Witryna dcGO
Pobierz URL POBIERZ dcGO
Narzędzia
Sieć PSnet , STOL , dcGOR , dcGO Predictor , dcGO Enrichment

dcGO to kompleksowa baza danych ontologii dla domen białkowych. Jako źródło ontologii, dcGO integruje Otwarte Ontologie Biomedyczne z różnych kontekstów, począwszy od informacji funkcjonalnych, takich jak Ontologia Genetyczna, po inne dotyczące enzymów i szlaków, od informacji o fenotypie w głównych organizmach modelowych po informacje o chorobach człowieka i lekach. Jako domeny białkowej , dcGO zawiera adnotacje zarówno do poszczególnych domen, jak i supra-domen (tj. kombinacji dwóch lub więcej kolejnych domen).

koncepcje

Za dcGO stoją dwie kluczowe koncepcje. Pierwsza koncepcja polega na oznaczaniu domen białkowych ontologią, na przykład Ontologią genów. Dlatego nazywa się to dcGO, ontologia genetyczna zorientowana na domenę. Druga koncepcja polega na wykorzystaniu domen białkowych znakowanych ontologicznie, na przykład do przewidywania funkcji białek. Mówiąc prościej, pierwsza koncepcja dotyczy tworzenia zasobów dcGO, a druga dotyczy korzystania z zasobów dcGO.

Osie czasu

  • W 2010 roku algorytm stojący za dcGO został pierwotnie opublikowany jako ulepszenie bazy danych SUPERFAMILY .
  • W 2011 r. „dcGO Predictor” zajął 10. miejsce w konkursie CAFA 2011 w zastosowaniu do ontologii genetycznej . Ten predyktor jest tylko metodą opartą na domenie bez uczenia maszynowego.
  • W 2012 roku baza została oficjalnie udostępniona, opublikowana w numerze bazy NAR.
  • W 2013 r. udoskonalono serwer WWW, aby obsługiwał wiele analiz z wykorzystaniem zasobu dcGO.
  • Na początku 2014 r. „dcGO Predictor” został przesłany do przewidywania zarówno funkcji, jak i fenotypu, zajmując 4. miejsce w przewidywaniu fenotypu CAFA.
  • Pod koniec 2014 roku opracowano pakiet R dcGOR o otwartym kodzie źródłowym, który pomaga analizować ontologie i adnotacje domen białkowych.

Serwer internetowy

Niedawne użycie dcGO polega na zbudowaniu sieci domen z perspektywy funkcjonalnej do porównań krzyżowych ontologii oraz połączeniu z drzewem życia gatunków (sTOL) w celu zapewnienia kontekstu filogenetycznego dla funkcji i fenotypu.

Oprogramowanie

Oprogramowanie typu open source dcGOR jest rozwijane przy użyciu języka programowania R w celu analizowania ontologii i adnotacji zorientowanych na dziedzinę. Obsługiwane analizy obejmują:

  • łatwy dostęp do szerokiej gamy ontologii i ich adnotacji zorientowanych na dziedzinę;
  • potrafi budować niestandardowe ontologie i adnotacje;
  • analiza i wizualizacja wzbogacania w oparciu o domeny;
  • budowa sieci domeny (podobieństwa semantycznego) według adnotacji ontologicznych;
  • analiza istotności do szacowania sieci kontaktów (istotności statystycznej) z wykorzystaniem algorytmu błądzenia losowego ;
  • wysokowydajne obliczenia równoległe.

Aktywnie rozwijane funkcjonalności to:

  • algorytm i implementacje do tworzenia adnotacji ontologicznych zorientowanych na dziedzinę;
  • przewidywanie terminów ontologicznych dla wejściowych architektur domen białkowych;
  • rekonstrukcja dyskretnych postaci przodków przy użyciu maksymalnego prawdopodobieństwa / oszczędności.

Zobacz też

Linki zewnętrzne