OrtoDB
Treść | |
---|---|
Opis | Katalog ortologów . |
Kontakt | |
Centrum Badań | Szwajcarski Instytut Bioinformatyki |
Laboratorium | Grupa obliczeniowej genomiki ewolucyjnej |
Autorski | Evgenia V. Kriventseva |
Cytowanie podstawowe | Kriventseva i in. (2015) |
Data wydania | 2007 |
Dostęp | |
Strona internetowa | |
Pobierz URL | https://www.orthodb.org/?page=filelist |
Punkt końcowy Sparql | |
Różnorodny | |
Licencja | CC-BY-3.0 |
OrthoDB przedstawia katalog ortologicznych genów kodujących białka u kręgowców , stawonogów , grzybów , roślin i bakterii . Ortologia odnosi się do ostatniego wspólnego przodka rozważanego gatunku, a zatem OrthoDB wyraźnie wyznacza ortologi przy każdym głównym promieniowaniu wzdłuż filogenezy gatunku. Baza ortologów prezentuje dostępne deskryptory białek wraz z Gene Ontology i InterPro atrybuty, które służą do dostarczania ogólnych adnotacji opisowych grup ortologicznych i ułatwiają kompleksowe przeszukiwanie bazy danych ortologii. OrthoDB zapewnia również obliczone cechy ewolucyjne ortologów, takie jak powtarzalność genów i profile utraty, współczynniki rozbieżności, grupy rodzeństwa i architektury intron-egzon genu.
W genomice porównawczej nie można lekceważyć znaczenia skali. Ponieważ wyznaczanie ortologii genów wymaga specjalistycznej wiedzy i znacznych zasobów obliczeniowych, skala jest czymś, czego pojedyncze niespecjalistyczne grupy badawcze nie mogą osiągnąć samodzielnie. To trudne zadanie realizuje OrthoDB , z bardzo obszernymi zestawami gatunków i kilkoma unikalnymi cechami, takimi jak obszerne adnotacje funkcjonalne i ewolucyjne grup ortologicznych, z integracją wielu przydatnych linków do innych wiodących na świecie baz danych, które koncentrują się na przechwytywaniu informacji o funkcjach genów. Żaden genom nie może istnieć jako użyteczne źródło danych bez obszernych analiz porównawczych z innymi genomami – OrthoDB zapewnia krytycznie ważne źródło genomiki porównawczej dla całej społeczności badaczy, od osób zainteresowanych wielkimi pytaniami ewolucyjnymi po tych, którzy koncentrują się na specyficznych funkcjach biologicznych poszczególnych genów .
Metodologia
Ortologię definiuje się w odniesieniu do ostatniego wspólnego przodka rozważanego gatunku, określając w ten sposób hierarchiczny charakter klasyfikacji ortologicznych. Jest to wyraźnie uwzględnione w OrthoDB poprzez zastosowanie procedury wyznaczania ortologii w każdym głównym punkcie promieniowania rozważanej filogenezy. Implementacja OrthoDB wykorzystuje algorytm klastrowania Best-Reciprocal-Hit (BRH) oparty na zasadzie wszystko przeciwko wszystkim Smitha -Watermana porównania sekwencji białek. Wstępne przetwarzanie zestawu genów wybiera najdłuższy kodujący białko transkrypt genów o alternatywnym splicingu i bardzo podobnych kopii genów. Procedura trianguluje BRH w celu stopniowego budowania klastrów i wymaga ogólnego minimalnego dopasowania sekwencji, aby uniknąć chodzenia po domenach. Te klastry rdzeniowe są dalej rozszerzane, aby obejmowały wszystkie bliżej spokrewnione paralogi w obrębie gatunku oraz wcześniej zidentyfikowane bardzo podobne kopie genów.
Zawartość danych
Baza danych zawiera około 600 gatunków eukariotycznych i ponad 3600 bakterii pochodzących z Ensembl , UniProt , NCBI , FlyBase i kilku innych baz danych. Stale zwiększające się pobieranie próbek zsekwencjonowanych genomów zapewnia jaśniejszy opis większości genealogii genów, co ułatwi postawienie świadomych hipotez dotyczących funkcji genów w nowo zsekwencjonowanych genomach.
Przykłady badań, w których wykorzystano dane z OrthoDB , obejmują analizy porównawcze ewolucji repertuaru genów , porównania genów rozwojowych muszek owocówek i komarów , analizy zmian w ekspresji genów wywołanych mączką krwi lub infekcją u komarów , analiza ewolucji produkcji mleka ssaków , oraz ewolucja genów i genomów komarów . Inne badania cytujące OrthoDB można znaleźć w PubMed i Google Scholar .
Wydajność
OrthoDB konsekwentnie dobrze radzi sobie w ocenach porównawczych wraz z innymi procedurami wyznaczania ortologii. Wyniki porównano z drzewami referencyjnymi dla trzech dobrze konserwowanych rodzin białek oraz z większym zestawem wybranych rodzin białek.
BUSKO
Zestawy porównawcze uniwersalnych ortologów z pojedynczą kopią — grupy ortologiczne są wybierane z OrthoDB do klasyfikacji stawonogów, kręgowców, metazoanów, grzybów i innych głównych kladów na poziomie podstawowym . Grupy muszą zawierać pojedyncze kopie ortologów w co najmniej 90% gatunków (w innych mogą zostać utracone lub zduplikowane), a brakujące gatunki nie mogą pochodzić z tego samego kladu. Gatunki z częstymi stratami lub duplikacjami są usuwane z selekcji, chyba że zajmują kluczową pozycję w filogenezie. BUSCO oczekuje się zatem, że zostaną znalezione jako ortologi pojedynczej kopii w każdym nowo zsekwencjonowanym genomie z odpowiedniego kladu filogenetycznego i mogą być użyte do analizy nowo zsekwencjonowanych genomów w celu oceny ich względnej kompletności. Narzędzie BUSCO i zestawy danych (dostępne tutaj ) są szeroko stosowane w wielu projektach genomicznych, a większość redaktorów czasopism wymaga obecnie takich ocen jakości przed zaakceptowaniem nowych publikacji dotyczących genomu.