OrtoDB

OrtoDB
OrthoDB logo.png
Treść
Opis Katalog ortologów .
Kontakt
Centrum Badań Szwajcarski Instytut Bioinformatyki
Laboratorium Grupa obliczeniowej genomiki ewolucyjnej
Autorski Evgenia V. Kriventseva
Cytowanie podstawowe Kriventseva i in. (2015)
Data wydania 2007
Dostęp
Strona internetowa www .orthodb .org
Pobierz URL https://www.orthodb.org/?page=filelist
Punkt końcowy Sparql sparql.orthodb.org/sparql _ _ _
Różnorodny
Licencja CC-BY-3.0

OrthoDB przedstawia katalog ortologicznych genów kodujących białka u kręgowców , stawonogów , grzybów , roślin i bakterii . Ortologia odnosi się do ostatniego wspólnego przodka rozważanego gatunku, a zatem OrthoDB wyraźnie wyznacza ortologi przy każdym głównym promieniowaniu wzdłuż filogenezy gatunku. Baza ortologów prezentuje dostępne deskryptory białek wraz z Gene Ontology i InterPro atrybuty, które służą do dostarczania ogólnych adnotacji opisowych grup ortologicznych i ułatwiają kompleksowe przeszukiwanie bazy danych ortologii. OrthoDB zapewnia również obliczone cechy ewolucyjne ortologów, takie jak powtarzalność genów i profile utraty, współczynniki rozbieżności, grupy rodzeństwa i architektury intron-egzon genu.

W genomice porównawczej nie można lekceważyć znaczenia skali. Ponieważ wyznaczanie ortologii genów wymaga specjalistycznej wiedzy i znacznych zasobów obliczeniowych, skala jest czymś, czego pojedyncze niespecjalistyczne grupy badawcze nie mogą osiągnąć samodzielnie. To trudne zadanie realizuje OrthoDB , z bardzo obszernymi zestawami gatunków i kilkoma unikalnymi cechami, takimi jak obszerne adnotacje funkcjonalne i ewolucyjne grup ortologicznych, z integracją wielu przydatnych linków do innych wiodących na świecie baz danych, które koncentrują się na przechwytywaniu informacji o funkcjach genów. Żaden genom nie może istnieć jako użyteczne źródło danych bez obszernych analiz porównawczych z innymi genomami – OrthoDB zapewnia krytycznie ważne źródło genomiki porównawczej dla całej społeczności badaczy, od osób zainteresowanych wielkimi pytaniami ewolucyjnymi po tych, którzy koncentrują się na specyficznych funkcjach biologicznych poszczególnych genów .

Metodologia

Ortologię definiuje się w odniesieniu do ostatniego wspólnego przodka rozważanego gatunku, określając w ten sposób hierarchiczny charakter klasyfikacji ortologicznych. Jest to wyraźnie uwzględnione w OrthoDB poprzez zastosowanie procedury wyznaczania ortologii w każdym głównym punkcie promieniowania rozważanej filogenezy. Implementacja OrthoDB wykorzystuje algorytm klastrowania Best-Reciprocal-Hit (BRH) oparty na zasadzie wszystko przeciwko wszystkim Smitha -Watermana porównania sekwencji białek. Wstępne przetwarzanie zestawu genów wybiera najdłuższy kodujący białko transkrypt genów o alternatywnym splicingu i bardzo podobnych kopii genów. Procedura trianguluje BRH w celu stopniowego budowania klastrów i wymaga ogólnego minimalnego dopasowania sekwencji, aby uniknąć chodzenia po domenach. Te klastry rdzeniowe są dalej rozszerzane, aby obejmowały wszystkie bliżej spokrewnione paralogi w obrębie gatunku oraz wcześniej zidentyfikowane bardzo podobne kopie genów.

Zawartość danych

Baza danych zawiera około 600 gatunków eukariotycznych i ponad 3600 bakterii pochodzących z Ensembl , UniProt , NCBI , FlyBase i kilku innych baz danych. Stale zwiększające się pobieranie próbek zsekwencjonowanych genomów zapewnia jaśniejszy opis większości genealogii genów, co ułatwi postawienie świadomych hipotez dotyczących funkcji genów w nowo zsekwencjonowanych genomach.

Przykłady badań, w których wykorzystano dane z OrthoDB , obejmują analizy porównawcze ewolucji repertuaru genów , porównania genów rozwojowych muszek owocówek i komarów , analizy zmian w ekspresji genów wywołanych mączką krwi lub infekcją u komarów , analiza ewolucji produkcji mleka ssaków , oraz ewolucja genów i genomów komarów . Inne badania cytujące OrthoDB można znaleźć w PubMed i Google Scholar .

Wydajność

OrthoDB konsekwentnie dobrze radzi sobie w ocenach porównawczych wraz z innymi procedurami wyznaczania ortologii. Wyniki porównano z drzewami referencyjnymi dla trzech dobrze konserwowanych rodzin białek oraz z większym zestawem wybranych rodzin białek.

BUSKO

Zestawy porównawcze uniwersalnych ortologów z pojedynczą kopią — grupy ortologiczne są wybierane z OrthoDB do klasyfikacji stawonogów, kręgowców, metazoanów, grzybów i innych głównych kladów na poziomie podstawowym . Grupy muszą zawierać pojedyncze kopie ortologów w co najmniej 90% gatunków (w innych mogą zostać utracone lub zduplikowane), a brakujące gatunki nie mogą pochodzić z tego samego kladu. Gatunki z częstymi stratami lub duplikacjami są usuwane z selekcji, chyba że zajmują kluczową pozycję w filogenezie. BUSCO oczekuje się zatem, że zostaną znalezione jako ortologi pojedynczej kopii w każdym nowo zsekwencjonowanym genomie z odpowiedniego kladu filogenetycznego i mogą być użyte do analizy nowo zsekwencjonowanych genomów w celu oceny ich względnej kompletności. Narzędzie BUSCO i zestawy danych (dostępne tutaj ) są szeroko stosowane w wielu projektach genomicznych, a większość redaktorów czasopism wymaga obecnie takich ocen jakości przed zaakceptowaniem nowych publikacji dotyczących genomu.

Uwagi i odniesienia

Zobacz też

Linki zewnętrzne