Microbes Online

Przegląd podstawowych składników witryny MicrobesOnline

MicrobesOnline to ogólnodostępna i ogólnodostępna witryna internetowa, na której znajduje się wiele porównawczych narzędzi genomicznych do porównywania gatunków drobnoustrojów na poziomie genomicznym, transkryptomicznym i funkcjonalnym. MicrobesOnline został opracowany przez Virtual Institute for Microbial Stress and Survival, który ma siedzibę w Lawrence Berkeley National Laboratory w Berkeley w Kalifornii. Witryna została uruchomiona w 2005 roku, z regularnymi aktualizacjami do 2011 roku.

Głównym celem MicrobesOnline jest zapewnienie łatwego w użyciu zasobu, który integruje bogactwo danych z wielu źródeł. Ta zintegrowana platforma ułatwia badania w zakresie genomiki porównawczej , analizy szlaków metabolicznych , składu genomu , genomiki funkcjonalnej , a także danych dotyczących domen białek i rodzin . Zapewnia również narzędzia do wyszukiwania lub przeglądania bazy danych z genami, gatunkami, sekwencjami, grupami ortologicznymi , ontologią genów (GO) terminy lub słowa kluczowe ścieżki itp. Kolejną z jego głównych funkcji jest Gene Cart, który umożliwia użytkownikom prowadzenie rejestru interesujących ich genów. Jedną z najważniejszych cech bazy danych jest ogólna dostępność nawigacji i wzajemne połączenia między narzędziami.

Tło

Rozwój wysokowydajnych metod sekwencjonowania genomu przyniósł bogactwo danych, które wymagają zaawansowanej bioinformatyki narzędzia do ich analizy i interpretacji. Obecnie istnieje wiele narzędzi do badania danych sekwencyjnych genomiki i wydobywania informacji z różnych perspektyw. Jednak brak ujednolicenia nomenklatury i ustandaryzowanych protokołów między narzędziami sprawia, że ​​bezpośrednie porównanie ich wyników jest bardzo trudne. Dodatkowo użytkownik jest zmuszony do ciągłego przełączania się z różnych stron internetowych lub oprogramowania, dostosowując format swoich danych do indywidualnych wymagań. MicrobesOnline został opracowany w celu zintegrowania możliwości różnych narzędzi w ujednoliconą platformę w celu łatwego porównania wyników analiz, ze szczególnym uwzględnieniem prokariotów gatunki i podstawne eukarionty .

Gatunki zawarte w bazie danych

MicrobesOnline zawiera dane dotyczące genomu, ekspresji genów i sprawności dla szerokiego zakresu gatunków drobnoustrojów. Dane genomowe są dostępne dla 1752 bakterii , 94 archeonów i 119 eukariontów, co daje w sumie 3707 genomów, z których 2842 są oznaczone jako kompletne. Dane dotyczące ekspresji genów są dostępne dla 113 gatunków, a dane dotyczące sprawności są dostępne dla 4 organizmów.

Funkcje i architektura witryny

Strona główna MicrobesOnline z wyróżnionymi sześcioma głównymi sekcjami dostępu do bazy danych.

MicrobesOnline zapewnia różnorodne narzędzia do wyszukiwania, analizowania i integrowania informacji związanych z genomami bakterii do zastosowań w czterech głównych obszarach: informacja genetyczna, genomika funkcjonalna, genomika porównawcza i badania szlaków metabolicznych. Strona główna MicrobesOnline to portal umożliwiający dostęp do jego funkcji, który obejmuje sześć głównych sekcji: górne elementy nawigacyjne, selektor genomu, przykłady samouczka opartego na E.coli K-12, łącze do aplikacji Genome-Linked Application for Metabolic Mapy (GLAMM), najciekawsze strony internetowe i lista „o MicrobesOnline”. W ramach trwającego projektu autorzy MicrobesOnline twierdzą, że narzędzia do analizy danych i obsługa większej liczby typów danych zostaną rozbudowane.

Informacja genetyczna

Informacje o genach drobnoustrojów przechowywane w MicrobesOnline obejmują sekwencje ( geny , transkrypty i białka ), loci genomowe , adnotacje genów i niektóre statystyki sekwencji. Dostęp do tych informacji można uzyskać za pośrednictwem trzech funkcji wyświetlanych na stronie głównej MicrobesOnline: wyszukiwania sekwencji i wyszukiwania zaawansowanego w górnej części nawigacji oraz selektora genomu. W przypadku narzędzia do wyszukiwania sekwencji MicrobesOnline integruje BLAT , FastHMM i FastBLAST do wyszukiwania sekwencji białek oraz używa MEGABLAST do wyszukiwania sekwencji nukleotydów. Podaje również link do BLAST jako alternatywny sposób wyszukiwania sekwencji. Z drugiej strony zaawansowane narzędzie wyszukiwania umożliwia użytkownikowi przeszukiwanie informacji genetycznych według kategorii, niestandardowego zapytania, wyszukiwania wieloznacznego i wyszukiwania według pola, które wykorzystuje nazwę genu, opis, identyfikator klastra grup ortologicznych (COG) , termin GO, KEGG (EC) itp. jako słowa kluczowe.

Przykład widoku listy genów

Pole „wybrane genomy” selektora genomu zawiera listę genomów dodanych z listy ulubionych genomów po lewej stronie lub wyszukiwanych według słów kluczowych. Po prawej stronie selektora genomu po wybraniu genomów można zastosować cztery działania: interfejs „znajdź geny” wyszukuje nazwę genu w wybranych genomach i wyświetla wyniki w widoku listy genów; przycisk „info” wyświetla krótkie podsumowanie wybranych genomów w widoku podsumowania; przycisk „GO” otwiera przeglądarkę GO o nazwie VertiGo, która zestawia liczbę genów w różnych pozycjach GO; wreszcie przycisk „ścieżka” inicjuje przeglądarkę ścieżek, która ilustruje pełne ścieżki wszystkich organizmów w bazie danych MicrobesOnline.

Ponadto nazwy genomów pokazane w widoku podsumowania prowadzą do widoku danych pojedynczego genomu, który przedstawia bogactwo informacji o wybranym genomie. W widoku listy genów łącza „GODHST B...” prowadzą użytkownika do narzędzia informacji o locus, gdzie wyświetlane są szczegółowe informacje, takie jak operon i regulon , domeny i rodziny, sekwencje, adnotacje itp.

wózki genowe

Niestandardowa demonstracja tymczasowego wózka genów i stałego wózka genów.

Ważną funkcją przechowywania prac użytkownika jest Gene Cart. Wiele stron internetowych MicrobesOnline wyświetlających informacje genetyczne zawiera łącze umożliwiające dodanie interesujących genów do sesyjnego koszyka genów, który jest dostępny dla wszystkich użytkowników. Jest to tymczasowy koszyk genów i jako taki traci informacje, gdy użytkownik zamyka przeglądarkę internetową. Geny w sesyjnym koszyku genów można zapisać w stałym koszyku genów, który jest dostępny tylko dla zarejestrowanych użytkowników po zalogowaniu.

Genomika funkcjonalna

Jednym z celów tworzenia MicrobesOnline jest przechowywanie informacji funkcjonalnych o genomach drobnoustrojów. Takie informacje obejmują ontologię genów i profile ekspresji genów oparte na mikromacierzach, do których można uzyskać dostęp za pośrednictwem dwóch interfejsów, zwanych odpowiednio przeglądarką GO i przeglądarką danych ekspresji. Przeglądarka GO zapewnia łącza do genów uporządkowanych według terminów ontologii genów, a przeglądarka danych ekspresji zapewnia zarówno dostęp do profili ekspresji, jak i informacji o warunkach eksperymentalnych.

Hierarchia ontologii genów

Geny E.coli K-12 podszczepu DH10B pod podświetloną pozycją GO „adhezja komórek”.

Przeglądarka GO, znana również jako VertiGo, jest używana przez MicrobesOnline do wyszukiwania i wizualizacji hierarchii GO, która jest ujednoliconym systemem werbalnym opisującym właściwości produktów genów, w tym składników komórkowych, funkcji molekularnych i procesów biologicznych. Selektor genomu na stronie głównej MicrobesOnline zapewnia bezpośredni sposób przeglądania hierarchii GO wybranych genomów, a także zapewnia listę genów pod wybranym terminem GO, które można następnie dodać do koszyka genów sesji w celu dalszej analizy.

Informacje o ekspresji genów

Przeglądarka eksperymentów jako składnik Expression Data Viewer.

Expression Data Viewer to interfejs do wyszukiwania i sprawdzania eksperymentów ekspresji genów opartych na mikromacierzach oraz profili ekspresji . Składa się z kilku elementów: przeglądarki eksperymentów do wyszukiwania określonych eksperymentów w wybranych genomach w wybranych warunkach eksperymentalnych, przeglądarki eksperymentów ekspresyjnych dostarczającej szczegółów każdego eksperymentu na mikromacierzy, przeglądarki ekspresji genów pokazującej mapę cieplną poziomów ekspresji wybranego genu i genów w tym samym operonie i wreszcie narzędzie do wyszukiwania profili do wyszukiwania profili ekspresji genów. Dostęp do przeglądarki danych ekspresji można uzyskać na trzy sposoby: „Przeglądaj dane funkcjonalne” na pasku nawigacyjnym, „Dane ekspresji genu” na stronie głównej i listę „Ekspresja genu” w widoku danych pojedynczego genomu, gdzie dane ekspresji są dostępne. Widok danych pojedynczego genomu może również pokazywać interakcję białko-białko przeglądarka umożliwiająca inspekcję kompleksów interakcji i pobieranie danych dotyczących ekspresji (np. Escherichia coli str. K-12 substr. MG1655). Ponadto użytkownik może uruchomić MultiExperiment Viewer (MeV) w widoku danych pojedynczego genomu w celu analizy i wizualizacji danych ekspresji.

Genomika porównawcza

MicrobesOnline przechowuje informacje o homologii genów i filogenezie do porównawczych badań genomicznych, do których można uzyskać dostęp za pośrednictwem dwóch interfejsów. Pierwszym z nich jest Przeglądarka Drzew, która rysuje drzewo gatunku lub drzewo genów dla wybranego genu i jego sąsiedztwa. Drugi to Orthology Browser, który jest rozszerzeniem Genome Browser i demonstruje wybrany gen w kontekście jego sąsiedztwa dopasowanego do ortologów w innych wybranych genomach. Obie przeglądarki udostępniają opcje zapisywania genu w koszyku genów sesji do dalszej analizy.

Przeglądarka drzew

Widok drzewa gatunków w stylu prostokątnym

Dostęp do przeglądarki drzewa można uzyskać, wyszukując gen za pomocą narzędzia Find Genes na stronie głównej za pomocą jego identyfikatora VIMSS (np. VIMSS15779). Po uzyskaniu dostępu do widoku kontekstu genów za pomocą opcji „Przeglądaj genomy według drzew”, wyświetlane jest drzewo genów i diagram kontekstu genów. Ponadto opcja „Wyświetl drzewo gatunków” otwiera widok drzewa gatunków, który pokazuje drzewo gatunków obok drzewa genów. Dodatkowo przeglądarka drzew umożliwia użytkownikom wybór zarówno genów, jak i genomów według ich podobieństwa. Ponadto pokazuje również poziome transfery genów między genomami.

Przeglądarka ortologii

Widok kontekstu genów, który pokazuje konteksty genomów obok drzewa genów.

Przeglądarka ortologii wyświetla ortologi genomów w porównaniu z genomem zapytania, wybierając wiele genomów z pola „Wybierz organizm(y) do wyświetlenia”.

Ortologia wokół VIMSS ID 15779 pięciu podanych genomów wyświetlana w przeglądarce ortologii.

Informacje o locus można przeglądać za pomocą opcji „przeglądaj geny”, a ten gen można dodać do koszyka genów sesji lub można pobrać jego dane dotyczące ekspresji genów (w tym mapę cieplną). Alternatywnie widok kontekstu genów pojawia się podczas przeglądania genomów według drzew.

Informacje o szlaku metabolicznym

Szlak metabolizmu pirogronianu zilustrowany przez Pathway Browser.
Mapa szlaku KEGG Rickettsia rickettsii jest wizualizowana przez GLAMM z podświetlonym metabolitem.

Pathway Browser pozwala użytkownikom poruszać się po mapach szlaków Encyklopedii genów i genomów z Kioto (KEGG), wyświetlając przewidywaną obecność lub brak enzymów dla maksymalnie dwóch wybranych genomów. W przeglądarce ścieżek można wyświetlić mapę konkretnej ścieżki i porównanie między dwoma rodzajami drobnoustrojów. Numer komisji enzymatycznej (np. 3.1.3.25) zapewnia link do widoku listy genów, który pokazuje informacje o wybranym enzymie i pozwala użytkownikowi dodawać geny do koszyka genów sesji.

Układ Bioinformatics Workbench

GLAMM to kolejne narzędzie do wyszukiwania i wizualizacji szlaków metabolicznych w ujednoliconym interfejsie internetowym. Pomaga użytkownikom identyfikować lub konstruować nowe, transgeniczne szlaki.

Bioinformatyka

MicrobesOnline zintegrowało liczne narzędzia do analizy sekwencji, profili ekspresji genów i interakcji białko-białko w interfejs o nazwie Bioinformatics Workbench, do którego dostęp można uzyskać za pośrednictwem wózków genów. Obsługiwane obecnie analizy obejmują dopasowanie wielu sekwencji , konstrukcję drzew filogenetycznych , wyszukiwanie motywów i skany, podsumowania profili ekspresji genów i interakcji białko-białko. W celu zaoszczędzenia zasobów obliczeniowych, użytkownik może uruchomić dwa jednoczesne zadania przez maksymalnie cztery godziny, a wszystkie wyniki są zapisywane tymczasowo, aż do zakończenia sesji. Wyniki można udostępniać innym użytkownikom lub grupom za pośrednictwem narzędzia kontroli dostępu do zasobów.

Wspieranie baz danych

Podsumowanie baz danych MicrobesOnline

MicrobesOnline opiera się na integracji danych z szeregu baz danych, które zarządzają różnymi aspektami jego możliwości. Obszerna lista jest następująca:

  • Informacje o sekwencji : Nieredundantne sekwencje białek, genów i transkryptów oraz adnotacje są pobierane z RefSeq i Uniprot .
  • Klasyfikacja taksonomiczna gatunków i sekwencji : taksonomia NCBI służy do klasyfikowania gatunków i sekwencji do grup filogenetycznych oraz do budowy drzewa filogenetycznego.
  • Identyfikacja nieopisanych białek na podstawie sekwencji : CRITICA służy do znajdowania odcinków sekwencji DNA, które kodują białka. Stosuje się zarówno genomikę porównawczą, jak i metodę niezależną od porównania i adnotacji.
  • Identyfikacja genów bez adnotacji na podstawie sekwencji : MicrobesOnline wykorzystuje Glimmer do automatycznego znajdowania genów w sekwencjach bakterii, archeonów i wirusów.
  • Klasyfikacja białek : Uwzględniono klasyfikację białek według ich konserwatywnych domen, rodzin i nadrodzin określonych przez repozytoria PIRSF, Pfam , SMART i SUPERFAMILY .
  • Informacje o ortologii genów : ortologiczne grupy genów różnych gatunków są oparte na informacjach z bazy danych COG, która opiera się na porównaniu sekwencji białek w celu wykrycia homologii.
  • Funkcjonalne informacje o genach i białkach : zakres dostarczonych informacji funkcjonalnych jest dostarczany przez: GOA dla Gene Ontology adnotacja genów do kategorii funkcjonalnych, KEGG dla szlaków metabolicznych, molekularnych i sygnalizacyjnych genów oraz PANTHER dla informacji o szlakach molekularnych i funkcjonalnych , w kontekście relacji między rodzinami białek i ich ewolucji . TIGRFAM i Gene3D są przywoływane w celu uzyskania informacji strukturalnych i adnotacji białek.
  • Dane dotyczące ekspresji genów : zarówno baza danych NCBI GEO, jak i Many Microbe Microarrays Database obsługują dane dotyczące ekspresji genów z MicrobesOnline. Zestawy danych skompilowane przez Many Microbe Microarrays Database mają tę dodatkową zaletę, że są bezpośrednio porównywalne, ponieważ akceptowane są tylko dane generowane przez jednokanałowe mikromacierze Affymetrix , a następnie są normalizowane.
  • Wykrywanie CRISPR : CRISPR to loci DNA zaangażowane w odporność na sekwencje inwazyjne, w których krótkie bezpośrednie powtórzenia są oddzielone sekwencjami rozdzielającymi. Bazy danych generowane przez algorytmy CRT i PILER-CL służą do wykrywania CRISPR.
  • Wykrywanie tRNA : Baza danych tRNAscan-SE służy jako punkt odniesienia do identyfikacji sekwencji tRNA.
  • Przesyłanie danych przez użytkowników : Użytkownicy mają możliwość przesyłania zarówno genomów, jak i plików ekspresyjnych do MicrobesOnline i analizowania ich za pomocą oferowanych narzędzi analitycznych, z opcją zachowania prywatności danych (w przypadku danych niepublikowanych) lub udostępnienia ich publicznie . Dane z mikromacierzy powinny zawierać jasną identyfikację organizmów, platform, zabiegów i kontroli, warunków doświadczalnych, zastosowanych punktów czasowych i technik normalizacji, jak również dane dotyczące ekspresji w formacie współczynnika logarytmicznego lub poziomów logarytmicznych. Chociaż wstępne sekwencje genomu są akceptowane, muszą być zgodne z pewnymi wytycznymi: (1) złożony genom musi mieć mniej niż 100 rusztowań, (2) Należy użyć formatu pliku FASTA , posiadającego unikalną etykietę dla każdego kontigu , (3) najlepiej powinny być obecne przewidywania genów (w tym przypadku akceptowane formaty to GenBank , EMBL , tab-delimited i FASTA ), (4) nazwa genomu oraz należy podać identyfikator taksonomii NCBI.

Aktualizacje

MicrobesOnline był aktualizowany co 3 do 9 miesięcy od 2007 do 2011 roku, gdzie dodano nowe funkcje oraz nowe dane dotyczące gatunków. Jednak od marca 2011 r. nie pojawiły się żadne nowe informacje o wydaniu.

Kompatybilność z innymi witrynami

MicrobesOnline jest kompatybilny z innymi podobnymi platformami zintegrowanych danych o drobnoustrojach, takimi jak IMG i RegTransBase , biorąc pod uwagę, że w całej bazie danych utrzymywane są standardowe identyfikatory genów.

MicrobesOnline w dziedzinie platform do analizy drobnoustrojów

Podjęto inne wysiłki w celu stworzenia ujednoliconej platformy dla narzędzi do analizy prokariotów, jednak większość z nich koncentruje się na jednym zestawie typów analiz. Kilka przykładów tych skoncentrowanych baz danych obejmuje między innymi te, które koncentrują się na analizie danych metabolicznych (Microme ), genomice porównawczej (MBGD i przeglądarka OMA ), regulonach i czynnikach transkrypcyjnych (RegPrecise ), porównawczej genomice funkcjonalnej (Pathline ). Jednak inne zespoły podjęły znaczące wysiłki w celu stworzenia kompleksowych platform, które w dużej mierze pokrywają się z możliwościami MicrobesOnline. MicroScope i Zintegrowany system genomów drobnoustrojów (IMG) to przykłady popularnych i ostatnio aktualizowanych baz danych (stan na wrzesień 2014 r.).

Rozszerzenie analizy metagenomu: metaMicrobesOnline

metaMicrobesOnline został opracowany przez tych samych programistów co MicrobesOnline i stanowi rozszerzenie możliwości MicrobesOnline, skupiając się na filogenetycznej analizie metagenomów . Dzięki interfejsowi sieciowemu podobnemu do MicrobesOnline, użytkownik może przełączać się między witrynami za pomocą łącza „przełącz na” na stronie głównej.

Zobacz też

Linki zewnętrzne