Centrum zasobów bioinformatyki wirusowej

Viral Bioinformatics Resource Center ( VBRC ) jest internetowym zasobem zapewniającym dostęp do bazy danych wyselekcjonowanych genomów wirusowych i różnorodnych narzędzi do bioinformatycznej analizy genomu. Zasób ten był jednym z ośmiu BRC ( Centrów Zasobów Bioinformatycznych ) finansowanych przez NIAID w celu promowania badań nad pojawiającymi się i ponownie pojawiającymi się patogenami , szczególnie tymi postrzeganymi jako potencjalne zagrożenia bioterrorystyczne . VBRC jest teraz wspierany przez dr Chrisa Uptona z Uniwersytet Wiktorii .

Wyselekcjonowana baza danych VBRC zawiera wszystkie publicznie dostępne sekwencje genomowe dla wirusów ospy i wirusów afrykańskiego pomoru świń (ASFV). Unikalnym aspektem tego zasobu w porównaniu z innymi genomowymi bazami danych jest grupowanie wszystkich opisanych genów w grupy ortologiczne (tj. rodziny białek ) w oparciu o wcześniejsze wyszukiwanie podobieństwa sekwencji BLASTP .

Dostęp do wyselekcjonowanej bazy danych uzyskuje się za pośrednictwem VOCS (Viral Orthologous Clusters), dostępnego do pobrania interfejsu użytkownika opartego na języku Java , który działa jako centralne źródło informacji dla innych programów środowiska roboczego VBRC. Programy te służą różnorodnym funkcjom analizy bioinformatycznej ( uliniowienie całego lub subgenomu , wyświetlanie genomu i kilka rodzajów analizy sekwencji genów/białek). Większość z tych narzędzi jest zaprogramowana tak, aby przyjmowały również dane wprowadzane przez użytkownika.

Rodziny wirusów uwzględnione w bazie danych VBRC

VBRC obejmuje następujące wirusy:

Organizacja bazy danych VBRC

Baza danych VBRC przechowuje wirusowe dane bioinformatyczne na trzech poziomach:

  1. Całe genomy. Ten poziom zawiera informacje o gatunku wirusa lub izolacie i całej jego sekwencji genomowej.
  2. Geny z adnotacjami. Ten poziom zawiera wszystkie przewidywane ORF (otwarte ramki odczytu) w konkretnym genomie wirusa, wraz z ich sekwencjami DNA i (przetłumaczonymi) białkami.
  3. Grupy ortologiczne (rodziny). Ten poziom jest wyróżnikiem bazy VBRC. Każdy opatrzony adnotacjami gen, po wprowadzeniu do bazy danych, jest poddawany przeszukiwaniu BLASTP względem wszystkich innych genów znajdujących się już w bazie danych. Na podstawie wyników wyszukiwania jest on albo przypisywany do istniejącej wcześniej grupy ortologów, albo umieszczany w nowo utworzonej, własnej grupie ortologów. Celem tego poziomu jest „umożliwienie szybkiego porównania podobnych genów w obrębie danej rodziny wirusów”. [ źródło opublikowane samodzielnie? ]

Centralne narzędzia dostarczone przez VBRC

VBRC zapewnia naukowcom szeroką gamę narzędzi połączonych z bazami danych. Spośród nich cztery centralne programy to VOCs , VGO , BBB i JDotter .


  1. VOC (Viral Orthologous Clusters) VOC to główny interfejs dostępu do bazy danych. Użytkownicy mogą przeszukiwać dostępne dane według szeregu kryteriów związanych z charakterystyką genomu, genu lub grupy ortologów. Wyniki wyszukiwania są wyświetlane w formie tabeli; stąd użytkownik może uzyskać dalsze informacje na temat konkretnego wpisu w bazie danych lub uruchomić narzędzie powiązane z LZO (patrz poniżej) w celu analizy wybranych danych. Dostępne są dodatkowe narzędzia analityczne, takie jak wyszukiwanie BLAST, mapy genomu, dopasowanie genomu lub genu, drzewa filogenetyczne itp.

  2. VGO (Viral Genome Organizer) VGO to oparty na Javie interfejs służący do przeglądania i wyszukiwania sekwencji genomu wirusa. Wraz z graficzną reprezentacją wybranego genomu VBRC (lub dostarczonego przez użytkownika), program wyświetla informacje dotyczące genomu będącego przedmiotem zainteresowania, w tym jego genów, ORF i kodonów start/stop. Dostępne są narzędzia umożliwiające użytkownikowi wykonywanie wyrażeń regularnych, motywów rozmytych i wyszukiwania masowego. VGO można również wykorzystać do identyfikacji powiązanych genów w wielu sekwencjach.

  3. BBB (Base-by-Base) Base-by-Base jest niezależnym od platformy (opartym na Javie), edytorem par całego genomu i wielokrotnym dopasowaniem. Program podkreśla różnice między kolejnymi parami sekwencji w ramach dopasowania, umożliwiając w ten sposób użytkownikowi badanie dużego dopasowania na poziomie pojedynczej reszty. Adnotacje z bazy danych VBRC lub plików dostarczonych przez użytkownika są wyświetlane obok każdej sekwencji.
    Chociaż Base-By-Base miał służyć jako edytor i przeglądarka dopasowań bardzo podobnych sekwencji, generuje również wiele dopasowań przy użyciu Clustal Omega, T-Coffee i MUSCLE. Dostępne są funkcje edycji umożliwiające użytkownikom ręczne dostrajanie takich wyrównań; użytkownicy mogą również opisywać genomy komentarzami lub sekwencjami starterów.

  4. JDotter JDotter jest opartym na Javie interfejsem użytkownika zapewniającym połączony z VBRC dostęp do linuksowej wersji Dottera. JDotter może zarówno uzyskiwać dostęp do wstępnie przetworzonych wykresów punktowych genomu i sekwencji genów (DNA lub białek) dostępnych w bazie danych VBRC, jak i pobierać dane od użytkownika w celu generowania nowych wykresów punktowych . JDotter łączy się również z wyselekcjonowaną bazą danych lub plikiem dostarczonym przez użytkownika, aby wyświetlić dodatkowe dane dotyczące funkcji, takie jak adnotacje genów.

Inne narzędzia dostarczone przez VBRC

VBRC udostępnia na swojej stronie internetowej szereg dodatkowych narzędzi analitycznych opartych na języku Java. Narzędzia w tej kategorii są zaprojektowane do wykonywania bardzo konkretnych zadań (np. wyrażeń regularnych , wykreślania skośnego DNA) i chociaż można uzyskać do nich dostęp jako samodzielne programy z danymi wprowadzonymi przez użytkownika, większość z nich ma zwiększoną użyteczność po uruchomieniu z centralna aplikacja VOCS z danymi dostarczonymi przez VBRC.

Te dodatkowe narzędzia to:

  • Sequence Searcher przeprowadza wyszukiwanie wyrażeń regularnych i motywów rozmytych w sekwencjach DNA lub białek i jest wbudowane w VOCS.
  • GFS (Genome Fingerprint Scanning) odwzorowuje dane odcisków palców masy peptydów na sekwencje genomowe. Jest wbudowany w VOCS.
  • NAP (Nucleotide Amino Acid Alignment) to interfejs Java do napC, programu zaprojektowanego do dopasowania sekwencji nukleotydów i białek, z uwzględnieniem przerw końcowych i mutacji insercyjnych/delecyjnych. Można uzyskać do niego dostęp z VOCS.
  • GraphDNA zapewnia skosy i spacery DNA ( oparte na płaszczyźnie kartezjańskiej przedstawienie zawartości nukleotydów) z bazy danych VBRC lub sekwencji DNA dostarczonej przez użytkownika. Jest zintegrowany z VOCS.
  • Ploter hydrofobowości generuje wykres hydrofobowości dla sekwencji białkowej dostarczonej przez bazę danych VBRC lub dostarczonej przez użytkownika. Obsługiwane są trzy skale hydrofobowości ( Kyte-Doolittle , Hopp-Woods i Parker-Guo-Hodges); procedura tworzenia wykresów opiera się na przesuwanym oknie o długości określonej przez użytkownika. Można uzyskać do niego dostęp z VOCS.
  • GATU (Genome Annotation Transfer Utility) umożliwia użytkownikowi dodawanie adnotacji do nowo zsekwencjonowanego genomu w oparciu o adnotacje obecne w genomie referencyjnym; może również przewidywać nowe geny w genomie zapytania.

Zobacz też

Dalsza lektura

  • Bioinformatyka do analizy genomów wirusa ospy
  • W końcu to mały świat — genomika wirusów i globalna dominacja wirusów
  • Podejścia bioinformatyczne do analizy porównawczej wirusów

Linki zewnętrzne

  1. ^    Da Silva, Melissa; Upton, Chris (2012). Wirus krowianki i pokswirusologia . Metody w biologii molekularnej . Tom. 890. Melissa Da Silva i Chris Upton. s. 233–258. doi : 10.1007/978-1-61779-876-4_14 . ISBN 978-1-61779-875-7 . PMID 22688771 .
  2. Bibliografia   _ Upton, Chris (2011). „W końcu to mały świat - genomika wirusów i globalna dominacja wirusów”. Aktualna opinia w wirusologii . 1 (4): 280–281. doi : 10.1016/j.coviro.2011.08.001 . PMID 22440784 .
  3. ^    Amgarten, Deyvid; Upton, Chris (2018). Genomika porównawcza . Metody w biologii molekularnej . Tom. 1704. Deyvid Amgarten i Chris Upton. s. 401–417. doi : 10.1007/978-1-4939-7463-4_15 . ISBN 978-1-4939-7461-0 . PMID 29277875 .