PhagesDB
Założony | kwiecień 2010 |
---|---|
Lokalizacja |
|
Członkowie |
20366 (stan na 15.03.2022) |
Kluczowi ludzie |
Dr Graham Hatfull (profesor HHMI), Dan Russell (webmaster), Debbie Jacobs-Sera (koordynator programu phagehunting), dr Welkin H. Pope (adiunkt naukowy) i dr Viknesh Sivanathan (oficer programu HHMI) |
Afiliacje | SEA-PHAGES (Science Education Alliance-Phage Hunters Advancing Genomics and Evolutionary Science) |
Strona internetowa |
Baza danych Actinobacteriophage , bardziej znana jako PhagesDB , to strona internetowa i baza danych , które gromadzą i udostępniają informacje związane z odkrywaniem, charakteryzacją i genomiką wirusów preferujących infekowanie gospodarzy Actinobacterium . Służy do porównywania fagów i ich adnotacji genomowych. Baza danych zawiera informacje o ponad 8000 bakteriofagów , w tym ponad 1600 z już zsekwencjonowanymi genomami.
Tło
PhagesDB zapewnia społeczności badawczej Actinobacteriophage punkt wyjścia do publikowania swoich odkryć i udostępniania ich członkom swojej społeczności, którzy mogą następnie dalej analizować dane i wykorzystywać je do opisywania nowo odkrytych genomów fagów poprzez porównanie. Został zaprojektowany, aby nadążyć za tempem odkrywania, dzięki czemu nowe geny mogą być przesyłane w czasie rzeczywistym. Ma pomóc uniknąć „opóźnienia czasowego między sekwencjonowaniem a dostępnością genomów z adnotacjami w GenBank. Łączy studentów z całego świata, którzy prowadzą autentyczne badania za pośrednictwem SEA-PHAGES programu, aby mogli dzielić się swoimi wynikami z resztą społeczności naukowej.” Istnieje ponad 6400 zarejestrowanych użytkowników PhagesDB z adresami e-mail xxx.edu, co odzwierciedla wykorzystanie przez studentów-naukowców.
W 1993 roku sekwencjonowanie L5 doprowadziło do rozpoczęcia pierwszej dekady genomiki Actinobacteriophage i zakończyło się publikacją analizy porównującej 14 różnych genomów mykobakteriofagów w 2003 roku. Korzystając z lokalnych arkuszy kalkulacyjnych i GenBanku, możliwe było zarządzanie uzyskanymi danymi przez około rok, pod warunkiem, że było to w tempie około jednego genomu rocznie. Jednak następujące dwa wydarzenia sprawiły, że podejście to stało się nie do obrony. Po pierwsze, utworzenie programu Phage Hunters Integrating Research and Education (PHIRE) stworzyło ścieżkę dla początkujących naukowców ze szkół średnich i wyższych do oczyszczania, izolowania i charakteryzowania ich własnych nowych fagów, co doprowadziło do gwałtownego wzrostu ilości izolatów fagów, które można uzyskać do sekwencjonowania. Po drugie, odkrycie technologii sekwencjonowania nowej generacji spowodowało szybsze i tańsze sekwencjonowanie tych genomów fagów. W rezultacie liczba genomów fagów sekwencjonowanych w następnej dekadzie wzrosła wykładniczo. Fundacja Science Education Alliance – Phage Hunters Advancing Genomics and Evolutionary Science ( SEA-PHAGES ) w 2008 roku zwiększył liczbę rurociągów do izolacji i sekwencjonowania aktynobakteriofagów, a radzenie sobie z danymi tworzonymi przez te programy stanowiło wyzwanie.
PhagesDB został stworzony jako pojedyncze, skoncentrowane archiwum informacji o fagach, do którego każdy zainteresowany lub zaangażowany w badanie fagów może uzyskać dostęp i wprowadzić dane. Dostępna przez Internet próbka bazy danych umożliwiła przechowywanie i wyszukiwanie danych w metodyczny i elastyczny sposób, a także zapewniała łatwy dostęp każdemu, kto ma połączenie z Internetem. W kwietniu 2010 r. Uruchomiono PhagesDB, które początkowo było przeznaczone tylko dla mykobakteriofagów (fagów żywicieli mykobakteryjnych). W 2015 roku stała się bazą danych Actinobacteriophage, która zawiera wszystkie fagi infekujące gospodarzy z Phylum Actinomycetota .
Projekt i funkcje
Stworzenie PhagesDB zostało przeprowadzone przy użyciu Django i był hostowany na serwerze WebFaction. Django to oparty na Pythonie framework do tworzenia stron internetowych, który został wybrany specjalnie ze względu na swoją wszechstronność, dostępność dla nieprofesjonalnych programistów, przejrzystość dokumentacji i kilka innych gotowych funkcji, w tym w pełni funkcjonalną stronę administracyjną. Ważne było, aby miał dostęp do nieprofesjonalnych programistów, ponieważ pozwala to na bardziej zróżnicowany zakres wyników. Zamiast lokalnie hostować PhagesDB, wybrano WebFaction ze względu na łatwą integrację z Django, wysoki poziom bezpieczeństwa danych i krótkie przestoje. Witryna bazy danych otwiera się z przeważnie zieloną i czarną stroną lobby, aw lewym górnym rogu znajduje się pasek wyszukiwania. Nazwy fagów można sekwencjonować i/lub szkicować, wpisywać w pasku wyszukiwania, a wyniki pojawiają się natychmiast.
PhagesDB ma indywidualną stronę fagową dla każdego pojedynczego faga z ponad 8000 fagów, które zostały wprowadzone do bazy danych. Strony te zawierają szczegółowe informacje dotyczące fagów. Informacje te obejmują szczegóły odkrycia (współrzędne GPS, rok znalezienia, temperatura izolacji, bakteria gospodarza itp.), szczegóły sekwencjonowania (długość genomu, zawartość G + C, typ zakończeń genomu itp.), szczegóły charakterystyki (morfotyp, klaster/podgrupa, lista genów itp. ) itp.). W stosownych przypadkach znajdują się łącza do wpisu GenBank dotyczącego faga, a także do artykułu, w którym został opublikowany. Oprócz tego istnieje oddzielna strona GeneMark dla każdego faga, która pozwala na wzajemne odniesienie do pozycji genomów w projekcie fagów, aby upewnić się, że genom rzeczywiście występuje w określonym miejscu. PhagesDB może być używany samodzielnie, ale okazuje się, że jest dokładniejszy, gdy jest używany we współpracy z inną witryną bioinformatyczną, taką jak NCBI Blast. Poniższy rysunek przedstawia różne typy i liczbę zsekwencjonowanych fagów:
Sekwencjonowanie typów fagów | Sekwencja numerów |
---|---|
aktynoplany | 1 |
Arthrobacter | 240 |
Brevibacterium | 2 |
Corynebacterium | 12 |
Gordonia | 296 |
Kocuria | 4 |
Mikrobakterie | 98 |
mykobakterie | 1590 |
Propionibacterium | 55 |
Rodokok | 53 |
Rotia | 1 |
Streptomyces | 167 |
Tetrasphaera | 1 |
Tsukamurella | 2 |
W PhagesDB istnieje wiele różnych sposobów, w jakie użytkownik może przeglądać i kontaktować się z grupami fagów. Listy fagów można generować i klasyfikować według gospodarza (rodzaju, gatunku lub szczepu), klastra, podgrupy, instytucji, roku znalezienia, długości genomu, zawartości G + C i kilku innych kryteriów. Strona filtra pozwala na kombinację kryteriów ukierunkowaną na grupę fagów o określonych cechach. Każdy klaster i podklaster fagów ma swoją własną stronę z katalogiem fagów członkowskich. Oprócz tego każdy klaster i podklaster ma również informacje o sobie, na przykład liczbę członków w klastrach, ich średnią wielkość genomu i gospodarzy, których członkowie zarażają lub wolą zarażać. Istnieje interaktywna mapa, która pokazuje wszystkie fagi/klastry, które są sekwencjonowane ze znanymi współrzędnymi GPS. Daje to informacje o geograficznym rozmieszczeniu miejsc izolacji fagów. Strona porównania pozwala użytkownikom przeglądać wszystkie obrazy łysinek, obrazy trawienia lub mikrofotografie dla danej grupy fagów. PhagesDB ma aminokwasów na temat genomów fagów , które są sekwencjonowane przez integrację z Phameratorem
Dostęp i prawa do danych
Dane PhagesDB mogą być przeglądane przez każdego i każdy może zarejestrować się na stronie (poprzez Google , Facebook , Twitter lub sam PhagesDB), dając możliwość dodawania nowych znalezionych fagów i modyfikowania danych fagowych, jednocześnie ucząc się więcej o charakterystyce fagów.
Ponadto strona oferuje wiele sposobów przywracania podstawowych danych. Strona pobierania danych składa się z linków do pobrania wszystkich sekwencji genomu faga, tekstów o każdym fagu z obszernymi informacjami oraz zdjęć z wszystkimi obrazami łysinek, zdjęciami trawienia restrykcyjnego żelu lub mikrografiami dla dowolnego klastra. Każda strona Pham zawiera link do pobrania aminokwasowych wszystkich członków tego Pham dla porównawczych motywów proteomicznych.
interfejs programowania aplikacji (API), aby umożliwić użytkownikom podejście do wielu podstawowych danych w sposób bardziej zgodny z komputerami. PhagesDB API odbiera odwołania do wszystkich fagów, według hosta, klastra lub podklastra, sekwencjonowane itp., i przywraca obiekty json z żądanymi informacjami. PhagesDB przechowuje niektóre niepublikowane dane, których nie ma na żadnym podłożu, w tym sekwencje genomu, które zostały ostatnio wykonane. Warunki korzystania z PhagesDB zawiera instrukcje, w jaki sposób i jakie dane będą wykorzystywane przez osoby trzecie. Na przykład użytkownicy, którzy chcą wykorzystać nieopublikowane dane do swoich celów prywatnych, potrzebują zgody właścicieli danych.