Baza danych struktur węglowodanów
Treść | |
---|---|
Opis | naturalnych węglowodanów z NMR , adnotacjami bibliograficznymi i biologicznymi. |
Przechwycone typy danych |
struktury węglowodanów i powiązane dane |
Organizmy |
|
Kontakt | |
Centrum Badań | Zelinsky Instytut Chemii Organicznej |
Autorski | Philip V. Toukach, Ksenia S. Egorova, Yuri A. Knirel i in. |
Cytowanie podstawowe | Baza danych struktur węglowodanów |
Data wydania | 2005 |
Dostęp | |
Strona internetowa | http://csdb.glycoscience.ru/ |
Pobierz URL | funkcja eksportu w interfejsie internetowym |
Narzędzia | |
Sieć | |
Różnorodny | |
Wersjonowanie | Tak |
Częstotliwość udostępniania danych |
coroczny |
Wersja | 1 (połączony) |
Polityka kuracji | tak (ręczny i automatyczny) |
Baza danych struktury węglowodanów (CSDB) to bezpłatna baza danych i platforma usługowa w glikoinformatyce , uruchomiona w 2005 roku przez grupę rosyjskich naukowców z Instytutu Chemii Organicznej ND Zelinsky Rosyjskiej Akademii Nauk. CSDB przechowuje opublikowane dane strukturalne, taksonomiczne, bibliograficzne i spektroskopowe NMR dotyczące naturalnych węglowodanów i cząsteczek pokrewnych węglowodanom.
Przegląd
Głównymi danymi przechowywanymi w CSDB są struktury węglowodanowe pochodzenia bakteryjnego, grzybowego i roślinnego. Każda struktura jest przypisana do organizmu i zawiera link(i) do odpowiednich publikacji naukowych, w których została opisana. Oprócz danych strukturalnych, CSDB przechowuje również NMR , informacje o metodach rozszyfrowania określonej struktury oraz niektóre inne dane. CSDB zapewnia dostęp do kilku narzędzi badawczych związanych z węglowodanami:
- Symulacja widm 1D i 2D NMR węglowodanów ( GODDESS: zorientowana na glikan symulacja widma empirycznego oparta na bazie danych ) .
- Zautomatyzowane wyjaśnianie struktury oparte na NMR ( GRASS: generowanie, ranking i przypisywanie struktur sacharydowych ).
- Analiza statystyczna rozkładu cech strukturalnych w glikomach organizmów żywych
- Generowanie zoptymalizowanych współrzędnych atomowych dla dowolnego sacharydu i podbazy map konformacji.
- Grupowanie taksonów w oparciu o podobieństwa glikomów ( drzewo życia na bazie węglowodanów )
- glikozylotransferazy ( GT-explorer )
Historia i finansowanie
Do 2015 r. równolegle istniały bazy danych Bacterial Carbohydrate Structure Database (BCSDB) i Plant&Fungal Carbohydrate Structure Database (PFCSDB). W 2015 roku zostały one połączone w jedną Bazę Danych Struktury Węglowodanów (CSDB). Rozwój i utrzymanie CSDB były finansowane przez Międzynarodowe Centrum Nauki i Technologii (2005-2007), program grantowy Prezydenta Federacji Rosyjskiej (2005-2006), Rosyjską Fundację Badań Podstawowych (2005-2007,2012-2014,2015-2017, 2018-2020), Deutsches Krebsforschungszentrum (krótkoterminowy w latach 2006-2010) oraz Russian Science Foundation (2018-2020).
Źródła i zasięg danych
Głównymi źródłami danych CSDB są:
- Publikacje naukowe indeksowane w dedykowanych bazach cytowań, w tym NCBI Pubmed i Thomson Reuters Web Of Science (ok. 18000 rekordów).
- Baza danych CCSD (Carbbank ) (ok. 3000 rekordów).
Selekcji i dodawania danych do CSDB dokonuje się ręcznie, przeglądając oryginalne publikacje naukowe. Dane pochodzące z innych baz podlegają procedurze korekty błędów i akceptacji. Od 2017 roku zasięg dotyczący bakterii i archeonów wynosi ok. 80% struktur węglowodanowych opublikowanych w literaturze naukowej Czas między publikacją danych względnych a ich złożeniem w CSDB wynosi około 18 miesięcy. Rośliny są objęte do 1997 r., a grzyby do 2012 r. CSDB nie obejmuje danych z animalia , z wyjątkiem metazoa jednokomórkowego . Istnieje wiele dedykowanych baz danych dotyczących węglowodanów pochodzenia zwierzęcego , np. UniCarbKB lub GLYCOSCIENCES.de .
CSDB jest uznawany za jeden z największych projektów w glikoinformatyce . Znajduje zastosowanie w badaniach strukturalnych naturalnych węglowodanów oraz w glikoprofilowaniu. Zawartość CSDB została wykorzystana jako źródło danych w innych glikoinformatycznych .
Przedmioty zdeponowane
- Struktury molekularne glikanów , glikopolimerów i glikokoniugatów : struktura pierwszorzędowa, informacja o aglikonie , stopień polimeryzacji i klasa cząsteczki. Zakres strukturalny obejmuje cząsteczki złożone z reszt ( monosacharydów , alditoli , aminokwasów , kwasów tłuszczowych itp.) połączonych wiązaniami glikozydowymi , estrowymi, amidowymi, ketalowymi, fosfo- lub sulfodiestrowymi, w których co najmniej jedna reszta jest monosacharydem lub jego pochodną .
- Bibliografia powiązana ze strukturami: dane wydawnicze, słowa kluczowe, streszczenia, identyfikatory w bazach bibliograficznych
- Biologiczny kontekst struktur: powiązany takson , szczep , serogrupa , organizm gospodarza, informacje o chorobie. Omówione domeny to: prokarioty, rośliny, grzyby i wybrane patogenne jednokomórkowe metazoa . Baza danych zawiera wyłącznie glikany pochodzące z tych domen lub otrzymane poprzez chemiczną modyfikację takich glikanów.
- Wyznaczone widma NMR i warunki doświadczalne.
- Glikozylotransferazy związane z taksonami: identyfikatory genów i enzymów , pełne struktury, donor i substraty, metody badania aktywności enzymatycznej, poziom wiarygodności.
- Odwołania do innych baz danych
- Inne dane zebrane z oryginalnych publikacji
- Mapy konformacyjne disacharydów pochodzące z symulacji dynamiki molekularnej .
Powiązania z innymi bazami danych
CSDB jest usieciowana z innymi bazami danych o glikomikach , takimi jak MonosaccharideDB , Glycosciences.DE , NCBI Pubmed , NCBI Taxonomy , NLM directory , International Classification of Diseases 11 itp. Oprócz natywnej notacji CSDB Linear, struktury są prezentowane w wielu notacjach węglowodanów (SNFG, SweetDB, GlycoCT, WURCS , GLYCAM itp.). CSDB można eksportować jako źródło opisu zasobów (RDF) zgodnie z ontologią GlycoRDF .