Narodowe Centrum Informacji Biotechnologicznej


Narodowe Centrum Informacji Biotechnologicznej
Skrót NCBI
Założony 1988 ; 35 lat temu ( 1988 )
Siedziba Bethesda , Maryland
Lokalizacja
Współrzędne Współrzędne :
Oficjalny język
język angielski
Dyrektor

Stephen Sherry (od 26 września 2022)
Organizacja macierzysta
Narodowa Biblioteka Medyczna Stanów Zjednoczonych
Afiliacje Narodowy Instytut Zdrowia
Strona internetowa ncbi.nlm.nih.gov

Narodowe Centrum Informacji Biotechnologicznej ( NCBI ) jest częścią Narodowej Biblioteki Medycznej Stanów Zjednoczonych (NLM), oddziału National Institutes of Health (NIH). Jest zatwierdzony i finansowany przez rząd Stanów Zjednoczonych . NCBI ma siedzibę w Bethesda w stanie Maryland i zostało założone w 1988 roku na mocy ustawy sponsorowanej przez amerykańskiego kongresmana Claude'a Peppera .

NCBI zawiera szereg baz danych związanych z biotechnologią i biomedycyną i jest ważnym źródłem narzędzi i usług bioinformatycznych. Główne bazy danych obejmują GenBank dla sekwencji DNA i PubMed , bibliograficzną bazę danych literatury biomedycznej. Inne bazy danych obejmują NCBI Epigenomics . Wszystkie te bazy danych są dostępne online za pośrednictwem wyszukiwarki Entrez . NCBI wyreżyserował David Lipman , jeden z oryginalnych autorów BLAST programu dopasowywania sekwencji i powszechnie szanowanej postaci w bioinformatyce .

GenBank

NCBI było odpowiedzialne za udostępnianie bazy danych sekwencji DNA GenBank od 1992 r. GenBank współpracuje z poszczególnymi laboratoriami i innymi bazami danych sekwencji, takimi jak Europejskie Laboratorium Biologii Molekularnej (EMBL) i Bank Danych DNA Japonii (DDBJ).

Od 1992 roku NCBI rozrosło się, dostarczając inne bazy danych oprócz GenBanku. NCBI udostępnia Gene, Online Mendelian Inheritance in Man , Molecular Modeling Database (struktury białek 3D), dbSNP (baza danych polimorfizmów pojedynczych nukleotydów ), Reference Sequence Collection, mapę ludzkiego genomu oraz przeglądarkę taksonomii i koordynuje z National Cancer Institute w celu realizacji projektu anatomii genomu raka. NCBI przypisuje każdemu gatunkowi organizmu unikalny identyfikator (numer identyfikacyjny taksonomii).

NCBI dysponuje narzędziami programowymi, które są dostępne za pośrednictwem przeglądarek internetowych lub przez FTP . Na przykład BLAST jest programem do wyszukiwania podobieństw sekwencji. BLAST może dokonać porównania sekwencji z bazą danych GenBank DNA w mniej niż 15 sekund.

Półka na książki NCBI

NCBI Bookshelf to zbiór ogólnodostępnych, do pobrania, wersji online wybranych książek biomedycznych. Regał obejmuje szeroki zakres tematów, w tym biologię molekularną , biochemię , biologię komórki , genetykę , mikrobiologię , stany chorobowe z molekularnego i komórkowego punktu widzenia, metody badawcze i wirusologię . Niektóre z książek to internetowe wersje wcześniej opublikowanych książek, podczas gdy inne, takie jak Przerwa na kawę , są pisane i redagowane przez pracowników NCBI. Regał jest uzupełnieniem Entrez PubMed repozytorium recenzowanych streszczeń publikacji w tym Bookshelf zapewnia ustalone perspektywy na rozwijające się obszary studiów i kontekst, w którym można zorganizować wiele odmiennych pojedynczych fragmentów zgłoszonych badań. [ potrzebne źródło ]

Podstawowe narzędzie wyszukiwania lokalnego wyrównania (BLAST)

BLAST to algorytm służący do obliczania podobieństwa sekwencji między sekwencjami biologicznymi, takimi jak sekwencje nukleotydowe DNA i sekwencje aminokwasowe białek. BLAST to potężne narzędzie do znajdowania sekwencji podobnych do sekwencji zapytania w tym samym organizmie lub w różnych organizmach. Przeszukuje sekwencję zapytań w bazach danych i serwerach NCBI i wysyła wyniki z powrotem do przeglądarki osoby w wybranym formacie. Sekwencje wejściowe do BLAST są w większości w formacie FASTA lub GenBank, podczas gdy dane wyjściowe mogą być dostarczane w różnych formatach, takich jak formatowanie HTML, XML i zwykły tekst. HTML jest domyślnym formatem wyjściowym strony internetowej NCBI. Wyniki dla NCBI-BLAST są prezentowane w formacie graficznym ze wszystkimi znalezionymi trafieniami, tabelą z identyfikatorami sekwencji dla trafień z danymi związanymi z punktacją, wraz z dopasowaniami dla sekwencji będącej przedmiotem zainteresowania i otrzymanymi trafieniami z analogicznymi wynikami BLAST dla nich.

Entrez

Entrez Global Query Cross-Database Search System jest używany w NCBI dla wszystkich głównych baz danych, takich jak sekwencje nukleotydów i białek, struktury białek, PubMed, taksonomia, kompletne genomy, OMIM i kilka innych . Entrez to zarówno system indeksowania, jak i wyszukiwania danych z różnych źródeł do badań biomedycznych. NCBI rozprowadziło pierwszą wersję Entrez w 1991 roku, składającą się z sekwencji nukleotydowych z PDB i GenBank , sekwencje białek z SWISS-PROT, przetłumaczone GenBank, PIR, PRF, PDB oraz powiązane streszczenia i cytaty z PubMed. Entrez jest specjalnie zaprojektowany do integracji danych z kilku różnych źródeł, baz danych i formatów w jednolity model informacji i system wyszukiwania, który może skutecznie wyszukiwać odpowiednie odniesienia, sekwencje i struktury.

Gen

Gen został wdrożony w NCBI w celu scharakteryzowania i uporządkowania informacji o genach. Służy jako główny węzeł w sieci danych genomowej mapy, ekspresji, sekwencji, funkcji białka, struktury i homologii. Do każdego rekordu genu przypisany jest unikalny GeneID, który można śledzić w cyklach rewizji. genów dla znanych lub przewidywanych genów są tutaj ustalane i wyznaczane przez pozycje na mapie lub sekwencje nukleotydów. Gene ma kilka zalet w stosunku do swojego poprzednika, LocusLink, w tym lepszą integrację z innymi bazami danych w NCBI, szerszy zakres taksonomiczny oraz ulepszone opcje zapytań i wyszukiwania zapewniane przez system Entrez.

Białko

Baza danych białek przechowuje zapis tekstowy dla poszczególnych sekwencji białek, pochodzących z wielu różnych zasobów, takich jak projekt NCBI Reference Sequence (RefSeq), GenBank, PDB i UniProtKB/SWISS-Prot. Rekordy białek są obecne w różnych formatach, w tym FASTA i XML i są powiązane z innymi zasobami NCBI. Białko dostarcza użytkownikom odpowiednich danych, takich jak geny, sekwencje DNA/RNA, szlaki biologiczne, dane dotyczące ekspresji i zmienności oraz literatura. Zapewnia również z góry określone zestawy podobnych i identycznych białek dla każdej sekwencji obliczonej przez BLAST. Baza danych struktur NCBI zawiera zestawy współrzędnych 3D dla struktur określonych eksperymentalnie w PDB, które są importowane przez NCBI. Baza danych konserwowanych domen ( CDD ) białek zawiera profile sekwencji, które charakteryzują wysoce konserwatywne domeny w obrębie sekwencji białek. Posiada również rekordy z zasobów zewnętrznych, takich jak SMART i Pfam . Istnieje inna baza danych białek, znana jako baza danych Protein Clusters, która zawiera zestawy sekwencji białek, które są pogrupowane zgodnie z maksymalnymi dopasowaniami między poszczególnymi sekwencjami obliczonymi przez BLAST.

Baza danych Pubchem

PubChem NCBI jest publicznym zasobem dotyczącym cząsteczek i ich aktywności w testach biologicznych. PubChem jest przeszukiwalny i dostępny przez Entrez .

Zobacz też

Linki zewnętrzne