Karty genowe
Treść | |
---|---|
Przechwycone typy danych |
Ludzkie geny i modelowe ortologi |
Organizmy | Homo sapiens |
Kontakt | |
Centrum Badań | Koronne Centrum Genomu Człowieka, WIS |
Cytowanie podstawowe | PMID 9097728 |
Dostęp | |
Format danych | HTML |
Strona internetowa |
GeneCards to baza danych ludzkich genów , która zawiera informacje genomiczne , proteomiczne , transkryptomiczne , genetyczne i funkcjonalne dotyczące wszystkich znanych i przewidywanych genów ludzkich. Jest rozwijany i utrzymywany przez Crown Human Genome Center w Instytucie Nauki Weizmanna we współpracy z LifeMap Sciences.
Baza danych ma na celu zapewnienie kompleksowego przeglądu aktualnie dostępnych informacji biomedycznych na temat poszukiwanego genu, w tym jego aliasów i identyfikatorów, kodowanych białek , powiązanych chorób i odmian, jego funkcji, odpowiednich publikacji i innych. Baza danych GeneCards zapewnia dostęp do bezpłatnych internetowych dotyczących ponad 350 000 znanych i przewidywanych ludzkich genów, zintegrowanych z ponad 150 zasobów danych, takich jak HGNC , Ensembl i NCBI . Podstawowa lista genów jest oparta na NCBI, Ensembl i zatwierdzonych symbolach genów opublikowanych przez HUGO Gene Nomenclature Committee (HGNC). Informacje są starannie zbierane i wybierane z tych baz danych przez mechanizm integracyjny.
Z biegiem czasu baza danych GeneCards rozwinęła zestaw narzędzi (VarElect, GeneALaCart itp.), Które mają bardziej wyspecjalizowane możliwości wykorzystujące bazę danych. Od 1998 roku baza danych GeneCards jest szeroko wykorzystywana przez bioinformatyczne , genomiczne i medyczne przez ponad 24 lata.
Historia
Od lat 80. XX wieku informacje o sekwencjach stają się coraz bardziej obfite; później wiele laboratoriów zdało sobie z tego sprawę i zaczęło przechowywać takie informacje w centralnych repozytoriach – podstawowej bazie danych. Jednak informacje dostarczane przez podstawowe bazy danych sekwencji (bazy danych niższego poziomu) koncentrują się na różnych aspektach. Aby zebrać te rozproszone dane, w 1997 roku Koronne Centrum Genomu Ludzkiego Instytutu Nauki Weizmanna stworzyło bazę danych o nazwie „GeneCards”. Ta baza danych dotyczyła głównie informacji o ludzkim genomie, ludzkich genach, funkcjach zakodowanych białek i pokrewnych chorobach, chociaż ma od tego czasu rozbudowany.
Wzrost
wyszukiwarkę tekstową . Od 1998 r. w bazie danych zintegrowano więcej zasobów danych i typów danych, takich jak ekspresja białek i informacje o sieci genów. Poprawiła również szybkość i wyrafinowanie wyszukiwarki oraz rozszerzyła się z dogmatu skoncentrowanego na genach , aby zawierała analizy zestawów genów. Wersja 3 bazy danych gromadzi informacje z ponad 90 zasobów bazy danych w oparciu o skonsolidowaną listę genów. Dodał także zestaw narzędzi GeneCards, które koncentrują się na bardziej konkretnych celach. „GeneNote i GeneAnnot do analiz transkryptomu , GeneLoc do lokalizacji i markerów genomowych, GeneALaCart do zapytań wsadowych i GeneDecks do znajdowania partnerów funkcjonalnych i destylacji zestawów genów”. Baza danych jest aktualizowana w 3-letnim cyklu planowania, wdrażania, rozwoju, półautomatycznego zapewniania jakości i wdrażania. Stosowane technologie to Eclipse , Apache , Perl , XML , PHP , Propel , Java , R i MySQL .
Trwające rozszerzenia GeneCards
- Modele zwierzęce
- Profilowanie proteomiki tkankowej
- geny RNA
- Mapowanie identyfikatorów genów i białek
- Przetwarzanie analityczne online (OLAP)
Dostępność
Instytucje non-profit mogą bezpłatnie korzystać z kart GeneCard w celach edukacyjnych i badawczych pod adresem https://www.genecards.org/ oraz akademickimi witrynami lustrzanymi . Użycie komercyjne wymaga licencji. [ potrzebne źródło ]
Pakiet GeneCards
GeneDecks
GeneDecks to nowatorskie narzędzie analityczne do identyfikacji podobnych lub partnerskich genów, które zapewnia metrykę podobieństwa poprzez podkreślenie wspólnych deskryptorów między genami, w oparciu o unikalne bogactwo kombinatorycznych adnotacji ludzkich genów w GeneCards.
- Kombinacja adnotacji : Używając GeneDecks, można uzyskać zestaw podobnych genów dla określonego genu z wybraną kombinatoryczną adnotacją . Wynikiem tabeli podsumowującej jest uszeregowanie różnych poziomów podobieństwa między zidentyfikowanymi genami a genem sondującym.
- Ujednolicenie adnotacji : różne źródła danych często oferują adnotacje z heterogenicznym systemem nazewnictwa. Ujednolicenie adnotacji GeneDecks opiera się na podobieństwie algorytmów wykrywania przestrzeni genów GeneCards .
- Polowanie na partnerów : W narzędziu Partner Hunter firmy GeneDecks użytkownicy podają gen zapytania, a system wyszukuje podobne geny w oparciu o kombinatoryczne podobieństwo ważonych atrybutów.
- Destylacja zestawów : w destylatorze Set użytkownicy podają zestaw genów, a system klasyfikuje atrybuty według stopnia ich udziału w danym zestawie genów. Podobnie jak Partner Hunter, umożliwia zaawansowane badanie różnych zestawów genów o różnym pochodzeniu w celu odkrywania i wyjaśniania odpowiednich wzorców biologicznych, poprawiając w ten sposób systematyczną kontrolę genomiki i biologii systemów.
GeneALaCart
GeneALaCart to silnik zapytań wsadowych zorientowany na zestaw genów, oparty na popularnej bazie danych GeneCards. Umożliwia pobieranie informacji o wielu genach w zapytaniu wsadowym.
GeneLoc
Członek kombinezonu GeneLoc przedstawia zintegrowaną mapę chromosomów człowieka , która jest bardzo ważna przy projektowaniu niestandardowego chipa przechwytującego , w oparciu o dane zintegrowane przez algorytm GeneLoc. GeneLoc zawiera dalsze łącza do GeneCards, Human Genome Sequencing NCBI, UniGene i zasobów mapowania.
Stosowanie
Szukaj
Najpierw wprowadź wyszukiwane hasło w puste miejsce na stronach głównych. Metody wyszukiwania obejmują słowa kluczowe, tylko symbol, symbol/alias/identyfikator i symbol/alias. Domyślną opcją wyszukiwania jest wyszukiwanie według słów kluczowych. Gdy użytkownik wyszukuje według słów kluczowych, wyświetlana jest karta MicroCard i MiniCard. Jednak gdy użytkownik wyszukuje tylko według Symbolu, zostanie przekierowany do GeneCard. Wyszukiwanie można rozszerzyć, klikając wyszukiwanie zaawansowane, w którym użytkownik może bezpośrednio wybrać sekcję, kategorię, GIFtS, źródło symboli i zestawy genów. Sekcje obejmują pseudonimy i opisy, zaburzenia, leki i związki, ekspresję w tkankach ludzkich, funkcję, lokalizację genomu, warianty genomu, ortologi, paralogi, ścieżki i interakcje, domeny/rodziny białek, białka, publikacje, streszczenia i transkrypcje. Domyślną opcją jest wyszukiwanie wszystkich sekcji. Kategorie obejmują kodowanie białek , pseudogeny , geny RNA , loci genetyczne , klastry genów i nieskategoryzowane. Domyślną opcją jest wyszukiwanie we wszystkich kategoriach. GIFtS to GeneCards Inferred Functionality Scores, który podaje obiektywne liczby pokazujące poziom wiedzy na temat funkcjonalności ludzkich genów. Obejmuje wysoki, średni, niski i niestandardowy zakres. Źródła symboli obejmują HGNC ( Komitet Nomenklatury Genów HUGO ), EntrezGene (informacje skoncentrowane na genach w NCBI), Ensembl, GeneCards RNA geny, CroW21 i tak dalej.
Ponadto użytkownik może wybrać wyszukiwanie wszystkich kart genetycznych lub w ramach podzbioru genów, co byłoby bardziej szczegółowe i miałoby priorytet.
Po drugie, strona wyników wyszukiwania pokazuje wszystkie odpowiednie minikarty. Symbol, opis, kategoria, upominki, identyfikator GC i wynik są wyświetlane na stronie. Użytkownik może kliknąć przycisk plusa dla każdej z minikart, aby otworzyć minikartę. Ponadto użytkownik może kliknąć bezpośrednio na symbol, aby zobaczyć szczegóły konkretnej karty GeneCard.
Zawartość kart genetycznych
W przypadku konkretnej karty GeneCard (przykład: Karta GeneCard dla TGFB1 ) składa się ona z następującej zawartości.
- Nagłówek : Nagłówek składa się z symbolu genu, kategorii (tj. kodującej białko), GIFtS(tj. 74) i GCID(GC19M041837). Różne kategorie mają różne kolory do wyrażenia: kodowanie białek, pseudogen, gen RNA, klaster genów , locus genetyczny i nieskategoryzowane. Tło wskazuje źródła symboli: HGNC Approved Gens, EntrezGene Database, Ensembl Gene Database lub GeneCards Generated Gens.
- Aliasy : Aliasy, jak sama nazwa wskazuje, pokazują synonimy i aliasy genu według różnych źródeł, takich jak HGNC. Prawa kolumna pokazuje, w jaki sposób aliasy są powiązane z zasobami i podaje poprzednie identyfikatory GC.
- Podsumowania : Lewa kolumna jest taka sama jak ta w aliasach, która pokazuje źródła. Prawa kolumna tutaj zawiera krótkie podsumowanie funkcji genu, lokalizacji i wpływu na fenotyp z różnych źródeł.
- Poglądy genomiczne : Oprócz źródeł, ta sekcja zawiera odniesienia do sekwencji DNA, elementów regulatorowych, epigenetyki, pasma chromosomów i lokalizacji genomowej różnych źródeł. Czerwona linia na obrazie wskazuje zintegrowaną lokalizację GeneLoc. W szczególności, jeśli zintegrowana lokalizacja GeneLoc różni się od lokalizacji w Entrez Gene, jest pokazana na zielono; Niebieski pojawia się, gdy zintegrowana lokalizacja GeneLoc różni się od lokalizacji w Ensembl. Dostęp do szczegółów dodatku można uzyskać, korzystając z łączy w sekcji.
- Białka : Ta sekcja przedstawia informacje o genach z adnotacjami, w tym zalecaną nazwę, rozmiar, podjednostkę, lokalizację subkomórkową i drugorzędne przystąpienia. Wprowadzono również modyfikacje potranslacyjne, dane dotyczące ekspresji białek, białka REF SEQ, białka ENSEMBL, szczegóły białek reaktomu, produkty rekombinowanego białka ludzkiego, ontologię genów , produkty przeciwciał i produkty testowe.
- Domeny/rodziny białek : Ta sekcja zawiera informacje o domenach i rodzinach białek z adnotacjami.
- Funkcja : Sekcja funkcji opisuje funkcje genów, w tym: fenotypy ludzkie , związane cele, shRNA dla ludzi i/lub myszy/szczurów, cele genów miRNA , produkty RNAi , mikroRNA dla ortologów ludzi i/lub myszy/szczurów, edycja genów , klony , Linie komórkowe , modele zwierzęce, testy hybrydyzacji in situ .
- Ścieżki i interakcje : Ta sekcja przedstawia ujednolicone ścieżki i interakcje GeneCard, które pochodzą z różnych źródeł. Ujednolicone ścieżki GeneCard są gromadzone w super-ścieżkach, które pokazują połączenie między różnymi ścieżkami. Interakcja pokazuje szczegóły interakcji i interakcji.
- Narkotyki i związki : Ta sekcja łączy karty GeneCard z lekami i związkami. Związki pokazują związek chemiczny, działanie i numer CAS. Związek DrugBank podaje związek, synonimy, numer CAS (numer rejestru Chemical Abstracts), typ (transporter/cel/nośnik/enzym), działania i identyfikatory PubMed. HMDB i Novoseek pokazują powiązania związków chemicznych, które obejmują związek, synonimy, numer CAS i identyfikatory PubMed (artykuły związane ze związkiem). BitterDB wyświetla związek, numer CAS i UŚMIECH ( Uproszczona specyfikacja wprowadzenia wiersza wprowadzania danych molekularnych ). PharmGKB podaje lek/związek i jego adnotację.
- Transkrypty : ta sekcja składa się z mRNA sekwencji odniesienia, klastra Unigene i sekwencji reprezentatywnej, produktów miRNA, produktów inhib.RNA, produktów klonów, produktów starterów i dodatkowej sekwencji mRNA. Ponadto użytkownik może uzyskać strukturę egzonu z GeneLoc.
- Wyrażenie : Lewa kolumna pokazuje zasoby danych. W tej sekcji uwzględniono obrazy i dane dotyczące ekspresji, podobne geny, macierze PCR, startery do testów hybrydyzacji u ludzi i in situ.
- Ortologi : Ta sekcja zawiera ortologi dla konkretnego genu z liczby gatunków. Tabela przedstawia odpowiedni organizm, klasyfikację taksonomiczną, gen, opis, podobieństwo do ludzi, typ ortologii i szczegóły. Jest podłączony do ENSEMBL Gene Tree, TreeFam Gene Tree i Aminode.
- Paralogi : Ta sekcja wyświetla paralogi i pseudogeny dla określonego genu.
- Warianty genomowe : Warianty genomowe przedstawiają wyniki SNP/wariantów NCBI, raport o nierównowadze sprzężeń HapMap, zmiany strukturalne, bazę danych mutacji genów ludzkich (HGMD), startery PCR dalekiego zasięgu QIAGEN SeqTarget w macierzach PCR mutacji raka u ludzi, myszy i szczurów oraz SABiosciences. Tabela w tej sekcji pokazuje identyfikator SNP, ważny, istotność kliniczną, Chr pos, sekwencję dla danych genomowych, AAChg, typ i więcej dla danych związanych z transkrypcją, częstość alleli , pop, całkowitą próbkę i więcej dla częstości alleli. Dla Valid inny znak reprezentuje różne metody sprawdzania poprawności. „C” oznacza klaster boczny; „A” oznacza allel by-2hit-2; „F” oznacza częstotliwość zastępczą; „H” to by-hapmap, a „O” to by-other-pop. Znaczenie kliniczne może być jedno z następujących: niepatogenne, patogenne, odpowiedź na lek, zgodność tkankowa, prawdopodobne-niepatogenne, prawdopodobne-patogenne, nietestowane, nieznane i inne. Typ powinien być jednym z następujących: nonsynon, syn, cds, spl, utr, int, exc, loc, stg, ds500, spa, spd, us2k, us5k, oznaczenia PupaSUITE.
- Disorders/Diseases : Pokazuje zaburzenia/choroby związane z genem.
- Publikacje : Wyświetla publikacje związane z genem.
- Wyszukiwania zewnętrzne : wyszukuje więcej informacji w PubMed , OMIM i NCBI.
- Bazy danych genomu : inne bazy danych i specjalistyczne bazy danych.
- Własność intelektualna : ta sekcja zawiera informacje o patentach i technologiach podlegających licencjonowaniu.
- Produkty
Aplikacje
Karty GeneCard są szeroko stosowane w dziedzinie biologii i biomedycyny. Na przykład SH Shah wyodrębnił dane dotyczące wczesnego początku choroby wieńcowej z kart GeneCard, aby zidentyfikować geny, które przyczyniają się do choroby . Potwierdzono, że chromosomy 3q13, 1q25 itd. wywierają wpływ, aw tym artykule dalej omówiono związek między chorobliwymi genami a lipoproteinami surowicy przy pomocy karty GeneCard.
Innym przykładem jest badanie naukowe dotyczące syntetycznej śmiertelności w raku . Śmiertelność syntetyczna pojawia się, gdy mutacja w pojedynczym genie nie ma wpływu na funkcję komórki, ale mutacja w dodatkowym genie prowadzi do śmierci komórki. Badanie to miało na celu znalezienie nowych metod leczenia raka poprzez blokowanie śmiertelności leków. GeneCards wykorzystano do porównania danych danego genu docelowego ze wszystkimi możliwymi genami. W tym procesie wynik udostępniania adnotacji został obliczony przy użyciu GeneDecks Partner Hunter (obecnie zwanego Genes Like Me), aby uzyskać paralogię. linii komórkowych nerwiaka niedojrzałego .