TRANSFAC

TRANSFAC
Database.png
Treść
Opis Baza danych czynników transkrypcyjnych
Przechwycone typy danych
Eukariotyczne czynniki transkrypcyjne , miejsca ich wiązania i profile wiązania
Organizmy eukarionty
Kontakt
Centrum Badań Centrum Badań nad Zakażeniami im. Helmholtza; BIOBASE GmbH ; geneXplain GmbH
Cytowanie podstawowe Skrzydłowy (2008)
Data wydania 1988
Dostęp
Strona internetowa TRANSFAC 7.0 Publiczny 2005

TRANSFAC (baza danych TRANScription FACtor) to ręcznie tworzona baza danych eukariotycznych czynników transkrypcyjnych , ich genomowych miejsc wiązania i profili wiązania DNA . Zawartość bazy danych można wykorzystać do przewidywania potencjalnych miejsc wiązania czynnika transkrypcyjnego .

Wstęp

Źródłem bazy danych był wczesny zbiór danych opublikowany w 1988 r. Pierwsza wersja, która została wydana pod nazwą TRANSFAC, została opracowana w byłym Niemieckim Narodowym Centrum Badawczym Biotechnologii i przeznaczona do instalacji lokalnej (obecnie: Centrum Badań nad Zakażeniami im. Helmholtza ) . W ramach jednego z pierwszych finansowanych ze środków publicznych projektów bioinformatycznych, uruchomionego w 1993 r., TRANSFAC rozwinął się w zasób, który stał się dostępny w Internecie.

W 1997 roku TRANSFAC został przeniesiony do nowo utworzonej spółki BIOBASE w celu zapewnienia długoterminowego finansowania bazy danych. Od tego czasu najbardziej aktualna wersja musi być licencjonowana, podczas gdy starsze wersje są bezpłatne dla użytkowników niekomercyjnych. Od lipca 2016 TRANSFAC jest utrzymywany i dystrybuowany przez geneXplain GmbH, Wolfenbüttel, Niemcy.

Treść i funkcje

Zawartość bazy danych jest zorganizowana w taki sposób, że koncentruje się na interakcji między czynnikami transkrypcyjnymi (TF) a ich miejscami wiązania DNA (TFBS). TF są opisane w odniesieniu do ich cech strukturalnych i funkcjonalnych, wyodrębnionych z oryginalnej literatury naukowej. Są one klasyfikowane do rodzin, klas i nadklas zgodnie z cechami ich domen wiążących DNA .

Wiązanie TF z miejscem genomowym dokumentuje się przez określenie lokalizacji miejsca, jego sekwencji i zastosowanej metody eksperymentalnej. Wszystkie strony, które odnoszą się do jednego TF lub grupy blisko spokrewnionych TF, są wyrównywane i wykorzystywane do konstruowania macierzy punktacji specyficznej dla pozycji (PSSM) lub macierzy zliczania. Wiele macierzy biblioteki macierzy TRANSFAC zostało skonstruowanych przez zespół kuratorów , inne zostały zaczerpnięte z publikacji naukowych.

Aplikacje

Baza danych TRANSFAC może służyć jako encyklopedia eukariotycznych czynników transkrypcyjnych. Sekwencje docelowe i regulowane geny można wymienić dla każdego TF, które można wykorzystać jako punkt odniesienia dla narzędzi rozpoznawania TFBS lub jako zestawy treningowe dla algorytmów rozpoznawania nowych miejsc wiązania czynnika transkrypcyjnego (TFBS). Klasyfikacja TF umożliwia analizę takich zbiorów danych pod kątem właściwości domen wiążących DNA. Innym zastosowaniem jest odzyskanie wszystkich TF, które regulują dany (zestaw) genów. W kontekście badań biologii systemowej udokumentowane w projekcie TRANSFAC relacje genów docelowych TF wykorzystano do skonstruowania i analizy sieci regulujących transkrypcję. Zdecydowanie najczęstszym zastosowaniem TRANSFAC jest obliczeniowe przewidywanie potencjalnego TFBS. Istnieje wiele algorytmów, które wykorzystują do tego celu poszczególne miejsca wiązania lub bibliotekę macierzową:

  • Patch – analizuje podobieństwa sekwencji z miejscami wiązania udokumentowanymi w TRANSFAC; jest dostarczany wraz z bazą danych.
  • SiteSeer – analizuje podobieństwa sekwencji z miejscami wiązania udokumentowanymi w TRANSFAC.
  • Dopasuj – identyfikuje potencjalny TFBS za pomocą biblioteki macierzowej; jest dostarczany wraz z bazą danych.
  • TESS (Transscription Element Search System) – analizuje podobieństwa sekwencji z miejscami wiązania TRANSFAC oraz potencjalnymi miejscami wiązania przy użyciu bibliotek macierzowych TRANSFAC i trzech innych źródeł. TESS udostępnia również program do identyfikacji modułów cis-regulatorowych (CRM, charakterystyczne kombinacje TFBS), który wykorzystuje macierze TRANSFAC.
  • PROMO – macierzowe przewidywanie TFBS za pomocą komercyjnej wersji bazy danych
  • TFM Explorer – Identyfikacja wspólnych potencjalnych TFBS w zestawie genów
  • MotifMogul – macierzowa analiza sekwencji z wieloma różnymi algorytmami
  • ConTra – macierzowa analiza sekwencji w konserwatywnych regionach promotora
  • PMS (Poly Matrix Search) – oparta na macierzach analiza sekwencji w konserwatywnych regionach promotora

Porównanie macierzy z biblioteką macierzy TRANSFAC i innymi źródłami:

  • T-Reg Comparator do porównywania pojedynczych lub grup macierzy z tymi z TRANSFAC lub innych bibliotek.
  • MACO (Poly Matrix Search) – porównanie macierzy z bibliotekami macierzy.

Szereg serwerów udostępnia adnotacje genomowe obliczone za pomocą TRANSFAC. Inni wykorzystali takie analizy do wywnioskowania docelowych zestawów genów.

Zobacz też

Linki zewnętrzne