Pakiet MEME

Pakiet MEME to zbiór narzędzi do odkrywania i analizy motywów sekwencji .

Odkrycie motywu

JA JA

M ultiple Expectation maximizations for Motif E licitation (MEME) to narzędzie do odkrywania motywów w grupie powiązanych sekwencji DNA lub białek . MEME przyjmuje jako dane wejściowe grupę sekwencji DNA lub białek i wyprowadza tyle motywów, ile zażąda, aż do określonego przez użytkownika progu pewności statystycznej. MEME wykorzystuje techniki modelowania statystycznego, aby automatycznie wybrać najlepszą szerokość, liczbę wystąpień i opis dla każdego motywu.

GLAM2

Lokalne wyrównanie motywów z przerwami (GLAM 2) to narzędzie do odkrywania motywów z przerwami w grupie sekwencji DNA lub białek. W przeciwieństwie do MEME, GLAM2 nie próbuje znaleźć kilku różnych motywów za jednym razem. Zamiast tego wykonuje replikacje: wielokrotnie próbuje znaleźć najlepszy możliwy motyw.

DREME

Discriminative Regular Expression Motif Ecitation (DREME) to narzędzie do odkrywania motywów w dużych zbiorach sekwencji. DREME jest wydajne obliczeniowo i dlatego nadaje się do wyszukiwania motywów w dużych zbiorach danych pochodzących z ChIP-seq ( immunoprecypitacja chromatyny , a następnie sekwencjonowanie). W trosce o wydajność obliczeniową DREME znajduje tylko motywy, które można wyrazić w alfabecie IUPAC , który zawiera standardowy alfabet DNA ACGT oraz jedenaście symboli wieloznacznych (na przykład R oznacza albo A lub G ).

MEME-Chip

MEME-ChIP to narzędzie do odkrywania motywów w zestawach danych pochodzących z eksperymentów ChIP-seq (immunoprecypitacja chromatyny, a następnie sekwencjonowanie).

Wyszukiwanie motywów

FIMO

Find Individual Motif Occurrences (FIMO) to narzędzie do znajdowania wystąpień motywów w bazie danych sekwencji. FIMO przeszukuje bazę danych pod kątem dostarczonych motywów i zgłasza wartość q dla każdego dopasowania.

GLAM2SCAN

GLAM2SCAN to narzędzie do wyszukiwania wystąpień motywu GLAM2 w bazie danych sekwencji.

MASZT

Motif Alignment & Search Tool (MAST) to narzędzie do przeszukiwania baz danych sekwencji biologicznych w poszukiwaniu sekwencji, które zawierają wystąpienie każdego motywu w danym zestawie motywów. MAST ocenia mecze i podaje wartości p dla czterech typów zdarzeń:

  • Wartość p pozycji: Wartość p dopasowania danej pozycji w sekwencji do motywu jest zdefiniowana jako prawdopodobieństwo, że losowo wybrana pozycja w losowo wygenerowanej sekwencji ma wynik dopasowania co najmniej tak duży jak dany pozycja. Uwaga: Jeśli MAST łączy odwrotne nici DNA dopełniacza, wartość p pozycji nie jest korygowana dla wielu testów.
  • Wartość p sekwencji: Wartość p dopasowania sekwencji do motywu jest zdefiniowana jako prawdopodobieństwo, że losowo wygenerowana sekwencja o tej samej długości ma wynik dopasowania co najmniej tak duży, jak największy wynik dopasowania dowolnej pozycji w sekwencja.
  • Połączona wartość p: Wartość p dopasowania sekwencji do grupy motywów jest zdefiniowana jako prawdopodobieństwo, że losowo wygenerowana sekwencja o tej samej długości będzie miała wartości p sekwencji, których iloczyn jest co najmniej tak mały jak iloczyn wartości p sekwencji dopasowań motywów do danej sekwencji.
  • Wartość E: Wartość E dopasowania sekwencji w bazie danych do grupy motywów jest zdefiniowana jako oczekiwana liczba sekwencji w losowej bazie danych o tym samym rozmiarze, które pasowałyby do motywów tak dobrze, jak sekwencja i jest równa łącznej wartości p sekwencji pomnożonej przez liczbę sekwencji w bazie danych.

Analiza wzbogacenia motywu

SpaMo

Spaced Motif Analysis Tool (SpaMo) to narzędzie do wnioskowania o interakcjach między czynnikami transkrypcyjnymi. SpaMo pobiera zestaw sekwencji (zwykle sekwencje otaczające piki ChIP-seq), motyw reprezentowany w tych sekwencjach oraz bazę danych znanych motywów. SpaMo wyszukuje w bazie danych instancje motywów bazowych wzbogaconych w miejscach sąsiadujących z danym motywem. Te wzbogacenia sugerują fizyczną interakcję między czynnikami, które wiążą każdy motyw.

CentriMo

Central Motif Enrichment Analysis (CentriMo) to narzędzie do wnioskowania o bezpośrednim wiązaniu DNA z danych ChIP-seq. CentriMo opiera się na obserwacji, że rozkład pozycyjny miejsc wiązania pasujących do motywu bezpośredniego wiązania jest zwykle unimodalny, dobrze wyśrodkowany i maksymalny w dokładnym środku regionów pików ChIP-seq. CentriMo pobiera zestaw sekwencji i wykreśla występowanie motywów względem piku ChIP-seq. Motywy, które występują wyłącznie na piku, dostarczają dobrych dowodów na bezpośrednie wiązanie, podczas gdy motywy, które nie występują w spójnej pozycji względem piku, mogą nie wiązać się bezpośrednio.

Wyszukiwanie klastrów motywów

MCAST

Motif Cluster Alignment and Search Tool (MCAST) to narzędzie do przeszukiwania bazy danych sekwencji pod kątem statystycznie istotnych skupisk niepokrywających się wystąpień zestawu motywów. Takie klastry mogą reprezentować moduły regulacyjne.

Porównanie motywów

TOMTOM

Tomtom to narzędzie do porównywania motywu DNA z bazą danych znanych motywów. TOMTOM wyszukuje statystycznie istotnie podobne motywy do motywu zapytania. TOMTOM jest przydatny do określenia, czy odkryty motyw jest nowy, czy jest odmianą znanego motywu.

Analiza funkcji motywu

GOMO

Gene Ontology for MOtifs (GOMO) to narzędzie do identyfikacji możliwych ról motywów wiążących DNA. Robi to, porównując geny, w których występuje motyw, z Gene Ontology . Jeśli motyw występuje statystycznie istotnie powyżej genów związanych z określoną funkcją (na przykład trawieniem laktozy), sugeruje to, że czynnik transkrypcyjny , który wiąże motyw, może regulować tę funkcję (na przykład poprzez promowanie transkrypcji białek trawiących laktozę).

Linki zewnętrzne