Lista oprogramowania do dopasowywania sekwencji
Ta lista oprogramowania do dopasowywania sekwencji jest kompilacją narzędzi programowych i portali internetowych używanych do dopasowywania sekwencji parami i dopasowywania wielu sekwencji . Zobacz oprogramowanie do wyrównywania strukturalnego, aby uzyskać informacje o wyrównywaniu strukturalnym białek.
Tylko przeszukiwanie bazy danych
Nazwa | Opis | Typ sekwencji* | Autorski | Rok |
---|---|---|---|---|
PODMUCH | Wyszukiwanie lokalne z szybką heurystyką k-tuple (podstawowe narzędzie wyszukiwania lokalnego wyrównania) | Obydwa | Altschul SF , Gish W , Miller W , Myers EW , Lipman DJ | 1990 |
HPC-BLAST | Wielowęzłowe i wielordzeniowe opakowanie BLAST zgodne z NCBI. Rozpowszechniany z najnowszą wersją BLAST, to opakowanie ułatwia równoległość algorytmu w nowoczesnych architekturach hybrydowych z wieloma węzłami i wieloma rdzeniami w każdym węźle. | Białko | Burdyshaw CE, Sawyer S, Horton MD, Brook RG, Rekapalli B | 2017 |
CS-BLAST | BLAST specyficzny dla kontekstu sekwencji, bardziej czuły niż BLAST, FASTA i SSEARCH. Wersja iteracyjna specyficzna dla pozycji CSI-BLAST jest bardziej czuła niż PSI-BLAST | Białko | Angermueller C, Biegert A, Soeding J | 2013 |
CUDASW++ | Akcelerowany przez GPU algorytm Smitha Watermana dla wielu współdzielonych procesorów graficznych | Białko | Liu Y, Maskell DL i Schmidt B | 2009/2010 |
DIAMENT | Aligner BLASTX i BLASTP oparty na podwójnym indeksowaniu | Białko | Buchfink B, Xie C, Huson DH, Reuter K, Drost HG | 2015/2021 |
SZYBKO | Wyszukiwanie lokalne z szybką heurystyką k -tuple, wolniejsze, ale bardziej czułe niż BLAST | Obydwa | ||
GGSEARCH, GLSEARCH | Global:Global (GG), Global:Local (GL) wyrównanie ze statystykami | Białko | ||
Magik genomu | Oprogramowanie do ultraszybkiego lokalnego wyszukiwania motywów sekwencji DNA i dopasowywania parami danych NGS (FASTA, FASTQ). | DNA | Hepperle D (www.sequentix.de) | 2020 |
Genoogle | Genoogle wykorzystuje techniki indeksowania i przetwarzania równoległego do wyszukiwania sekwencji DNA i białek. Jest rozwijany w Javie i open source. | Obydwa | Albrechta F | 2015 |
HMMER | Lokalne i globalne wyszukiwanie z profilem Ukryte modele Markowa, bardziej czułe niż PSI-BLAST | Obydwa | Durbin R , Eddy SR , Krogh A , Mitchison G | 1998 |
Apartament HH | Porównanie parami profilu ukrytych modeli Markowa; bardzo wrażliwy | Białko | Söding J | 2005/2012 |
IDF | Odwrotna częstotliwość dokumentów | Obydwa | ||
Piekielny | Wyszukiwanie profilu SCFG | RNA | Eddy S | |
KLAST | Wydajne narzędzie ogólnego przeznaczenia do wyszukiwania podobieństw sekwencji | Obydwa | 2009/2014 | |
LAMBDA | Wysokowydajny lokalny aligner kompatybilny z BLAST, ale znacznie szybszy; obsługuje SAM/BAM | Białko | Hannes Hauswedell, Jochen Singer, Knut Reinert | 2014 |
MMsekw2 | Pakiet oprogramowania do wyszukiwania i grupowania ogromnych zestawów sekwencji. Podobna czułość do BLAST i PSI-BLAST, ale o rząd wielkości szybsza | Białko | Steinegger M, Mirdita M, Galiez C, Söding J | 2017 |
SZUKAJ | Ultraszybkie narzędzie do analizy sekwencji | Obydwa | Edgar, RC (2010). „Wyszukiwanie i grupowanie rzędów wielkości szybsze niż BLAST” . Bioinformatyka . 26 (19): 2460–2461. doi : 10.1093/bioinformatyka/btq461 . PMID 20709691 . opublikowanie | 2010 |
OSWALD | OpenCL Smith-Waterman na FPGA firmy Altera dla dużych baz danych białek | Białko | Rucci E, García C, Botella G, De Giusti A, Naiouf M, Prieto-Matías M | 2016 |
paralotniarstwo | Szybkie wyszukiwanie Smitha-Watermana z wykorzystaniem paralelizacji SIMD | Obydwa | codziennie j | 2015 |
PSI-BLAST | Specyficzny dla pozycji iteracyjny BLAST, lokalne wyszukiwanie z macierzami punktacji specyficznymi dla pozycji , znacznie bardziej czuły niż BLAST | Białko | Altschul SF , Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W , Lipman DJ | 1997 |
Wyszukiwanie PSI | Połączenie algorytmu wyszukiwania Smitha-Watermana ze strategią konstruowania profilu PSI-BLAST w celu znalezienia daleko spokrewnionych sekwencji białek i zapobiegania błędom homologicznego nadmiernego rozszerzenia. | Białko | Li W, McWilliam H, Goujon M, Cowley A, Lopez R, Pearson WR | 2012 |
R&R | Retrieve and Relate (R&R) to wysoce wydajna, ale wrażliwa wyszukiwarka obejmująca wiele baz danych, zdolna do równoległego przeszukiwania sekwencji DNA, RNA i białek. | Obydwa | 2019 | |
ScalaBLAST | Wysoce równoległy skalowalny BLAST | Obydwa | Oehmen i in. | 2011 |
Sequilab | Łączenie i profilowanie danych dopasowania sekwencji z wyników NCBI-BLAST z głównymi serwerami/usługami analizy sekwencji | Nukleotyd, peptyd | 2010 | |
SAM | Lokalne i globalne wyszukiwanie z profilem Ukryte modele Markowa, bardziej czułe niż PSI-BLAST | Obydwa | Karplus K , Krogh A | 1999 |
SZUKAJ | Wyszukiwanie Smitha-Watermana, wolniejsze, ale bardziej czułe niż FASTA | Obydwa | ||
SWAPHI | Pierwszy równoległy algorytm wykorzystujący nowy procesor Intel Xeon Phis do przyspieszenia przeszukiwania bazy danych białek Smitha-Watermana | Białko | Liu Y i Schmidta B | 2014 |
SWAPHI-LS | Pierwszy równoległy algorytm Smitha-Watermana wykorzystujący klastry Intel Xeon Phi do przyspieszenia dopasowania długich sekwencji DNA | DNA | Liu Y, Tran TT, Lauenroth F, Schmidt B | 2014 |
PŁYWAĆ | Implementacja Smitha-Watermana dla architektur Intel Multicore i Manycore | Białko | Rucci E, García C, Botella G, De Giusti A, Naiouf M i Prieto-Matías M. | 2015 |
PŁYWANIE 2.0 | Udoskonalona technologia Smith-Waterman w architekturze wielordzeniowej i wielordzeniowej firmy Intel w oparciu o rozszerzenia wektorowe AVX-512 | Białko | Rucci E, García C, Botella G, De Giusti A, Naiouf M i Prieto-Matías M. | 2018 |
TRZEPNĄĆ | Szybkie wyszukiwanie Smitha-Watermana z wykorzystaniem paralelizacji SIMD | Obydwa | Rognes T | 2011 |
* Typ sekwencji: białkowa lub nukleotydowa
Wyrównanie parami
Nazwa | Opis | Typ sekwencji* | Typ wyrównania** | Autor | Rok |
---|---|---|---|---|---|
ACANA | Szybkie dopasowanie par oparte na kotwicy heurystycznej | Obydwa | Obydwa | Huang, Umbach, Li | 2005 |
Wyrównaj mnie | Dopasowania sekwencji białek błonowych | Białko | Obydwa | M. Stamm, K. Khafizov, R. Staritzbichler, LR Forrest | 2013 |
WYRÓWNAJ | W przypadku cząsteczek DNA, RNA i białek o wielkości do 32 MB wyrównuje wszystkie sekwencje o rozmiarze K lub większym. Podobne wyrównania są grupowane razem do analizy. Automatyczny filtr powtarzających się sekwencji. | Obydwa | Lokalny | E. Wachtel | 2017 |
Bioprzewodniki Biostrings::pairwiseAlignment | Programowanie dynamiczne | Obydwa | Oba + bez końcówek | P. Abyoun | 2008 |
BioPerl dpAlign | Programowanie dynamiczne | Obydwa | Oba + bez końcówek | YM Chan | 2003 |
BLASTZ, OSTATNI | Rozsiane dopasowanie wzorca | Nukleotyd | Lokalny | Schwartza i in. | 2004,2009 |
Wyrównanie CUDA | Dopasowanie sekwencji DNA o nieograniczonej wielkości w jednym lub wielu procesorach graficznych | Nukleotyd | Lokalny, półglobalny, globalny | E. Sandesa | 2011-2015 |
DNADot | Internetowe narzędzie do tworzenia wykresów punktowych | Nukleotyd | Światowy | R. Bowena | 1998 |
KROPKA | Narzędzie do rysowania punktowego oparte na Javie | Obydwa | Światowy | M. Pagni i T. Junier | 1998 |
ŚWIĘTO | Rozszerzenie lokalne oparte na posteriori z opisowym modelem ewolucji | Nukleotyd | Lokalny | AK Hudek i DG Brown | 2010 |
Kompilator genomu Kompilator genomu | Dopasuj pliki chromatogramów (.ab1, .scf) do sekwencji szablonów, zlokalizuj błędy i natychmiast je popraw. | Nukleotyd | Lokalny | Korporacja kompilatora genomu | 2014 |
G-PAS | Dynamiczne programowanie oparte na GPU z funkcją śledzenia wstecznego | Obydwa | Lokalny, półglobalny, globalny | W. Frohmberg, M. Kierzynka i in. | 2011 |
GapMis | Dopasowuje sekwencje parami z jedną przerwą | Obydwa | Półglobalny | K. Frousios, T. Flouri, CS Iliopoulos, K. Park, SP Pissis, G. Tischler | 2012 |
Magik genomu | Oprogramowanie do ultraszybkiego wyszukiwania lokalnych motywów sekwencji DNA i dopasowywania parami danych NGS (FASTA, FASTQ). | DNA | Lokalny, półglobalny, globalny | Hepperle D (www.sequentix.de) | 2020 |
GGSEARCH, GLSEARCH | Global:Global (GG), Global:Local (GL) wyrównanie ze statystykami | Białko | Globalne w zapytaniu | W. Pearsona | 2007 |
JAigner | Implementacja oprogramowania Smith-Waterman w języku Java typu open source | Obydwa | Lokalny | A. Mustafy | 2005 |
K*Sync | Dopasowanie sekwencji białka do struktury, które obejmuje strukturę drugorzędową, konserwację strukturalną, profile sekwencji oparte na strukturze i konsensusowe wyniki dopasowania | Białko | Obydwa | D. Chivian & D. Baker | 2003 |
USTAWIĆ | Wielokrotne, nienakładające się, lokalne podobieństwo (ten sam algorytm co SIM) | Obydwa | Lokalne nienakładające się | W. Pearsona | 1991 (algorytm) |
Wyrównaj NW | Standardowy algorytm programowania dynamicznego Needlemana-Wunscha | Białko | Światowy | Y Zhang | 2012 |
złośliwy | wyrównanie modelowania; modeluje zawartość informacyjną sekwencji | Nukleotyd | Obydwa | D. Powell, L. Allison i TI Dix | 2004 |
dopasowujący | Lokalne wyrównanie Watermana-Eggerta (na podstawie LALIGN) | Obydwa | Lokalny | I. Longden (zmodyfikowany z W. Pearsona) | 1999 |
MCALIGN2 | jawne modele ewolucji indel | DNA | Światowy | J. Wang i in. | 2006 |
MegAlign Pro (biologia molekularna Lasergene) | Oprogramowanie do dopasowywania sekwencji DNA, RNA, białek lub DNA + białek za pomocą algorytmów dopasowywania par i wielu sekwencji, w tym analizy MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson i Dotplot. | Obydwa | Obydwa | DNASTAR | 1993-2016 |
Mamo | oparte na drzewie sufiksów | Nukleotyd | Światowy | S. Kurtz i in. | 2004 |
igła | Programowanie dynamiczne Needlemana-Wunscha | Obydwa | Półglobalny | A. Bleasby'ego | 1999 |
Ngila | koszty luki logarytmicznej i afinicznej oraz jawne modele ewolucji indel | Obydwa | Światowy | R. Cartwrighta | 2007 |
północny zachód | Programowanie dynamiczne Needlemana-Wunscha | Obydwa | Światowy | AK Martin | 1990-2015 |
paralotniarstwo | Biblioteka programowania dynamicznego C/C++/Python/Java SIMD dla SSE, AVX2 | Obydwa | Globalny, bez końca, lokalny | J. Codziennie | 2015 |
Ścieżka | Smith-Waterman na wykresie translacji wstecznej białka (wykrywa przesunięcia ramki na poziomie białka) | Białko | Lokalny | M. Gîrdea i in. | 2009 |
Łowca Wzorów | Rozsiane dopasowanie wzorca | Nukleotyd | Lokalny | B. Ma i in. | 2002-2004 |
ProbA (również propA) | Próbkowanie stochastycznej funkcji podziału poprzez programowanie dynamiczne | Obydwa | Światowy | U. Mücksteina | 2002 |
PyMOL | Polecenie „align” wyrównuje sekwencję i stosuje ją do struktury | Białko | Globalny (według wyboru) | WL DeLano | 2007 |
REPuter | oparte na drzewie sufiksów | Nukleotyd | Lokalny | S. Kurtz i in. | 2001 |
SZABLOZĄB | Wyrównanie przy użyciu przewidywanych profili łączności | Białko | Światowy | F. Teichert, J. Minning, U. Bastolla i M. Porto | 2009 |
Satsuma | Równoległe dopasowanie syntenii całego genomu | DNA | Lokalny | MG Grabherr i in. | 2010 |
SEQALN | Różne programy dynamiczne | Obydwa | Lokalne lub globalne | MS Waterman i P. Hardy | 1996 |
SIM, GAP, NAP, LAP | Lokalne podobieństwo z różnymi metodami leczenia luk | Obydwa | Lokalne lub globalne | X. Huanga i W. Millera | 1990-6 |
SIM | Lokalne podobieństwo | Obydwa | Lokalny | X. Huanga i W. Millera | 1991 |
SPA: Super wyrównanie parami | Szybkie globalne wyrównanie parami | Nukleotyd | Światowy | Shen, Yang, Yao, Hwang | 2002 |
SZUKAJ | Lokalne ( Smitha-Watermana ) dopasowanie do statystyk | Białko | Lokalny | W. Pearsona | 1981 (algorytm) |
Pracownia Sekwencji | Aplet Java demonstrujący różne algorytmy z | Sekwencja ogólna | Lokalne i globalne | A.Meskauskas | 1997 (podręcznik) |
SZYBKO | Przyspieszenie Smitha-Watermana na FPGA firmy Intel z OpenCL dla długich sekwencji DNA | Nukleotyd | Lokalny | E. Rucciego | 2017-2018 |
SWIFT garnitur | Szybkie lokalne wyszukiwanie wyrównania | DNA | Lokalny | K. Rasmussen, W. Gerlach | 2005,2008 |
nosze | Programowanie dynamiczne Needlemana-Wunscha zoptymalizowane pod kątem pamięci | Obydwa | Światowy | I. Longden (zmodyfikowany z G. Myers i W. Miller) | 1999 |
wyrównać | Wyrównuje sekwencje kwasów nukleinowych na podstawie dopasowania białek | Nukleotyd | NA | G. Williams (zmodyfikowany z B. Pearsona) | 2002 |
UGEN | Opensource Smith-Waterman dla SSE/CUDA, wyszukiwarka powtórzeń oparta na tablicy sufiksów i dotplot | Obydwa | Obydwa | UniPro | 2010 |
woda | Programowanie dynamiczne Smitha-Watermana | Obydwa | Lokalny | A. Bleasby'ego | 1999 |
dopasowanie słów | k - dopasowanie parami krotek | Obydwa | NA | I. Longdena | 1998 |
TAK | Rozsiane dopasowanie wzorca | Nukleotyd | Lokalny | L. Noe i G. Kucherov | 2004 |
* Typ sekwencji: białko lub nukleotyd ** Typ dopasowania: lokalny lub globalny
Dopasowanie wielu sekwencji
Nazwa | Opis | Typ sekwencji* | Typ wyrównania** | Autor | Rok | Licencja |
---|---|---|---|---|---|---|
ABA | Wyrównanie A-Bruijna | Białko | Światowy | B. Raphael i in. | 2004 | Zastrzeżone , bezpłatne oprogramowanie dla edukacji, badań, organizacji non-profit |
ALE | ręczne wyrównanie; trochę pomocy programowej | Nukleotydy | Lokalny | J. Blandy i K. Fogel | 1994 (najnowsza wersja 2007) | Bezpłatna , GPL2 |
WYRÓWNAJ | W przypadku cząsteczek DNA, RNA i białek o wielkości do 32 MB wyrównuje wszystkie sekwencje o rozmiarze K lub większym, MSA lub w obrębie pojedynczej cząsteczki. Podobne wyrównania są grupowane razem do analizy. Automatyczny filtr powtarzających się sekwencji. | Obydwa | Lokalny | E. Wachtel | 2017 | Bezpłatny |
MAPA | Wyżarzanie sekwencyjne | Obydwa | Światowy | A. Schwartza i L. Pachtera | 2006 | |
zaraz. | szybkie, optymalne dopasowanie trzech sekwencji z wykorzystaniem liniowych kosztów przerwy | Nukleotydy | Światowy | D. Powell, L. Allison i TI Dix | 2000 | |
BAli-Phy | Drzewo + wiele wyrównań; probabilistyczno-bayesowski; wspólne oszacowanie | Oba + kodony | Światowy | BD Redelings i MA Suchard | 2005 (najnowsza wersja 2018) | Bezpłatnie, GPL |
Baza po bazie | Oparty na języku Java edytor dopasowywania wielu sekwencji ze zintegrowanymi narzędziami do analizy | Obydwa | Lokalne lub globalne | R. Brodie i in. | 2004 | Zastrzeżony , darmowy , musi się zarejestrować |
CHAOS, DIALIZACJA | Wyrównanie iteracyjne | Obydwa | Lokalny (preferowany) | M. Brudno i B. Morgenstern | 2003 | |
Clustal W | Progresywne wyrównanie | Obydwa | Lokalne lub globalne | Thompsona i in. | 1994 | Bezpłatnie, LGPL |
CodonCode Aligner | Wielokierunkowe; Obsługa ClustalW i Phrap | Nukleotydy | Lokalne lub globalne | P. Richterich i in. | 2003 (najnowsza wersja 2009) | |
Kompas | Porównanie dopasowania wielu sekwencji białek z oceną istotności statystycznej | Białko | Światowy | RI Sadriejew i in. | 2009 | |
ODSZYFROWAĆ | Wyrównanie progresywno-iteracyjne | Obydwa | Światowy | Erika S. Wrighta | 2014 | Bezpłatnie, GPL |
DIALIGN-TX i DIALIGN-T | Metoda oparta na segmentach | Obydwa | Lokalny (preferowany) lub Globalny | ARSubramański | 2005 (najnowsza wersja 2008) | |
Wyrównanie DNA | Metoda oparta na segmentach dla dopasowań wewnątrzgatunkowych | Obydwa | Lokalny (preferowany) lub Globalny | A.Roehl | 2005 (najnowsza wersja 2008) | |
Asembler sekwencji bazowej DNA | Wielokierunkowe; W pełni automatyczne wyrównanie sekwencji; Automatyczna korekta niejednoznaczności; Dzwoniący z bazy wewnętrznej; Wyrównanie seq linii poleceń | Nukleotydy | Lokalne lub globalne | Heracle BioSoft SRL | 2006 (najnowsza wersja 2018) | Komercyjne (niektóre moduły są darmowe) |
DNADynamo | połączone DNA z białkiem wielokrotne dopasowanie z MUSCLE , Clustal i Smith-Waterman | Obydwa | Lokalne lub globalne | DNADynamo | 2004 (najnowsza wersja 2017) | |
EDNA | Dopasowanie wielu sekwencji oparte na energii dla miejsc wiązania DNA | Nukleotydy | Lokalne lub globalne | Salama, RA. i in. | 2013 | |
FAMSA | Stopniowe dopasowanie dla bardzo dużych rodzin białek (setki tysięcy członków) | Białko | Światowy | Deorowicz i in. | 2016 | Bezpłatna , GPL3 |
FSA | Wyżarzanie sekwencyjne | Obydwa | Światowy | RK Bradley i in. | 2008 | |
Genialny | Wyrównanie progresywno-iteracyjne; Wtyczka ClustalW | Obydwa | Lokalne lub globalne | AJ Drummond i in. | 2005 (najnowsza wersja 2017) | |
Kalign | Progresywne wyrównanie | Obydwa | Światowy | T. Lassmanna | 2005 | |
MAFFT | Wyrównanie progresywno-iteracyjne | Obydwa | Lokalne lub globalne | K. Katoh i in. | 2005 | Wolny, BSD |
MARNA | Wielokrotne dopasowanie RNA | RNA | Lokalny | S. Siebert i in. | 2005 | |
MAWID | Progresywne wyrównanie | Obydwa | Światowy | N. Bray i L. Pachter | 2004 | |
MegAlign Pro (biologia molekularna Lasergene) | Oprogramowanie do dopasowywania sekwencji DNA, RNA, białek lub DNA + białek za pomocą algorytmów dopasowywania par i wielu sekwencji, w tym analizy MUSCLE, Mauve, MAFFT, Clustal Omega, Jotun Hein, Wilbur-Lipman, Martinez Needleman-Wunsch, Lipman-Pearson i Dotplot. | Obydwa | Lokalne lub globalne | DNASTAR | 1993-2016 | |
MSA | Programowanie dynamiczne | Obydwa | Lokalne lub globalne | DJ Lipman i in. | 1989 (zmodyfikowany 1995) | |
MSAProbs | Programowanie dynamiczne | Białko | Światowy | Y. Liu, B. Schmidt, D. Maskell | 2010 | |
MULTALIN | Klastrowanie programowania dynamicznego | Obydwa | Lokalne lub globalne | F. Corpet | 1988 | |
Multi-LAGAN | Progresywne wyrównanie programowania dynamicznego | Obydwa | Światowy | M. Brudno i in. | 2003 | |
MIĘSIEŃ | Wyrównanie progresywno-iteracyjne | Obydwa | Lokalne lub globalne | R. Edgara | 2004 | |
Opal | Wyrównanie progresywno-iteracyjne | Obydwa | Lokalne lub globalne | T. Wheelera i J. Kececioglu | 2007 (najnowsza stabilna 2013, najnowsza beta 2016) | |
Pikan | Spójność probabilistyczna | DNA | Światowy | B. Paten i in. | 2008 | |
filo | Ludzka struktura obliczeniowa do porównawczej genomiki w celu rozwiązania wielu dopasowań | Nukleotydy | Lokalne lub globalne | Bioinformatyka McGill | 2010 | |
PMFastR | Progresywne wyrównanie ze świadomością struktury | RNA | Światowy | D. DeBlasio, J Braund, S Zhang | 2009 | |
Praliny | Progresywno-iteracyjne dopasowanie z rozszerzoną homologią spójności z preprofilowaniem i przewidywaniem struktury drugorzędowej | Białko | Światowy | J. Heringa | 1999 (najnowsza wersja 2009) | |
PicXAA | Nieprogresywne wyrównanie z maksymalną oczekiwaną dokładnością | Obydwa | Światowy | SME Sahraeian i BJ Yoon | 2010 | |
POA | Częściowy porządek/ukryty model Markowa | Białko | Lokalne lub globalne | C Lee | 2002 | |
wyrównać | Probabilistyka/spójność z prawdopodobieństwami funkcji podziału | Białko | Światowy | Roshan i Livesay | 2006 | Wolny, domena publiczna |
Problemy z wadami | Probabilistyczny/spójność | Białko | Lokalne lub globalne | C. Czy i in. | 2005 | Wolny, domena publiczna |
PROMALS3D | Progresywne wyrównanie/ukryty model Markowa/Struktura wtórna/Struktura 3D | Białko | Światowy | J. Pei i in. | 2008 | |
PRRN/PRRP | Wyrównywanie iteracyjne (zwłaszcza udoskonalanie) | Białko | Lokalne lub globalne | Y. Totoki (na podstawie O. Gotoh) | 1991 i później | |
PSWyrównaj | Wyrównanie zachowujące nieheurystykę | Obydwa | Lokalne lub globalne | SH Sze, Y. Lu, Q. Yang. | 2006 | |
RevTrans | Łączy wyrównanie DNA i białek, poprzez wsteczną translację wyrównania białek na DNA. | DNA/białko (specjalne) | Lokalne lub globalne | Wernerssona i Pedersena | 2003 (najnowsza wersja 2005) | |
SAGA | Dopasowanie sekwencji za pomocą algorytmu genetycznego | Białko | Lokalne lub globalne | C. Notredame i in. | 1996 (nowa wersja 1998) | |
SAM | Ukryty model Markowa | Białko | Lokalne lub globalne | A. Krogh i in. | 1994 (najnowsza wersja 2002) | |
Foka | Ręczne wyrównanie | Obydwa | Lokalny | A. Rambauta | 2002 | |
Wyrównaj statystyki | Bayesowska koestymacja wyrównania i filogenezy (MCMC) | Obydwa | Światowy | A. Nowak i in. | 2008 | |
Stemlok | Wielokrotne wyrównanie i przewidywanie struktury drugorzędowej | RNA | Lokalne lub globalne | I. Holmesa | 2005 | Bezpłatna, GPL 3 (część DART) |
Kawa T | Bardziej czułe progresywne wyrównanie | Obydwa | Lokalne lub globalne | C. Notredame i in. | 2000 (najnowsza wersja 2008) | Bezpłatna , GPL2 |
UGEN | Obsługuje wiele wyrównań za pomocą wtyczek MUSCLE , KAlign, Clustal i MAFFT | Obydwa | Lokalne lub globalne | Zespół UGENE | 2010 (najnowsza wersja 2020) | Bezpłatna , GPL2 |
WektorPrzyjaciele | VectorFriends Aligner, wtyczka MUSCLE i wtyczka Clustal W | Obydwa | Lokalne lub globalne | Zespół BioFriends | 2013 | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego |
GLProbs | Podejście oparte na adaptacyjnym modelu ukrytych par Markowa | Białko | Światowy | Y. Ye i in. | 2013 |
* Typ sekwencji: białkowa lub nukleotydowa. ** Typ wyrównania: lokalny lub globalny
Analiza genomiczna
Nazwa | Opis | Typ sekwencji* | |
---|---|---|---|
ORZEŁ | Ultraszybkie narzędzie do znajdowania względnie nieobecnych słów w danych genomowych | Nukleotyd | |
ACT (narzędzie do porównywania Artemis) | Synteny i genomika porównawcza | Nukleotyd | |
ZACHŁANNY | Globalne dopasowanie parami z całymi genomami | Nukleotyd | |
BLAT | Dopasowanie sekwencji cDNA do genomu. | Nukleotyd | |
ODSZYFROWAĆ | Dopasowanie rearanżowanych genomów przy użyciu translacji 6 ramek | Nukleotyd | |
ARTYLERIA PRZECIWLOTNICZA | Rozmyte dopasowanie i analiza całego genomu | Nukleotyd | |
GMAP | Dopasowanie sekwencji cDNA do genomu. Identyfikuje miejsca połączeń z dużą dokładnością. | Nukleotyd | |
Spign | Dopasowanie sekwencji cDNA do genomu. Identyfikuje miejsca połączeń z dużą dokładnością. Potrafi rozpoznawać i oddzielać duplikacje genów. | Nukleotyd | |
Fiołkoworóżowy | Wielokrotne dopasowanie przegrupowanych genomów | Nukleotyd | |
MGA | Wyrównywanie wielu genomów | Nukleotyd | |
Mulana | Lokalne wielokrotne dopasowania sekwencji długości genomu | Nukleotyd | |
Multiz | Wielokrotne dopasowanie genomów | Nukleotyd | |
PLAST-ncRNA | Szukaj ncRNA w genomach według lokalnego dopasowania funkcji partycji | Nukleotyd | |
Sequerome | Profilowanie danych dopasowania sekwencji z głównymi serwerami/usługami | Nukleotyd, peptyd | |
Sequilab | Profilowanie danych dopasowania sekwencji z wyników NCBI-BLAST z głównymi serwerami-usługami | Nukleotyd, peptyd | |
Shuffle-LAGAN | Glokalne dopasowanie parami ukończonych regionów genomu | Nukleotyd | |
SIBsim4, Sim4 | Program przeznaczony do dopasowania eksprymowanej sekwencji DNA z sekwencją genomową, z uwzględnieniem intronów | Nukleotyd | |
ZATRZASNĄĆ | Znalezienie genów, wyrównanie, adnotacja (identyfikacja homologii człowiek-mysz) | Nukleotyd | |
PRYZM | Wydajny aligner dla złożeń z wyraźnymi gwarancjami, wyrównujący odczyty bez splotów | Nukleotyd |
* Typ sekwencji: białkowa lub nukleotydowa
Znalezienie motywu
Nazwa | Opis | Typ sekwencji* |
---|---|---|
zespół napięcia przedmiesiączkowego | Wyszukiwanie i odkrywanie motywów | Obydwa |
FMM | Wyszukiwanie i odkrywanie motywów (można uzyskać również sekwencje dodatnie i ujemne jako dane wejściowe dla wzbogaconego wyszukiwania motywów) | Nukleotyd |
BLOKI | Identyfikacja motywu bez przerw z bazy danych BLOCKS | Obydwa |
eMOTYW | Ekstrakcja i identyfikacja krótszych motywów | Obydwa |
Próbnik motywów Gibbsa | Ekstrakcja motywu stochastycznego według prawdopodobieństwa statystycznego | Obydwa |
HMMTOP | Przewidywanie helis transbłonowych i topologia białek | Białko |
I-strony | Lokalna biblioteka motywów strukturalnych | Białko |
JCoils | Przewidywanie zwiniętej cewki i leucynowego zamka błyskawicznego | Białko |
MEM /MASZT | Odkrywanie i wyszukiwanie motywów | Obydwa |
CUDA-MEME | Akcelerowany przez GPU algorytm MEME (v4.4.0) dla klastrów GPU | Obydwa |
MERCI | Odkrywanie i wyszukiwanie motywów dyskryminacyjnych | Obydwa |
Wybuch PHI | Narzędzie do wyszukiwania i wyrównywania motywów | Obydwa |
Phylosan | Narzędzie do wyszukiwania motywów | Nukleotyd |
PRATT | Generowanie wzorców do użytku z ScanProsite | Białko |
ScanProsite | Narzędzie do przeszukiwania bazy danych Motif | Białko |
TEIRESJASZ | Ekstrakcja motywów i przeszukiwanie bazy danych | Obydwa |
BAZALT | Wyszukiwanie wielu motywów i wyrażeń regularnych | Obydwa |
* Typ sekwencji: białkowa lub nukleotydowa
Analiza porównawcza
Nazwa | Autorski |
---|---|
PFAM 30.0 (2016) | |
Inteligentny (2015) | Letunic, Copley, Schmidt, Ciccarelli, Doerks, Schultz, Ponting, Bork |
BAliBASE 3 (2015) | Thompson, Plewniak, Poch |
Oxbench (2011) | Raghava, Searle, Audley, Barber, Barton |
Kolekcja wzorców (2009) | Edgara |
HOMSTRAD (2005) | Mizuguchi |
PREFABRYKAT 4.0 (2005) | Edgara |
Znak SAB (2004) | Van Walle, Lasters, Wyns |
Widzowie wyrównania, redaktorzy
Zobacz Lista oprogramowania do wizualizacji osiowania .
Dopasowanie sekwencji krótkiego odczytu
Nazwa | Opis | opcja sparowanego końca | Użyj jakości FASTQ | Gapiony | Wielowątkowy | Licencja | Odniesienie | Rok |
---|---|---|---|---|---|---|---|---|
Arioc | Oblicza wyrównania przerw Smitha-Watermana i jakość mapowania na jednym lub kilku procesorach graficznych. Obsługuje wyrównania BS-seq. Przetwarza od 100 000 do 500 000 odczytów na sekundę (w zależności od danych, sprzętu i skonfigurowanej czułości). | Tak | NIE | Tak | Tak | Wolny, BSD | 2015 | |
BarraCUDA | z przyspieszoną przez GPGPU transformacją Burrowsa-Wheelera (indeks FM) oparty na BWA, obsługuje wyrównywanie indeli z otworami i rozszerzeniami luk. | Tak | NIE | Tak | Tak, wątki POSIX i CUDA | Bezpłatnie, GPL | ||
BBMap | Używa krótkich kmerów do szybkiego indeksowania genomu; brak limitu rozmiaru lub liczby rusztowań. Wyższa czułość i swoistość niż nakładki Burrows-Wheeler, z podobną lub większą szybkością. Wykonuje globalne wyrównanie zoptymalizowane pod kątem transformacji afinicznej, które jest wolniejsze, ale dokładniejsze niż Smith-Waterman. Obsługuje dane Illumina, 454, PacBio, Sanger i Ion Torrent. Rozpoznawanie splicingu; zdolny do przetwarzania długich indeli i RNA-seq. Czysta Jawa; działa na dowolnej platformie. Używany przez Joint Genome Institute . | Tak | Tak | Tak | Tak | Wolny, BSD | 2010 | |
BSZYBKO | Wyraźny kompromis w zakresie czasu i dokładności z wcześniejszym oszacowaniem dokładności, wspierany przez indeksowanie sekwencji referencyjnych. Optymalnie kompresuje indeksy. Może obsłużyć miliardy krótkich odczytów. Może obsługiwać wstawienia, usunięcia, SNP i błędy kolorów (może mapować odczyty przestrzeni kolorów ABI SOLiD). Wykonuje pełne wyrównanie Smitha Watermana. | Tak, wątki POSIX | Bezpłatnie, GPL | 2009 | ||||
BigBWA | Uruchamia Burrows-Wheeler Aligner -BWA w klastrze Hadoop . Obsługuje algorytmy BWA-MEM, BWA-ALN i BWA-SW, pracując z odczytami sparowanymi i pojedynczymi. Oznacza to istotne skrócenie czasu obliczeń podczas pracy w klastrze Hadoop, dodając skalowalność i odporność na błędy. | Tak | Niskiej jakości przycinanie podstaw | Tak | Tak | Bezpłatna , GPL3 | 2015 | |
BLASTN | Program dopasowywania nukleotydów BLAST, powolny i niedokładny w przypadku krótkich odczytów, wykorzystuje bazę danych sekwencji (EST, sekwencja Sangera) zamiast genomu odniesienia. | |||||||
BLAT | Wykonane przez Jima Kenta . Może obsłużyć jedną niezgodność na początkowym etapie wyrównywania. | Tak, klient-serwer | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | 2002 | ||||
Muszka | Wykorzystuje transformatę Burrowsa-Wheelera do stworzenia stałego, wielokrotnego użytku indeksu genomu; 1,3 GB śladu pamięci dla ludzkiego genomu. Wyrównuje ponad 25 milionów odczytów Illumina w ciągu 1 godziny procesora. Obsługuje zasady wyrównywania podobne do Maq i SOAP | Tak | Tak | NIE | Tak, wątki POSIX | Bezpłatny, Artystyczny | 2009 | |
BWA | Wykorzystuje transformatę Burrowsa-Wheelera do utworzenia indeksu genomu. Jest nieco wolniejszy niż Bowtie, ale pozwala wyrównać indele. | Tak | Niskiej jakości przycinanie podstaw | Tak | Tak | Bezpłatnie, GPL | 2009 | |
BWA-PSSM | Probabilistyczny algorytm wyrównywania krótkich odczytów oparty na wykorzystaniu macierzy punktacji specyficznych dla pozycji (PSSM). Aligner jest adaptowalny w tym sensie, że może uwzględniać wyniki jakości odczytów i modeli odchyleń specyficznych dla danych, takich jak te obserwowane w starożytnym DNA, danych PAR-CLIP lub genomach z tendencyjnymi kompozycjami nukleotydów. | Tak | Tak | Tak | Tak | Bezpłatnie, GPL | 2014 | |
CASHX | Kwantyfikuj i zarządzaj dużymi ilościami danych sekwencji krótkiego odczytu. Potok CASHX zawiera zestaw narzędzi, które mogą być używane razem lub osobno jako moduły. Algorytm ten jest bardzo dokładny w przypadku doskonałych trafień do genomu referencyjnego. | NIE | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | |||||
Oberwanie chmury | Mapowanie z krótkim odczytem przy użyciu usługi Hadoop MapReduce | Tak, Hadoop MapReduce | Bezpłatny, Artystyczny | |||||
CUDA-EC | Korekcja błędów wyrównania krótkiego odczytu przy użyciu procesorów graficznych. | Tak, włączone GPU | ||||||
CUSHAW | Kompatybilny z CUDA wyrównywacz krótkiego odczytu do dużych genomów oparty na transformacji Burrowsa-Wheelera | Tak | Tak | NIE | Tak (z włączoną kartą graficzną) | Bezpłatnie, GPL | 2012 | |
CUSHAW2 | Wyrównanie krótkiego i długiego odczytu z przerwami na podstawie maksymalnej liczby nasion dokładnego dopasowania. Ten wyrównywacz obsługuje wyrównania odczytów w przestrzeniach podstawowych (np. Illumina, 454, Ion Torrent i PacBio) oraz ABI SOLiD w odczytywaniu przestrzeni barw. | Tak | NIE | Tak | Tak | Bezpłatnie, GPL | 2014 | |
CUSHAW2-GPU | Akcelerowany przez GPU mechanizm wyrównywania krótkiego odczytu CUSHAW2. | Tak | NIE | Tak | Tak | Bezpłatnie, GPL | ||
CUSHAW3 | Czułe i dokładne wyrównanie krótkiego odczytu w przestrzeni bazowej i przestrzeni kolorów z zaszczepianiem hybrydowym | Tak | NIE | Tak | Tak | Bezpłatnie, GPL | 2012 | |
drSZYBKO | Oprogramowanie do wyrównywania mapowania odczytu, które implementuje pomijanie pamięci podręcznej w celu zminimalizowania transferów pamięci głównej/pamięci podręcznej, takie jak mrFAST i mrsFAST, jednak zaprojektowane dla platformy sekwencjonowania SOLiD (odczyty przestrzeni kolorów). Zwraca również wszystkie możliwe lokalizacje na mapie w celu lepszego wykrywania zmian strukturalnych. | Tak | Tak, dla zmian strukturalnych | Tak | NIE | Wolny, BSD | ||
ELANDIA | Wdrożone przez Illumina. Obejmuje wyrównanie bez przerw ze skończoną długością odczytu. | |||||||
BIELIK | Extended Randomized Numerical alignEr do dokładnego wyrównania odczytów NGS. Może mapować odczyty potraktowane wodorosiarczynem. | Tak | Niskiej jakości przycinanie podstaw | Tak | Wielowątkowość i obsługa MPI | Bezpłatna , GPL3 | ||
GASSST | Znajduje globalne zestawienia krótkich sekwencji DNA z dużymi bankami DNA | Wielowątkowość | CeCILL wersja 2. | 2011 | ||||
KLEJNOT | Wysokiej jakości silnik wyrównania (wyczerpujące mapowanie z podstawieniami i indelami). Dokładniejszy i kilka razy szybszy niż BWA czy Bowtie 1/2. Zapewniono wiele samodzielnych aplikacji biologicznych (mapper, split mapper, mappability i inne). | Tak | Tak | Tak | Tak | Bezpłatna , GPL3 | 2012 | |
MAPA Genalice | Ultraszybkie i wszechstronne narzędzie do wyrównywania odczytu NGS o wysokiej precyzji i niewielkich rozmiarach pamięci masowej. | Tak | Niskiej jakości przycinanie podstaw | Tak | Tak | Własny , komercyjny | ||
Genialny asembler | Szybki, dokładny asembler z możliwością obsługi dowolnej kombinacji technologii sekwencjonowania, długości odczytu, dowolnej orientacji parowania, z dowolnym rozmiarem odstępu dla parowania, z genomem referencyjnym lub bez. | Tak | Własny , komercyjny | |||||
GensearchNGS | Kompletna platforma z przyjaznym dla użytkownika graficznym interfejsem użytkownika do analizy danych NGS. Integruje zastrzeżony algorytm wyrównywania wysokiej jakości i możliwość wtyczek do integracji różnych publicznych wyrównywaczy w ramach umożliwiających importowanie krótkich odczytów, wyrównywanie ich, wykrywanie wariantów i generowanie raportów. Jest przeznaczony do projektów resekwencjonowania, a mianowicie w warunkach diagnostycznych. | Tak | NIE | Tak | Tak | Własny , komercyjny | ||
GMAP i GSNAP | Solidne, szybkie wyrównanie do krótkiego odczytu. GMAP: dłuższe odczyty, z wieloma indelami i splicingami (patrz wpis powyżej w części Analiza genomiki); GSNAP: krótsze odczyty, z jednym wcięciem lub maksymalnie dwoma spawami na odczyt. Przydatne do cyfrowej ekspresji genów, genotypowania SNP i indel. Opracowany przez Thomasa Wu z Genentech. Używany przez Narodowe Centrum Zasobów Genomu (NCGR) w Alpheus. | Tak | Tak | Tak | Tak | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | ||
GNUMAP | Dokładnie wykonuje wyrównanie z przerwami danych sekwencji uzyskanych z maszyn do sekwencjonowania nowej generacji (w szczególności Solexa-Illumina) z powrotem do genomu dowolnej wielkości. Obejmuje przycinanie adaptera, wywoływanie SNP i analizę sekwencji wodorosiarczynu. | Tak, obsługuje również pliki Illumina *_int.txt i *_prb.txt ze wszystkimi 4 wynikami jakości dla każdej bazy | Wielowątkowość i obsługa MPI | 2009 | ||||
HIVE-sześciokąt | Wykorzystuje tablicę skrótów i macierz kwitnienia do tworzenia i filtrowania potencjalnych pozycji w genomie. Aby uzyskać wyższą wydajność, wykorzystuje podobieństwo krzyżowe między krótkimi odczytami i unika ponownego wyrównywania nieunikalnych, zbędnych sekwencji. Jest szybszy niż Bowtie i BWA i pozwala na indele i rozbieżne, czułe dopasowania do wirusów, bakterii i bardziej konserwatywnych dopasowań eukariotycznych. | Tak | Tak | Tak | Tak | Własne , bezpłatne oprogramowanie dla użytkowników akademickich i niekomercyjnych zarejestrowanych w instancji wdrożeniowej HIVE | 2014 | |
IMOS | Ulepszony Meta-aligner i Minimap2 na Spark. Rozproszony aligner do długiego odczytu na platformie Apache Spark z liniową skalowalnością przy wykonywaniu na jednym węźle. | Tak | Tak | Tak | Bezpłatny | |||
Izaak | W pełni wykorzystuje całą moc obliczeniową dostępną w jednym węźle serwerowym; dzięki temu dobrze skaluje się w szerokim zakresie architektur sprzętowych, a wydajność wyrównania poprawia się wraz z możliwościami sprzętowymi | Tak | Tak | Tak | Tak | Bezpłatnie, GPL | ||
OSTATNI | Wykorzystuje nasiona adaptacyjne i skuteczniej radzi sobie z sekwencjami bogatymi w powtórzenia (np. genomami). Na przykład: może dopasować odczyty do genomów bez maskowania powtórzeń, bez przytłaczania przez powtarzające się trafienia. | Tak | Tak | Tak | Tak | Bezpłatnie, GPL | 2011 | |
MAQ | Wyrównanie bez przerw, które uwzględnia wyniki jakości dla każdej bazy. | Bezpłatnie, GPL | ||||||
pan SZYBKO, pani SZYBKO | Oprogramowanie do wyrównywania z przerwami (mrFAST) i bez przerw (mrsFAST), które implementuje nieświadomość pamięci podręcznej w celu zminimalizowania transferów pamięci głównej/pamięci podręcznej. Zostały zaprojektowane dla platformy sekwencjonowania Illumina i mogą zwracać wszystkie możliwe lokalizacje na mapie w celu lepszego wykrywania zmian strukturalnych. | Tak | Tak, dla zmian strukturalnych | Tak | NIE | Wolny, BSD | ||
MAMA | Mapowanie MOM lub maksymalnego oligonukleotydu to narzędzie do dopasowywania zapytań, które przechwytuje dopasowanie o maksymalnej długości w krótkim odczycie. | Tak | ||||||
MOZAIK | Wyrównywacz z szybkimi przerwami i asembler z przewodnikiem referencyjnym. Wyrównuje odczyty przy użyciu pasmowego Smitha-Watermana zaszczepionego wynikami ze schematu mieszania k-mer. Obsługuje odczyty o różnych rozmiarach od bardzo krótkich do bardzo długich. | Tak | ||||||
MPscan | Szybki aligner oparty na strategii filtracji (bez indeksowania, użyj q-gramów i wstecznego niedeterministycznego dopasowywania DAWG ) | 2009 | ||||||
Novoalign i NovoalignCS | Wyrównanie z przerwami pojedynczego końca i sparowanego końca Illumina GA I i II, ABI Color space i ION Czyta Torrent. Wysoka czułość i specyficzność, z wykorzystaniem właściwości podstawowych na wszystkich etapach dopasowywania. Obejmuje przycinanie adaptera, kalibrację jakości bazowej, wyrównanie Bi-Seq oraz opcje raportowania wielu wyrównań na odczyt. Użycie niejednoznacznych kodów IUPAC w odniesieniu do typowych SNP może poprawić przywoływanie SNP i usunąć błąd alleliczny. | Tak | Tak | Tak | Wersje wielowątkowe i MPI dostępne z płatną licencją | Własna , bezpłatna wersja jednowątkowa do użytku akademickiego i niekomercyjnego | ||
NastępnyGENe | Opracowany do użytku przez biologów przeprowadzających analizę danych sekwencjonowania nowej generacji z platform Roche Genome Sequencer FLX, Illumina GA/HiSeq, Life Technologies Applied BioSystems' SOLiD System, PacBio i Ion Torrent. | Tak | Tak | Tak | Tak | Własny , komercyjny | ||
Mapa następnej generacji | Elastyczny i szybki program do mapowania odczytu (dwa razy szybszy niż BWA), osiąga czułość mapowania porównywalną do Stampy. Wewnętrznie wykorzystuje wydajną pod względem pamięci strukturę indeksu (tabela skrótów) do przechowywania pozycji wszystkich 13-merów obecnych w genomie referencyjnym. Regiony mapowania, w których wymagane jest wyrównanie parami, są określane dynamicznie dla każdego odczytu. Wykorzystuje szybkie instrukcje SIMD (SSE) w celu przyspieszenia obliczeń wyrównania na CPU. Jeśli to możliwe, wyrównania są obliczane na GPU (przy użyciu OpenCL/CUDA), co dodatkowo skraca czas działania o 20-50%. | Tak | NIE | Tak | Tak, wątki POSIX , OpenCL/ CUDA , SSE | Bezpłatny | 2013 | |
Zestaw narzędzi wariantów Omixon | Obejmuje bardzo czułe i bardzo dokładne narzędzia do wykrywania SNP i indeli. Oferuje rozwiązanie do mapowania krótkich odczytów NGS z umiarkowaną odległością (do 30% rozbieżności sekwencji) od genomów referencyjnych. Nie ma ograniczeń co do rozmiaru odniesienia, co w połączeniu z wysoką czułością sprawia, że Variant Toolkit doskonale nadaje się do ukierunkowanych projektów sekwencjonowania i diagnostyki. | Tak | Tak | Tak | Tak | Własny , komercyjny | ||
PALMapper | Wydajnie oblicza zarówno sklejone, jak i niesklejone linie trasowania z dużą dokładnością. Opierając się na strategii uczenia maszynowego w połączeniu z szybkim mapowaniem opartym na pasmowym algorytmie podobnym do Smitha-Watermana, wyrównuje około 7 milionów odczytów na godzinę na jednym procesorze. Udoskonala pierwotnie zaproponowane podejście QPALMA. | Tak | Bezpłatnie, GPL | |||||
Partek Flow | Do użytku przez biologów i bioinformatyków. Obsługuje wyrównanie bez przerw, przerw i połączeń splicingowych z odczytów pojedynczych i sparowanych końców z Illumina, Life Technologies Solid TM, Roche 454 i Ion Torrent nieprzetworzonych danych (z informacjami o jakości lub bez). Integruje potężną kontrolę jakości na poziomie FASTQ/Qual i na wyrównanych danych. Dodatkowe funkcje obejmują przycinanie i filtrowanie surowych odczytów, wykrywanie SNP i InDel, oznaczanie ilościowe mRNA i mikroRNA oraz wykrywanie genów fuzyjnych. | Tak | Tak | Tak | Możliwa instalacja wieloprocesorowa, klient-serwer | Zastrzeżona , komercyjna , bezpłatna wersja próbna | ||
PRZECHODZIĆ | Indeksuje genom, a następnie rozszerza nasiona przy użyciu wstępnie obliczonych dopasowań słów. Działa z przestrzenią bazową, przestrzenią kolorów (SOLID) i może dopasowywać odczyty genomowego i splicingowego RNA-seq. | Tak | Tak | Tak | Tak | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | ||
Trwała ondulacja | Indeksuje genom za pomocą okresowych nasion, aby szybko znaleźć dopasowanie z pełną czułością do czterech niezgodności. Może mapować odczyty Illumina i SOLiD. W przeciwieństwie do większości programów do mapowania, prędkość wzrasta przy dłuższych długościach odczytu. | Tak | Bezpłatnie, GPL | |||||
PRIMEX | Indeksuje genom za pomocą tabeli wyszukiwania k-mer z pełną czułością do regulowanej liczby niezgodności. Najlepiej nadaje się do mapowania sekwencji 15-60 bp do genomu. | NIE | NIE | Tak | Nie, wiele procesów na wyszukiwanie | [1] | 2003 | |
QPalma | Może wykorzystywać wyniki jakości, długości intronów i przewidywania miejsca splicingu obliczeniowego, aby wykonać i wykonać bezstronne dopasowanie. Można go przeszkolić w zakresie specyfiki eksperymentu RNA-seq i genomu. Przydatne do odkrywania miejsca składania/intronu i budowania modelu genu. (Zobacz PALMapper, aby uzyskać szybszą wersję). | Tak, klient-serwer | Bezpłatna , GPL2 | |||||
Razer S | Brak limitu długości odczytu. Hamminga lub edytuj mapowanie odległości z konfigurowalnymi wskaźnikami błędów. Konfigurowalna i przewidywalna czułość (kompromis między czasem pracy a czułością). Obsługuje mapowanie odczytu sparowanego końca. | Bezpłatnie, LGPL | ||||||
PRAWDZIWE, RZECZYWISTE | REAL to wydajne, dokładne i czułe narzędzie do wyrównywania krótkich odczytów uzyskanych z sekwencjonowania nowej generacji. Program może obsłużyć ogromną liczbę pojedynczych odczytów generowanych przez analizator genomu nowej generacji Illumina/Solexa. cREAL to proste rozszerzenie REAL do dopasowywania krótkich odczytów uzyskanych z sekwencjonowania nowej generacji do genomu o strukturze kołowej. | Tak | Tak | Bezpłatnie, GPL | ||||
RMAP | Może mapować odczyty z lub bez informacji o prawdopodobieństwie błędu (wyniki jakości) i obsługuje odczyty ze sparowanymi końcami lub mapowanie odczytu potraktowane wodorosiarczynem. Nie ma ograniczeń co do długości odczytu ani liczby niezgodności. | Tak | Tak | Tak | Bezpłatna , GPL3 | |||
rNA | Randomizowany wyrównywacz numeryczny do dokładnego wyrównania odczytów NGS | Tak | Niskiej jakości przycinanie podstaw | Tak | Wielowątkowość i obsługa MPI | Bezpłatna , GPL3 | ||
Śledczy RTG | Niezwykle szybki, tolerancyjny na wysokie liczby indel i podstawień. Obejmuje pełne wyrównanie odczytu. Produkt zawiera kompleksowe potoki do wykrywania wariantów i analizy metagenomicznej z dowolną kombinacją danych Illumina, Complete Genomics i Roche 454. | Tak | Tak, dla wariantu wywołania | Tak | Tak | Zastrzeżone , bezpłatne oprogramowanie do użytku indywidualnego badacza | ||
Segemehl | Potrafi obsłużyć wstawienia, usunięcia, niedopasowania; używa rozszerzonych tablic sufiksów | Tak | NIE | Tak | Tak | Zastrzeżone , darmowe oprogramowanie do użytku niekomercyjnego | 2009 | |
SeqMap | Do 5 mieszanych substytucji i insercji-delecji; różne opcje strojenia i formaty wejścia-wyjścia | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | ||||||
Shrek | Korekcja błędów krótkiego odczytu ze strukturą danych drzewa sufiksów | Tak, Jawa | ||||||
Krewetka | Indeksuje genom referencyjny od wersji 2. Używa masek do generowania możliwych kluczy. Może mapować odczyty przestrzeni kolorów ABI SOLiD. | Tak | Tak | Tak | Tak, OpenMP | Bezpłatnie, [[licencje BSD| style="background: #DFF; vertical-align: middle; text-align: center; " class="free table-free"|Free, BSD ] ] pochodna |
|
2009-2011 |
SUWAK | Slider to aplikacja dla danych wyjściowych Illumina Sequence Analyzer, która wykorzystuje pliki „prawdopodobieństwa” zamiast plików sekwencji jako dane wejściowe do dopasowania do sekwencji odniesienia lub zestawu sekwencji odniesienia. | Tak | Tak | NIE | NIE | 2009-2010 | ||
SOAP, SOAP2, SOAP3, SOAP3-dp | SOAP: solidny z małą (1-3) liczbą luk i niedopasowań. Poprawa szybkości w stosunku do BLAT, wykorzystuje 12-literową tablicę skrótów. SOAP2: użycie dwukierunkowego BWT do zbudowania indeksu referencyjnego i jest znacznie szybsze niż pierwsza wersja. SOAP3: wersja z akceleracją GPU, która może znaleźć wszystkie 4-niedopasowane wyrównania w dziesiątki sekund na milion odczytów. SOAP3-dp, również akcelerowany przez GPU, obsługuje dowolną liczbę niezgodności i luk zgodnie z punktacją kary za przerwy afiniczne. | Tak | NIE | Tak, SOAP3-dp | Tak, wątki POSIX ; SOAP3, SOAP3-dp wymagają GPU z obsługą CUDA | Bezpłatnie, GPL | ||
SOCS | Dla technologii ABI SOLiD. Znaczne wydłużenie czasu mapowania odczytów z niedopasowaniami (lub błędami kolorów). Używa iteracyjnej wersji algorytmu wyszukiwania łańcuchów Rabina-Karpa. | Tak | Bezpłatnie, GPL | |||||
SparkBWA | Integruje narzędzie Burrows–Wheeler Aligner (BWA) z platformą Apache Spark działającą na platformie Hadoop . Wersja 0.2 z października 2016 obsługuje algorytmy BWA-MEM, BWA-backtrack i BWA-ALN. Wszystkie działają z odczytami pojedynczymi i odczytami sparowanymi. | Tak | Niskiej jakości przycinanie podstaw | Tak | Tak | Bezpłatna , GPL3 | 2016 | |
SSAHA, SSAHA2 | Szybki dla niewielkiej liczby wariantów | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | ||||||
Pieczątka | Dla Illumina czyta. Wysoka specyficzność i czułość na odczyty z indelami, wariantami strukturalnymi lub wieloma SNP. Wolno, ale prędkość dramatycznie wzrosła dzięki zastosowaniu BWA do pierwszego przejazdu wyrównawczego. | Tak | Tak | Tak | NIE | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | 2010 | |
Burza | Dla odczytów Illumina lub ABI SOLiD z natywnym wyjściem SAM . Bardzo czuły na odczyty z wieloma błędami, indele (pełne od 0 do 15, poza tym rozszerzone wsparcie). Wykorzystuje rozmieszczone ziarna (pojedyncze trafienie) i bardzo szybki filtr pasmowy SSE - SSE2 - AVX2 - AVX-512 . Tylko w przypadku odczytów o stałej długości autorzy zalecają SHRiMP2 inaczej. | NIE | Tak | Tak | Tak, OpenMP | Bezpłatny | 2010 | |
Subread, Subjunc | Superszybkie i dokładne alignery odczytu. Subread może służyć do mapowania zarówno odczytów gDNA-seq, jak i RNA-seq. Subjunc wykrywa połączenia ekson-egzon i mapuje odczyty RNA-seq. Wykorzystują nowy paradygmat mapowania o nazwie seed-and-vote . | Tak | Tak | Tak | Tak | Bezpłatna , GPL3 | ||
tajpan | De-novo asembler dla Illumina czyta | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | ||||||
UGEN | Interfejs wizualny zarówno dla Bowtie, jak i BWA oraz wbudowany aligner | Tak | Tak | Tak | Tak | Bezpłatnie, GPL | ||
VelociMapper | Akcelerowane przez FPGA narzędzie do mapowania wyrównania sekwencji odniesienia firmy TimeLogic . Szybsze niż transformacji Burrowsa-Wheelera, takie jak BWA i Bowtie. Obsługuje do 7 niezgodności i/lub indeksów bez spadku wydajności. Tworzy czułe wyrównania z przerwami Smitha-Watermana. | Tak | Tak | Tak | Tak | Własny , komercyjny | ||
XpressAlign | Wyrównywanie krótkiego odczytu oparte na przesuwanym oknie FPGA, które wykorzystuje zawstydzająco równoległą właściwość wyrównania krótkiego odczytu. Wydajność skaluje się liniowo wraz z liczbą tranzystorów na chipie (tj. wydajność gwarantowana podwaja się z każdą iteracją prawa Moore'a bez modyfikacji algorytmu). Niski pobór mocy jest przydatny w przypadku wyposażenia centrum danych. Przewidywalny czas pracy. Lepszy stosunek ceny do wydajności niż programowe wyrównywacze okien przesuwnych na obecnym sprzęcie, ale nie lepszy niż obecnie wyrównywacze programowe oparte na BWT. Potrafi zarządzać dużą liczbą (>2) niezgodności. Znajdzie wszystkie trafione pozycje dla wszystkich nasion. Wersja eksperymentalna z pojedynczym FPGA wymaga pracy, aby przekształcić ją w wersję produkcyjną z wieloma FPGA. | Zastrzeżone , darmowe oprogramowanie do użytku akademickiego i niekomercyjnego | ||||||
POWIĘKSZENIE | 100% czułość dla odczytów między 15 a 240 bp z praktycznymi niedopasowaniami. Bardzo szybki. Obsługa wstawiania i usuwania. Współpracuje z instrumentami Illumina i SOLiD, nie 454. | Tak (GUI), nie (CLI) | Własny , komercyjny |