Binarna mapa wyrównania

Binary Alignment Map (BAM) to kompleksowe surowe dane sekwencjonowania genomu ; składa się z bezstratnej , skompresowanej binarnej reprezentacji plików mapy wyrównania sekwencji .

BAM to skompresowana binarna reprezentacja SAM (mapa wyrównania sekwencji), kompaktowa i indeksowalna reprezentacja dopasowań sekwencji nukleotydów. Celem indeksowania jest szybkie odzyskanie linii trasowania, które pokrywają się z określoną lokalizacją, bez konieczności przeglądania ich wszystkich. Przed indeksowaniem BAM należy posortować według identyfikatora odniesienia, a następnie skrajnej lewej współrzędnej. BAM jest w skompresowanym formacie BGŻF.

Struktura plików BAM obejmuje sekcję nagłówka i sekcję wyrównania:

  • Nagłówek — ta sekcja zawiera nazwę próbki, długość próbki i metodę wyrównania. Sekcja linii trasowania zawiera linie trasowania, które są połączone z określonymi informacjami w sekcji nagłówka.
  • Wyrównania — nazwa odczytu, kolejność odczytu, jakość odczytu, informacje o wyrównaniu i znaczniki niestandardowe są zawarte w tym pliku. Chromosom, współrzędna początkowa, jakość dopasowania i ciąg deskryptora dopasowania są zawarte w odczytanej nazwie.
    • Sekcja wyrównania obejmuje:
      • Czytaj grupę (RG)
      • Etykieta z kodem kreskowym (BC)
      • Jakość osiowania na jednym końcu (SM)
      • Jakość wyrównania sparowanych końcówek (AS)
      • Edytuj etykietę odległości (NM)
      • Identyfikator amplikonu (XN)

układu współrzędnych opartego na 0 , gdzie jako SAM używa układu współrzędnych opartego na 1. BAM może reprezentować wartości z zakresu [−2^31 , 2^32).

Aby wyświetlić listę narzędzi do sekwencjonowania i analizy współpracujących z SAM/BAM, kliknij tutaj .


Zobacz też

Linki zewnętrzne