Binarna mapa wyrównania
Binary Alignment Map (BAM) to kompleksowe surowe dane sekwencjonowania genomu ; składa się z bezstratnej , skompresowanej binarnej reprezentacji plików mapy wyrównania sekwencji .
BAM to skompresowana binarna reprezentacja SAM (mapa wyrównania sekwencji), kompaktowa i indeksowalna reprezentacja dopasowań sekwencji nukleotydów. Celem indeksowania jest szybkie odzyskanie linii trasowania, które pokrywają się z określoną lokalizacją, bez konieczności przeglądania ich wszystkich. Przed indeksowaniem BAM należy posortować według identyfikatora odniesienia, a następnie skrajnej lewej współrzędnej. BAM jest w skompresowanym formacie BGŻF.
Struktura plików BAM obejmuje sekcję nagłówka i sekcję wyrównania:
- Nagłówek — ta sekcja zawiera nazwę próbki, długość próbki i metodę wyrównania. Sekcja linii trasowania zawiera linie trasowania, które są połączone z określonymi informacjami w sekcji nagłówka.
- Wyrównania — nazwa odczytu, kolejność odczytu, jakość odczytu, informacje o wyrównaniu i znaczniki niestandardowe są zawarte w tym pliku. Chromosom, współrzędna początkowa, jakość dopasowania i ciąg deskryptora dopasowania są zawarte w odczytanej nazwie.
- Sekcja wyrównania obejmuje:
- Czytaj grupę (RG)
- Etykieta z kodem kreskowym (BC)
- Jakość osiowania na jednym końcu (SM)
- Jakość wyrównania sparowanych końcówek (AS)
- Edytuj etykietę odległości (NM)
- Identyfikator amplikonu (XN)
- Sekcja wyrównania obejmuje:
układu współrzędnych opartego na 0 , gdzie jako SAM używa układu współrzędnych opartego na 1. BAM może reprezentować wartości z zakresu [−2^31 , 2^32).
Aby wyświetlić listę narzędzi do sekwencjonowania i analizy współpracujących z SAM/BAM, kliknij tutaj .
Zobacz też
- formacie FASTQ
- formacie SAM
- SAMtools
- formacie CRAM
- Lista formatów plików dla biologii molekularnej
- Kompresja danych sekwencjonowania genomu