FAIRE-Seq

FAIRE-Seq ( Formaldehyde - A ssisted I solation of Regulatory Elements ) jest metodą biologii molekularnej stosowaną do określania sekwencji regionów DNA w genomie związanych z aktywnością regulatorową . Technika została opracowana w laboratorium Jasona D. Lieba na Uniwersytecie Północnej Karoliny w Chapel Hill. W przeciwieństwie do DNazy-Seq , protokół FAIRE-Seq nie wymaga permeabilizacji komórek ani izolacji jąder i może analizować dowolny typ komórek. W badaniu siedmiu różnych typów komórek ludzkich, DNaza-seq i FAIRE-seq dały silną walidację krzyżową, przy czym każdy typ komórek miał 1-2% ludzkiego genomu jako otwartą chromatynę .

Przepływ pracy

Protokół opiera się na fakcie, że sieciowanie formaldehydem jest bardziej wydajne w DNA związanym z nukleosomami niż w regionach genomu zubożonych w nukleosomy. Ta metoda następnie segreguje nieusieciowany DNA, który zwykle znajduje się w otwartej chromatynie, który jest następnie sekwencjonowany. Protokół obejmuje sieciowanie, ekstrakcję fenolem i sekwencjonowanie DNA w fazie wodnej.

UCZCIWY

FAIRE wykorzystuje biochemiczne właściwości DNA związanego z białkami do oddzielania regionów zubożonych w nukleosomy w genomie. Komórki zostaną poddane sieciowaniu, co zapewni ustalenie interakcji między nukleosomami a DNA. Po sonikacji rozdrobniony i utrwalony DNA rozdziela się za pomocą ekstrakcji fenolowo-chloroformowej. Ta metoda tworzy dwie fazy, fazę organiczną i fazę wodną. Ze względu na swoje właściwości biochemiczne fragmenty DNA usieciowane z nukleosomami będą preferencyjnie znajdować się w fazie organicznej. Z drugiej strony regiony zubożone w nukleosomy lub „otwarte” zostaną znalezione w fazie wodnej. Poprzez specyficzną ekstrakcję fazy wodnej, tylko regiony zubożone w nukleosomy zostaną oczyszczone i wzbogacone.

Sekwencjonowanie

Fragmenty DNA wyekstrahowane metodą FAIRE można analizować w sposób wysokowydajny przy użyciu technik sekwencjonowania nowej generacji . Ogólnie rzecz biorąc, biblioteki są tworzone przez ligację specyficznych adapterów z fragmentami DNA, które umożliwiają ich grupowanie na platformie i amplifikację, co skutkuje odczytaniem/określeniem sekwencji DNA, i to równolegle dla milionów fragmentów DNA.

W zależności od rozmiaru genomu, na którym przeprowadza się FAIRE-seq, wymagana jest minimalna liczba odczytów, aby utworzyć odpowiednie pokrycie danych, zapewniając określenie właściwego sygnału. Ponadto genom referencyjny lub wejściowy, który nie został usieciowany, jest często sekwencjonowany obok w celu określenia poziomu szumu tła.

Należy zauważyć, że wyekstrahowane fragmenty FAIRE można oznaczyć ilościowo metodą alternatywną, stosując ilościową reakcję PCR . Jednak ta metoda nie pozwala na kwantyfikację całego genomu/wysokoprzepustową wyekstrahowanych fragmentów.

Wrażliwość

Istnieje kilka aspektów FAIRE-seq, które wymagają uwagi podczas analizy i interpretacji danych. Po pierwsze, stwierdzono, że FAIRE-seq będzie miał większy zasięg w regionach wzmacniających niż w regionach promotorowych. Kontrastuje to z alternatywną metodą DNazy-seq, o której wiadomo, że wykazuje wyższą czułość wobec regionów promotora. Ponadto stwierdzono, że FAIRE-seq wykazuje preferencje dla wewnętrznych intronów i eksonów. Ogólnie uważa się również, że dane FAIRE-seq wykazują wyższy poziom tła, co czyni tę metodę mniej czułą.

Analiza obliczeniowa

W pierwszym kroku dane FAIRE-seq są odwzorowywane na referencyjny genom użytego organizmu modelowego.

Następnie identyfikacja regionów genomowych z otwartą chromatyną odbywa się za pomocą algorytmu wywoływania pików. Różne narzędzia oferują do tego celu pakiety (np. ChIPOTle ZINBA i MACS2). ChIPOTle wykorzystuje przesuwne okno 300bp do identyfikacji statystycznie istotnych sygnałów. W przeciwieństwie do tego, MACS2 identyfikuje wzbogacony sygnał, łącząc parametr callpeak z innymi opcjami, takimi jak „broad”, „broad cutoff”, „no model” lub „shift”. ZINBA to ogólny algorytm wykrywania wzbogacenia w zbiorze danych krótkiego odczytu. W ten sposób pomaga w dokładnym wykrywaniu sygnału w złożonych zestawach danych o niskim stosunku sygnału do szumu.

BedTools służy do łączenia ulepszonych regionów znajdujących się blisko siebie w celu utworzenia CORE (Cluster of Open Regulatory Elements). Pomaga to w identyfikacji regionów dostępnych dla chromatyny i wzorców regulacji genów, które w innym przypadku byłyby niewykrywalne, biorąc pod uwagę niższą rozdzielczość, którą często niesie ze sobą FAIRE-seq.

Dane są zwykle wizualizowane jako ścieżki (np. bigWig) i można je przesłać do przeglądarki genomu UCSC.

Główne ograniczenie tej metody, tj. niski stosunek sygnału do szumu w porównaniu z innymi testami dostępności chromatyny, bardzo utrudnia obliczeniową interpretację tych danych.

Metody alternatywne

Istnieje kilka metod, których można użyć jako alternatywy dla FAIRE-seq. DNaza-seq wykorzystuje zdolność enzymu DNazy I do cięcia wolnego/otwartego/dostępnego DNA w celu identyfikacji i sekwencjonowania otwartej chromatyny. Później opracowany ATAC-seq wykorzystuje transpozazę Tn5, która wstawia określone fragmenty lub transpozony do dostępnych regionów genomu w celu identyfikacji i sekwencjonowania otwartej chromatyny.