DRIP-sekw
DRIP-seq (sekwencjonowanie DRIP) to technologia profilowania całego genomu typu hybrydy DNA-RNA zwanej „ pętlą R ”. DRIP-seq wykorzystuje niezależne od sekwencji, ale specyficzne dla struktury przeciwciało do immunoprecypitacji DNA-RNA (DRIP) do wychwytywania pętli R w celu masowo równoległego sekwencjonowania DNA .
Wstęp
Pętla R to trójniciowa struktura kwasu nukleinowego , która składa się z hybrydowego dupleksu DNA-RNA i przesuniętej pojedynczej nici DNA (ssDNA). Pętle R powstają głównie w cytozynę regionach genomowych podczas transkrypcji i wiadomo, że biorą udział w ekspresji genów i przełączaniu klas immunoglobulin . Znaleziono je u różnych gatunków, od bakterii po ssaki. Są preferencyjnie zlokalizowane na promotorach wyspowych CpG w komórkach ludzkich i regionach o wysokim stopniu transkrypcji w drożdżach.
W nienormalnych warunkach, a mianowicie zwiększonej produkcji hybryd DNA-RNA, pętle R mogą powodować niestabilność genomu poprzez narażanie jednoniciowego DNA na endogenne uszkodzenia wywierane przez działanie enzymów, takich jak AID i APOBEC , lub nadmierną ekspozycję na chemicznie reaktywne gatunki. Dlatego zrozumienie, gdzie iw jakich okolicznościach powstają pętle R w całym genomie, ma kluczowe znaczenie dla lepszego zrozumienia niestabilności genomu. Charakterystyka pętli R była początkowo ograniczona do podejść specyficznych dla locus. Jednak po pojawieniu się masowego sekwencjonowania równoległego , a następnie pochodnych, takich jak DRIP-seq, otworzyła się możliwość badania całych genomów pod kątem pętli R.
DRIP-seq opiera się na wysokiej swoistości i powinowactwie przeciwciała monoklonalnego (mAb) S9.6 do hybryd DNA-RNA o różnej długości. S9.6 mAb zostało po raz pierwszy stworzone i scharakteryzowane w 1986 roku i jest obecnie stosowane do selektywnej immunoprecypitacji pętli R. Od tego czasu był używany w różnych metodach immunoprecypitacji do charakteryzowania pętli R. Koncepcja DRIP-seq jest podobna do sekwencjonowania ChIP ; Fragmenty pętli R są głównym materiałem immunoprecypitowanym w DRIP-seq.
Zastosowania i aktualne badania
DRIP-seq jest używany głównie do mapowania całego genomu pętli R. Identyfikacja miejsc tworzenia pętli R umożliwia badanie różnych zdarzeń komórkowych, takich jak funkcja tworzenia pętli R w określonych regionach, charakterystyka tych regionów i wpływ na ekspresję genów. Można go również wykorzystać do badania wpływu pętli R na inne procesy, takie jak replikacja i synteza DNA. Pośrednio, DRIP-seq można przeprowadzić na zmutowanych liniach komórkowych z niedoborem genów zaangażowanych w rozdzielczość pętli R. Tego typu badania dostarczają informacji o roli zmutowanego genu w hamowaniu powstawania DNA-RNA i potencjalnie o znaczeniu pętli R w niestabilności genomu.
DRIP-seq został po raz pierwszy użyty do profilowania całego genomu pętli R u ludzi, co wykazało powszechne tworzenie się pętli R w promotorach wysp CpG. Naukowcy odkryli w szczególności, że tworzenie się pętli R jest związane z niemetylowanym stanem wysp CpG.
DRIP-seq został później użyty do profilowania tworzenia pętli R w miejscach rozpoczęcia i zakończenia transkrypcji w ludzkich pluripotencjalnych komórkach Ntera2 . W ramach tego badania naukowcy ujawnili, że pętle R na końcach 3' genów mogą być skorelowane z terminacją transkrypcji.
Przepływ pracy DRIP-seq
Ekstrakcja genomowego DNA
Najpierw genomowy DNA (gDNA) jest ekstrahowany z komórek będących przedmiotem zainteresowania przez traktowanie proteinazą K, a następnie ekstrakcję fenolem-chloroformem i wytrącanie etanolem . Dodatkowe trawienie zymoliazą jest konieczne dla komórek drożdży w celu usunięcia ściany komórkowej przed traktowaniem proteinazą K. gDNA można również ekstrahować różnymi innymi metodami, takimi jak metody oparte na kolumnach .
Fragmentacja genomowego DNA
gDNA traktuje się nukleazą S1 w celu usunięcia niepożądanego ssDNA i RNA , a następnie wytrąca się etanolem w celu usunięcia nukleazy S1. Następnie gDNA jest fragmentowany za pomocą endonukleazy restrykcyjnej , uzyskując fragmenty dwuniciowego DNA (dsDNA) o różnej wielkości. Alternatywnie, fragmenty gDNA można wygenerować przez sonikację .
Immunoprecypitacja
Pofragmentowany gDNA inkubuje się z mAb S9.6 specyficznym dla struktury DNA-RNA. Ten etap jest unikalny dla protokołu DRIP-seq, ponieważ całkowicie opiera się na wysokiej swoistości i powinowactwie mAb S9.6 do hybryd DNA-RNA. Przeciwciało rozpozna i zwiąże te regiony rozproszone w genomie i zostanie użyte do immunoprecypitacji. Przeciwciała S9.6 wiążą się z kulkami magnetycznymi poprzez oddziaływanie ze specyficznymi ligandami (tj. białkiem A lub białkiem G ) na powierzchni kulek. Zatem fragmenty zawierające DNA-RNA będą wiązać się z kulkami za pomocą przeciwciała.
Elucja
Kulki magnetyczne przemywa się w celu usunięcia gDNA niezwiązanego z kulkami przez serię przemywań, a hybrydy DNA-RNA odzyskuje się przez elucję. Aby usunąć przeciwciało związane z hybrydami kwasu nukleinowego, przeprowadza się traktowanie proteinazą K, a następnie ekstrakcję fenolem-chloroformem i wytrącanie etanolem. Powoduje to izolację oczyszczonych hybryd DNA-RNA o różnej wielkości.
Sekwencjonowanie
W celu masowego sekwencjonowania równoległego tych fragmentów materiał po immunoprecypitacji poddaje się sonikacji, selekcjonuje pod względem wielkości i liguje z kodami kreskowymi adapterów oligonukleotydowych w celu wzbogacenia klastra i sekwencjonowania.
Analiza obliczeniowa
Aby wykryć miejsca tworzenia pętli R, setki milionów odczytów sekwencjonowania z DRIP-seq są najpierw dopasowywane do genomu referencyjnego za pomocą wyrównywacza sekwencji z krótkim odczytem , a następnie metody wywoływania szczytów zaprojektowane dla ChIP-seq mogą być użyte do oceny DRIP sygnały. Jeśli różne koktajle enzymów restrykcyjnych zostały użyte do różnych eksperymentów DRIP-seq tej samej próbki, nazywane są konsensusowe piki DRIP-seq. Zazwyczaj piki porównuje się z pikami z odpowiedniej RNazą H1 , która służy jako kontrola wejściowa.
Ograniczenia
Ze względu na brak innej metody immunoprecypitacji pętli R opartej na przeciwciałach, walidacja wyników DRIP-seq jest trudna. Jednak wyniki innych metod profilowania R-loop, takich jak DRIVE-seq, mogą być wykorzystane do pomiaru konsensusu.
Z drugiej strony DRIP-seq opiera się na istniejących platformach sekwencjonowania z krótkim odczytem do sekwencjonowania pętli R. Innymi słowy, wszystkie nieodłączne ograniczenia tych platform dotyczą również DRIP-seq. W szczególności typowe platformy sekwencjonowania z krótkim odczytem dawałyby nierówny zasięg odczytu w regionach bogatych w GC. Sekwencjonowanie długich pętli R może stanowić wyzwanie, ponieważ pętle R powstają głównie w regionach DNA bogatych w cytozynę. Co więcej, regiony bogate w GC mają z natury niską złożoność, co jest trudne dla wyrównywaczy z krótkim odczytem w celu uzyskania unikalnych dopasowań.
Inne metody profilowania R-loop
Chociaż istnieje kilka innych metod analizy i profilowania tworzenia pętli R, tylko kilka zapewnia pokrycie i solidność w skali całego genomu.
- Niedenaturująca modyfikacja i sekwencjonowanie wodorosiarczynem : ta metoda polega na traktowaniu wodorosiarczynem, a następnie sekwencjonowaniu i opiera się na mutagennym działaniu wodorosiarczynu sodu na ssDNA. Chociaż ta metoda jest używana głównie do lokalizacji określonych promotorów wyspowych CpG, była używana do wykrywania pętli R w mniejszej skali i innych wrażliwych miejsc ssDNA.
- Wzbogacanie DNA:RNA in vitro (DRIVE-seq) : Ta metoda ma bardzo podobne zasady do DRIP-seq, z wyjątkiem zastosowania endonukleazy MBP-RNASEH1 zamiast mAb S9.6 do odzyskiwania pętli R. MBP-RNASEH1 stanowi alternatywę dla mAb S9.6, gdy potrzebny jest dodatkowy test wychwytu, jednak nadekspresja tej endonukleazy może stwarzać zagrożenie cytotoksyczne in vivo .
- Immnunoprecypitacja DNA:RNA, a następnie hybrydyzacja na mikromacierzy Tiling (DRIP-chip) : Ta metoda również opiera się na zastosowaniu mAb S9.6. Jednak zamiast wchodzić do potoku sekwencjonowania, materiał po immunoprecypitacji w chipie DRIP jest hybrydyzowany z mikromacierzą . Przewagą DRIP-chip nad DRIP-seq jest szybkie uzyskiwanie danych. Czynnikami ograniczającymi tę technikę są liczba sond na mikromacierzach chipowych i brak informacji o sekwencji DNA.