Wnioskowanie o trajektorii

Wnioskowanie o trajektorii zaimplementowane w Slingshot dla ( a ) symulowanego dwuwymiarowego zestawu danych i ( b ) zestawu danych jednokomórkowego RNA-seq nabłonka węchowego .

Wnioskowanie o trajektorii lub porządkowanie pseudoczasowe to technika obliczeniowa stosowana w transkryptomice pojedynczych komórek w celu określenia wzorca dynamicznego procesu doświadczanego przez komórki, a następnie uporządkowania komórek na podstawie ich postępu w tym procesie. Protokoły jednokomórkowe mają znacznie wyższy poziom szumu niż luzem RNA-seq , więc częstym krokiem w przepływie pracy transkryptomiki jednokomórkowej jest grupowanie komórek na podgrupy. Grupowanie może poradzić sobie z tą nieodłączną zmiennością, łącząc sygnał z wielu komórek, jednocześnie umożliwiając identyfikację typów komórek. Jednak pewne różnice w ekspresji genów między komórkami są wynikiem procesów dynamicznych, takich jak cykl komórkowy , różnicowanie komórek czy odpowiedź na bodźce zewnętrzne. Wnioskowanie o trajektorii ma na celu scharakteryzowanie takich różnic poprzez umieszczenie komórek wzdłuż ciągłej ścieżki, która reprezentuje ewolucję procesu, zamiast dzielenia komórek na oddzielne skupiska. W niektórych metodach odbywa się to poprzez rzutowanie komórek na oś zwaną pseudoczas , który reprezentuje postęp w procesie.

Metody

Od 2015 roku powstało ponad 50 algorytmów wnioskowania o trajektorii. Chociaż przyjęte podejścia są różne, istnieją pewne podobieństwa w metodach. Zazwyczaj etapy algorytmu polegają na redukcji wymiarowości w celu zmniejszenia złożoności danych, budowanie trajektorii w celu określenia struktury procesu dynamicznego oraz rzutowanie danych na trajektorię, tak aby komórki były pozycjonowane przez ich ewolucję w procesie, a komórki o podobnych profilach ekspresji znajdowały się blisko siebie. Algorytmy wnioskowania o trajektorii różnią się specyficzną procedurą stosowaną do redukcji wymiarowości, rodzajami struktur, których można użyć do przedstawienia procesu dynamicznego, oraz informacjami wstępnymi, które są wymagane lub mogą być dostarczone.

PCA wielowymiarowego rozkładu Gaussa . Pokazane wektory to pierwszy (dłuższy wektor) i drugi główny składowy, które wskazują kierunki maksymalnej wariancji.

Redukcja wymiarowości

Dane uzyskane za pomocą pojedynczej komórki RNA-seq mogą składać się z tysięcy komórek, z których każda ma poziomy ekspresji zarejestrowane w tysiącach genów. Aby skutecznie przetwarzać dane o tak dużej wymiarowości, wiele algorytmów wnioskowania o trajektorii wykorzystuje jako pierwszy krok procedurę redukcji wymiarowości, taką jak analiza głównych składowych (PCA), analiza niezależnych składowych (ICA) lub t-SNE . Celem tego kroku jest połączenie wielu cech danych w bardziej informacyjną miarę danych. Na przykład współrzędna wynikająca z redukcji wymiarowości może łączyć poziomy ekspresji wielu genów związanych z cyklem komórkowym w jedną wartość reprezentującą pozycję komórki w cyklu komórkowym. Taka transformacja odpowiada redukcji wymiarowości w przestrzeni cech, ale redukcja wymiarowości może być również zastosowana do przestrzeni próbki poprzez grupowanie razem grup podobnych komórek.

Budynek trajektorii

Graf z sześcioma wierzchołkami. Wiele algorytmów wnioskowania o trajektorii wykorzystuje wykresy do zbudowania trajektorii.

Wiele metod przedstawia strukturę procesu dynamicznego za pomocą podejścia opartego na grafach . W takim podejściu wierzchołki grafu odpowiadają stanom procesu dynamicznego, takim jak typy komórek w różnicowaniu komórek, a krawędzie między węzłami odpowiadają przejściom między stanami. Tworzenie wykresu trajektorii można wykonać za pomocą k-najbliższych sąsiadów lub minimalnego drzewa rozpinającego algorytmy. Topologia trajektorii odnosi się do struktury grafu, a różne algorytmy ograniczają się do tworzenia topologii grafu określonego typu, np. liniowej , rozgałęzionej lub cyklicznej .

Wykorzystanie wcześniejszych informacji

Niektóre metody wymagają lub pozwalają na wprowadzenie wcześniejszych informacji, które są wykorzystywane do kierowania tworzeniem trajektorii. Wykorzystanie wcześniejszych informacji może prowadzić do dokładniejszego określenia trajektorii, ale złe wcześniejsze informacje mogą sprowadzić algorytm na manowce lub zniekształcić wyniki w stosunku do oczekiwań. Przykładami informacji wstępnych, które można wykorzystać we wnioskowaniu o trajektorii, są wybór komórek początkowych, które znajdują się na początku trajektorii, liczba rozgałęzień w trajektorii oraz liczba stanów końcowych trajektorii.

Oprogramowanie

MAŁGORZATA

MARGARET stosuje metodę głębokiego, nienadzorowanego uczenia metrycznego do wnioskowania o utajonej przestrzeni komórkowej i skupiskach komórek. Trajektoria jest modelowana przy użyciu wykresu połączeń klastrów w celu uchwycenia złożonych topologii trajektorii. MARGARET wykorzystuje wywnioskowaną trajektorię do określania stanów końcowych i wnioskowania o plastyczności losu komórki za pomocą skalowalnego modelu łańcucha Absorbującego Markowa .

Monokl

Monocle najpierw stosuje test ekspresji różnicowej w celu zmniejszenia liczby genów, a następnie stosuje niezależną analizę składową w celu dodatkowej redukcji wymiarowości. Aby zbudować trajektorię, Monocle oblicza minimalne drzewo rozpinające , a następnie znajduje najdłuższą połączoną ścieżkę w tym drzewie. Komórki są rzutowane na najbliższy im punkt wzdłuż tej ścieżki.

p-Kreode

p-Creode znajduje najbardziej prawdopodobną ścieżkę przez dopasowany do gęstości wykres k-najbliższych sąsiadów . Grafy z zespołu są oceniane za pomocą metryki podobieństwa grafu, aby wybrać najbardziej reprezentatywną topologię. p-Creode został przetestowany na szeregu platform jednokomórkowych, w tym cytometrii masowej , multipleksowej immunofluorescencji i pojedynczej komórki RNA-seq . Nie są wymagane żadne wcześniejsze informacje.

Proca

Slingshot przyjmuje etykiety klastrów jako dane wejściowe, a następnie porządkuje te klastry w rodowody, konstruując minimalne drzewo rozpinające . Ścieżki w drzewie są wygładzane przez dopasowanie równoczesnych głównych krzywych, a wartość pseudoczasu komórki jest określana przez jej rzutowanie na jedną lub więcej z tych krzywych. Wcześniejsze informacje, takie jak klastry początkowe i końcowe, są opcjonalne.

TSCAN

TSCAN przeprowadza redukcję wymiarowości za pomocą analizy głównych składowych i grupuje komórki za pomocą modelu mieszanego . Minimalne drzewo rozpinające jest obliczane na podstawie środków klastrów, a trajektoria jest określana jako najdłuższa połączona ścieżka tego drzewa. TSCAN to nienadzorowany algorytm, który nie wymaga żadnych wcześniejszych informacji.

Wanderlust / Wishbone

Wanderlust został opracowany do analizy danych z cytometrii masowej , ale został przystosowany do zastosowań w transkryptomice pojedynczych komórek . Algorytm k-najbliższych sąsiadów jest używany do konstruowania wykresu, który łączy każdą komórkę z komórką najbliższą jej względem metryki, takiej jak odległość euklidesowa lub odległość cosinusowa . Wanderlust wymaga wprowadzenia komórki początkowej jako informacji wstępnej.

Wishbone jest zbudowany na Wanderlust i pozwala na bifurkację w topologii grafu, podczas gdy Wanderlust tworzy graf liniowy . Wishbone łączy analizę głównych składowych i mapy dyfuzji w celu uzyskania redukcji wymiarowości, a następnie tworzy również wykres KNN .

Wodospad

Wodospad przeprowadza redukcję wymiarowości za pomocą analizy głównych składowych i wykorzystuje algorytm k-średnich do znajdowania klastrów komórek. Minimalne drzewo rozpinające jest budowane między środkami klastrów. Wodospad jest całkowicie nienadzorowany, nie wymaga uprzedniej informacji i tworzy liniowe trajektorie.

  1. ^ b ; Bacher, Rhonda     Kendziorski, Krystyna (2016-04-07). „Projektowanie i analiza obliczeniowa eksperymentów z sekwencjonowaniem RNA pojedynczych komórek” . Biologia genomu . 17 (1): 63. doi : 10.1186/s13059-016-0927-y . ISSN 1474-760X . PMC 4823857 . PMID 27052890 .
  2. ^ a b     Hwang, Byungjin; Lee, Ji Hyun; Bang, Duhee (2018-08-07). „Technologie sekwencjonowania jednokomórkowego RNA i rurociągi bioinformatyczne” . Medycyna eksperymentalna i molekularna . 50 (8): 1–14. doi : 10.1038/s12276-018-0071-8 . ISSN 2092-6413 . PMC 6082860 . PMID 30089861 .
  3. Bibliografia     _ Teichmann, Sarah A.; Marioni, John C. (2015-01-28). „Wyzwania obliczeniowe i analityczne w transkryptomice jednokomórkowej”. Nature Recenzje Genetyka . 16 (3): 133–145. doi : 10.1038/nrg3833 . ISSN 1471-0056 . PMID 25628217 . S2CID 205486032 .
  4. ^ abc Cannoodt ,     Robrecht; Saelens, Wouter; Saeys, Yvan (2016-10-19). „Metody obliczeniowe do wnioskowania o trajektorii na podstawie transkryptomiki jednokomórkowej” . Europejski Dziennik Immunologiczny . 46 (11): 2496–2506. doi : 10.1002/eji.201646347 . ISSN 0014-2980 . PMID 27682842 . S2CID 19562455 .
  5. ^ ab Trapnell     , Cole; Cacchiarelli, Davide; Grimsby, Jonna; Pokharel, Prapti; Li, Shuqiang; Morse, Michael; Lennon, Niall J; Livak, Kenneth J; Mikkelsen, Tarjei S (2014-03-23). „Dynamika i regulatory decyzji o losie komórek są ujawniane przez pseudoczasowe porządkowanie pojedynczych komórek” . Biotechnologia przyrody . 32 (4): 381–386. doi : 10.1038/nbt.2859 . ISSN 1087-0156 . PMC 4122333 . PMID 24658644 .
  6. ^ a b c d    Saelens, Wouter; Cannoodt, Robrecht; Todorow, Helena; Saeys, Yvan (2019-01-04). „Porównanie metod wnioskowania o trajektorii pojedynczej komórki” . Biotechnologia przyrody . 37 (5): 547–555. doi : 10.1038/s41587-019-0071-9 . PMID 30936559 . S2CID 89616753 .
  7. ^     Conesa, Ana; Madrigal, Pedro; Tarazona, Sonia; Gomez-Cabrero, David; Cervera, Alejandra; McPherson, Andrew; Szcześniak, Michał Wojciech; Gaffney, Daniel J.; Elo, Laura L. (2016-01-26). „Przegląd najlepszych praktyk w zakresie analizy danych RNA-seq” . Biologia genomu . 17 (1): 13. doi : 10.1186/s13059-016-0881-8 . ISSN 1474-760X . PMC 4728800 . PMID 26813401 .
  8. ^ ab Josef     , Nir; Regew, Awiw; Wagner, Allon (listopad 2016). „Ujawnianie wektorów tożsamości komórkowej za pomocą genomiki pojedynczych komórek” . Biotechnologia przyrody . 34 (11): 1145–1160. doi : 10.1038/nbt.3711 . ISSN 1546-1696 . PMC 5465644 . PMID 27824854 .
  9. Bibliografia     _ Tan, Yuqi; Kumar, Pavitra (2017-01-01). „Zrozumienie rozwoju i komórek macierzystych za pomocą analiz ekspresji genów opartych na pojedynczych komórkach” . Rozwój . 144 (1): 17–32. doi : 10.1242/dev.133058 . ISSN 1477-9129 . PMC 5278625 . PMID 28049689 .
  10. ^ ab Ulica    , Kelly; Risso, Davide; Fletcher, Russell B.; Das, Diya; Ngai, John; Józef, Nir; Purdom, Elżbieta; Dudoit, Sandrine (2018-06-19). „Proca: wnioskowanie o linii komórkowej i pseudoczasie dla transkryptomiki jednokomórkowej” . Genomika BMC . 19 (1): 477. doi : 10.1186/s12864-018-4772-0 . PMC 6007078 . PMID 29914354 .
  11. ^     Pandey, Kuszagra; Zafar, Hamim (2022). „Wnioskowanie o zmianach stanu komórki i plastyczności losu komórki z pojedynczej komórki za pomocą MARGARET” . Badania kwasów nukleinowych . 50 (15): e86. doi : 10.1093/nar/gkac412 . ISSN 0305-1048 . PMC 9410915 . PMID 35639499 .
  12. Bibliografia     _ Sewiński, CJ; Sood, A.; Adak S.; Bello, Missouri; Bordwell, A.; Może, A.; Corwin, A.; Dinn, S. (2013-07-01). „Wysoce multipleksowana analiza pojedynczych komórek tkanki nowotworowej utrwalonej w formalinie i zatopionej w parafinie” . Obrady Narodowej Akademii Nauk . 110 (29): 11982–11987. Bibcode : 2013PNAS..11011982G . doi : 10.1073/pnas.1300136110 . ISSN 0027-8424 . PMC 3718135 . PMID 23818604 .
  13. ^     Lau, Ken S.; Coffey, Robert J.; Gerdes, Michael J.; Liu, Qi; Franklin, Jeffrey L.; Roland, Józef T.; Ping, Jie; Simmons, Alan J.; McKinley, Eliot T. (2018-01-24). „Analiza trajektorii bez nadzoru pojedynczej komórki RNA-Seq i dane obrazowania ujawniają alternatywne pochodzenie komórek pęczków w jelicie” . Systemy komórkowe . 6 (1): 37–51.e9. doi : 10.1016/j.cels.2017.10.012 . ISSN 2405-4712 . PMC 5799016 . PMID 29153838 .
  14. Bibliografia     _ Ji, Hongkai (2016-05-13). „TSCAN: rekonstrukcja pseudoczasowa i ocena w analizie sekwencji RNA pojedynczej komórki” . Badania kwasów nukleinowych . 44 (13): e117. doi : 10.1093/nar/gkw430 . ISSN 0305-1048 . PMC 4994863 . PMID 27179027 .
  15. ^     Bendall, Sean C.; Davis, Kara L.; Amir, El-ad Dawid; Tadmor, Michelle D.; Simonds, Erin F.; Chen, Tiffany J.; Shenfeld, Daniel K.; Nolan, Garry P.; Pe'Er, Dana (24.04.2014). „Wykrywanie trajektorii pojedynczej komórki ujawnia postęp i koordynację regulacyjną w rozwoju ludzkich komórek B” . komórka . 157 (3): 714–725. doi : 10.1016/j.cell.2014.04.005 . ISSN 0092-8674 . PMC 4045247 . PMID 24766814 .
  16. Bibliografia     _ Tadmor, Michelle D; Reich-Zeliger, Szlomit; Anioł, Omer; Salame, Tomer Meir; Kathail, Pooja; Choi, Kristy; Bendall, Sean; Friedman, Nir (2016-05-02). „Wishbone identyfikuje rozwidlające się trajektorie rozwojowe na podstawie danych z pojedynczej komórki” . Biotechnologia przyrody . 34 (6): 637–645. doi : 10.1038/nbt.3569 . ISSN 1087-0156 . PMC 4900897 . PMID 27136076 .
  17. Bibliografia     _ Berg, Daniel A.; Zhu, Yunhua; Shin, Joseph Y.; Piosenka, Juanie; Bonaguidi, Michael A.; Enikolopow, Grigorij; Nauen, David W.; Christian, Kimberly M.; Ming, Guo-li; Piosenka, Hongjun (2015-09-03). „Seq jednokomórkowego RNA z wodospadem ujawnia kaskady molekularne leżące u podstaw neurogenezy dorosłych” . Komórka Komórka Macierzysta . 17 (3): 360–372. doi : 10.1016/j.stem.2015.07.013 . ISSN 1934-5909 . PMC 8638014 . PMID 26299571 .

Linki zewnętrzne