Złożona analiza cech całego genomu

Złożona analiza cech całego genomu ( GCTA ) Oparte na genomie ograniczone maksymalne prawdopodobieństwo ( GREML ) to statystyczna metoda szacowania składowej wariancji w genetyce, która określa ilościowo całkowity (addytywny) wkład w dziedziczność cechy określonego podzbioru wariantów genetycznych (zwykle ograniczone do SNP z MAF > 1%, stąd terminy takie jak „dziedziczność chipa” / „dziedziczność SNP”). Odbywa się to poprzez bezpośrednie określenie ilościowe przypadkowego podobieństwa genetycznego niespokrewnionych osobników i porównanie go z ich zmierzonym podobieństwem cechy; jeśli dwie niespokrewnione osoby są stosunkowo podobne genetycznie i mają podobne pomiary cech, wówczas zmierzona genetyka prawdopodobnie przyczynowo wpłynie na tę cechę, a korelacja może do pewnego stopnia powiedzieć, jak bardzo. Można to zilustrować, wykreślając kwadratowe różnice cech parami między osobami w stosunku do ich szacowanego stopnia pokrewieństwa. Ramy GCTA można zastosować w różnych ustawieniach. Na przykład można go wykorzystać do zbadania zmian w dziedziczności w miarę starzenia się i rozwoju. Można go również rozszerzyć, aby analizować dwuwymiarowe korelacje genetyczne między cechami. Trwa debata na temat tego, czy GCTA generuje wiarygodne lub stabilne oszacowania odziedziczalności, gdy jest używany na bieżących danych SNP. Metoda opiera się na przestarzałej i fałszywej dychotomii genów i środowiska. Cierpi również na poważne słabości metodologiczne, takie jak podatność na rozwarstwienie populacji .

Szacunki odziedziczalności GCTA są przydatne, ponieważ zapewniają dolne granice wkładu genetycznego w cechy, takie jak inteligencja , bez polegania na założeniach stosowanych w badaniach bliźniąt i innych badaniach rodzinnych i rodowodowych , potwierdzając je w ten sposób i umożliwiając zaprojektowanie silnego powiązania obejmującego cały genom projekty badań (GWAS) w celu znalezienia określonych wariantów genetycznych. Na przykład oszacowanie GCTA wynoszące 30% odziedziczalności SNP jest zgodne z większą całkowitą odziedziczalnością genetyczną wynoszącą 70%. Jeśli jednak oszacowanie GCTA wynosiłoby ~ 0%, oznaczałoby to jedną z trzech rzeczy: a) nie ma wkładu genetycznego, b) wkład genetyczny ma wyłącznie postać nieuwzględnionych wariantów genetycznych lub c) wkład genetyczny jest w całości w formie efektów nieaddytywnych, takich jak epistaza / dominacja . Przeprowadzenie GCTA na poszczególnych chromosomach i regresja szacowanej proporcji wariancji cechy wyjaśnionej przez każdy chromosom w stosunku do długości tego chromosomu może ujawnić, czy odpowiedzialne warianty genetyczne skupiają się lub są rozmieszczone równomiernie w całym genomie, czy też są sprzężone z płcią . Chromosomy można oczywiście zastąpić bardziej szczegółowymi lub funkcjonalnie poinformowanymi podpodziałami. Badanie korelacji genetycznych może ujawnić, w jakim stopniu zaobserwowane korelacje, takie jak między inteligencją a statusem społeczno-ekonomicznym, wynikają z tych samych cech genetycznych, a w przypadku chorób może wskazać wspólne ścieżki przyczynowe, takie jak można wywnioskować ze zmienności genetycznej wspólnie powiązanej ze schizofrenią i innymi chorobami psychicznymi lub obniżoną inteligencją.

Historia

Szacowanie w biologii/hodowli zwierząt przy użyciu standardowych metod ANOVA / REML składników wariancji, takich jak dziedziczność, wspólne środowisko, efekty matczyne itp., zazwyczaj wymaga osobników o znanym pokrewieństwie, takich jak rodzic/dziecko; jest to często niedostępne lub dane rodowodowe niewiarygodne, co prowadzi do niemożności zastosowania metod lub wymaga ścisłej kontroli laboratoryjnej całej hodowli (co zagraża zewnętrznej ważności wszystkich szacunków), a kilku autorów zauważyło, że pokrewieństwo można mierzyć bezpośrednio na podstawie markerów genetycznych (a gdyby osoby były rozsądnie spokrewnione, ekonomicznie niewiele markerów musiałoby być uzyskanych dla uzyskania mocy statystycznej), co skłoniło Kermita Ritlanda do zaproponowania w 1996 r., że bezpośrednio mierzone pokrewieństwo parami można porównać z pomiarami fenotypów parami (Ritland 1996, „A Marker-based Method do wnioskowania o dziedziczeniu ilościowym w populacjach naturalnych” .

Ponieważ koszty sekwencjonowania genomu gwałtownie spadły w 2000 roku, możliwe stało się uzyskanie wystarczającej liczby markerów na wystarczającej liczbie podmiotów do wiarygodnych szacunków przy użyciu bardzo odległych spokrewnionych osobników. Wczesne zastosowanie tej metody na ludziach nastąpiło wraz z Visscherem i in. 2006/2007, w którym wykorzystano markery SNP do oszacowania rzeczywistego pokrewieństwa rodzeństwa i oszacowania dziedziczności na podstawie genetyki bezpośredniej. U ludzi, w przeciwieństwie do pierwotnych zastosowań zwierzęcych/roślinnych, pokrewieństwo jest zwykle znane z dużą pewnością w „dzikiej populacji”, a korzyści z GCTA są bardziej związane z unikaniem założeń klasycznych projektów genetyki behawioralnej i weryfikacją ich wyników oraz podziałem dziedziczności według Klasa SNP i chromosomy. Pierwsze zastosowanie właściwego GCTA u ludzi opublikowano w 2010 r., Stwierdzając, że 45% wariancji wzrostu człowieka można wytłumaczyć uwzględnionymi SNP. (Duże GWASa dotyczące wzrostu potwierdziły od tego czasu szacunki). Następnie opisano algorytm GCTA, a implementację oprogramowania opublikowano w 2011 r. Od tego czasu był używany do badania szerokiej gamy cech biologicznych, medycznych, psychiatrycznych i psychologicznych u ludzi oraz zainspirował wiele wariantów podejść.

Korzyści

Solidna dziedziczność

Badania bliźniąt i rodzin były od dawna wykorzystywane do szacowania wariancji wyjaśnionej przez poszczególne kategorie przyczyn genetycznych i środowiskowych. W szerokiej gamie badanych cech ludzkich występuje zazwyczaj minimalny wpływ środowiska wspólnego, znaczny wpływ środowiska niewspólnego i duży składnik genetyczny (głównie addytywny), który wynosi średnio ~ 50%, a czasem znacznie wyższy w przypadku niektórych cech, takich jak jak wzrost czy inteligencja. Jednak badania bliźniąt i rodzin były krytykowane za opieranie się na szeregu założeń, które są trudne lub niemożliwe do zweryfikowania, takich jak założenie o równych środowiskach (że środowiska bliźniąt jednojajowych i dwuzygotycznych są jednakowo podobne) , że nie ma błędna klasyfikacja zygotyczności (mylenie identyczności z braterstwem i odwrotnie), że bliźnięta nie są reprezentatywne dla populacji ogólnej i że nie ma kojarzenia selektywnego . Naruszenie tych założeń może skutkować zarówno odchyleniem w górę, jak iw dół oszacowań parametrów. (Ta debata i krytyka skupiały się szczególnie na dziedziczeniu IQ .)

Wykorzystanie danych SNP lub całego genomu od niespokrewnionych uczestników (z uczestnikami zbyt spokrewnionymi, zwykle > 0,025 lub poziomami ~ czwartego kuzyna, usuniętymi i kilkoma głównymi składnikami uwzględnionymi w regresji w celu uniknięcia i kontroli stratyfikacji populacji ) omija wiele krytyki dziedziczności: bliźnięta są często całkowicie niezaangażowane, nie ma kwestii równego traktowania, pokrewieństwo jest dokładnie oszacowane, a próbki są pobierane z szerokiej gamy podmiotów.

Oprócz tego, że są bardziej odporne na naruszenia założeń badania bliźniąt, dane SNP mogą być łatwiejsze do zebrania, ponieważ nie wymagają rzadkich bliźniaków, a zatem można również oszacować dziedziczność rzadkich cech (z należytą poprawką na błąd ustalenia ) .

Moc GWAS

Szacunki GCTA można wykorzystać do rozwiązania problemu brakującej dziedziczności i zaprojektowania GWAS, które przyniosą statystycznie istotne trafienia w całym genomie. Odbywa się to poprzez porównanie oszacowania GCTA z wynikami mniejszych GWAS. Jeśli GWAS n=10k przy użyciu danych SNP nie przyniesie żadnych trafień, ale GCTA wskazuje na wysoką dziedziczność wynikającą z SNP, oznacza to, że zaangażowana jest duża liczba wariantów ( poligeniczność ), a zatem znacznie większe GWAS będą być wymagane do dokładnego oszacowania efektu każdego SNP i bezpośredniego uwzględnienia ułamka odziedziczalności GCTA.

Niedogodności

  1. Ograniczone wnioskowanie: oszacowania GCTA są z natury ograniczone, ponieważ nie mogą oszacować szeroko rozumianej dziedziczności, takiej jak badania bliźniąt / rodzin, ponieważ szacują jedynie dziedziczność z powodu SNP. Dlatego, chociaż służą one jako krytyczna kontrola bezstronności badań bliźniąt/rodzin, GCTA nie mogą ich zastąpić w szacowaniu całkowitego wkładu genetycznego w cechę.
  2. Istotne wymagania dotyczące danych: liczba genotypowanych SNP na osobę powinna wynosić tysiące, a najlepiej setki tysięcy, aby uzyskać rozsądne oszacowanie podobieństwa genetycznego (chociaż nie jest to już takim problemem w przypadku obecnych komercyjnych chipów, które domyślnie ustawiają setki tysięcy lub miliony znaczniki); a liczba osób, dla dość stabilnych szacunków prawdopodobnej odziedziczalności SNP, powinna wynosić co najmniej n > 1000, a najlepiej n > 10 000. W przeciwieństwie do tego, badania bliźniacze mogą dostarczyć dokładnych szacunków z ułamkiem wielkości próby.
  3. obliczeniowa: Oryginalna implementacja GCTA skaluje się słabo , więc nawet jeśli dostępna jest wystarczająca ilość danych do dokładnych szacunków GCTA, obciążenie obliczeniowe może być niewykonalne. GCTA można poddać metaanalizie jako standardową, precyzyjnie ważoną metaanalizę z efektem stałym, więc grupy badawcze czasami szacują kohorty lub podzbiory, a następnie łączą je metaanalitycznie (kosztem dodatkowej złożoności i pewnej utraty precyzji). To motywowało do tworzenia szybszych implementacji i wariantów algorytmów, które przyjmują różne założenia, takie jak wykorzystanie dopasowania momentu .

  4. Potrzeba surowych danych: GCTA wymaga podobieństwa genetycznego wszystkich podmiotów, a tym samym ich surowych informacji genetycznych; ze względu na obawy dotyczące prywatności dane poszczególnych pacjentów są rzadko udostępniane. GCTA nie można uruchomić na podstawie podsumowujących statystyk zgłoszonych publicznie przez wiele projektów GWAS, a jeśli łączy się wiele szacunków GCTA, należy przeprowadzić metaanalizę . W przeciwieństwie do tego istnieją alternatywne techniki, które działają na podsumowaniach zgłaszanych przez GWAS bez wymagania surowych danych, np. „ Regresja wyniku LD ” porównuje statystyki nierównowagi powiązań (dostępne z publicznych zbiorów danych, takich jak 1000 genomów ) z publicznymi podsumowaniami rozmiarów efektów w celu wywnioskowania odziedziczalności i oszacowania genetyczne korelacje/nakładanie się wielu cech. Broad Institute prowadzi LD Hub , który zapewnia publiczny interfejs sieciowy dla >=177 cech z regresją wyniku LD. Inną metodą wykorzystującą dane zbiorcze jest HESS.
  5. Przedziały ufności mogą być nieprawidłowe lub poza zakresem dziedziczności 0-1 i wysoce nieprecyzyjne ze względu na asymptotykę.
  6. Niedoszacowanie odziedziczalności SNP: GCTA domyślnie zakłada, że ​​wszystkie klasy SNP, rzadsze lub bardziej powszechne, nowsze lub starsze, mniej lub bardziej w nierównowadze sprzężeń, mają średnio takie same efekty; u ludzi rzadsze i nowsze warianty mają zwykle większe i bardziej negatywne skutki, ponieważ reprezentują ładunek mutacji usuwany przez selekcję negatywną . Podobnie jak w przypadku błędu pomiaru, wpłynie to na szacunki GCTA w kierunku niedoszacowania odziedziczalności.

Interpretacja

Szacunki GCTA są często błędnie interpretowane jako „całkowity wkład genetyczny”, a ponieważ są one często znacznie mniejsze niż szacunki z badań bliźniaczych, zakłada się, że badania bliźniacze są stronnicze, a wkład genetyczny w określoną cechę jest niewielki. Jest to nieprawidłowe, ponieważ szacunki GCTA są dolnymi granicami. [ potrzebne źródło ]

Bardziej poprawna interpretacja byłaby następująca: Szacunki GCTA to oczekiwana wielkość wariancji, którą można przewidzieć za pomocą nieskończenie dużego GWAS przy użyciu prostego addytywnego modelu liniowego (bez żadnych interakcji lub efektów wyższego rzędu) w określonej populacji w określonym czasie ograniczony wybór SNP i cecha mierzona ze szczególną precyzją. W związku z tym istnieje wiele sposobów na przekroczenie szacunków GCTA:

  1. Dane dotyczące genotypowania SNP są zwykle ograniczone do 200 000-1 mln najpowszechniejszych lub interesujących naukowo SNP, chociaż ponad 150 milionów zostało udokumentowanych przez sekwencjonowanie genomu; w miarę jak ceny SNP spadają, a macierze stają się bardziej wszechstronne lub sekwencjonowanie całego genomu całkowicie zastępuje genotypowanie SNP, oczekiwana dziedziczność wąskosensowna wzrośnie, gdy więcej wariantów genetycznych zostanie uwzględnionych w analizie. Selekcję można również znacznie rozszerzyć za pomocą haplotypów i imputacji (SNP mogą zastępować nieobserwowane warianty genetyczne, z którymi są zwykle dziedziczone); np. Yang i in. 2015 stwierdzili, że przy bardziej agresywnym wykorzystaniu imputacji do wnioskowania o nieobserwowanych wariantach, oszacowanie wzrostu GCTA wzrasta do 56% z 45%, a Hill i in. 2017 stwierdza, że ​​rozszerzenie GCTA w celu objęcia rzadszych wariantów podnosi szacunki inteligencji z ~ 30% do ~ 53% i wyjaśnia całą dziedziczność w ich próbce; dla 4 cech w brytyjskim Biobanku, przypisanie podniosło szacunki odziedziczalności SNP. Dodatkowe warianty genetyczne obejmują mutacje de novo / ładunek mutacji i zmiany strukturalne, takie jak zmiany liczby kopii .
  2. wąskosensowne oszacowania dziedziczności zakładają prostą addytywność efektów, ignorując interakcje. Ponieważ niektóre wartości cech będą spowodowane tymi bardziej skomplikowanymi efektami, całkowity efekt genetyczny przekroczy efekt podzbioru mierzony za pomocą GCTA, a gdy zostaną znalezione i zmierzone addytywne SNP, możliwe stanie się również znalezienie interakcji przy użyciu bardziej wyrafinowanych statystyk modele.
  3. wszystkie oszacowania korelacji i odziedziczalności są obciążone w dół do zera przez obecność błędu pomiaru ; potrzeba dostosowania tego prowadzi do technik, takich jak korekcja błędu pomiaru Spearmana , ponieważ niedoszacowanie może być dość poważne w przypadku cech, w przypadku których dokładny pomiar na dużą skalę jest trudny i kosztowny, takich jak inteligencja. Na przykład oszacowanie inteligencji GCTA na poziomie 0,31, oparte na pomiarze inteligencji z ponownego testu , po korekcie ( ), być prawdziwym oszacowaniem ~ 0,48, co wskazuje, że same wspólne SNP wyjaśniają połowę wariancji. W związku z tym GWAS z lepszym pomiarem inteligencji może spodziewać się znalezienia większej liczby trafień wywiadowczych niż wskazuje GCTA oparty na głośniejszym pomiarze.

Implementacje

GCTA
Oryginalni autorzy Jian Yang
Pierwsze wydanie 30 sierpnia 2010 ; 12 lat temu ( 2010-08-30 )
Wersja stabilna
1.26.0 / 22 czerwca 2016 r . ; 6 lat temu ( 2016-06-22 )
Wersje podglądowe
1.93.2beta / 8 maja 2020 r . ; 2 lata temu ( 2020-05-08 )
Napisane w C++
System operacyjny

Linux macOS (nie w pełni przetestowany) Windows (nie w pełni przetestowany)
Platforma x86_64
Dostępne w język angielski
Typ Genetyka
Licencja
GPL v3 (kod źródłowy) MIT (pliki wykonywalne)
Strona internetowa cnsgenomics.com/oprogramowanie/gcta/ _ _ _ _
od 8 kwietnia 2021 r

Oryginalny pakiet oprogramowania „GCTA” jest najczęściej używany; jego podstawowa funkcjonalność obejmuje oszacowanie dziedziczenia SNP w GREML, ale zawiera inne funkcje:

  • Oszacuj związek genetyczny z SNP całego genomu;
  • Oszacuj współczynnik chowu wsobnego z SNP całego genomu;
  • Oszacuj wariancję wyjaśnioną przez wszystkie autosomalne SNP;
  • Podziel wariancję genetyczną na poszczególne chromosomy;
  • Oszacuj zmienność genetyczną związaną z chromosomem X;
  • Zbadanie wpływu kompensacji dawki na zmienność genetyczną chromosomu X ;
  • Przewidywanie addytywnych efektów genetycznych w całym genomie dla poszczególnych osób i poszczególnych SNP;
  • Oszacuj strukturę LD obejmującą listę docelowych SNP;
  • Symuluj dane GWAS na podstawie zaobserwowanych danych genotypowych;
  • Konwertuj surowe dane genotypu Illumina na format PLINK ;
  • Warunkowa i łączna analiza statystyk podsumowujących GWAS bez danych genotypowych na poziomie indywidualnym
  • Szacowanie korelacji genetycznej między dwiema cechami (chorobami) przy użyciu danych SNP
  • analiza asocjacji modeli liniowych

Inne implementacje i warianty algorytmów obejmują:

Cechy

Szacunki GCTA często znajdują szacunki 0,1-0,5, zgodne z szeroko rozumianymi szacunkami dziedziczności (z wyjątkiem cech osobowości, dla których teoria i aktualne wyniki GWAS sugerują genetykę nieaddytywną napędzaną przez selekcję zależną od częstotliwości ). Cechy, na których zastosowano jednowymiarową GCTA (z wyłączeniem oszacowań odziedziczalności SNP obliczonych przy użyciu innych algorytmów, takich jak regresja wyniku LD i dwuwymiarowe GCTA, które są wymienione w korelacji genetycznej ) obejmują (format oszacowania punktowego: „ ( błąd standardowy )"):

Zobacz też

  1. ^ Ryc. 3 z Yang i in. 2010 lub Ryc. 3 z Ritland & Ritland 1996
  2. ^ „Genetyczny wkład w stabilność i zmianę inteligencji od dzieciństwa do starości” , Deary i in. 2012
  3. ^ Lee i wsp. 2012, „Oszacowanie plejotropii między złożonymi chorobami przy użyciu zależności genomowych pochodzących z polimorfizmu pojedynczego nukleotydu i ograniczonego maksymalnego prawdopodobieństwa”
  4. ^     Kryszna Kumar, Siddharth; Feldman, Marcus W.; Rehkopf, David H.; Tuljapurkar, Shripad (2016-01-05). „Ograniczenia GCTA jako rozwiązanie brakującego problemu dziedziczności” . Proceedings of the National Academy of Sciences of the United States of America . 113 (1): E61–70. Bibcode : 2016PNAS..113E..61K . doi : 10.1073/pnas.1520109113 . ISSN 1091-6490 . PMC 4711841 . PMID 26699465 .
  5. Bibliografia _ SIMONS, RONALD L. (luty 2015). „Badania nad dziedziczeniem w erze postgenomicznej: fatalna wada jest konceptualna”. Kryminologia . 53 (1): 103–112. doi : 10.1111/1745-9125.12060 .
  6. Bibliografia     _ Ratanatharathorn, A.; Aiello, AE; Almli, LM; Amstadter, AB; Ashley-Koch, AE; Baker, DG; Beckham, JC; Bierut, LJ (marzec 2018). „Największy GWAS PTSD (N = 20 070) daje genetyczne nakładanie się na schizofrenię i różnice między płciami w dziedziczności” . Psychiatria molekularna . 23 (3): 666–673. doi : 10.1038/mp.2017.77 . ISSN 1476-5578 . PMC 5696105 . PMID 28439101 . „Częstym błędnym przekonaniem na temat szacunków odziedziczalności chipów SNP obliczonych za pomocą GCTA i LDSC jest to, że powinny one być podobne do szacunków z badań bliźniaczych, podczas gdy w rzeczywistości badania bliźniacze mają tę zaletę, że wychwytują wszystkie efekty genetyczne – powszechne, rzadkie i te, których nie genotypowano dostępnymi metodami Tak więc założenie powinno być takie, że h2SNP < h2TWIN przy użyciu GCTA i LDSC, i to właśnie obserwujemy w przypadku PTSD, jak zaobserwowano w przypadku wielu innych fenotypów.
  7. ^ Eric Turkheimer ( „Still Missing” , Turkheimer 2011) omawia wyniki GCTA w kontekście debaty na temat badań nad bliźniakami: uniwersalność dziedziczenia i brak mechanizmu – nowy paradygmat położył kres pierwszemu i zanim będę dalej wyjaśniał mój sceptycyzm co do tego, czy najważniejsze problemy zostały rozwiązane, warto docenić, jak znaczące jest to osiągnięcie. programu badawczego Visschera, nie powinno być obecnie argumentu, że cały zbiór ilościowych badań genetycznych wykazujących uniwersalne znaczenie genów dla rozwoju człowieka był w jakiś sposób oparty na optymistycznym poglądzie na założenie równych środowisk w badaniach bliźniąt, kładąc kres cała błędna szkoła myślenia wśród tradycyjnych przeciwników klasycznej genetyki ilościowej (i przez asocjację behawioralną) (np. Joseph, 2010; Kamin i Goldberger, 2002)”; zob. także Turkheimer, Harden i Nisbett : „Metody te dały naukowcom nowy sposób obliczania dziedziczności: badania, które bezpośrednio mierzą zmienność sekwencji DNA, wykazały, że pary ludzi, którzy nie są spokrewnieni, ale są nieco bardziej podobne genetycznie, mają też bardziej podobne IQ niż inne pary ludzi, którzy są bardziej różni genetycznie. Te „oparte na DNA” badania dziedziczności nie mówią dużo więcej niż klasyczne badania bliźniąt, ale rozwiewają wiele utrzymujących się podejrzeń, że badania bliźniąt były w jakiś sposób fundamentalnie wadliwe. Podobnie jak ważność testów inteligencji, dziedziczność inteligencji nie jest już naukowo kontrowersyjna”.
  8. ^ „To odkrycie silnej plejotropii całego genomu w różnych zdolnościach poznawczych i uczenia się, indeksowane przez ogólną inteligencję, jest głównym odkryciem dotyczącym pochodzenia indywidualnych różnic w inteligencji. Niemniej jednak wydaje się, że odkrycie to miało niewielki wpływ na pokrewne dziedziny, takie jak neuronaukę kognitywną lub eksperymentalną psychologię poznawczą.Sugerujemy, że jednym z powodów tego zaniedbania jest to, że dziedziny te na ogół ignorują różnice indywidualne.65,66 zawsze były obawy co do niektórych jego założeń;6 sądzimy, że zmieni się to teraz, gdy GCTA zaczyna potwierdzać bliźniacze wyniki”. -- „Genetyka i różnice w inteligencji: pięć specjalnych ustaleń” , Plomin & Deary 2015
  9. Bibliografia _ _ porównuje się przez adopcję.Chociaż projekty bliźniąt i adopcji były krytykowane oddzielnie (Plomin i in., 2013), te dwa projekty generalnie zbiegają się do tego samego wniosku, mimo że opierają się na bardzo różnych założeniach, co dodaje sił tym wnioskom... GCTA nie docenia wpływu genetycznego z kilku powodów i wymaga próbek kilku tysięcy osobników, aby ujawnić niewielki sygnał przypadkowego podobieństwa genetycznego z szumu różnic DNA w całym genomie (Vinkhuyzen, Wray, Yang, Goddard i Visscher, 2013). konsekwentnie dostarcza dowodów na znaczący wpływ genetyczny na zdolności poznawcze (Benyamin i in., 2014; Davies i in., 2015; St. Pourcain i in., 2014), psychopatologia (LK Davis i in., 2013; Gaugler i in., 2014; Klei i in., 2012; Lubke i in., 2012, 2014; McGue i in., 2013; Ripke i in., 2013; Wray i in., 2014), osobowości (CA Rietveld, Cesarini i in., 2013; Verweij i in., 2012; Vinkhuyzen i in., 2012) oraz używania substancji lub uzależnienia od narkotyków (Palmer i in., 2015; Vrieze, McGue, Miller, Hicks i Iacono, 2013), potwierdzając w ten sposób wyniki badań bliźniąt i adopcji”.
  10. ^ patrz także Ritland 1996b, „Estymatory pokrewieństwa parami i indywidualne współczynniki chowu wsobnego” ; Ritland & Ritland 1996, „Wnioski o dziedziczeniu ilościowym na podstawie naturalnej struktury populacji małpy żółtej, Mimulus guttatus ; Lynch & Ritland 1999, "Oszacowanie parami pokrewieństwa z markerami molekularnymi" ; Ritland 2000, „Pokrewieństwo wywnioskowane z markerów jako narzędzie do wykrywania dziedziczności w przyrodzie” ; Thomas 2005, „Oszacowanie zależności genetycznych za pomocą markerów molekularnych i ich skuteczności w szacowaniu odziedziczalności w populacjach naturalnych”
  11. ^ Visscher i in. 2006, „Oszacowanie dziedziczności bez założeń na podstawie dzielenia tożsamości według pochodzenia między pełnym rodzeństwem w całym genomie”
  12. ^ Visscher i wsp. 2007, „Podział genomu zmienności genetycznej na wzrost z 11 214 par rodzeństwa”
  13. ^ „Wspólne SNP wyjaśniają dużą część odziedziczalności wzrostu człowieka” , Yang i in. 2010
  14. ^ Komentarz do„ Wspólnych SNP wyjaśnia dużą część dziedziczności wzrostu człowieka ”Yang i in. (2010)” , Visscher i in.
  15. ^ „Definiowanie roli wspólnej zmienności w genomowej i biologicznej architekturze wzrostu dorosłego człowieka” , Wood i in. 2014
  16. ^ „GCTA: narzędzie do analizy złożonych cech całego genomu” , Yang i in. 2011
  17. ^ „Metaanaliza dziedziczności cech ludzkich na podstawie pięćdziesięciu lat badań nad bliźniakami” , Polderman i in. 2015
  18. Bibliografia   _ Wright, Jan Paweł; Boutwell, Brian B.; Schwartz, Joseph A.; Connolly, Eric J.; Nedelec, Joseph L.; Bóbr, Kevin M. (2014-11-01). „Wykazanie ważności badań bliźniaczych w kryminologii” . Kryminologia . 52 (4): 588–626. doi : 10.1111/1745-9125.12049 . ISSN 1745-9125 .
  19. Bibliografia _ obecne mikromacierze SNP, ponieważ istnieje wiele zmienności DNA, które nie są wychwycone przez te SNP. W rezultacie GCTA nie może oszacować całej odziedziczalności, być może tylko około połowy odziedziczalności. Pierwsze raporty z analiz GCTA szacują, że odziedziczalność wynosi około połowy szacunków odziedziczalności z bliźniąt oraz badania adopcyjne pod kątem wzrostu (Lee, Wray, Goddard i Visscher, 2011; Yang i in., 2010; Yang, Manolio i in., 2011) oraz inteligencji (Davies i in., 2011).” str. 110, Genetyka behawioralna , Plomin i in. 2012
  20. ^ „Metaanaliza wyników GREML z wielu kohort” , Yang 2015
  21. ^ „Analiza odziedziczalności całego zjawiska w brytyjskim biobanku” , Ge i in. 2016
  22. ^ Pasaniuc & Price 2016, „Analiza genetyki złożonych cech za pomocą podsumowujących statystyk asocjacyjnych”
  23. ^ „Regresja wyniku LD odróżnia zakłócenia od poligeniczności w badaniach asocjacyjnych całego genomu” , Bulik-Sullivan i in. 2015
  24. ^ „LD Hub: scentralizowana baza danych i interfejs sieciowy do regresji wyniku LD, który maksymalizuje potencjał danych GWAS na poziomie podsumowania dla analizy dziedziczności SNP i korelacji genetycznej” , Zheng i in.
  25. ^ „Kontrastowanie architektury genetycznej 30 złożonych cech na podstawie podsumowujących danych asocjacyjnych” , Shi i in. 2016
  26. ^ „Szybka i dokładna konstrukcja przedziałów ufności dla dziedziczności” , Schweiger i in. 2016
  27. ^ „Architektura złożonych cech ludzkich zależna od nierównowagi sprzężeń pokazuje działanie selekcji negatywnej” , Gazal i in. 2017
  28. ^ „Głębokie sekwencjonowanie 10 000 ludzkich genomów” , Telenti 2015
  29. ^ „Haplotypy powszechnych SNP mogą wyjaśnić brakującą dziedziczność złożonych chorób” , Bhatia i in. 2015
  30. Bibliografia _ _
  31. ^ Hill i wsp. 2017, „Analiza genomowa danych rodzinnych ujawnia dodatkowy wpływ genetyczny na inteligencję i osobowość”
  32. ^ Evans i wsp. 2017, „Porównanie metod wykorzystujących dane całego genomu do oszacowania odziedziczalności i architektury genetycznej złożonych cech”
  33. ^ Metody metaanalizy: korygowanie błędów i stronniczości w wynikach badań , Hunter & Schmidt 2004
  34. ^ a b c d e „Dokument GCTA” . cnsgenomics.com . Źródło 2021-04-08 .
  35. ^ „Szybkie liniowe modele mieszane do badań asocjacyjnych całego genomu” , Lippert 2011
  36. ^ „Ulepszone liniowe modele mieszane do badań asocjacyjnych całego genomu” , Listgarten i in. 2012
  37. ^ „Zalety i pułapki w stosowaniu metod asocjacji modeli mieszanych” , Yang i in. 2014
  38. ^ „Mieszany model z wieloma znacznikami lasso do mapowania asocjacji z korektą struktury populacji” , Rakitsch i in. 2012
  39. ^ „Wydajna analiza modelu mieszanego całego genomu do badań asocjacyjnych” , Zhou & Stephens 2012
  40. ^ „Model składowych wariancji w celu uwzględnienia struktury próbki w badaniach asocjacyjnych całego genomu” , Kang i in. 2012
  41. ^ „Zaawansowana analiza cech złożonych” , Gray i in. 2012
  42. ^ „Zaawansowana złożona analiza cech dziedziczenia regionalnego dla GPU i tradycyjnej architektury równoległej” , Cebamanos i in. 2012
  43. ^ „Wydajna analiza mieszanego modelu Bayesa zwiększa siłę asocjacji w dużych kohortach” , Loh i in. 2012
  44. ^ „Kontrastujące architektury genetyczne schizofrenii i innych złożonych chorób przy użyciu szybkiej analizy składników wariancji” , Loh i in. 2015; patrz także „Kontrastowanie regionalnych architektur schizofrenii i innych złożonych chorób za pomocą analizy szybkich składników wariancji” , Loh i in. 2015
  45. ^ „Mieszane modele do metaanalizy i sekwencjonowania” , Bulik-Sullivan 2015
  46. ^ „Masowo przyspieszona analiza dziedziczności całego genomu (MEGHA)” , Ge i in. 2015
  47. ^ Speed ​​i wsp. 2016, „Ponowna ocena odziedziczalności SNP w złożonych cechach ludzkich”
  48. ^ Evans i in. 2017, „Oszacowanie dziedziczności złożonych cech w wąskim sensie przy użyciu informacji o tożsamości według pochodzenia”.
  49. ^ „Utrzymanie zmienności genetycznej osobowości człowieka: testowanie modeli ewolucyjnych poprzez oszacowanie dziedziczności ze względu na wspólne warianty przyczynowe i badanie wpływu chowu wsobnego na odległość” , Verweij i in.
  50. ^ „Ewolucyjna genetyka osobowości” , Penke i in. 2007; „Ponowna wizyta w ewolucyjnej genetyce osobowości” , Penke i Jokela 2016

Dalsza lektura

Linki zewnętrzne