Korelacja genetyczna
W wielowymiarowej genetyce ilościowej korelacja genetyczna (oznaczana ) proporcja , cechy z przyczyn genetycznych , korelacja między wpływów genetycznych na cechę i wpływów genetycznych na inną cechę oceniających stopień plejotropii lub nakładanie się przyczyn. Korelacja genetyczna równa 0 oznacza, że wpływ genetyczny na jedną cechę jest niezależny od drugiej, podczas gdy korelacja równa 1 oznacza, że wszystkie wpływy genetyczne na dwie cechy są identyczne. Dwuwymiarową korelację genetyczną można uogólnić do wnioskowania o genetycznych ukrytych czynnikach zmiennych dla > 2 cech przy użyciu analizy czynnikowej . Modele korelacji genetycznych zostały wprowadzone do genetyki behawioralnej w latach 70. – 80. XX wieku.
Korelacje genetyczne mają zastosowanie w walidacji wyników badań asocjacyjnych całego genomu (GWAS), hodowli, przewidywaniu cech i odkrywaniu etiologii cech i chorób.
Można je oszacować na podstawie danych na poziomie indywidualnym z badań bliźniąt i genetyki molekularnej, a nawet zbiorczych statystyk GWAS. Stwierdzono, że korelacje genetyczne są powszechne w genetyce innej niż człowiek i są zasadniczo podobne do ich odpowiednich korelacji fenotypowych, a także często występują w cechach ludzkich, zwanych „fenomem”.
To odkrycie powszechnej plejotropii ma implikacje dla sztucznej selekcji w rolnictwie, interpretacji korelacji fenotypowych, nierówności społecznych, prób zastosowania randomizacji mendlowskiej we wnioskowaniu przyczynowym, zrozumienia biologicznego pochodzenia złożonych cech oraz projektowania GWAS.
Korelację genetyczną należy przeciwstawić korelacji środowiskowej między środowiskami wpływającymi na dwie cechy (np. jeśli złe odżywianie w gospodarstwie domowym spowodowało zarówno niższy IQ, jak i wzrost); korelacja genetyczna między dwiema cechami może przyczynić się do obserwowanej ( fenotypowej ) korelacji między dwiema cechami, ale korelacje genetyczne mogą być również przeciwne obserwowanym korelacjom fenotypowym, jeśli korelacja środowiskowa jest wystarczająco silna w innym kierunku, być może z powodu kompromisów lub specjalizacji. Obserwacja, że korelacje genetyczne zwykle odzwierciedlają korelacje fenotypowe, jest znana jako „ Hipoteza Cheveruda ” i została potwierdzona u zwierząt i ludzi oraz wykazała, że są one podobnej wielkości; na przykład w brytyjskim Biobanku ze 118 ciągłych cech ludzkich tylko 29% ich wzajemnych korelacji ma przeciwne znaki, a późniejsza analiza 17 wysokiej jakości cechy UKBB wykazały korelację bliską jedności.
Interpretacja
Korelacje genetyczne to nie to samo, co dziedziczność , ponieważ chodzi o nakładanie się dwóch zestawów wpływów, a nie o ich bezwzględną wielkość; dwie cechy mogą być wysoce dziedziczne, ale nie być skorelowane genetycznie lub mieć niewielką dziedziczność i być całkowicie skorelowane (o ile dziedziczności są niezerowe).
Rozważmy na przykład dwie cechy – ciemną skórę i czarne włosy. Te dwie cechy mogą indywidualnie wykazywać bardzo wysoką dziedziczność (większość zmienności cechy na poziomie populacji wynika z różnic genetycznych lub, mówiąc prościej, genetyka ma znaczący udział w tych dwóch cechach), jednak nadal mogą mieć bardzo niski poziom genetyczny korelacji, gdyby na przykład te dwie cechy były kontrolowane przez różne, nienakładające się, niepowiązane loci genetyczne.
Korelacja genetyczna między dwiema cechami będzie miała tendencję do tworzenia korelacji fenotypowych – np. korelacja genetyczna między inteligencją a SES lub wykształceniem a rodziną SES implikuje, że inteligencja/SES będzie również skorelowana fenotypowo. Korelacja fenotypowa będzie ograniczona stopniem korelacji genetycznej, a także dziedzicznością każdej cechy. Oczekiwana korelacja fenotypowa to dziedziczność dwuwymiarowa” i można go obliczyć jako pierwiastki kwadratowe dziedziczności pomnożone przez korelację genetyczną. (Korzystając z Plomina, dla dwóch cech o dziedziczności 0,60 i 0,23, korelacji fenotypowej dwuwymiarowa wyniosłaby , więc z obserwowanej korelacji fenotypowej 0,28/0,45 = 62% wynika z genetyki.)
Przyczyna
Korelacje genetyczne mogą powstać z powodu:
- nierównowaga sprzężeń (dwa sąsiednie geny są zwykle dziedziczone razem, każdy wpływa na inną cechę)
- biologiczna plejotropia (pojedynczy gen mający wiele niezwiązanych ze sobą efektów biologicznych lub wspólna regulacja wielu genów)
- pośredniczona plejotropia (gen powoduje cechę X , a cecha X powoduje cechę Y ).
- uprzedzenia: stratyfikacja populacji, taka jak pochodzenie lub kojarzenie selektywne (czasami nazywane „nierównowagą fazy gamet”), fałszywa stratyfikacja, taka jak błąd ustalenia / samoselekcja lub paradoks Berksona lub błędna klasyfikacja diagnoz
Używa
Przyczyny zmian cech
Korelacje genetyczne są przydatne naukowo, ponieważ korelacje genetyczne można analizować w czasie w obrębie jednostki podłużnie (np. Inteligencja jest stabilna przez całe życie, z powodu tych samych wpływów genetycznych - dzieciństwo genetycznie koreluje r sol = 0.62 {\displaystyle r_{ ze starością) lub między badaniami, populacjami lub grupami/rasami etnicznymi [ potrzebne źródło ] , lub w poprzek diagnoz, umożliwiając odkrycie, czy różne geny wpływają na cechę w ciągu życia (zwykle nie), czy różne geny wpływają na cechę w różnych populacjach z powodu różnych lokalnych środowisk, czy istnieje heterogeniczność choroby w różnych czasach lub miejscach lub płeć (zwłaszcza w przypadku diagnoz psychiatrycznych istnieje niepewność, czy „autyzm” lub „schizofrenia” jednego kraju jest taka sama jak w innym kraju, czy też kategorie diagnostyczne zmieniły się w czasie/miejscu, prowadząc do różnych poziomów błędu ustalenia ) oraz do jakiego stopnia cechy, takie jak zaburzenia autoimmunologiczne lub psychiatryczne lub funkcje poznawcze, są w znaczący sposób skupione ze względu na wspólną podstawę biologiczną i architekturę genetyczną (na przykład trudności w czytaniu i matematyce są genetycznie skorelowane, zgodnie z ogólną hipotezą genów , i te korelacje genetyczne wyjaśniają obserwowane korelacje fenotypowe lub „współchorobowość”; IQ i specyficzne miary wydajności poznawczej, takie jak zadania werbalne , przestrzenne i pamięciowe, czas reakcji , pamięć długotrwała , funkcje wykonawcze itp. wszystkie wykazują wysokie korelacje genetyczne, podobnie jak pomiary neuroanatomiczne [ potrzebne źródło ] , a korelacje mogą wzrastać wraz z wiekiem, co ma wpływ na etiologię i naturę inteligencji) [ potrzebne źródło ] . Może to stanowić istotne ograniczenie dla konceptualizacji tych dwóch cech: cechy, które wydają się różne fenotypowo , ale które mają wspólną podstawę genetyczną, wymagają wyjaśnienia, w jaki sposób te geny mogą wpływać na obie cechy.
Wzmacnianie GWAS
Korelacje genetyczne można wykorzystać w GWAS , wykorzystując wyniki poligeniczne lub trafienia w całym genomie dla jednej (często łatwiejszej do zmierzenia) cechy, aby zwiększyć wcześniejsze prawdopodobieństwo wariantów drugiej cechy; na przykład, ponieważ inteligencja i lata edukacji są silnie skorelowane genetycznie, GWAS dla edukacji będzie z natury również GWAS dla inteligencji i będzie w stanie również przewidzieć wariancję inteligencji, a najsilniejszych kandydatów na SNP można wykorzystać do zwiększenia mocy statystycznej mniejszego GWAS, przeprowadzono połączoną analizę ukrytej cechy, w której każda mierzona genetycznie skorelowana cecha pomaga zmniejszyć błąd pomiaru i znacznie zwiększa moc GWAS (np. Krapohl i in. 2017, używając elastycznej sieci i wielu wyników poligenicznych, poprawiając przewidywanie inteligencji z 3,6% wariancji do 4,8%; Hill i wsp. 2017b używają MTAG, aby połączyć cechy wykształcenia obciążone 3 g , dochód gospodarstwa domowego i wynik testu poznawczego, aby znaleźć 107 trafień i podwaja moc predykcyjną inteligencji) lub można zrobić GWAS dla wielu cech łącznie.
Korelacje genetyczne mogą również określać ilościowo udział korelacji <1 w zbiorach danych, co może powodować fałszywą „ brakującą dziedziczność ”, poprzez oszacowanie stopnia, w jakim różne metody pomiaru, wpływy przodków lub środowiska tworzą tylko częściowo nakładające się zestawy odpowiednich wariantów genetycznych.
Hodowla
Bezwłose psy mają niedoskonałe zęby; zwierzęta długowłose i szorstkowłose mają skłonność do posiadania, jak się twierdzi, długich lub wielu rogów; gołębie z pierzastymi łapami mają skórę między zewnętrznymi palcami; gołębie z krótkim dziobem mają małe stopy, a te z długimi dziobami duże stopy. Dlatego też, jeśli człowiek będzie wybierał, a tym samym powiększał jakąś osobliwość, prawie na pewno będzie modyfikował nieumyślnie inne części struktury, dzięki tajemniczym prawom korelacji.
— Charles Darwin , O powstawaniu gatunków , 1859
Korelacje genetyczne są również przydatne w stosowanych kontekstach, takich jak hodowla roślin / zwierząt , umożliwiając zastąpienie łatwiejszych do zmierzenia, ale silnie skorelowanych genetycznie cech (szczególnie w przypadku cech sprzężonych z płcią lub cech binarnych w ramach modelu progu odpowiedzialności , gdzie różnice w fenotypie rzadko można zaobserwować, ale inną wysoce skorelowaną miarę, być może endofenotyp , jest dostępny dla wszystkich osobników), kompensując inne środowiska niż te, w których prowadzono hodowlę, dokonując dokładniejszych prognoz wartości hodowlanej przy użyciu wielowymiarowego równania hodowcy w porównaniu z przewidywaniami opartymi na jednowymiarowym równaniu hodowcy przy użyciu wyłącznie odziedziczalności na podstawie cechy i zakładając niezależność cech i unikanie nieoczekiwanych konsekwencji poprzez wzięcie pod uwagę, że sztuczna selekcja na/przeciw cechie X również zwiększy/zmniejszy wszystkie cechy, które pozytywnie/negatywnie korelują z X . Granice selekcji wyznaczone przez interkorelację cech oraz możliwość zmiany korelacji genetycznych w długoterminowych programach hodowlanych prowadzą do dylematu Haldane'a ograniczającego intensywność selekcji, a tym samym postęp.
Eksperymenty hodowlane na genetycznie skorelowanych cechach mogą mierzyć stopień, w jakim skorelowane cechy są z natury powiązane rozwojowo i odpowiedź jest ograniczona, a które można oddzielić. Niektóre cechy, takie jak wielkość plamek ocznych u motyla Bicyclus anynana, można rozdzielić podczas rozmnażania, ale inne pary, takie jak kolory plamek ocznych, opierały się wysiłkom.
Definicja matematyczna
Mając genetyczną macierz kowariancji, korelację genetyczną oblicza się poprzez standaryzację , tj. poprzez przekształcenie macierzy kowariancji w macierz korelacji. Ogólnie rzecz biorąc, jeśli jest genetyczną macierzą kowariancji i { . Dla danej kowariancji genetycznej między dwiema cechami, jedną z wariancją genetyczną a drugą z wariancją genetyczną , korelacja genetyczna jest obliczana w taki sam sposób, jak współczynnik korelacji .
Obliczanie korelacji genetycznej
Korelacje genetyczne wymagają próbki zawierającej informacje genetyczne. Można je oszacować w eksperymentach hodowlanych na dwóch cechach o znanej dziedziczności i selekcji jednej cechy w celu zmierzenia zmiany drugiej cechy (pozwalając na wywnioskowanie korelacji genetycznej), badaniach rodziny / adopcji / bliźniaków (analizowanych za pomocą SEM lub analizy ekstremów DeFriesa - Fulkera ), molekularne oszacowanie pokrewieństwa, takie jak GCTA , metody wykorzystujące wyniki poligeniczne, takie jak HDL (High-Definition Likelihood), regresja wyniku LD, BOLT-REML, CPBayes lub HESS, porównanie trafień SNP w całym genomie w GWAS (jako luźna dolna granica) i korelacje fenotypowe populacji z przynajmniej kilka spokrewnionych osób.
Podobnie jak w przypadku szacowania odziedziczalności SNP i korelacji genetycznej, lepsze skalowanie obliczeniowe i możliwość oszacowania przy użyciu tylko ustalonych sumarycznych statystyk asocjacyjnych jest szczególną zaletą regresji wyników HDL i LD w porównaniu z konkurencyjnymi metodami. W połączeniu z rosnącą dostępnością podsumowujących statystyk GWAS lub wyników poligenicznych ze zbiorów danych, takich jak UK Biobank , takie metody na poziomie podsumowania doprowadziły do eksplozji badań korelacji genetycznych od 2015 r. [ Potrzebne źródło ]
Metody są powiązane z regresją Hasemana-Elstona i regresją PCGC. Takie metody obejmują zazwyczaj cały genom, ale możliwe jest również oszacowanie korelacji genetycznych dla określonych wariantów lub regionów genomu.
Jednym ze sposobów rozważenia tego jest użycie cechy X u bliźniaka 1 do przewidywania cechy Y u bliźniaka 2 dla bliźniąt monozygotycznych i dwuzygotycznych (tj. wykorzystanie IQ bliźniaka 1 do przewidywania objętości mózgu bliźniaka 2); jeśli ta korelacja krzyżowa jest większa w przypadku bardziej podobnych genetycznie bliźniąt jednojajowych niż w przypadku bliźniąt dwuzygotycznych, podobieństwo wskazuje, że cechy nie są genetycznie niezależne i istnieje pewna wspólna genetyka wpływająca zarówno na IQ, jak i objętość mózgu. (Moc statystyczną można zwiększyć, używając rodzeństwa).
Na korelacje genetyczne wpływają obawy metodologiczne; niedoszacowanie odziedziczalności, na przykład z powodu kojarzenia selektywnego , doprowadzi do przeszacowania podłużnej korelacji genetycznej, a umiarkowany poziom błędnych diagnoz może tworzyć pseudokorelacje.
Ponieważ mają na nie wpływ dziedziczności obu cech, korelacje genetyczne mają niską moc statystyczną, zwłaszcza w przypadku błędów pomiaru odchylających dziedziczność w dół, ponieważ „szacunki korelacji genetycznych są zwykle obarczone dość dużymi błędami próbkowania, a zatem rzadko są bardzo dokładne”: błąd oszacowania wynosi . (Większe korelacje genetyczne i dziedziczności zostaną oszacowane dokładniej.) Jednak włączenie korelacji genetycznych do analizy cechy plejotropowej może zwiększyć moc z tego samego powodu, dla którego regresje wielowymiarowe są silniejsze niż oddzielne regresje jednowymiarowe.
Metody bliźniacze mają tę zaletę, że można ich używać bez szczegółowych danych biologicznych, z korelacjami genetycznymi człowieka obliczonymi już w latach 70. XX wieku i korelacjami genetycznymi zwierząt/roślin obliczonymi w latach 30. mają tę wadę, że przyjmują założenia, które były krytykowane, aw przypadku rzadkich cech, takich jak jadłowstręt psychiczny, znalezienie wystarczającej liczby bliźniaków z diagnozą, aby dokonać sensownych porównań między bliźniakami, może być trudne, i można je oszacować tylko z dostępem do bliźniaka dane; metody genetyki molekularnej, takie jak regresja wyniku GCTA lub LD, mają tę zaletę, że nie wymagają określonego stopnia pokrewieństwa, dzięki czemu można łatwo badać rzadkie cechy za pomocą kontroli przypadku , które również zmniejszają liczbę założeń, na których się opierają, ale metody te nie mogły być uruchomione do niedawna, wymagają dużych rozmiarów próbek w tysiącach lub setkach tysięcy (aby uzyskać dokładne oszacowania odziedziczalności SNP, patrz wzór na błąd standardowy ), może wymagać danych genetycznych na poziomie indywidualnym (w przypadku GCTA, ale nie regresji wyniku LD).
Mówiąc dokładniej, jeśli dwie cechy, powiedzmy wzrost i waga, mają następującą addytywną macierz wariancji genetycznej-kowariancji:
Wysokość | Waga | |
Wysokość | 36 | 36 |
Waga | 36 | 117 |
Wtedy korelacja genetyczna wynosi 0,55, jak widać na poniższej znormalizowanej macierzy:
Wysokość | Waga | |
Wysokość | 1 | |
Waga | 0,55 | 1 |
W praktyce aplikacje do modelowania równań strukturalnych, takie jak Mx lub OpenMx (a wcześniej historycznie LISREL ) są używane do obliczania zarówno genetycznej macierzy kowariancji, jak i jej znormalizowanej postaci. W R cov2cor () standaryzuje macierz.
Zazwyczaj publikowane raporty dostarczają składników wariancji genetycznej, które zostały wystandaryzowane jako odsetek całkowitej wariancji (na przykład w modelu badania bliźniąt ACE znormalizowany jako odsetek V-total = A+C+E). W takim przypadku metryka do obliczania kowariancji genetycznej (wariancja w macierzy kowariancji genetycznej) jest tracona (z powodu procesu standaryzacji), więc nie można łatwo oszacować genetycznej korelacji dwóch cech z takich opublikowanych modeli. Modele wielowymiarowe (takie jak rozkład Cholesky'ego [ potrzebne lepsze źródło ] ) pozwoli jednak widzowi zobaczyć wspólne efekty genetyczne (w przeciwieństwie do korelacji genetycznej) poprzez przestrzeganie reguł ścieżki. Dlatego ważne jest podawanie w publikacjach niestandaryzowanych współczynników ścieżki.
Zobacz też
- Korelacja gen-środowisko
- Dziedziczność inteligencji ; współczynnik g (psychometria)
- Epidemiologia poznawcza
- Badania kohorty urodzeniowej Lothian
- Randomizacja mendlowska
Cytowane źródła
- Sokolnik, Douglas Scott (1960). Wprowadzenie do genetyki ilościowej .
-
Plomin, Robert; DeFries, John C.; Knopik, Valerie S. i Neiderhiser, Jenae M. (2012). Genetyka behawioralna . ISBN 978-1-4292-4215-8 .
{{ cite book }}
: CS1 maint: wiele nazwisk: lista autorów ( link )
Linki zewnętrzne
- G-matrix Online zarchiwizowane 18.09.2016 w Wayback Machine