Randomizacja mendlowska

W epidemiologii randomizacja mendlowska (powszechnie w skrócie MR) to metoda wykorzystująca zmierzone zróżnicowanie genów do zbadania przyczynowego wpływu narażenia na wynik . Zgodnie z kluczowymi założeniami (patrz poniżej), projekt ogranicza zarówno odwrotną przyczynowość, jak i zakłócenia, które często znacznie utrudniają lub wprowadzają w błąd w interpretacji wyników badań epidemiologicznych.

Gregor Mendel
Grzegorz Mendel. Termin randomizacja mendlowska został nazwany, ponieważ losowe przypisanie wariantów genetycznych od rodziców do potomstwa ma fundamentalne znaczenie dla tej metody.

Projekt badania został po raz pierwszy zaproponowany w 1986 r., a następnie opisany przez Graya i Wheatleya jako metoda uzyskiwania bezstronnych szacunków wpływu przypuszczalnej zmiennej przyczynowej bez przeprowadzania tradycyjnego badania z randomizacją (tj. „złotego standardu ” w epidemiologii ustalania przyczynowości) . Autorzy ci ukuli również termin randomizacja mendlowska .

Motywacja

Jednym z głównych celów epidemiologii jest identyfikacja modyfikowalnych przyczyn skutków zdrowotnych i chorób, zwłaszcza tych, które dotyczą zdrowia publicznego . Aby stwierdzić, czy modyfikacja określonej cechy (np. poprzez interwencję, leczenie lub zmianę polityki) przyniesie korzystny efekt w populacji, wymagane są niezbite dowody na to, że ta cecha powoduje wynik będący przedmiotem zainteresowania. Jednak wiele projektów obserwacyjnych badań epidemiologicznych ma ograniczoną zdolność odróżniania korelacji od związku przyczynowego - w szczególności, czy dana cecha powoduje interesujący wynik, jest po prostu związana z tym wynikiem (ale go nie powoduje) lub jest konsekwencją samego wyniku . Tylko ta pierwsza będzie korzystna w warunkach zdrowia publicznego, gdzie celem jest modyfikacja tej cechy w celu zmniejszenia obciążenia chorobami. Istnieje wiele projektów badań epidemiologicznych, których celem jest zrozumienie relacji między cechami w próbie populacji, z których każdy ma wspólne i unikalne zalety i ograniczenia w zakresie dostarczania dowodów przyczynowych, przy czym „złotym standardem” jest randomizowane kontrolowane próby .

Dobrze znane udane demonstracje dowodów przyczynowych spójne w wielu badaniach z różnymi projektami obejmują zidentyfikowane związki przyczynowe między paleniem a rakiem płuc oraz między ciśnieniem krwi a udarem. Jednak zdarzały się również godne uwagi niepowodzenia, gdy ekspozycje, które przypuszczalnie były przyczynowym czynnikiem ryzyka dla określonego wyniku, zostały później wykazane w dobrze przeprowadzonych randomizowanych kontrolowanych badaniach, które nie były przyczynowe. Na przykład wcześniej uważano, że hormonalna terapia zastępcza zapobiega chorobom układu krążenia , ale obecnie wiadomo, że nie przynosi ona takich korzyści, a nawet może niekorzystnie wpływać na zdrowie. Innym godnym uwagi przykładem jest selen i rak prostaty. Niektóre badania obserwacyjne wykazały związek między wyższymi poziomami krążącego selenu (zwykle nabywanego przez różne pokarmy i suplementy diety) a niższym ryzykiem raka prostaty. Jednak badanie Selenium and Vitamin E Cancer Prevention Trial (SELECT) wykazało dowody na to, że suplementacja selenu w diecie faktycznie zwiększała ryzyko raka prostaty i zaawansowanego raka prostaty oraz miała dodatkowy, nieoczekiwany wpływ na zwiększenie ryzyka cukrzycy typu 2.

Takie niespójności między obserwacyjnymi badaniami epidemiologicznymi a randomizowanymi kontrolowanymi badaniami są prawdopodobnie funkcją społecznych, behawioralnych lub fizjologicznych czynników zakłócających w wielu obserwacyjnych projektach epidemiologicznych, które są szczególnie trudne do dokładnego zmierzenia i trudne do kontrolowania. Ponadto badania z randomizacją są zazwyczaj kosztowne, czasochłonne i pracochłonne, a wielu odkryć epidemiologicznych nie można powtórzyć w badaniach klinicznych z etycznego punktu widzenia.

Definicja

Randomizacja mendlowska (MR) jest zasadniczo metodą szacowania zmiennych instrumentalnych wywodzącą się z ekonometrii . Metoda wykorzystuje właściwości zmienności genetycznej linii płciowej (zwykle w postaci polimorfizmów pojedynczych nukleotydów). lub SNP) silnie powiązany z domniemanym narażeniem jako „zastępczy” lub „instrument” dla tego narażenia w celu zbadania i oszacowania przyczynowego wpływu narażenia na wynik będący przedmiotem zainteresowania na podstawie danych obserwacyjnych. Zastosowana odmiana genetyczna będzie miała albo dobrze poznany wpływ na wzorce narażenia (np. skłonność do intensywnego palenia), albo skutki naśladujące efekty wywoływane przez modyfikowalne narażenie (np. podwyższony poziom cholesterolu we krwi). Co ważne, genotyp musi wpływać na stan choroby jedynie pośrednio poprzez wpływ na ekspozycję będącą przedmiotem zainteresowania.

Skierowany graf acykliczny tradycyjnie używany do reprezentowania struktury randomizacji mendlowskiej i jej podstawowych założeń. to warianty genetyczne, , to wynik zainteresowania, a możliwe są

Ponieważ genotypy są przypisywane losowo, gdy są przekazywane z rodziców na potomstwo podczas mejozy , grupy osobników określone przez zmienność genetyczną związaną z ekspozycją na poziomie populacji powinny być w dużej mierze niezwiązane z czynnikami zakłócającymi, które zwykle nękają obserwacyjne badania epidemiologiczne. Zmienność genetyczna linii zarodkowej (tj. ta, która może być dziedziczona) jest również tymczasowo ustalona w momencie poczęcia i nie jest modyfikowana przez początek jakiegokolwiek wyniku lub choroby, co wyklucza odwrotną przyczynowość . Ponadto, biorąc pod uwagę ulepszenia nowoczesnych technologii genotypowania, błąd pomiaru i systematyczna błędna klasyfikacja są często niskie w przypadku danych genetycznych. Pod tym względem randomizację Mendla można traktować jako analogię do „randomizowanej, kontrolowanej próby natury”.

Randomizacja mendlowska wymaga trzech podstawowych założeń zmiennych instrumentalnych. Mianowicie:

  1. Warianty genetyczne wykorzystywane jako narzędzie do narażenia są związane z narażeniem. Jest to znane jako założenie „istotności”.
  2. Nie ma wspólnych przyczyn (tj. czynników zakłócających ) wariantów genetycznych i wyniku będącego przedmiotem zainteresowania. Jest to znane jako założenie „niezależności” lub „zamienności”.
  3. Nie ma niezależnej ścieżki między wariantem genetycznym a skutkiem innej niż ekspozycja. Jest to znane jako założenie „ograniczenia wykluczenia” lub „brak poziomej plejotropii”.

Aby upewnić się, że pierwsze podstawowe założenie zostało potwierdzone, randomizacja mendlowska wymaga scharakteryzowanych związków między zmiennością genetyczną a ekspozycjami będącymi przedmiotem zainteresowania. Są one zwykle pozyskiwane z badań asocjacyjnych całego genomu, chociaż mogą to być również badania genów kandydujących. Drugie założenie opiera się na braku podstruktury populacji (np. czynniki geograficzne, które indukują związek między genotypem a wynikiem), wyborze partnera , który nie jest związany z genotypem (tj. losowe krycie lub panmixia ) i brak efektów dynastycznych (tj. gdzie ekspresja rodzicielskiego genotypu w rodzicielskim fenotypie bezpośrednio wpływa na fenotyp potomstwa).

Analiza statystyczna

Randomizacja mendlowska jest zwykle stosowana poprzez wykorzystanie estymacji zmiennych instrumentalnych z wariantami genetycznymi działającymi jako instrumenty ekspozycji będącej przedmiotem zainteresowania. Można to wdrożyć, wykorzystując dane dotyczące wariantów genetycznych, narażenia i wyniku będącego przedmiotem zainteresowania dla grupy osób w pojedynczym zbiorze danych lub wykorzystując dane podsumowujące dotyczące związku między wariantami genetycznymi a narażeniem oraz związku między wariantami genetycznymi a wynikiem w oddzielne zestawy danych. Metoda została również wykorzystana w badaniach ekonomicznych badających wpływ otyłości na zarobki i inne wyniki na rynku pracy.

Gdy używany jest pojedynczy zbiór danych, stosowane są metody szacowania, takie jak metody stosowane często w innych przypadkach szacowania zmiennych instrumentalnych, takie jak dwuetapowa metoda najmniejszych kwadratów. Jeśli wiele wariantów genetycznych jest powiązanych z ekspozycją, można je wykorzystać indywidualnie jako instrumenty lub połączyć w celu utworzenia wyniku allelu, który jest używany jako pojedynczy instrument.

Analiza z wykorzystaniem danych podsumowujących często wykorzystuje dane z badań asocjacyjnych całego genomu. W tym przypadku związek między wariantami genetycznymi a narażeniem pochodzi z podsumowania wyników uzyskanych w ramach badania asocjacyjnego obejmującego cały genom w odniesieniu do narażenia. Powiązanie między tymi samymi wariantami genetycznymi a wynikiem jest następnie pobierane z podsumowania wyników uzyskanych w badaniu asocjacyjnym całego genomu dla wyniku. Te dwa zestawy zbiorczych wyników są następnie wykorzystywane do uzyskania oszacowania MR. Biorąc pod uwagę następujący zapis:

wpływ wariantu genetycznego na ekspozycję ;

szacowany wpływ wariantu genetycznego g na wynik ;

oszacowany błąd standardowy tego oszacowanego efektu;

MR oszacowanie przyczynowego wpływu narażenia wynik ;

a biorąc pod uwagę wpływ pojedynczego wariantu genetycznego, oszacowanie MR można uzyskać ze stosunku Walda:

Gdy stosuje się wiele wariantów genetycznych, poszczególne wskaźniki dla każdego wariantu genetycznego są łączone przy użyciu odwrotnego ważenia wariancji, w którym każdy indywidualny stosunek jest ważony niepewnością ich oszacowania. Daje to oszacowanie IVW, które można obliczyć jako:

Alternatywnie, to samo oszacowanie można uzyskać z regresji liniowej, w której jako wynik wykorzystano powiązanie wariant genetyczny-wynik, a jako ekspozycję powiązanie wariant genetyczny-ekspozycja. Ta regresja liniowa jest ważona niepewnością w powiązaniu wyniku wariantu genetycznego i nie zawiera stałej.

Metody te dostarczają jedynie wiarygodnych szacunków przyczynowego wpływu ekspozycji na wynik przy założeniach podstawowych zmiennych instrumentalnych. Dostępne są alternatywne metody, które są odporne na naruszenie trzeciego założenia, tj. dostarczają wiarygodnych wyników przy niektórych typach poziomej plejotropii. Ponadto niektóre uprzedzenia wynikające z naruszenia drugiego założenia IV, takie jak efekty dynastyczne, można przezwyciężyć poprzez wykorzystanie danych obejmujących rodzeństwo lub rodziców i ich potomstwo.

Historia

Mendlowska metoda randomizacji opiera się na dwóch zasadach wywodzących się z oryginalnej pracy Gregora Mendla na temat dziedziczenia genetycznego. Jego podstawy wywodzą się z praw Mendla, a mianowicie 1) prawa segregacji, w którym następuje całkowita segregacja dwóch allelomorfów w równej liczbie komórek rozrodczych heterozygoty oraz 2) oddzielne pary allelomorfów segregują się niezależnie od siebie i które zostały po raz pierwszy opublikowane jako taki w 1906 roku przez Roberta Heatha Locka . Innym prekursorem randomizacji mendlowskiej jest Sewall Wright , który wprowadził analizę ścieżki , forma diagramu przyczynowego używana do wnioskowania przyczynowego na podstawie danych nieeksperymentalnych. Metoda opiera się na kotwicach przyczynowych, a kotwice w większości jego przykładów zostały dostarczone przez dziedziczenie mendlowskie , co jest podstawą MR. Kolejnym elementem logiki MR jest gen instrumentalny, którego koncepcję wprowadził Thomas Hunt Morgan . Jest to ważne, ponieważ wyeliminowało potrzebę zrozumienia fizjologii genu w celu wnioskowania o procesach genetycznych. [ potrzebne źródło ]

Od tego czasu w literaturze pojawiają się przykłady badań wykorzystujących genetykę molekularną do wnioskowania o modyfikowalnych czynnikach ryzyka, co jest istotą MR. Jednym z przykładów jest praca Gerry'ego Lowera i współpracowników z 1979 roku, którzy wykorzystali fenotyp N-acetylotransferazy jako kotwicę do wyciągnięcia wniosków na temat różnych ekspozycji, w tym palenia i barwników aminowych, jako czynników ryzyka raka pęcherza moczowego. Innym przykładem jest praca Martijna Katana (wówczas z Wageningen University & Research , Holandia ), w którym opowiadał się za projektem badania z wykorzystaniem allelu apolipoproteiny E jako instrumentalnej zmiennej kotwicy w celu zbadania obserwowanego związku między niskim poziomem cholesterolu we krwi a zwiększonym ryzykiem raka. W rzeczywistości termin „randomizacja mendlowska” został po raz pierwszy użyty w druku przez Richarda Graya i Keitha Wheatleya (obaj z Radcliffe Infirmary , Oxford, Wielka Brytania ) w 1991 r. w nieco innym kontekście; w metodzie pozwalającej na oszacowanie zmiennej instrumentalnej, ale w odniesieniu do podejścia opartego na dziedziczeniu mendlowskim, a nie na genotypie. W swoim artykule z 2003 roku Shah Ebrahim i George Davey Smith ponownie używają tego terminu do opisania metody wykorzystania wariantów genetycznych linii zarodkowej do zrozumienia przyczynowości w analizie zmiennych instrumentalnych i to właśnie ta metodologia jest obecnie szeroko stosowana i której przypisuje się znaczenie . Mendlowska metoda randomizacji jest obecnie szeroko stosowana w epidemiologii przyczynowej, a liczba badań MR opisywanych w literaturze naukowej rośnie każdego roku od czasu publikacji z 2003 roku. W 2021 roku opublikowano wytyczne STROBE-MR, aby pomóc czytelnikom i recenzentom badań z randomizacją Mendla w ocenie ważności i użyteczności opublikowanych badań.

Dalsza lektura

Linki zewnętrzne