Dopasowanie wyniku skłonności

W analizie statystycznej danych obserwacyjnych dopasowywanie wyniku skłonności ( PSM ) jest techniką dopasowywania statystycznego , która próbuje oszacować efekt leczenia, polityki lub innej interwencji poprzez uwzględnienie współzmiennych , które przewidują otrzymanie leczenia. PSM próbuje zmniejszyć błąd systematyczny z powodu zmiennych zakłócających , które można znaleźć w oszacowaniu efektu leczenia uzyskanego z prostego porównania wyników między jednostkami które otrzymały leczenie w porównaniu z tymi, które go nie otrzymały . Paul R. Rosenbaum i Donald Rubin wprowadzili tę technikę w 1983 roku.

Istnieje możliwość błędu systematycznego, ponieważ różnica w wynikach leczenia (takich jak średni efekt leczenia ) między grupami leczonymi i nieleczonymi może być spowodowana czynnikiem, który przewiduje leczenie, a nie samym leczeniem. W eksperymentach z randomizacją randomizacja umożliwia obiektywną ocenę efektów leczenia; dla każdej współzmiennej randomizacja oznacza, że ​​grupy badane będą średnio zrównoważone, zgodnie z prawem wielkich liczb . Niestety, w przypadku badań obserwacyjnych przypisanie terapii do badanych osób zazwyczaj nie jest przypadkowe. Dopasowanie próbuje zmniejszyć błąd przypisania leczenia i naśladować randomizację, tworząc próbę jednostek, które otrzymały leczenie, która jest porównywalna pod względem wszystkich obserwowanych zmiennych towarzyszących z próbą jednostek, które nie otrzymały leczenia.

„Skłonność” opisuje, jakie jest prawdopodobieństwo, że jednostka została potraktowana, biorąc pod uwagę jej wartości współzmiennych. Im silniejsze zakłócenie leczenia i zmiennych towarzyszących, a tym samym silniejsze obciążenie w analizie efektu leczenia naiwnego, tym lepiej zmienne towarzyszące przewidują, czy jednostka jest leczona, czy nie. Mając jednostki o podobnych wynikach skłonności zarówno w leczeniu, jak iw grupie kontrolnej, takie zakłócenia są zmniejszone.

Na przykład ktoś może być zainteresowany poznaniem konsekwencji palenia . Konieczne jest przeprowadzenie badania obserwacyjnego, ponieważ losowe przydzielanie ludzi do leczenia „paleniem” jest nieetyczne. Efekt leczenia oszacowany przez proste porównanie osób palących z tymi, które nie paliły, byłby obciążony wszelkimi czynnikami przewidującymi palenie (np. płeć i wiek). PSM próbuje kontrolować te uprzedzenia, porównując grupy leczone i nieleczone w odniesieniu do zmiennych kontrolnych.

Przegląd

PSM dotyczy przypadków wnioskowania przyczynowego i mylącego błędu w ustawieniach nieeksperymentalnych , w których: (i) niewiele jednostek w grupie porównawczej bez leczenia jest porównywalnych z jednostkami leczonymi; oraz (ii) wybranie podzbioru jednostek porównawczych podobnych do jednostki uzdatniania jest trudne, ponieważ jednostki muszą być porównywane poprzez wielowymiarowy zbiór charakterystyk obróbki wstępnej.

W normalnym dopasowywaniu dopasowywane są pojedyncze cechy charakterystyczne, które odróżniają grupy leczone i kontrolne, aby grupy były bardziej podobne. Ale jeśli te dwie grupy nie pokrywają się w znacznym stopniu, może zostać wprowadzony istotny błąd . Na przykład, jeśli porówna się tylko najgorsze przypadki z nieleczonej grupy „porównawczej” z najlepszymi przypadkami z grupy leczonej , wynikiem może być regresja w kierunku średniej , co może sprawić, że grupa porównawcza będzie wyglądać lepiej lub gorzej niż w rzeczywistości.

PSM wykorzystuje przewidywane prawdopodobieństwo przynależności do grupy – np. grupa leczona w porównaniu z grupą kontrolną – w oparciu o obserwowane predyktory, zwykle uzyskiwane z regresji logistycznej w celu utworzenia grupy kontrfaktycznej . Oceny skłonności mogą być używane do dopasowywania lub jako współzmienne , samodzielnie lub z innymi pasującymi zmiennymi lub zmiennymi towarzyszącymi.

Generalna procedura

1. Oszacuj wyniki skłonności, np. za pomocą regresji logistycznej :

  • Zmienna zależna: Z = 1, jeśli jednostka uczestniczyła (tj. jest członkiem grupy badanej); Z = 0, jeśli jednostka nie brała udziału (tj. jest członkiem grupy kontrolnej).
  • Wybierz odpowiednie czynniki zakłócające (zmienne, o których przypuszcza się, że są związane zarówno z leczeniem, jak i wynikiem)
  • Uzyskaj oszacowanie wyniku skłonności: przewidywane prawdopodobieństwo p lub log[ p /(1 − p )].

2. Dopasuj każdego uczestnika do jednego lub więcej nieuczestniczących na podstawie oceny skłonności, używając jednej z następujących metod:

  • Dopasowanie najbliższego sąsiada
  • Optymalne pełne dopasowanie: dopasuj każdego uczestnika do unikalnego podmiotu niebędącego uczestnikiem, aby zminimalizować całkowity dystans w wynikach skłonności między uczestnikami a dopasowanymi podmiotami nieuczestniczącymi. Metodę tę można łączyć z innymi technikami dopasowywania.
  • Dopasowanie suwmiarki: jednostki porównawcze w obrębie określonej szerokości wyniku skłonności leczonych jednostek są dopasowywane, gdzie szerokość jest na ogół ułamkiem odchylenia standardowego wyniku skłonności
  • metryczne Mahalanobisa w połączeniu z PSM
  • Dopasowanie stratyfikacji
  • Dopasowywanie różnic w różnicach (jądra i lokalne wagi liniowe)
  • Dokładne dopasowanie

3. Sprawdź, czy współzmienne są zrównoważone między grupami leczonymi i porównawczymi w ramach warstw wyniku skłonności.

  • Użyj standaryzowanych różnic lub wykresów, aby zbadać rozkłady
  • Jeśli współzmienne nie są zrównoważone, wróć do kroków 1 lub 2 i zmodyfikuj procedurę

4. Oszacuj efekty na podstawie nowej próby

  • Zazwyczaj: średnia ważona średnich różnic w wynikach w ramach meczu między uczestnikami i nieuczestnikami.
  • Użyj analiz odpowiednich dla nie-niezależnych dopasowanych próbek, jeśli więcej niż jeden nieuczestniczący jest dopasowany do każdego uczestnika

Definicje formalne

Podstawowe ustawienia

Podstawowy przypadek to dwa zabiegi (ponumerowane 1 i 0), z N niezależnymi i identycznie rozłożonymi zmiennymi losowymi podmiotów. Każdy podmiot odpowiedziałbym na leczenie za pomocą i na kontrolę za pomocą . Ilość do oszacowania to średni efekt leczenia : . Z wskazuje, czy podmiot otrzymałem leczenie ( lub kontrolę ( ). Niech będzie wektorem obserwowanych pomiarów (lub współzmiennych) obserwowanych przed leczeniem dla pacjenta . Obserwacje są dokonywane przed przypisaniem leczenia, ale funkcje w mogą nie obejmować wszystkich (lub ) z tych, które zostały użyte do podjęcia decyzji o przypisaniu numeracja jednostek (tj.: ja = 1, ..., N ) nie zawiera żadnych informacji poza tym, co jest zawarte W poniższych sekcjach pominięto indeks i , jednocześnie omawiając stochastyczne zachowanie niektórych tematów.

Zdecydowanie nie do zignorowania przydział leczenia

0 Niech jakiś podmiot ma wektor współzmiennych X (tj.: warunkowo nieuwikłany) i niektóre potencjalne wyniki r i r 1 odpowiednio pod kontrolą i leczeniem. Mówi się, że przypisanie leczenia jest silnie ignorowane , jeśli potencjalne wyniki są niezależne od leczenia ( Z ) uwarunkowane zmiennymi tła X . Można to zapisać zwięźle jako

gdzie oznacza niezależność statystyczną .

Bilansujący wynik

Bilansujący wynik b ( X ) jest funkcją obserwowanych współzmiennych X w taki sposób, że rozkład warunkowy X przy danym b ( X ) jest taki sam dla jednostek leczonych ( Z = 1) i kontrolnych ( Z = 0):

Najbardziej trywialną funkcją jest .

Wynik skłonności

Wynik skłonności to prawdopodobieństwo , że jednostka (np. osoba, klasa, szkoła) zostanie przypisana do określonego leczenia, biorąc pod uwagę zestaw obserwowanych zmiennych towarzyszących. Oceny skłonności są używane do zmniejszania zakłóceń poprzez zrównywanie grup na podstawie tych współzmiennych.

, że mamy binarny wskaźnik leczenia Z , zmienną odpowiedzi r i współzmienne obserwowane w tle X. Wynik skłonności definiuje się jako warunkowe prawdopodobieństwo leczenia, biorąc pod uwagę zmienne tła:

W kontekście metodologii wnioskowania przyczynowego i ankiety oceny skłonności są szacowane (za pomocą metod takich jak regresja logistyczna , losowe lasy lub inne), przy użyciu pewnego zestawu współzmiennych. Te oceny skłonności są następnie wykorzystywane jako estymatory wag, które mają być używane z ważenia odwrotnego prawdopodobieństwa .

Główne twierdzenia

Poniższe zostały po raz pierwszy przedstawione i udowodnione przez Rosenbauma i Rubina w 1983 roku:

  • skłonności jest wynikiem równoważącym mi
  • który jest „ wynikiem równoważącym ( ). Wynik skłonności jest najbardziej zgrubną funkcją równoważenia wyniku, ponieważ bierze (prawdopodobnie) wielowymiarowy obiekt ( X i ) i przekształca go w jeden wymiar (chociaż inne oczywiście też istnieją), podczas gdy jest najlepszy.
  • Jeśli przypisanie leczenia jest zdecydowanie ignorowane, biorąc pod uwagę X, to:
  • Jest to również zdecydowanie ignorowane, biorąc pod uwagę jakąkolwiek funkcję równoważenia. Konkretnie, biorąc pod uwagę wynik skłonności:
  • Dla dowolnej wartości wyniku równoważenia różnica między środkami leczenia i kontroli próbek pod ręką (tj.: ), w oparciu o osoby, które mają taką samą wartość wyniku bilansującego, może służyć jako nieobciążony estymator średniego efektu leczenia : .
  • Korzystanie z przykładowych szacunków wyników równoważenia może zapewnić równowagę próbki na X

Stosunek do wystarczalności

Jeśli pomyślimy o wartości Z jako o parametrze populacji, który wpływa na rozkład X , to wynik równoważenia służy jako wystarczająca statystyka dla Z . Ponadto powyższe twierdzenia wskazują, że wskaźnik skłonności jest minimalną wystarczającą statystyką, jeśli myślimy o Z jako parametrze X . Wreszcie, jeśli przypisanie leczenia Z jest zdecydowanie ignorowane, biorąc pod uwagę X , wówczas ocena skłonności jest minimalną wystarczającą statystyką dla wspólnej dystrybucji .

Test graficzny do wykrywania obecności zmiennych zakłócających

Judea Pearl wykazała, że ​​istnieje prosty test graficzny, zwany kryterium tylnych drzwi, który wykrywa obecność zmiennych zakłócających. Aby oszacować efekt leczenia, zmienne tła X muszą blokować wszystkie tylne ścieżki na wykresie. To blokowanie można wykonać albo przez dodanie zmiennej zakłócającej jako kontroli w regresji, albo przez dopasowanie zmiennej zakłócającej.

Niedogodności

Wykazano, że PSM zwiększa „niezrównoważenie, nieefektywność, zależność od modelu i stronniczość” modelu, co nie ma miejsca w przypadku większości innych metod dopasowywania. Spostrzeżenia stojące za wykorzystaniem dopasowywania są nadal aktualne, ale powinny być stosowane z innymi metodami dopasowywania; oceny skłonności mają również inne produktywne zastosowania w ważeniu i podwójnie solidnej estymacji.

Podobnie jak inne procedury dopasowywania, PSM szacuje średni efekt leczenia na podstawie danych obserwacyjnych. Kluczowymi zaletami PSM w momencie jego wprowadzenia było to, że stosując liniową kombinację współzmiennych dla pojedynczego wyniku, równoważy grupy badane i kontrolne na dużej liczbie współzmiennych bez utraty dużej liczby obserwacji. Gdyby jednostki leczenia i kontroli były zrównoważone na dużej liczbie współzmiennych pojedynczo, potrzebna byłaby duża liczba obserwacji, aby przezwyciężyć „problem wymiarowości ” „przy czym wprowadzenie nowej współzmiennej bilansującej zwiększa geometrycznie minimalną niezbędną liczbę obserwacji w próbie .

Wadą PSM jest to, że uwzględnia tylko obserwowane (i obserwowalne) współzmienne, a nie ukryte cechy. Czynników, które wpływają na przydział do leczenia i wynik, ale których nie można zaobserwować, nie można uwzględnić w procedurze dopasowywania. Ponieważ procedura kontroluje tylko obserwowane zmienne, wszelkie ukryte odchylenia spowodowane ukrytymi zmiennymi mogą pozostać po dopasowaniu. Inną kwestią jest to, że PSM wymaga dużych próbek, ze znacznym nakładaniem się grup leczonych i kontrolnych.

Ogólne obawy dotyczące dopasowywania zostały również podniesione przez Judeę Pearl , która argumentowała, że ​​ukryte uprzedzenia mogą w rzeczywistości wzrosnąć, ponieważ dopasowywanie obserwowanych zmiennych może uwolnić uprzedzenia z powodu uśpionych, nieobserwowanych czynników zakłócających. Podobnie Pearl argumentował, że redukcję błędu systematycznego można zapewnić jedynie (asymptotycznie) poprzez modelowanie jakościowych związków przyczynowych między leczeniem, wynikiem, obserwowanymi i nieobserwowanymi współzmiennymi. Zakłócenie pojawia się, gdy eksperymentator nie jest w stanie kontrolować alternatywnych, nieprzyczynowych wyjaśnień obserwowanej zależności między zmiennymi niezależnymi i zależnymi. Taka kontrola powinna spełniać kryterium „backdoora”. „Perły.

Implementacje w pakietach statystycznych

  • R : dopasowywanie wyników skłonności jest dostępne jako część pakietów MatchIt , optmatch lub innych.
  • SAS : Procedura PSMatch i makro obserwacje dopasowania OneToManyMTCH na podstawie oceny skłonności.
  • Stata : kilka poleceń implementuje dopasowywanie wyników skłonności, w tym napisany przez użytkownika psmatch2 . Stata w wersji 13 i nowszych oferuje również wbudowane polecenia teffects psmatch .
  • SPSS : Okno dialogowe dopasowywania Propensity Score jest dostępne w menu IBM SPSS Statistics (Data/Propensity Score Matching) i umożliwia użytkownikowi ustawienie tolerancji dopasowania, losową kolejność obserwacji podczas rysowania próbek, nadanie priorytetu dokładnym dopasowaniom, próbkowanie z lub bez zastąpienie, ustaw losowe ziarno i zmaksymalizuj wydajność, zwiększając szybkość przetwarzania i minimalizując zużycie pamięci.
  • Python : PsmPy , biblioteka do dopasowywania wyników skłonności w Pythonie

Zobacz też

Bibliografia