Projekt powtarzanych pomiarów

Projekt pomiarów powtarzanych to projekt badawczy obejmujący wielokrotne pomiary tej samej zmiennej na tych samych lub dopasowanych osobach w różnych warunkach lub w dwóch lub więcej okresach czasu. Na przykład powtarzane pomiary są gromadzone w badaniu podłużnym , w którym ocenia się zmiany w czasie.

Badania krzyżowe

Popularnym projektem powtarzanych działań jest badanie krzyżowe . Badanie krzyżowe to badanie podłużne , w którym pacjenci otrzymują sekwencję różnych terapii (lub ekspozycji). Chociaż badania krzyżowe mogą być badaniami obserwacyjnymi , wiele ważnych badań krzyżowych to eksperymenty kontrolowane . Projekty krzyżowe są powszechne w eksperymentach w wielu dyscyplinach naukowych , na przykład psychologii , edukacji , naukach farmaceutycznych i służba zdrowia , zwłaszcza medycyna.

Randomizowane , kontrolowane eksperymenty krzyżowe są szczególnie ważne w opiece zdrowotnej. W randomizowanym badaniu klinicznym pacjentom przydziela się losowo leczenie. Jeżeli takie badanie ma charakter powtarzanych pomiarów, pacjenci są losowo przydzielani do sekwencji terapii. Krzyżowe badanie kliniczne to projekt obejmujący powtarzane działania, w którym każdy pacjent jest losowo przydzielany do sekwencji leczenia obejmującej co najmniej dwa rodzaje leczenia (z których jedno może być leczeniem standardowym lub placebo) . ): W ten sposób każdy pacjent przechodzi z jednego leczenia na drugie.

Prawie wszystkie projekty skrzyżowań charakteryzują się „równoważeniem”, co oznacza, że ​​wszyscy badani powinni otrzymać tę samą liczbę zabiegów i wszyscy uczestnicy uczestniczą w leczeniu przez tę samą liczbę okresów. W większości badań krzyżowych każdy uczestnik otrzymuje wszystkie rodzaje leczenia.

Jednakże wiele projektów powtarzalnych działań nie jest skrzyżowaniami: w badaniu podłużnym sekwencyjnych skutków powtarzanych zabiegów nie ma potrzeby stosowania żadnego „ krzyżowania ”, na przykład (Vonesh i Chinchilli; Jones i Kenward).

Używa

  • Ograniczona liczba uczestników — schemat powtarzanych pomiarów zmniejsza wariancję szacunków efektów leczenia, umożliwiając wyciąganie wniosków statystycznych na mniejszej liczbie uczestników.
  • Wydajność — projekty powtarzalnych pomiarów umożliwiają szybsze zakończenie wielu eksperymentów, ponieważ do ukończenia całego eksperymentu trzeba przeszkolić mniej grup. Na przykład eksperymenty, w których każdy warunek zajmuje tylko kilka minut, podczas gdy szkolenie do wykonania zadań zajmuje tyle samo, jeśli nie więcej czasu.
  • Analiza podłużna — projekty powtarzalnych pomiarów pozwalają badaczom monitorować zmiany uczestników w czasie, zarówno w sytuacjach długo-, jak i krótkoterminowych.

Efekty zamówienia

Efekty porządku mogą wystąpić, gdy uczestnik eksperymentu jest w stanie wykonać zadanie, a następnie wykonać je ponownie. Przykłady efektów porządku obejmują poprawę lub spadek wydajności, co może wynikać z efektów uczenia się, nudy lub zmęczenia. Wpływ efektów porządku może być mniejszy w długoterminowych badaniach podłużnych lub poprzez zrównoważenie za pomocą projektu krzyżowego .

Równoważenie

W tej technice dwie grupy wykonują te same zadania lub doświadczają tych samych warunków, ale w odwrotnej kolejności. Przy dwóch zadaniach lub warunkach tworzone są cztery grupy.

Równoważenie
Zadanie/warunek Zadanie/warunek Uwagi
grupa A
1
2
Grupa A najpierw wykonuje zadanie/warunek 1, a następnie zadanie/warunek 2
Grupa B
2
1
Grupa B najpierw wykonuje Zadanie/Warunek 2, a następnie Zadanie/Warunek 1

Przeciwdziałanie próbom uwzględnienia dwóch ważnych źródeł systematycznych zmian w tego typu projektach: praktyki i efektów nudy. W przeciwnym razie oba mogłyby prowadzić do różnych wyników uczestników ze względu na znajomość terapii lub zmęczenie nimi.

Ograniczenia

Może nie być możliwe, aby każdy uczestnik znajdował się we wszystkich warunkach eksperymentu (tj. ograniczenia czasowe, lokalizacja eksperymentu itp.). Osoby ciężko chore mają tendencję do rezygnujenia z badań podłużnych, co może zafałszować wyniki. W takich przypadkach preferowane byłyby modele z efektami mieszanymi , ponieważ pozwalają one poradzić sobie z brakującymi wartościami.

Regresja średnia może wpływać na warunki ze znacznymi powtórzeniami. Dojrzewanie może mieć wpływ na badania, które rozciągają się w czasie. Zdarzenia poza eksperymentem mogą zmienić reakcję pomiędzy powtórzeniami.

Powtarzane pomiary ANOVA

Ta figura jest przykładem projektu powtarzanych pomiarów, który można analizować przy użyciu rANOVA (ANOVA z powtarzanymi pomiarami). Zmienną niezależną jest czas (poziomy: czas 1, czas 2, czas 3, czas 4), w którym ktoś dokonał pomiaru, a zmienną zależną jest wynik pomiaru szczęścia. Przykładowe wyniki zadowolenia uczestników podano dla 3 uczestników dla każdego czasu lub poziomu zmiennej niezależnej.

Analiza wariancji powtarzanych pomiarów (rANOVA) jest powszechnie stosowanym podejściem statystycznym do projektów pomiarów powtarzanych. W przypadku takich projektów współczynnik powtarzalnego pomiaru (jakościowa zmienna niezależna) jest czynnikiem wewnątrzobiektowym, natomiast zależna zmienna ilościowa, na podstawie której mierzony jest każdy uczestnik, jest zmienną zależną.

Podział błędu

Jedną z największych zalet rANOVA, podobnie jak w przypadku projektów z powtarzanymi pomiarami w ogóle, jest możliwość oddzielenia zmienności wynikającej z różnic indywidualnych. Rozważmy ogólną strukturę statystyki F :

F = leczenie MS / błąd MS = ( leczenie SS / leczenie df )/( błąd SS / błąd df )

W projekcie międzyobiektowym występuje element wariancji wynikający z różnic indywidualnych, który łączy się z terminami leczenia i błędów:

SS ogółem = leczenie SS + błąd SS
df ogółem = n - 1

W projekcie pomiarów powtarzanych możliwe jest oddzielenie zmienności podmiotu od warunków leczenia i błędu. W takim przypadku zmienność można podzielić na zmienność między terapiami (lub efekty wewnątrz osobnika, z wyłączeniem różnic indywidualnych) i zmienność w obrębie terapii. Zmienność wewnątrz leczenia można dalej podzielić na zmienność międzyosobniczą (różnice indywidualne) i błąd (z wyłączeniem różnic indywidualnych):

SS ogółem = leczenie SS (z wyłączeniem różnic indywidualnych) + pacjenci SS + błąd SS
df ogółem = df leczenie (w obrębie osobników) + df pomiędzy podmiotami + df błąd = ( k - 1) + ( n - 1) + (( n - k )( n - 1))

W odniesieniu do ogólnej struktury statystyki F jasne jest, że poprzez podzielenie zmienności między podmiotami wartość F wzrośnie, ponieważ suma kwadratów składnika błędu będzie mniejsza, co spowoduje mniejszy błąd MSE. Warto zauważyć, że zmienność podziału zmniejsza stopnie swobody testu F, dlatego zmienność między obiektami musi być wystarczająco znacząca, aby zrównoważyć utratę stopni swobody. Jeśli zmienność międzyosobnicza jest niewielka, proces ten może w rzeczywistości zmniejszyć wartość F.

Założenia

Podobnie jak w przypadku wszystkich analiz statystycznych, należy spełnić określone założenia, aby uzasadnić zastosowanie tego testu. Naruszenia mogą mieć umiarkowany lub poważny wpływ na wyniki i często prowadzą do zawyżenia błędu typu 1 . W przypadku rANOVA obowiązują standardowe założenia dotyczące jednej i wielu zmiennych. Założenia jednowymiarowe to:

  • Normalność — dla każdego poziomu czynnika wewnątrzobiektowego zmienna zależna musi mieć rozkład normalny .
  • Sferyczność — wyniki różnic obliczone pomiędzy dwoma poziomami czynnika wewnątrzobiektowego muszą mieć tę samą wariancję w celu porównania dowolnych dwóch poziomów. (To założenie ma zastosowanie tylko wtedy, gdy istnieją więcej niż 2 poziomy zmiennej niezależnej.)
  • Losowość — przypadki powinny pochodzić z próby losowej, a wyniki różnych uczestników powinny być od siebie niezależne.

rANOVA wymaga również spełnienia pewnych założeń dotyczących wielu zmiennych, ponieważ test wielowymiarowy przeprowadza się na podstawie wyników różnicowych. Założenia te obejmują:

  • Wielowymiarowa normalność — wyniki różnic mają w populacji wielowymiarowy rozkład normalny.
  • Losowość — indywidualne przypadki powinny pochodzić z próby losowej, a różnice w wynikach każdego uczestnika są niezależne od wyników innego uczestnika.

Próba F

Podobnie jak w przypadku innych analiz testów wariancji, rANOVA wykorzystuje statystykę F w celu określenia istotności. W zależności od liczby czynników wewnątrzobiektowych i naruszeń założeń należy wybrać najbardziej odpowiedni z trzech testów:

  • Standardowy jednowymiarowy test ANOVA F — ten test jest powszechnie stosowany, biorąc pod uwagę tylko dwa poziomy czynnika wewnątrzobiektowego (tj. punkt czasowy 1 i punkt czasowy 2). Ten test nie jest zalecany, biorąc pod uwagę więcej niż 2 poziomy czynnika wewnątrzobiektowego, ponieważ w takich przypadkach często naruszane jest założenie o kulistości.
  • Alternatywny test jednoczynnikowy — testy te uwzględniają naruszenia założenia o kulistości i można je zastosować, gdy współczynnik wewnątrzobiektowy przekracza 2 poziomy. Statystyka F jest taka sama jak w standardowym jednoczynnikowym teście ANOVA F, ale jest powiązana z dokładniejszą wartością p. Korekcję tę przeprowadza się poprzez zmniejszenie stopni swobody w celu określenia krytycznej wartości F. Powszechnie stosowane są dwie poprawki: poprawka Greenhouse’a – Geissera oraz poprawka Huynha – Feldta. Korekta cieplarniana-Geissera jest bardziej konserwatywna, ale rozwiązuje powszechny problem rosnącej zmienności w czasie w projekcie z powtarzanymi pomiarami. Korekta Huynha – Feldta jest mniej konserwatywna, ale nie uwzględnia kwestii rosnącej zmienności. Sugerowano, aby dolny Huynh – Feldt był używany przy mniejszych odchyleniach od kulistości, natomiast Greenhouse – Geisser, gdy odstępstwa są duże.
  • Test wielowymiarowy — ten test nie zakłada sferyczności, ale jest również wysoce konserwatywny.

Rozmiar efektu

Jedną z najczęściej zgłaszanych statystyk wielkości efektu dla rANOVA jest częściowy eta-kwadrat (η p 2 ). Powszechne jest również stosowanie wielowymiarowej η 2 , gdy naruszone zostało założenie o kulistości i raportowana jest statystyka testu wielowymiarowego. Trzecią statystyką wielkości efektu, którą podaje się , jest uogólniona η2 , która jest porównywalna z ηp2 w jednokierunkowej ANOVA z powtarzanymi pomiarami. Wykazano, że jest to lepsze oszacowanie wielkości efektu w przypadku innych testów wewnątrzobiektowych.

Przestrogi

rANOVA nie zawsze jest najlepszą analizą statystyczną w przypadku projektów z powtarzanymi pomiarami. Analiza rANOVA jest podatna na skutki brakujących wartości, imputacji, nierównoważnych punktów czasowych między pacjentami i naruszeń sferyczności. Problemy te mogą skutkować stronniczością próbkowania i zawyżonym poziomem błędu typu I. W takich przypadkach lepiej rozważyć zastosowanie liniowego modelu mieszanego .

Zobacz też

Notatki

Projektowanie i analiza eksperymentów

  • Jones, Byron; Kenward, Michael G. (2003). Projektowanie i analiza prób krzyżowych (wydanie drugie). Londyn: Chapman i Hall.
  • Vonesh, Edward F. i Chinchilli, Vernon G. (1997). Modele liniowe i nieliniowe do analizy pomiarów powtarzalnych . Londyn: Chapman i Hall.

Eksploracja danych podłużnych

  •   Dawidian, Maria ; David M. Giltinan (1995). Modele nieliniowe dla powtarzanych danych pomiarowych . Monografie Chapmana i Halla / CRC na temat statystyki i prawdopodobieństwa stosowanego. ISBN 978-0-412-98341-2 .
  •   Fitzmaurice, Garrett; Dawidian, Marie; Verbeke, Geert; Molenberghs, Geert, wyd. (2008). Analiza danych podłużnych . Boca Raton, Floryda: Chapman i Hall/CRC. ISBN 978-1-58488-658-7 .
  • Jones, Byron; Kenward, Michael G. (2003). Projektowanie i analiza prób krzyżowych (wydanie drugie). Londyn: Chapman i Hall.
  •   Kim, Kevin i Timm, Neil (2007). „ „Ograniczony model MGLM i krzywej wzrostu” (rozdział 7)”. Ogólne modele liniowe jednowymiarowe i wielowymiarowe: Teoria i zastosowania w SAS (z 1 płytą CD-ROM dla Windows i UNIX) . Statystyka: podręczniki i monografie (wyd. drugie). Boca Raton, Floryda: Chapman & Hall/CRC. ISBN 978-1-58488-634-1 .
  •   Kollo, Tõnu i von Rosen, Dietrich (2005). „ Wielowymiarowe modele liniowe” (rozdział 4), zwłaszcza „Model krzywej wzrostu i rozszerzenia” (rozdział 4.1)”. Zaawansowane statystyki wielowymiarowe z macierzami . Matematyka i jej zastosowania. Tom. 579. Nowy Jork: Springer. ISBN 978-1-4020-3418-3 .
  •   Kshirsagar, Anant M. i Smith, William Boyce (1995). Krzywe wzrostu . Statystyka: podręczniki i monografie. Tom. 145. Nowy Jork: Marcel Dekker, Inc. ISBN 0-8247-9341-2 .
  •   Pan, Jian-Xin i Fang, Kai-Tai (2002). Modele krzywych wzrostu i diagnostyka statystyczna . Seria Springera w statystyce. Nowy Jork: Springer-Verlag. ISBN 0-387-95053-2 .
  •   Seber, GAF i Wild, CJ (1989). „ „Modele wzrostu (rozdział 7)” ”. Regresja nieliniowa . Seria Wileya w prawdopodobieństwie i statystyce matematycznej: prawdopodobieństwo i statystyka matematyczna. Nowy Jork: John Wiley & Sons, Inc., s. 325–367. ISBN 0-471-61760-1 .
  •   Timm, Neil H. (2002). „ „Ogólny model MANOVA (GMANOVA)” (rozdział 3.6.d)”. Stosowana analiza wieloczynnikowa . Teksty Springera w statystyce. Nowy Jork: Springer-Verlag. ISBN 0-387-95347-7 .
  • Vonesh, Edward F. i Chinchilli, Vernon G. (1997). Modele liniowe i nieliniowe do analizy pomiarów powtarzalnych . Londyn: Chapman i Hall. (Kompleksowe opracowanie teorii i praktyki)
  • Conaway, M. (1999, 11 października). Projekt powtarzanych pomiarów. Pobrano 18 lutego 2008 z http://biostat.mc.vanderbilt.edu/twiki/pub/Main/ClinStat/repmeas.PDF
  • Minke, A. (1997, styczeń). Przeprowadzanie analiz powtarzanych pomiarów: rozważania dotyczące projektu eksperymentalnego. Pobrano 18 lutego 2008 z Ericae.net: http://ericae.net/ft/tamu/Rm.htm
  • Shaughnessy, JJ (2006). Metody badawcze w psychologii. Nowy Jork: McGraw-Hill.

Linki zewnętrzne