Pseudoreplikacja

Pseudoreplikacja (czasami jednostka błędu analizy ) ma wiele definicji. Pseudoreplikacja została pierwotnie zdefiniowana w 1984 roku przez Stuarta H. Hurlberta jako wykorzystanie statystyk wnioskowania do testowania efektów leczenia z danymi z eksperymentów, w których albo zabiegi nie są replikowane (chociaż próbki mogą być), albo powtórzenia nie są statystycznie niezależne. Następnie Millar i Anderson zidentyfikowali to jako szczególny przypadek nieodpowiedniej specyfikacji czynników losowych, w którym występują zarówno czynniki losowe, jak i stałe. Czasami jest to wąsko interpretowane jako inflacja liczby próbek lub powtórzeń, które nie są statystycznie niezależne. Ta definicja pomija mylenie efektów jednostkowych i leczniczych w błędnie określonych Współczynnik F . W praktyce nieprawidłowe współczynniki F dla testów statystycznych efektów stałych często wynikają z domyślnego współczynnika F, który jest tworzony na podstawie błędu, a nie składnika mieszanego.

Lazic zdefiniował pseudoreplikację jako problem skorelowanych próbek, w których korelacja nie jest brana pod uwagę przy obliczaniu przedziału ufności dla średniej próbki. Aby zapoznać się z efektem korelacji szeregowej lub czasowej, zobacz także Centralne twierdzenie graniczne łańcucha Markowa .

Pseudoreplikacja z powodu korelacji próbek: bez uwzględnienia korelacji 90% przedział ufności dla średniej próbki jest o wiele za mały. Aby obejść ten problem, można na przykład zastosować metodę blokowania , w której najpierw grupuje się skorelowane próbki, a następnie (dla każdego bloku) oblicza się odpowiednie średnie próbki. Z tych dwóch „średnich z próby blokowej” oblicza się średnią z całej próbki jako ich średnią, jak również odchylenie standardowe. Daje to lepsze oszacowanie przedziału ufności średniej próbki.

Problem nieodpowiedniej specyfikacji pojawia się, gdy zabiegi są przypisane do jednostek, które są podpróbowane, a współczynnik F leczenia w tabeli analizy wariancji ( ANOVA ) jest tworzony w odniesieniu do resztkowej średniej kwadratowej, a nie w odniesieniu do średniej kwadratowej między jednostkami. Współczynnik F w stosunku do średniego kwadratu wewnątrz jednostki jest podatny na zakłócenia leczenia i efektów jednostkowych, zwłaszcza gdy liczba jednostek doświadczalnych jest niewielka (np. cztery jednostki zbiornika, dwa zbiorniki poddane działaniu, dwa zbiorniki nie poddane działaniu substancji, kilka podpróbek na zbiornik). Problem jest eliminowany przez utworzenie współczynnika F w stosunku do poprawnej średniej kwadratowej w tabeli ANOVA (zbiornik według traktowania MS w powyższym przykładzie), gdzie jest to możliwe. Problem jest rozwiązywany przez zastosowanie modeli mieszanych.

Hurlbert zgłosił „pseudoreplikację” w 48% zbadanych przez siebie badań, w których wykorzystano statystyki wnioskowania. Kilka badań analizujących artykuły naukowe opublikowane do 2016 roku podobnie wykazało, że około połowa artykułów była podejrzana o pseudoreplikację. Kiedy czas i zasoby ograniczają liczbę jednostek eksperymentalnych , a efekty jednostkowe nie mogą być wyeliminowane statystycznie poprzez testowanie wariancji jednostkowej, ważne jest, aby skorzystać z innych źródeł informacji, aby ocenić stopień, w jakim współczynnik F jest zakłócony przez efekty jednostkowe.

Replikacja

Replikacja zwiększa precyzję oszacowania, podczas gdy randomizacja dotyczy szerszego zastosowania próbki do populacji. Replikacja musi być odpowiednia: należy rozważyć replikację na poziomie jednostki eksperymentalnej, oprócz replikacji w jednostkach.

Testowanie hipotez

Testy statystyczne (np. test t i pokrewna rodzina testów ANOVA) opierają się na odpowiedniej replikacji w celu oszacowania istotności statystycznej . Testy oparte na rozkładach t i F zakładają błędy jednorodne, normalne i niezależne. Skorelowane błędy mogą prowadzić do fałszywej precyzji i zbyt małych wartości p.

typy

Hurlbert (1984) zdefiniował cztery typy pseudoreplikacji.

  • Prosta pseudoreplikacja (Rysunek 5a w Hurlbert 1984) występuje, gdy na zabieg przypada jedna jednostka eksperymentalna. Statystyka inferencyjna nie może oddzielić zmienności spowodowanej leczeniem od zmienności spowodowanej jednostkami eksperymentalnymi, gdy na jednostkę przypada tylko jeden pomiar.
  • Pseudoreplikacja czasowa (Rysunek 5c w Hurlbert 1984) występuje, gdy jednostki eksperymentalne różnią się na tyle w czasie, że efekty czasowe między jednostkami są prawdopodobne, a efekty leczenia są skorelowane z efektami czasowymi. Statystyka inferencyjna nie może oddzielić zmienności spowodowanej leczeniem od zmienności spowodowanej jednostkami eksperymentalnymi, gdy na jednostkę przypada tylko jeden pomiar.
  • Pseudoreplikacja ofiarna (Rysunek 5b w Hurlbert 1984) ma miejsce, gdy w analizie stosuje się średnie w ramach leczenia, a te średnie są testowane w ramach wariancji wewnątrzjednostkowej. Na rycinie 5b błędny współczynnik F będzie miał 1 df w średnim kwadracie licznika (leczenia) i 4 df w średnim kwadracie mianownika (2-1 = 1 df dla każdej jednostki doświadczalnej). Prawidłowy współczynnik F będzie miał 1 df w liczniku (leczenie) i 2 df w mianowniku (2-1 = 1 df dla każdego zabiegu). Prawidłowy współczynnik F kontroluje efekty jednostek eksperymentalnych, ale przy 2 df w mianowniku będzie miał niewielką moc wykrywania różnic w leczeniu.
  • Niejawna pseudoreplikacja występuje, gdy błędy standardowe (lub granice ufności) są szacowane w jednostkach eksperymentalnych. Podobnie jak w przypadku innych źródeł pseudoreplikacji, efekty leczenia nie mogą być statystycznie oddzielone od efektów z powodu zmienności między jednostkami eksperymentalnymi.

Zobacz też