Test Boschloo
Test Boschloo to statystyczny test hipotezy do analizy tabel kontyngencji 2x2 . Bada powiązanie dwóch zmiennych losowych o rozkładzie Bernoulliego i jest jednolicie mocniejszą alternatywą dla dokładnego testu Fishera . Został zaproponowany w 1970 roku przez RD Boschloo.
Ustawienie
Tabela kontyngencji 2x2 wizualizuje \ displaystyle :
Rozkład prawdopodobieństwa takich tabel można podzielić na trzy odrębne przypadki.
-
Sumy i sumy góry wszystkie określone przez . Jeśli i są niezależne, po hipergeometrycznym z parametrami : . -
Sumy z ale Następnie wszystkie losowe parametry są określane przez i x i } rozkład z prawdopodobieństwami : -
Tylko całkowita liczba sumy wierszy i sumy kolumn nie są. Następnie wektor losowy jest zgodny z rozkładem wielomianowym z wektorem prawdopodobieństwa .
Dokładny test Fishera jest przeznaczony dla pierwszego przypadku, a zatem dokładny test warunkowy (ponieważ warunkuje sumy kolumnowe). Typowym przykładem takiego przypadku jest Pani degustująca herbatę : Pani smakuje 8 filiżanek herbaty z mlekiem. Do 4 z tych filiżanek mleko wlewa się przed herbatą. Do pozostałych 4 filiżanek najpierw nalewa się herbatę. Pani próbuje przyporządkować puchary do dwóch kategorii. , zmienna losowa reprezentuje zastosowaną metodę (1 = pierwsze mleko, 0 = ostatnie mleko), a 1 = pierwsze odgadnięcie mleka, 0 = ostatnie mleko). zgadłem). Wtedy sumy wierszy to ustalone liczby filiżanek przygotowanych każdą metodą: . Pani wie, że w każdej kategorii są 4 kubki, więc przypisze po 4 kubki do każdej metody. Zatem sumy kolumn są również ustalane z góry: . Jeśli stanie odróżnić, i liczba prawidłowo sklasyfikowanych filiżanek z mlekiem najpierw rozkładowi hipergeometrycznemu .
Test Boschloo jest przeznaczony dla drugiego przypadku i dlatego jest dokładnym testem bezwarunkowym. Przykłady takiego przypadku często można znaleźć w badaniach medycznych, w których porównuje się binarny punkt końcowy między dwiema grupami pacjentów. Zgodnie z naszym zapisem, reprezentuje pierwszą grupę, która otrzymuje interesujące leki. reprezentuje drugą grupę, która otrzymuje placebo . na wyleczenie pacjenta (1 = wyleczenie, 0 = brak wyleczenia) Następnie sumy wierszy są równe wielkościom grup i są zwykle ustalane z góry. Sumy w kolumnach to całkowita liczba wyleczeń lub kontynuacji choroby i nie są ustalone z góry.
Przykład trzeciego przypadku można skonstruować w następujący sposób: jednocześnie monety i zrób Jeśli policzymy liczbę wyników w naszej tabeli 2x2 (1 = głowa, 0 = reszka), nie wiemy z góry, jak często moneta (losowe sumy wierszy), ani nie wiemy jak często moneta lub reszkę (losowe sumy kolumn).
Hipoteza testowa
Hipoteza zerowa jednostronnego testu Boschloo (wysokie wartości faworyzują hipotezę alternatywną) to:
Hipotezę zerową testu jednostronnego można również sformułować w innym kierunku (małe wartości faworyzują hipotezę alternatywną) :
Hipoteza zerowa testu dwustronnego to:
Nie ma uniwersalnej definicji dwustronnej wersji dokładnego testu Fishera. Ponieważ test Boschloo jest oparty na dokładnym teście Fishera, uniwersalna dwustronna wersja testu Boschloo również nie istnieje. Poniżej zajmiemy się testem jednostronnym i .
Pomysł Boschloo
poziom istotności oznaczamy przez . Dokładny test Fishera jest testem warunkowym i jest odpowiedni dla pierwszego z wyżej wymienionych przypadków. Ale jeśli traktujemy obserwowaną sumę kolumn z góry, dokładny test Fishera można również zastosować do drugiego przypadku Prawdziwy rozmiar testu zależy wtedy od parametrów i . Można wykazać, że maksymalny rozmiar przyjmuje się w równych proporcjach i nadal jest kontrolowany przez . Jednak Boschloo stwierdził, że w przypadku małych próbek maksymalny rozmiar jest często znacznie mniejszy niż . Prowadzi to do niepożądanej utraty mocy .
Boschloo zaproponował użycie dokładnego testu Fishera z wyższym poziomem nominalnym . Tutaj należy wybrać tak duży, jak to możliwe, tak aby maksymalny ∈ . Ta metoda była szczególnie korzystna w momencie publikacji Boschloo, ponieważ można było wyszukać wspólne wartości i . Dzięki temu wykonanie testu Boschloo było łatwe obliczeniowo.
Statystyka testowa
Reguła decyzyjna podejścia Boschloo opiera się na dokładnym teście Fishera. Równoważnym sposobem sformułowania testu jest użycie wartości p dokładnego testu Fishera jako statystyki testowej . Wartość p Fishera jest obliczana z rozkładu hipergeometrycznego (dla ułatwienia zapisu piszemy zamiast ):
Rozkład jest przez rozkłady dwumianowe x i zależy od nieznanego uciążliwego parametru . określonego wartością maksymalna wartość która [ . Wartość krytyczna poziomowi oryginalnego podejścia Boschloo.
Modyfikacja
Test Boschloo zajmuje się nieznanym uciążliwym parametrem maksimum z całej przestrzeni parametrów . Procedura Berger & Boos przyjmuje inne podejście, maksymalizując nad za przedział ufności i dodanie . jest zwykle małą wartością, na przykład 0,001 lub 0,0001. Powoduje to zmodyfikowany test Boschloo, który jest również dokładny.
Porównanie z innymi dokładnymi testami
Wszystkie dokładne testy mają określony poziom istotności, ale mogą mieć różną moc w różnych sytuacjach. Mehrotra i in. porównał moc niektórych dokładnych testów w różnych sytuacjach. Poniżej podsumowano wyniki testu Boschloo.
Zmodyfikowany test Boschloo
Test Boschloo i zmodyfikowany test Boschloo mają podobną moc we wszystkich rozważanych scenariuszach. Test Boschloo ma w niektórych przypadkach nieco większą moc i odwrotnie w innych przypadkach.
Dokładny test Fishera
Test Boschloo jest z założenia jednakowo silniejszy niż dokładny test Fishera. Dla małych liczebności prób (np. 10 na grupę) różnica mocy jest duża i waha się od 16 do 20 punktów procentowych w rozpatrywanych przypadkach. Różnica mocy jest mniejsza dla większych próbek.
Dokładny test zbiorczy
Ten test opiera się na statystyce testowej
gdzie grupowych i jest wydarzeniem połączonym wskaźnik.
Moc tego testu jest podobna do mocy testu Boschloo w większości scenariuszy. W niektórych przypadkach ma większą moc, a różnice wahają się głównie od 1 do 5 punktów procentowych W bardzo nielicznych przypadkach różnica dochodzi do 9 punktów procentowych.
Ten test można również zmodyfikować za pomocą procedury Berger & Boos. Jednak wynikowy test ma bardzo podobną moc do niezmodyfikowanego testu we wszystkich scenariuszach.
Dokładny test - Unpooled Z
Ten test opiera się na statystyce testowej
gdzie to współczynniki zdarzeń grupowych.
Moc tego testu jest podobna do mocy testu Boschloo w wielu scenariuszach. W niektórych przypadkach ma większą moc, z różnicami w zakresie od 1 do 5 punktów procentowych Jednak w niektórych innych przypadkach test Boschloo ma zauważalnie większą moc, z różnicami do 68 punktów procentowych.
Ten test można również zmodyfikować za pomocą procedury Berger & Boos. Wynikowy test ma podobną moc do niezmodyfikowanego testu w większości scenariuszy. W niektórych przypadkach modyfikacja znacznie poprawia moc, ale ogólne porównanie mocy z testem Boschloo pozostaje niezmienione.
Oprogramowanie
Obliczenia testu Boschloo można wykonać w następującym oprogramowaniu:
- Funkcja scipy.stats.boschloo_exact z SciPy
- Pakiety Dokładne i dokładne 2x2 języka programowania R
- StatXakt