test t Welcha

W statystyce test t Welcha lub test t nierównych wariancji to test lokalizacji dwóch prób , który służy do testowania hipotezy (zerowej), że dwie populacje mają równe średnie. Został nazwany na cześć swojego twórcy, Bernarda Lewisa Welcha , jest adaptacją testu t - Studenta i jest bardziej niezawodny, gdy dwie próbki mają nierówne wariancje i prawdopodobnie nierówne rozmiary próbek. Testy te są często określane jako „niesparowane” lub „niezależne próbki” t -testy, ponieważ są one zwykle stosowane, gdy jednostki statystyczne leżące u podstaw dwóch porównywanych próbek nie nakładają się. Biorąc pod uwagę, że test t Welcha był mniej popularny niż test t -Studenta i może być mniej znany czytelnikom, bardziej pouczającą nazwą jest „test t nierównych wariancji Welcha ” — lub „test t nierównych wariancji ” dla zwięzłości.

Założenia

t - Studenta zakłada, że ​​średnie z próby porównywanej dla dwóch populacji mają rozkład normalny i że populacje mają równe wariancje. Test t Welcha jest przeznaczony dla nierównych wariancji populacji, ale zachowane jest założenie o normalności. Test t Welcha jest przybliżonym rozwiązaniem problemu Behrensa – Fishera .

Obliczenia

t Welcha definiuje statystykę t za pomocą następującego wzoru:

gdzie i próbka średnia i jej standardowy , przy czym skorygowane odchylenie standardowe próbki i próby W przeciwieństwie do t Studenta -test , mianownik nie jest oparty na połączonym oszacowaniu wariancji .

Stopnie swobody związane z tym oszacowaniem wariancji są przybliżone za pomocą równania Welcha – Satterthwaite'a : }

To wyrażenie można uprościć, gdy :

Tutaj, swobody tym wariancji

Statystyka pochodzi w przybliżeniu z rozkładu t , ponieważ mamy przybliżony rozkład chi-kwadrat . To przybliżenie jest lepsze, gdy zarówno jak i są większe niż 5.

Test statystyczny

Po obliczeniu t i tych statystyk można użyć z rozkładem t do przetestowania jednej z dwóch możliwych hipotez zerowych :

Przybliżone stopnie swobody są rzeczywistymi na statystyki, podczas gdy są zaokrąglone w dół do najbliższej liczby całkowitej w arkuszach kalkulacyjnych.

Zalety i ograniczenia

t Welcha jest bardziej niezawodny niż test t -Studenta i utrzymuje współczynniki błędów typu I zbliżone do nominalnych dla nierównych wariancji i nierównych liczebności próbek w warunkach normalnych. Co więcej, moc testu t Welcha jest zbliżona do mocy testu t - Studenta , nawet gdy wariancje populacji są równe, a liczebność próbek jest zrównoważona. Test t Welcha można uogólnić na więcej niż 2 próbki, co jest bardziej niezawodne niż jednoczynnikowa analiza wariancji (ANOVA).

Nie zaleca się wstępnego testowania równych wariancji, a następnie wybierania między testem t Studenta a testem t Welcha . Raczej test t Welcha można zastosować bezpośrednio i bez żadnych istotnych wad do testu t -Studenta , jak wspomniano powyżej. Test t Welcha pozostaje solidny dla skośnych rozkładów i dużych rozmiarów próbek. Wiarygodność spada dla rozkładów skośnych i mniejszych próbek, gdzie można by ewentualnie wykonać test t Welcha .

Przykłady

t Welcha i test t Studenta . Próbki pochodzą z losowych rozkładów normalnych przy użyciu języka programowania R.

Dla wszystkich trzech przykładów średnie populacji wynosiły i i .

Pierwszy przykład dotyczy nierównych, ale bliskich wariancji ( , , ) i równe rozmiary próbek ( ). Niech A1 i A2 oznaczają dwie próbki losowe:

Drugi przykład dotyczy nierównych wariancji ( , , ) i nierówne rozmiary próbek ( , ). Mniejsza próbka ma większą wariancję:

Trzeci przykład dotyczy nierównych wariancji ( , , ) i nierówne rozmiary próbek ( , ). Większa próbka ma większą wariancję:

Referencyjne wartości p uzyskano poprzez symulację rozkładów statystyk t dla hipotezy zerowej równych średnich populacji ( ). Wyniki podsumowano w poniższej tabeli z dwustronnymi wartościami p:

Próbka A1 Próbka A2 Test t - Studenta test t Welcha
Przykład
1 15 20.8 7.9 15 23.0 3.8 −2,46 28 0,021 0,021 −2,46 24,9 0,021 0,017
2 10 20.6 9.0 20 22.1 0,9 −2.10 28 0,045 0,150 −1,57 9.9 0,149 0,144
3 10 19.4 1.4 20 21.6 17.1 −1,64 28 0,110 0,036 −2,22 24,5 0,036 0,042

t Welcha i test t Studenta dały identyczne wyniki, gdy dwie próbki miały podobne wariancje i rozmiary próbek (Przykład 1). Należy jednak pamiętać, że nawet jeśli próbkujesz dane z populacji o identycznych wariancjach, wariancje próbek będą się różnić, podobnie jak wyniki dwóch testów t. Tak więc w przypadku rzeczywistych danych oba testy prawie zawsze dadzą nieco inne wyniki.

t - Studenta dał niską wartość p, gdy mniejsza próbka miała większą wariancję (przykład 2) i wysoką wartość p, gdy większa próbka miała większą wariancję (przykład 3). W przypadku nierównych wariancji test t Welcha dał wartości p zbliżone do symulowanych wartości p.

Implementacje oprogramowania

Język/Program Funkcjonować Dokumentacja
LibreOffice TEST( Dane1;Dane2;Tryb;Typ )
MATLAB ttest2(dane1, dane2, 'typ_zmienne', 'nierówne')
Microsoft Excel sprzed 2010 r. (Test Studenta) TEST( tablica1 , tablica2 , ogony , typ )
Microsoft Excel 2010 i nowsze (Test Studenta) T.TEST( tablica1 , tablica2 , ogony , typ )
Minitab Dostęp przez menu
SAS (oprogramowanie) Domyślne wyjście z proc ttest (oznaczone jako „Satterthwaite”)
Python (poprzez zewnętrzną bibliotekę SciPy ) scipy.stats.ttest_ind( a , b , equal_var=False )
R t.test(dane1, dane2)
Haskella Statistics.Test.StudentT.welchTTest PróbkiDiffer data1 data2
JMP Jednokierunkowe ( Y ( YKolumna), X ( X Kolumna), Nierówne Wariancje ( 1 ) );
Julia Test nierównej wariancji (dane1, dane2)
Stan ttest nazwa_zmiennej1 == nazwa_zmiennej2 , welch
Arkusze Google TEST(zakres1;zakres2;końce;typ)
Pryzmat GraphPad Jest to wybór w oknie dialogowym testu t.
Statystyki IBM SPSS Opcja w menu
Oktawa GNU welch_test(x, y)

Zobacz też