test t Welcha
W statystyce test t Welcha lub test t nierównych wariancji to test lokalizacji dwóch prób , który służy do testowania hipotezy (zerowej), że dwie populacje mają równe średnie. Został nazwany na cześć swojego twórcy, Bernarda Lewisa Welcha , jest adaptacją testu t - Studenta i jest bardziej niezawodny, gdy dwie próbki mają nierówne wariancje i prawdopodobnie nierówne rozmiary próbek. Testy te są często określane jako „niesparowane” lub „niezależne próbki” t -testy, ponieważ są one zwykle stosowane, gdy jednostki statystyczne leżące u podstaw dwóch porównywanych próbek nie nakładają się. Biorąc pod uwagę, że test t Welcha był mniej popularny niż test t -Studenta i może być mniej znany czytelnikom, bardziej pouczającą nazwą jest „test t nierównych wariancji Welcha ” — lub „test t nierównych wariancji ” dla zwięzłości.
Założenia
t - Studenta zakłada, że średnie z próby porównywanej dla dwóch populacji mają rozkład normalny i że populacje mają równe wariancje. Test t Welcha jest przeznaczony dla nierównych wariancji populacji, ale zachowane jest założenie o normalności. Test t Welcha jest przybliżonym rozwiązaniem problemu Behrensa – Fishera .
Obliczenia
t Welcha definiuje statystykę t za pomocą następującego wzoru:
gdzie i są próbka średnia i jej standardowy , przy czym skorygowane odchylenie standardowe próbki i próby W przeciwieństwie do t Studenta -test , mianownik nie jest oparty na połączonym oszacowaniu wariancji .
Stopnie swobody związane z tym oszacowaniem wariancji są przybliżone za pomocą równania Welcha – Satterthwaite'a : }
To wyrażenie można uprościć, gdy :
Tutaj, swobody tym wariancji
Statystyka pochodzi w przybliżeniu z rozkładu t , ponieważ mamy przybliżony rozkład chi-kwadrat . To przybliżenie jest lepsze, gdy zarówno jak i są większe niż 5.
Test statystyczny
Po obliczeniu t i tych statystyk można użyć z rozkładem t do przetestowania jednej z dwóch możliwych hipotez zerowych :
- że dwie średnie populacji są równe, w którym stosuje się test dwustronny ; Lub
- że jeden ze średnich populacji jest większy lub równy drugiemu, w którym stosuje się test jednostronny .
Przybliżone stopnie swobody są rzeczywistymi na statystyki, podczas gdy są zaokrąglone w dół do najbliższej liczby całkowitej w arkuszach kalkulacyjnych.
Zalety i ograniczenia
t Welcha jest bardziej niezawodny niż test t -Studenta i utrzymuje współczynniki błędów typu I zbliżone do nominalnych dla nierównych wariancji i nierównych liczebności próbek w warunkach normalnych. Co więcej, moc testu t Welcha jest zbliżona do mocy testu t - Studenta , nawet gdy wariancje populacji są równe, a liczebność próbek jest zrównoważona. Test t Welcha można uogólnić na więcej niż 2 próbki, co jest bardziej niezawodne niż jednoczynnikowa analiza wariancji (ANOVA).
Nie zaleca się wstępnego testowania równych wariancji, a następnie wybierania między testem t Studenta a testem t Welcha . Raczej test t Welcha można zastosować bezpośrednio i bez żadnych istotnych wad do testu t -Studenta , jak wspomniano powyżej. Test t Welcha pozostaje solidny dla skośnych rozkładów i dużych rozmiarów próbek. Wiarygodność spada dla rozkładów skośnych i mniejszych próbek, gdzie można by ewentualnie wykonać test t Welcha .
Przykłady
t Welcha i test t Studenta . Próbki pochodzą z losowych rozkładów normalnych przy użyciu języka programowania R.
Dla wszystkich trzech przykładów średnie populacji wynosiły i i .
Pierwszy przykład dotyczy nierównych, ale bliskich wariancji ( , , ) i równe rozmiary próbek ( ). Niech A1 i A2 oznaczają dwie próbki losowe:
Drugi przykład dotyczy nierównych wariancji ( , , ) i nierówne rozmiary próbek ( , ). Mniejsza próbka ma większą wariancję:
Trzeci przykład dotyczy nierównych wariancji ( , , ) i nierówne rozmiary próbek ( , ). Większa próbka ma większą wariancję:
Referencyjne wartości p uzyskano poprzez symulację rozkładów statystyk t dla hipotezy zerowej równych średnich populacji ( ). Wyniki podsumowano w poniższej tabeli z dwustronnymi wartościami p:
Próbka A1 | Próbka A2 | Test t - Studenta | test t Welcha | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Przykład | ||||||||||||||
1 | 15 | 20.8 | 7.9 | 15 | 23.0 | 3.8 | −2,46 | 28 | 0,021 | 0,021 | −2,46 | 24,9 | 0,021 | 0,017 |
2 | 10 | 20.6 | 9.0 | 20 | 22.1 | 0,9 | −2.10 | 28 | 0,045 | 0,150 | −1,57 | 9.9 | 0,149 | 0,144 |
3 | 10 | 19.4 | 1.4 | 20 | 21.6 | 17.1 | −1,64 | 28 | 0,110 | 0,036 | −2,22 | 24,5 | 0,036 | 0,042 |
t Welcha i test t Studenta dały identyczne wyniki, gdy dwie próbki miały podobne wariancje i rozmiary próbek (Przykład 1). Należy jednak pamiętać, że nawet jeśli próbkujesz dane z populacji o identycznych wariancjach, wariancje próbek będą się różnić, podobnie jak wyniki dwóch testów t. Tak więc w przypadku rzeczywistych danych oba testy prawie zawsze dadzą nieco inne wyniki.
t - Studenta dał niską wartość p, gdy mniejsza próbka miała większą wariancję (przykład 2) i wysoką wartość p, gdy większa próbka miała większą wariancję (przykład 3). W przypadku nierównych wariancji test t Welcha dał wartości p zbliżone do symulowanych wartości p.
Implementacje oprogramowania
Język/Program | Funkcjonować | Dokumentacja |
---|---|---|
LibreOffice | TEST( Dane1;Dane2;Tryb;Typ ) |
|
MATLAB | ttest2(dane1, dane2, 'typ_zmienne', 'nierówne') |
|
Microsoft Excel sprzed 2010 r. (Test Studenta) | TEST( tablica1 , tablica2 , ogony , typ ) |
|
Microsoft Excel 2010 i nowsze (Test Studenta) | T.TEST( tablica1 , tablica2 , ogony , typ ) |
|
Minitab | Dostęp przez menu | |
SAS (oprogramowanie) | Domyślne wyjście z proc ttest (oznaczone jako „Satterthwaite”) |
|
Python (poprzez zewnętrzną bibliotekę SciPy ) | scipy.stats.ttest_ind( a , b , equal_var=False ) |
|
R | t.test(dane1, dane2) |
|
Haskella | Statistics.Test.StudentT.welchTTest PróbkiDiffer data1 data2 |
|
JMP | Jednokierunkowe ( Y ( YKolumna), X ( X Kolumna), Nierówne Wariancje ( 1 ) ); |
|
Julia | Test nierównej wariancji (dane1, dane2) |
|
Stan |
ttest nazwa_zmiennej1 == nazwa_zmiennej2 , welch
|
|
Arkusze Google |
TEST(zakres1;zakres2;końce;typ)
|
|
Pryzmat GraphPad | Jest to wybór w oknie dialogowym testu t. | |
Statystyki IBM SPSS | Opcja w menu | |
Oktawa GNU |
welch_test(x, y)
|
Zobacz też
- Test t - Studenta
- test Z
- Eksperyment czynnikowy
- Jednokierunkowa analiza wariancji
- Statystyka T-kwadrat Hotellinga dla dwóch prób , wielowymiarowe rozszerzenie testu t Welcha