Test wielomianowy

W statystyce test wielomianowy jest testem hipotezy zerowej , że parametry rozkładu wielomianowego są równe określonym wartościom; jest używany do danych kategorycznych .

Począwszy od próbki , z których każdy został zaobserwowany jako należący do . Można zdefiniować jako obserwowane liczby elementów w każdej komórce. Stąd

Następnie definiując wektor parametrów gdzie: To są wartości parametrów w ramach hipotezy zerowej .

Dokładne prawdopodobieństwo obserwowanej konfiguracji przy hipotezie zerowej jest podane przez

Prawdopodobieństwo istotności dla testu to prawdopodobieństwo wystąpienia obserwowanego zbioru danych lub zbioru danych mniej prawdopodobnego niż obserwowany, jeśli hipoteza zerowa jest prawdziwa. Za pomocą dokładnego testu oblicza się to jako

gdzie suma obejmuje wszystkie wyniki równie prawdopodobne lub mniej prawdopodobne niż zaobserwowane. W praktyce staje się to uciążliwe obliczeniowo wraz ze i więc prawdopodobnie warto używać dokładnych testów tylko dla małych próbek W przypadku większych próbek przybliżenia asymptotyczne są wystarczająco dokładne i łatwiejsze do obliczenia.

Jednym z takich przybliżeń jest iloraz wiarygodności . Można zdefiniować alternatywną hipotezę, zgodnie z którą każda wartość jest zastępowana maksymalnego prawdopodobieństwa Dokładne prawdopodobieństwo zaobserwowanej konfiguracji pod alternatywna hipoteza jest podana przez

Logarytm naturalny ilorazu wiarygodności między tymi dwoma prawdopodobieństwami pomnożony przez wtedy statystyka dla testu ilorazu wiarygodności

(Czynnik jest wybierany tak, aby statystyka miała asymptotyczny rozkład chi-kwadrat w tej samej aplikacji)

Jeśli hipoteza zerowa jest prawdziwa, to wraz ze rozkład zbiega się z chi-kwadrat ze stopniami swobody Jednak od dawna wiadomo (np. Lawley), że dla skończonych rozmiarów próbek momenty są większe niż chi-kwadrat, zwiększając w ten sposób prawdopodobieństwo błędów typu I (fałszywie dodatnich). Różnica między momentami chi-kwadrat i momentami statystyki testowej jest funkcją można dopasować aż do momentu, statystyka testowa zostanie podzielona przez dany czynnik przez

wartości są równe (tj. określa rozkład równomierny) upraszcza do

Następnie Smith i in . wyprowadził współczynnik podziału, który pasuje do pierwszego momentu o ile W przypadku równych wartości współczynnik ten wynosi

Hipotezę zerową można również sprawdzić za pomocą testu chi-kwadrat Pearsona

gdzie jest oczekiwaną liczbą przypadków w kategorii hipotezie zerowej. Ta statystyka również zbiega się do rozkładu -kwadrat ze stopniami swobody, gdy hipoteza zerowa jest prawdziwa, ale robi to raczej z dołu niż z dla . [ potrzebne źródło ]