Założenie statystyczne
Statystyka , podobnie jak wszystkie dyscypliny matematyczne, nie wyciąga prawidłowych wniosków z niczego. Wyciąganie interesujących wniosków na temat rzeczywistych populacji statystycznych prawie zawsze wymaga pewnych założeń. Założenia te należy przyjąć ostrożnie, ponieważ błędne założenia mogą generować bardzo niedokładne wnioski.
Oto kilka przykładów założeń statystycznych:
- Niezależność obserwacji od siebie (to założenie jest szczególnie częstym błędem).
- Niezależność błędu obserwacji od potencjalnych efektów zakłócających .
- Dokładna lub przybliżona normalność obserwacji (lub błędów).
- Liniowość stopniowanych odpowiedzi na bodźce ilościowe, np. w regresji liniowej .
Klasy założeń
Istnieją dwa podejścia do wnioskowania statystycznego : wnioskowanie oparte na modelu i wnioskowanie oparte na projekcie . Oba podejścia opierają się na pewnym modelu statystycznym reprezentującym proces generowania danych. W podejściu modelowym przyjmuje się, że model jest początkowo nieznany, a jednym z celów jest wybór odpowiedniego modelu do wnioskowania. W podejściu projektowym przyjmuje się, że model jest znany, a jednym z celów jest upewnienie się, że przykładowe dane są wybierane wystarczająco losowo do wnioskowania.
Założenia statystyczne można podzielić na dwie klasy, w zależności od zastosowanego podejścia do wnioskowania.
- Założenia oparte na modelu. Należą do nich następujące trzy typy:
- Założenia dystrybucyjne. Tam, gdzie model statystyczny obejmuje terminy związane z błędami losowymi , można przyjąć założenia dotyczące rozkładu prawdopodobieństwa tych błędów. W niektórych przypadkach założenie dotyczące dystrybucji odnosi się do samych obserwacji.
- Założenia konstrukcyjne. Relacje statystyczne między zmiennymi są często modelowane przez przyrównanie jednej zmiennej do funkcji innej (lub kilku innych) plus błąd losowy . Modele często obejmują strukturalne założenie dotyczące postaci zależności funkcjonalnej, np. jak w przypadku regresji liniowej . Można to uogólnić na modele uwzględniające relacje między leżącymi u podstaw nieobserwowanymi zmiennymi latentnymi .
- Założenia dotyczące zmienności krzyżowej. Założenia te obejmują łączne rozkłady prawdopodobieństwa samych obserwacji lub przypadkowych błędów w modelu. Proste modele mogą zawierać założenie, że obserwacje lub błędy są statystycznie niezależne .
- Założenia projektowe. Odnoszą się one do sposobu zbierania obserwacji i często zakładają randomizację podczas pobierania próbek .
Podejście oparte na modelach jest najczęściej stosowane we wnioskowaniu statystycznym; podejście projektowe jest stosowane głównie w przypadku doboru próby . Dzięki podejściu opartemu na modelu wszystkie założenia są skutecznie zakodowane w modelu.
Sprawdzenie założeń
Biorąc pod uwagę, że ważność każdego wniosku wyciągniętego z wnioskowania statystycznego zależy od ważności przyjętych założeń, oczywiste jest, że założenia te powinny zostać zweryfikowane na pewnym etapie. Niektóre przypadki — na przykład brak danych — mogą wymagać od badaczy oceny, czy założenie jest uzasadnione. Badacze mogą to nieco rozszerzyć, aby zastanowić się, jaki efekt może wywołać odejście od założeń. dostępne są różne rodzaje procedur walidacji modelu statystycznego – np . walidacji modelu regresji .
Zobacz też
Notatki
- Bibliografia _
- ^ Koch GG, Gillings DB (2006), „Wnioskowanie oparte na projekcie a oparte na modelu”, Encyclopedia of Statistical Sciences (redaktor — Kotz S.), Wiley-Interscience .
- ^ Cox, 2006, rozdz. 9
- ^ de Gruijter i in., 2006, §2.2
- ^ McPherson, 1990, §3.4.1
- ^ McPherson, 1990, §3.3
- ^ de Gruijter i in., 2006, §2.2.1
- Cox DR (2006), Zasady wnioskowania statystycznego , Cambridge University Press .
- de Gruijter J., Brus D., Bierkens M., Knotters M. (2006), Pobieranie próbek do monitorowania zasobów naturalnych , Springer-Verlag .
- Kruskal, William (grudzień 1988). „Cuda i statystyki: przypadkowe założenie niezależności (przemówienie prezydenckie ASA)” . Dziennik Amerykańskiego Towarzystwa Statystycznego . 83 (404): 929–940. doi : 10.2307/2290117 . JSTOR 2290117 .
- McPherson, G. (1990), Statystyka w badaniach naukowych: jej podstawa, zastosowanie i interpretacja , Springer-Verlag . ISBN 0-387-97137-8