Diagnostyka regresji
W statystyce diagnostyka regresji jest jedną z zestawu procedur dostępnych do analizy regresji , które mają na celu ocenę ważności modelu na wiele różnych sposobów. Ocena ta może polegać na eksploracji podstawowych założeń statystycznych modelu , badaniu struktury modelu poprzez rozważenie sformułowań, które mają mniej, więcej lub różne zmienne objaśniające , lub badaniu podgrup obserwacji w poszukiwaniu tych, które są słabo reprezentowane według modelu ( wartości odstające ) lub które mają stosunkowo duży wpływ na przewidywania modelu regresji.
Diagnostyka regresji może przybrać postać wyniku graficznego, nieformalnych wyników ilościowych lub formalnego testu hipotezy statystycznej , z których każdy dostarcza wskazówek do dalszych etapów analizy regresji.
Wstęp
Diagnostyka regresji była często rozwijana lub początkowo proponowana w kontekście regresji liniowej lub, w szczególności, zwykłej metody najmniejszych kwadratów . Oznacza to, że wiele formalnie zdefiniowanych metod diagnostycznych jest dostępnych tylko dla tych kontekstów.
Ocena założeń
- Rozkład błędów modelu
- Korelacja błędów modelu
Ocena struktury modelu
- Adekwatność istniejących zmiennych objaśniających
- Częściowa działka resztkowa
- Test RESETU Ramseya
- Test F do stosowania, gdy istnieją powtórzone obserwacje, aby można było dokonać porównania między niedopasowaną sumą kwadratów a czystą sumą kwadratów błędów, przy założeniu, że błędy modelu są homoskedastyczne i mają rozkład normalny .
- Dodawanie lub usuwanie zmiennych objaśniających
- Wykres częściowej regresji
- Test t-Studenta do testowania włączenia pojedynczej zmiennej objaśniającej lub test F do testowania włączenia grupy zmiennych, oba przy założeniu, że błędy modelu są homoskedastyczne i mają rozkład normalny .
- Zmiana struktury modelu pomiędzy grupami obserwacji
- Porównywanie struktur modelu
Ważne grupy obserwacji
- Wartości odstające
- Wpływowe obserwacje