Pozostała suma kwadratów

W statystyce resztowa suma kwadratów ( RSS ), znana również jako suma kwadratów reszt ( SSR ) lub suma kwadratów oszacowań błędów ( SSE ), jest sumą kwadratów reszt (przewidywanych odchyleń od rzeczywistych wartości empirycznych danych). Jest miarą rozbieżności między danymi a modelem estymacji, takim jak regresja liniowa . Mały RSS wskazuje na ścisłe dopasowanie modelu do danych. Stosowany jest jako kryterium optymalności w doborze parametrów i wyborze modelu .

Ogólnie rzecz biorąc, całkowita suma kwadratów = wyjaśniona suma kwadratów + resztkowa suma kwadratów. Aby to udowodnić w wielowymiarowym zwykłych najmniejszych kwadratów (OLS), zobacz partycjonowanie w ogólnym modelu OLS .

Jedna zmienna objaśniająca

W modelu z pojedynczą zmienną objaśniającą RSS wyraża się wzorem:

gdzie y i jest i- wartością przewidywanej zmiennej, x i jest i -tą wartością zmiennej objaśniającej, a jest przewidywaną wartością y ja (nazywany również . W standardowym modelu prostej regresji liniowej { i współczynnikami , y i x są odpowiednio regressandem i regresorem , a ε jest wyrazem błędu . Suma kwadratów reszt jest sumą kwadratów ; to jest

gdzie jest szacowaną wartością stałego składnika jest β szacunkowa wartość współczynnika nachylenia .

Wyrażenie macierzowe dla resztkowej sumy kwadratów OLS

Ogólny model regresji z n obserwacjami i k objaśnieniami, z których pierwszy jest stałym wektorem jednostkowym, którego współczynnikiem jest punkt przecięcia regresji, to

gdzie y jest wektorem obserwacji zmiennej zależnej n × 1, każda kolumna macierzy n × k X jest wektorem obserwacji na jednym z k objaśniaczy jest wektorem k × 1 prawdziwych współczynników , a e jest wektorem n × 1 rzeczywistych błędów bazowych. Zwykły najmniejszych kwadratów dla wynosi

mi ; więc pozostała suma kwadratów wynosi:

,

(odpowiednik kwadratu normy reszt ). W pełni:

,

gdzie H jest macierzą kapelusza lub macierzą projekcji w regresji liniowej.

Relacja z korelacją momentu iloczynu Pearsona

Linia regresji metodą najmniejszych kwadratów jest dana przez

,

gdzie i , gdzie i

Dlatego,

gdzie

Korelacja momentu iloczynu Pearsona jest dana przez więc

Zobacz też

  •   Draper, NR; Smith, H. (1998). Stosowana analiza regresji (wyd. 3). Johna Wileya. ISBN 0-471-17082-8 .