Statystyczna miara rozbieżności między danymi a modelem estymacji
W statystyce resztowa suma kwadratów ( RSS ), znana również jako suma kwadratów reszt ( SSR ) lub suma kwadratów oszacowań błędów ( SSE ), jest sumą kwadratów reszt (przewidywanych odchyleń od rzeczywistych wartości empirycznych danych). Jest miarą rozbieżności między danymi a modelem estymacji, takim jak regresja liniowa . Mały RSS wskazuje na ścisłe dopasowanie modelu do danych. Stosowany jest jako kryterium optymalności w doborze parametrów i wyborze modelu .
W modelu z pojedynczą zmienną objaśniającą RSS wyraża się wzorem:
gdzie y i jest i- tą wartością przewidywanej zmiennej, x i jest i -tą wartością zmiennej objaśniającej, a jest przewidywaną wartością y ja (nazywany również . W standardowym modelu prostej regresji liniowej { i są współczynnikami , y i x są odpowiednio regressandem i regresorem , a ε jest wyrazem błędu . Suma kwadratów reszt jest sumą kwadratów ; to jest
gdzie jest szacowaną wartością stałego składnika jest β szacunkowa wartość współczynnika nachylenia .
Wyrażenie macierzowe dla resztkowej sumy kwadratów OLS
Ogólny model regresji z n obserwacjami i k objaśnieniami, z których pierwszy jest stałym wektorem jednostkowym, którego współczynnikiem jest punkt przecięcia regresji, to
gdzie y jest wektorem obserwacji zmiennej zależnej n × 1, każda kolumna macierzy n × k X jest wektorem obserwacji na jednym z k objaśniaczy jest wektorem k × 1 prawdziwych współczynników , a e jest wektorem n × 1 rzeczywistych błędów bazowych. Zwykły najmniejszych kwadratów dla wynosi