Regresja jądra

W statystyce regresja jądra jest nieparametryczną techniką szacowania warunkowej wartości oczekiwanej zmiennej losowej . Celem jest znalezienie nieliniowej zależności między parą zmiennych losowych X i Y .

W dowolnej regresji nieparametrycznej warunkowe oczekiwanie zmiennej względem zmiennej można zapisać:

gdzie jest .

Regresja jądra Nadarai – Watsona

Nadaraya i Watson , obaj w 1964 roku, zaproponowali oszacowanie lokalnie średniej ważonej, używając jako funkcji ważącej. Estymator Nadarai – Watsona to:

gdzie jądrem _

Pochodzenie

Korzystając z oszacowania gęstości jądra dla wspólnego rozkładu f ( x , y ) i f ( x ) z jądrem K ,

dostajemy

który jest estymatorem Nadarayi – Watsona.

Estymator jądra Priestleya-Chao

gdzie (lub parametr wygładzania).

Estymator jądra Gassera-Müllera

gdzie

Przykład

Szacowana funkcja regresji.

Ten przykład jest oparty na kanadyjskich przekrojowych danych płacowych, składających się z losowej próby pobranej z taśm kanadyjskiego spisu powszechnego z 1971 r. dla mężczyzn posiadających wspólne wykształcenie (klasa 13). W sumie jest 205 obserwacji.

Rysunek po prawej stronie przedstawia oszacowaną funkcję regresji przy użyciu jądra Gaussa drugiego rzędu wraz z asymptotycznymi granicami zmienności.

Skrypt np

Następujące polecenia języka programowania R wykorzystują funkcję npreg() w celu zapewnienia optymalnego wygładzenia i utworzenia figury podanej powyżej. Polecenia te można wprowadzić w wierszu polecenia za pomocą funkcji wycinania i wklejania.


 



  

 
     
      install.packages  (  "np"  )  biblioteka  (  np  )  # nieparametryczne  dane biblioteki   (  cps71  )  dołącz  (  cps71  )  m  <-  npreg  (  logwage  ~  wiek  )  plot  (  m  ,  plot.errors.method  =  "asymptotic"  ,  plot.errors .style  =  "zespół"  ,  ylim  =  c  (  

   11  ,  15,2  ))  punkty  (  wiek  ,  logwaage  ,  cex  =  .  25  ) 

Powiązany

Według Davida Salsburga algorytmy stosowane w regresji jądra zostały niezależnie opracowane i użyte w systemach rozmytych : „Wymyślając prawie dokładnie ten sam algorytm komputerowy, wydaje się, że systemy rozmyte i regresje oparte na gęstości jądra zostały opracowane całkowicie niezależnie od siebie. "

Implementacja statystyczna

Zobacz też

Dalsza lektura

Linki zewnętrzne