Najlepsza liniowa nieobciążona prognoza
W statystyce najlepsza nieobciążona predykcja liniowa ( BLUP ) jest stosowana w liniowych modelach mieszanych do szacowania efektów losowych . BLUP został wyprowadzony przez Charlesa Roya Hendersona w 1950 r., ale wydaje się, że termin „najlepszy liniowy nieobciążony predyktor” (lub „przewidywanie”) był używany dopiero w 1962 r. „Najlepsze liniowe nieobciążone prognozy” (BLUP) efektów losowych są podobne do najlepszych liniowych nieobciążone oszacowania (BLUE) (patrz twierdzenie Gaussa-Markowa ) efektów stałych. To rozróżnienie wynika z tego, że zwykle mówi się nie o szacowaniu efektów stałych, ale raczej o przewidywaniu efektów losowych, ale poza tym te dwa terminy są równoważne. (Jest to trochę dziwne, ponieważ przypadkowe efekty zostały już „zrealizowane”; już istnieją. Użycie terminu „przewidywanie” może wynikać z faktu, że w dziedzinie hodowli zwierząt, w której pracował Henderson, przypadkowe efekty były zwykle zasługą genetyczną , które można wykorzystać do przewidywania jakości potomstwa (Robinson, strona 28)). Jednak równania dla efektów „stałych” i dla efektów losowych są różne.
W praktyce często zdarza się, że parametry związane z terminami efektów losowych są nieznane; te parametry to wariancje efektów losowych i reszt. Zazwyczaj parametry są szacowane i podłączane do predyktora, co prowadzi do Empirycznego Najlepszego Nieobciążonego Predyktora Liniowego (EBLUP). Zauważ, że po prostu podłączając oszacowany parametr do predyktora, dodatkowa zmienność jest nieuwzględniona, co prowadzi do zbyt optymistycznych wariancji predykcji dla EBLUP. [ potrzebne źródło ]
Najlepsze liniowe nieobciążone prognozy są podobne do empirycznych oszacowań Bayesa efektów losowych w liniowych modelach mieszanych, z tym wyjątkiem, że w tym drugim przypadku, gdy wagi zależą od nieznanych wartości składników wariancji, te nieznane wariancje są zastępowane oszacowaniami opartymi na próbie.
Przykład
Załóżmy, że model obserwacji { Y j ; j = 1, ..., n } jest zapisywane jako
gdzie jest średnią wszystkich obserwacji a mają jot i ε wariancje reprezentują efekt losowy i błąd obserwacji dla obserwacji j i załóżmy, że są one nieskorelowane i σ ξ 2 i σ ε 2 , odpowiednio. Ponadto x j jest wektorem zmiennych niezależnych dla j -tej i jest wektorem parametrów regresji
Problem BLUP polegający na zapewnieniu oszacowania wartości wolnej od błędów obserwacji dla k- tej obserwacji,
można sformułować jako wymagające, aby współczynniki predyktora liniowego, zdefiniowane jako
należy dobrać tak, aby zminimalizować wariancję błędu predykcji,
pod warunkiem, że predyktor jest nieobciążony,
BLUP kontra NIEBIESKI
W przeciwieństwie do przypadku najlepszego liniowego, nieobciążonego oszacowania „ilość do oszacowania” ma nie tylko udział elementu losowego, ale obserwowane wielkości, w szczególności , które przyczyniają się do w tym samym elemencie losowym.
W przeciwieństwie do BLUE, BLUP uwzględnia znane lub oszacowane odchylenia.
Historia BLUP w hodowli
Henderson zbadał hodowlę ze statystycznego punktu widzenia. Jego praca pomogła w opracowaniu wskaźnika selekcji (SI) i szacowanej wartości hodowlanej (EBV). Te metody statystyczne wpłynęły na rankingi stad do sztucznego zapłodnienia stosowane w Stanach Zjednoczonych. Te wczesne metody statystyczne są mylone z BLUP, który jest obecnie powszechny w hodowli zwierząt.
Właściwy termin BLUP wywodzi się z pracy Daniela Sorensena i Briana Kennedy'ego na University of Guelph w Kanadzie, w której rozszerzyli wyniki Hendersona na model obejmujący kilka cykli selekcji. Model ten został spopularyzowany przez University of Guelph w przemyśle mleczarskim pod nazwą BLUP. Dalsze prace przeprowadzone na Uniwersytecie wykazały wyższość BLUP nad EBV i SI, co doprowadziło do tego, że stał się głównym predyktorem genetycznym [ potrzebne źródło ] .
Istnieje zatem zamieszanie między spopularyzowanym powyżej modelem BLUP a najlepszą metodą statystyczną przewidywania liniowego, nieobciążoną, która była zbyt teoretyczna do ogólnego użytku. Model został dostarczony rolnikom do użytku na komputerach.
W Kanadzie wszystkie mleczarnie składają sprawozdania na szczeblu krajowym. Genetyka w Kanadzie była wspólna, co czyni ją największą pulą genetyczną, a tym samym źródłem ulepszeń. To i BLUP doprowadziły do szybkiego wzrostu bydła holsztyńskiego .
Zobacz też
Notatki
- Henderson CR (1975). „Najlepsze liniowe, nieobciążone oszacowanie i przewidywanie w ramach modelu selekcji”. Biometria . 31 (2): 423–447. doi : 10.2307/2529430 . JSTOR 2529430 . PMID 1174616 .
- Liu, Xu-Qing; Rong, Jian-Ying; Liu, Xiu-Ying (2008). „Najlepsza liniowa, nieobciążona prognoza dla kombinacji liniowych w ogólnych mieszanych modelach liniowych” . Dziennik analizy wielowymiarowej . 99 (8): 1503–1517. doi : 10.1016/j.jmva.2008.01.004 .