Uciążliwy parametr
W statystyce parametr uciążliwy to dowolny parametr , który nie jest określony, ale który musi być uwzględniony w testowaniu hipotez dotyczących parametrów, które są przedmiotem zainteresowania.
Klasyczny przykład uciążliwego parametru pochodzi z rozkładu normalnego , należącego do rodziny lokalizacji i skali . Dla co najmniej jednego rozkładu normalnego wariancja (wariancje), σ 2 często nie jest określona ani znana, ale chce się postawić hipotezę testującą średnią (średnie). Innym przykładem może być regresja liniowa z nieznaną wariancją zmiennej objaśniającej (zmiennej niezależnej): jej wariancja jest uciążliwym parametrem, który należy uwzględnić, aby uzyskać dokładne oszacowanie przedziału nachylenie regresji , oblicz p-wartości , test hipotezy na temat wartości nachylenia; patrz rozcieńczenie regresji .
Parametry uciążliwe to często parametr skali , ale nie zawsze; na przykład w modelach błędów w zmiennych nieznana prawdziwa lokalizacja każdej obserwacji jest uciążliwym parametrem. Parametr może również przestać być „uciążliwy”, jeśli stanie się przedmiotem badań, zostanie oszacowany na podstawie danych lub znany.
Statystyka teoretyczna
Ogólne traktowanie uciążliwych parametrów może być zasadniczo podobne w podejściu częstościowym i bayesowskim do statystyki teoretycznej. Polega ona na próbie podziału funkcji wiarygodności na składowe reprezentujące informacje o interesujących nas parametrach oraz informacje o innych (uciążliwych) parametrach. Może to obejmować pomysły dotyczące wystarczających statystyk i statystyk pomocniczych . Kiedy taki podział będzie można osiągnąć, możliwe będzie zakończenie analizy bayesowskiej dla interesujących nas parametrów poprzez algebraiczne określenie ich łącznego rozkładu a posteriori. Podział pozwala teorii częstości na opracowanie ogólnych podejść estymacyjnych w obecności uciążliwych parametrów. Jeśli nie można osiągnąć podziału, nadal możliwe jest skorzystanie z przybliżonego podziału.
W niektórych szczególnych przypadkach możliwe jest sformułowanie metod omijających obecność uciążliwych parametrów. Test t jest praktycznie użytecznym testem, ponieważ statystyka testowa nie zależy od nieznanej wariancji, a jedynie od wariancji próby. Jest to przypadek, w którym można wykorzystać decydującą ilość . Jednak w innych przypadkach takie obejście nie jest znane.
Statystyka praktyczna
Praktyczne podejścia do analizy statystycznej traktują parametry uciążliwe nieco inaczej w metodologii częstości i bayesowskiej.
Ogólne podejście w analizie częstości może opierać się na testach maksymalnego ilorazu wiarygodności . Zapewniają one zarówno testy istotności , jak i przedziały ufności dla parametrów będących przedmiotem zainteresowania, które są w przybliżeniu poprawne dla średnich i dużych rozmiarów próbek i które uwzględniają obecność uciążliwych parametrów. Patrz Basu (1977) dla ogólnej dyskusji oraz Spall i Garner (1990) dla niektórych dyskusji dotyczących identyfikacji parametrów w liniowych modelach dynamicznych (tj. reprezentacji w przestrzeni stanów ).
W analizie bayesowskiej ogólnie stosowane podejście tworzy losowe próbki ze wspólnego rozkładu a posteriori wszystkich parametrów: patrz łańcuch Markowa Monte Carlo . Biorąc to pod uwagę, łączny rozkład tylko interesujących parametrów można łatwo znaleźć, marginalizując uciążliwe parametry. Jednak to podejście może nie zawsze być wydajne obliczeniowo, jeśli niektóre lub wszystkie uciążliwe parametry można wyeliminować na podstawie teoretycznej.
Zobacz też
- Basu, D. (1977), „O eliminacji uciążliwych parametrów”, Journal of American Statistical Association , tom. 77, s. 355–366. doi : 10.1080/01621459.1977.10481002
- Bernardo, JM, Smith, AFM (2000) Bayesowska teoria . Wileya. ISBN 0-471-49464-X
- Cox, DR, Hinkley, DV (1974) Statystyka teoretyczna . Chapmana i Halla. ISBN 0-412-12420-3
- Spall, JC i Garner, JP (1990), „Identyfikacja parametrów dla modeli przestrzeni stanów z parametrami uciążliwymi”, IEEE Transactions on Aerospace and Electronic Systems , tom. 26(6), s. 992–998.
- Young, GA, Smith, RL (2005) Podstawy wnioskowania statystycznego , CUP. ISBN 0-521-83971-8