Uogólniony rozkład chi-kwadrat

Uogólniony rozkład chi-kwadrat
Funkcja gęstości prawdopodobieństwa
Generalized chi-square probability density function
Funkcja dystrybucji skumulowanej
Generalized chi-square cumulative distribution function
Notacja
Parametry



, wektor wag niecentralnych składowych chi-kwadrat , wektor stopni swobody niecentralnych składowych chi-kwadrat , wektor niecentralnych parametrów składowych chi-kwadrat średnia wyrażenia normalnego , sd wyrażenia normalnego
Wsparcie
Mieć na myśli
Zmienność
CF

W teorii prawdopodobieństwa i statystyce uogólniony rozkład chi-kwadrat (lub uogólniony rozkład chi-kwadrat ) jest rozkładem formy kwadratowej zmiennej wielonormalnej (wektor normalny) lub liniową kombinacją różnych zmiennych normalnych i kwadratów zmiennych normalnych. Równoważnie, jest to również liniowa suma niezależnych niecentralnych zmiennych chi-kwadrat i zmiennej normalnej . Istnieje kilka innych takich uogólnień, dla których czasami używa się tego samego terminu; niektóre z nich to szczególne przypadki omawianej tu rodziny, na przykład rozkład gamma .

Definicja

Uogólnioną zmienną chi-kwadrat można opisać na wiele sposobów. Jednym z nich jest zapisanie go jako sumy liniowej niezależnych niecentralnych zmiennych chi-kwadrat i zmiennej normalnej:

wagi , stopnie swobody niecentralności w i normalne parametry s {\ . Niektóre ważne szczególne przypadki tego mają wszystkie wagi lub mają centralne składowe chi-kwadrat lub pomijają normalny wyraz.

Ponieważ niecentralna zmienna chi-kwadrat jest sumą kwadratów zmiennych normalnych o różnych średnich, uogólniona zmienna chi-kwadrat jest również definiowana jako suma kwadratów niezależnych zmiennych normalnych plus niezależna zmienna normalna: tj. kwadratowy w normalnych zmiennych.

Innym równoważnym sposobem jest sformułowanie go jako kwadratowej formy wektora normalnego: :

.

Tutaj jest macierzą, jest wektorem i jest skalar. Te, wraz ze średnią normalnego i macierzą kowariancji , parametryzować dystrybucję. Parametry pierwszego wyrażenia (pod względem niecentralnych chi-kwadratów, normalnej i stałej) można obliczyć za pomocą parametrów drugiego wyrażenia (postać kwadratowa wektora normalnego). Jeśli (i tylko wtedy) tym sformułowaniu jest określony , to wszystkie w pierwszym sformułowaniu będą miały ten sam znak w .

W najbardziej ogólnym przypadku można dokonać redukcji w kierunku wspólnego formularza standardowego, stosując reprezentację następującego formularza:

gdzie D jest macierzą diagonalną, a x reprezentuje wektor nieskorelowanych standardowych normalnych zmiennych losowych.

Obliczanie pdf/cdf/odwrotnego cdf/liczb losowych

Funkcje gęstości prawdopodobieństwa, rozkładu skumulowanego i odwrotności rozkładu skumulowanego uogólnionej zmiennej chi-kwadrat nie mają prostych wyrażeń w postaci zamkniętej. Jednak algorytmy numeryczne i kod komputerowy ( Fortran i C , Matlab , R , Python ) zostały opublikowane w celu oceny niektórych z nich i wygenerowania losowych próbek.

W przypadku, gdy możliwe jest uzyskanie dokładnego wyrażenia na średnią i wariancję , pokazano w artykuł o formach kwadratowych .

Aplikacje

Uogólniony chi-kwadrat to rozkład szacunków statystycznych w przypadkach, w których nie obowiązuje zwykła teoria statystyczna , jak w poniższych przykładach.

W dopasowaniu i doborze modelu

Jeśli model predykcyjny jest dopasowany metodą najmniejszych kwadratów , ale reszty mają albo autokorelację , albo heteroskedastyczność , to alternatywne modele można porównać (w wyborze modelu ) przez odniesienie zmian sumy kwadratów do asymptotycznie ważnego uogólnionego rozkładu chi-kwadrat.

Klasyfikacja wektorów normalnych za pomocą analizy dyskryminacyjnej Gaussa

Jeśli jest jego logarytm prawdopodobieństwa jest formą kwadratową , a zatem rozłożony jako uogólniony chi-kwadrat. Logarytmiczny współczynnik wiarygodności, który wynika z jednego rozkładu normalnego w porównaniu z innym, jest również , więc ma rozkład jako uogólniony chi-kwadrat.

W analizie dyskryminacyjnej Gaussa próbki z rozkładów wielonormalnych są optymalnie oddzielane przy użyciu klasyfikatora kwadratowego , granicy będącej funkcją kwadratową (np. krzywa zdefiniowana przez ustawienie ilorazu wiarygodności między dwoma gaussami na 1). Stopy błędów klasyfikacji różnych typów (fałszywie dodatnie i fałszywie ujemne) są całkami rozkładów normalnych w obszarach kwadratowych zdefiniowanych przez ten klasyfikator. Ponieważ jest to matematycznie równoważne całkowaniu postaci kwadratowej wektora normalnego, wynikiem jest całka uogólnionej zmiennej chi-kwadrat.

W przetwarzaniu sygnału

Następująca aplikacja pojawia się w kontekście analizy Fouriera w przetwarzaniu sygnałów , teorii odnawiania w teorii prawdopodobieństwa oraz systemów wieloantenowych w komunikacji bezprzewodowej . Wspólnym czynnikiem tych obszarów jest to, że ważna jest suma zmiennych o rozkładzie wykładniczym (lub identycznie suma kwadratów wielkości zespolonych zmiennych Gaussa o kołowo-symetrycznej środku ).

mean 0 and variance Z k niezależnych , kołowo-symetrycznych złożonych zmiennych losowych Gaussa ze , then the random variable

ma uogólniony rozkład chi-kwadrat określonej postaci. Różnica w stosunku do standardowego rozkładu chi-kwadrat polega na tym, że złożone i mogą mieć różne wariancje, a różnica w stosunku do bardziej ogólnego rozkładu chi-kwadrat polega na tym, że odpowiednia macierz jest ukośna . Jeśli wszystkich ja , to zmniejszone o . pomnożone przez , ma rozkład chi-kwadrat χ } znany również jako rozkład Erlanga . Jeśli mają różne wartości dla wszystkich ja , to ma pdf

Jeśli istnieją zestawy powtarzających się wariancji między że są one podzielone na M zestawów, z każdy reprezentuje określoną wartość wariancji. Oznacz liczbę powtórzeń w każdej grupie. Oznacza to, że m ty zestaw zawiera mają wariancję Reprezentuje dowolną liniową kombinację niezależnych zmiennych losowych o rozkładzie

Plik pdf z jest

Gdzie

z ze zbioru wszystkich partycji (z jako ja

Zobacz też

  1. ^ Davies, RB (1973) Numeryczne odwrócenie funkcji charakterystycznej. Biometrika , 60 (2), 415–417
  2. ^ a b Davies, R, B. (1980) „Algorytm AS155: Rozkład kombinacji liniowej χ 2 zmiennych losowych”, Statystyka stosowana , 29, 323–333
  3. ^ a b Jones, DA (1983) „Analiza statystyczna modeli empirycznych dopasowanych przez optymalizację”, Biometrika , 70 (1), 67–88
  4. ^ a b c d e Das, Abhranil; Geisler, Wilson (2020). „Metoda całkowania i klasyfikowania rozkładów normalnych”. arXiv : 2012.14331 .
  5. ^ ab Statystyka Sheil, J., O'Muircheartaigh, I. (1977) „Algorytm AS106: Rozkład nieujemnych form kwadratowych w zmiennych normalnych”, stosowana , 26, 92–98
  6. ^   Imhof, JP (1961). „Obliczanie rozkładu form kwadratowych w zmiennych normalnych” (PDF) . Biometria . 48 (3/4): 419–426. doi : 10.2307/2332763 . JSTOR 2332763 .
  7. Bibliografia _ _ _
  8. Bibliografia _ _ _ _ _

Linki zewnętrzne