Uogólniony rozkład Dirichleta

W statystyce uogólniony rozkład Dirichleta ( GD ) jest uogólnieniem rozkładu Dirichleta z bardziej ogólną strukturą kowariancji i prawie dwukrotnie większą liczbą parametrów. Wektory losowe o rozkładzie GD są całkowicie neutralne .

Funkcja gęstości jest p

gdzie definiujemy . Tutaj oznacza funkcję Beta . standardowego ⩽ ( jest dowolne).

Na przykład, jeśli k=4 , to funkcja gęstości {2}

gdzie i .

Connor i Mosimann definiują plik PDF tak, jak to zrobili, z następującego powodu. Zdefiniuj zmienne losowe z . Następnie mają uogólniony rozkład Dirichleta sparametryzowany powyżej, jeśli są niezależnymi beta z parametrami , .

Alternatywna forma podana przez Wonga

Wong podaje nieco bardziej zwięzłą formę dla

gdzie dla i . Zauważ, że Wong definiuje rozkład w (niejawnie definiując) podczas gdy Connor i Mosiman używają wymiarowej z .

Ogólna funkcja momentu

Jeśli , więc

gdzie dla i . Zatem

Redukcja do standardowego rozkładu Dirichleta

Jak stwierdzono powyżej, jeśli dla , to rozkład sprowadza się do standardowego rozkładu Dirichleta. Warunek ten różni się od zwykłego przypadku, w którym ustawienie dodatkowych parametrów rozkładu uogólnionego na zero daje rozkład pierwotny. Jednak w przypadku GDD skutkuje to bardzo skomplikowaną funkcją gęstości.

Analiza bayesowska

Załóżmy, że Dirichletem i że jest wielomianem z tutaj ). jot {\ Displaystyle Y_ { dla i tylny jest uogólnionym rozkładem Dirichleta z

gdzie i przez

Próbkowanie eksperymentu

Wong podaje następujący system jako przykład tego, jak różnią się rozkłady Dirichleta i uogólnione rozkłady Dirichleta. Twierdzi, że duża urna zawiera różnych Proporcja każdego koloru jest nieznana. Napisz dla proporcji kulek z kolorem urnie.

Eksperyment 1 . Analityk 1 uważa, że (tj. Dirichlet z parametrami . analityk wykonuje pudełka i umieszcza kolorowe kulki w pudełku jest to przyjęto, że są liczby całkowite ). Następnie analityk 1 wyciąga piłkę z urny, obserwuje jej kolor (powiedzmy kolor umieszcza ją w pudełku . Może zidentyfikować właściwe pudełko, ponieważ są przezroczyste i widoczne są kolory kulek w środku. Proces trwa do momentu . Późniejszy rozkład to Dirichlet z parametrami będącymi liczbą kulek w każdym pudełku.

Eksperyment 2 . Analityk 2 uważa, że ​​jest zgodny z uogólnionym rozkładem Dirichleta: . Ponownie przyjmuje się, że wszystkie parametry są dodatnimi liczbami całkowitymi. Analityk pudełka Pudełka mają dwa obszary: jeden na kulki i jeden na kulki. Kule są kolorowe, ale kulki nie są kolorowe. Następnie dla kulki β jot kulki, do pudełka . Następnie umieszcza kolorową kulkę w pudełku displaystyle Następnie analityk losuje kulę z urny. Ponieważ pudełka są drewniane, analityk nie może powiedzieć, do którego pudełka włożyć piłkę (jak mógł to zrobić w eksperymencie 1 powyżej); ma też słabą pamięć i nie pamięta, w którym pudełku znajdują się kolorowe kulki. Musi odkryć, do którego pudełka należy włożyć piłkę. Robi to, otwierając pudełko 1 i porównując znajdujące się w nim kule z wylosowaną kulą. Jeśli kolory się różnią, pudełko jest niewłaściwe. Analityk umieszcza kulkę (sic) w pudełku 1 i przechodzi do pudełka 2. Powtarza ten proces, aż kule w pudełku będą pasować do wylosowanej kuli, w którym to momencie umieszcza piłkę (sic) w pudełku z innymi kulami pasujący kolor. Analityk następnie losuje kolejną kulę z urny i powtarza, aż kule. Tylny jest następnie uogólniony Dirichlet z parametrami i liczbą kulek w każdym pudełku

Zauważ, że w eksperymencie 2 zmiana kolejności pól ma nietrywialny efekt, w przeciwieństwie do eksperymentu 1.

Zobacz też