Notacja płytkowa

We wnioskowaniu bayesowskim notacja tablicowa jest metodą reprezentacji zmiennych, które powtarzają się w modelu graficznym . Zamiast rysować każdą powtarzającą się zmienną indywidualnie, stosuje się tabliczkę lub prostokąt do grupowania zmiennych w podwykres, który powtarza się razem, a na tabliczce rysowana jest liczba reprezentująca liczbę powtórzeń podwykresu na tabliczce. Założenia są takie, że podgraf jest powielany tyle razy, zmienne w podgrafie są indeksowane według liczby powtórzeń, a wszelkie połączenia przekraczające granicę płytki są replikowane raz dla każdego powtórzenia podgrafu.

Przykład

Notacja tablicowa dla utajonej alokacji Dirichleta

W tym przykładzie rozważymy utajoną alokację Dirichleta , sieć bayesowską , która modeluje, w jaki sposób dokumenty w korpusie są tematycznie powiązane. Istnieją dwie zmienne, których nie ma na żadnej tablicy; α jest parametrem jednolitego wcześniejszego Dirichleta w rozkładzie tematów według dokumentu, a β jest parametrem jednolitego wcześniejszego Dirichleta w dystrybucji słów według tematu.

$płytka$ reprezentuje wszystkie zmienne związane z określonym dokumentem, w tym tematów dla dokumentu i . Litera M w rogu tablicy oznacza, że zmienne w środku są powtarzane M razy, raz dla każdego dokumentu. Płyta wewnętrzna reprezentuje zmienne związane z każdym ze $}$ w dokumencie $ja$ : } $j$ rozkładem tematów dla - słowa w dokumencie i , a faktycznie użytym słowem.

N w rogu reprezentuje powtórzenie zmiennych na wewnętrznej płytce razy $.$ raz dla każdego słowa w i Kółko reprezentujące poszczególne słowa jest zacienione, co wskazuje, że każde $jest$ , a pozostałe kółka że inne zmienne są zmiennymi ukrytymi . Ukierunkowane krawędzie między zmiennymi wskazują zależności między zmiennymi: na przykład ${\ Displaystyle w_ {ij}}$ zależy od ${\ Displaystyle z_ {ij}}$ i β .

Rozszerzenia

Bayesowski wielowymiarowy model mieszaniny Gaussa z wykorzystaniem notacji tablicowej. Mniejsze kwadraty oznaczają stałe parametry; większe kółka oznaczają zmienne losowe. Wypełnione kształty wskazują znane wartości. Oznaczenie [K] oznacza wektor o rozmiarze K ; [D,D] oznacza macierz o rozmiarze D × D ; Samo K oznacza zmienną kategoryczną z K wynikami. Falista linia rozpoczynająca się od z kończąca się na poprzeczce oznacza przełącznik — wartość tej zmiennej wybiera, dla innych przychodzących zmiennych, której wartości należy użyć z tablicy rozmiar- K możliwych wartości.

Różni autorzy stworzyli wiele rozszerzeń, aby wyrazić więcej informacji niż tylko relacje warunkowe. Jednak niewiele z nich stało się standardem. Być może najczęściej używanym rozszerzeniem jest użycie prostokątów zamiast kół do wskazania zmiennych nielosowych — albo parametrów do obliczenia, hiperparametrów z określoną wartością (lub obliczonych za pomocą empirycznego Bayesa ) lub zmiennych, których wartości są obliczane deterministycznie z losowej zmienny.

Diagram po prawej pokazuje jeszcze kilka niestandardowych konwencji stosowanych w niektórych artykułach w Wikipedii (np. wariacyjny Bayes ):

Zmienne, które w rzeczywistości są wektorami losowymi , są wskazywane przez umieszczenie rozmiaru wektora w nawiasach w środku węzła.
Zmienne, które w rzeczywistości są macierzami losowymi , są podobnie oznaczane przez umieszczenie rozmiaru macierzy w nawiasach w środku węzła, z przecinkami oddzielającymi rozmiar wiersza od rozmiaru kolumny.
Zmienne kategorialne są wskazywane przez umieszczenie ich rozmiaru (bez nawiasu) w środku węzła.
Zmienne kategoryczne, które działają jak „przełączniki” i które wybierają jedną lub więcej innych zmiennych losowych do warunkowania z dużego zestawu takich zmiennych (np. składniki mieszaniny), są oznaczone specjalnym rodzajem strzałki zawierającej linię falistą i kończącą się skrzyżowanie T.
Pogrubiona czcionka jest konsekwentnie używana w przypadku węzłów wektorów lub macierzy (ale nie węzłów jakościowych).

Implementacja oprogramowania

Notacja płyt została zaimplementowana w różnych pakietach rysunkowych TeX / LaTeX , ale także jako część graficznych interfejsów użytkownika do programów statystycznych bayesowskich, takich jak BUGS i BayesiaLab.

^ Ghahramani, Zoubin (sierpień 2007). Modele graficzne (mowa). Tybinga, Niemcy . Źródło 21 lutego 2008 r .
^ Buntine, Wray L. (grudzień 1994). „Operacje uczenia się z modelami graficznymi” (PDF) . Dziennik badań nad sztuczną inteligencją . Fundacja dostępu do sztucznej inteligencji. 2 : 159–225. arXiv : cs/9412102 . Bibcode : 1994cs.......12102B . doi : 10.1613/jair.62 . ISSN 1076-9757 . Źródło 21 lutego 2008 r .

[1] Ghahramani, Zoubin (sierpień 2007). Modele graficzne (mowa). Tybinga, Niemcy . Źródło 21 lutego 2008 r .

[2] Buntine, Wray L. (grudzień 1994). „Operacje uczenia się z modelami graficznymi” (PDF) . Dziennik badań nad sztuczną inteligencją . Fundacja dostępu do sztucznej inteligencji. 2 : 159–225. arXiv : cs/9412102 . Bibcode : 1994cs.......12102B . doi : 10.1613/jair.62 . ISSN 1076-9757 . Źródło 21 lutego 2008 r .