Notacja płytkowa
We wnioskowaniu bayesowskim notacja tablicowa jest metodą reprezentacji zmiennych, które powtarzają się w modelu graficznym . Zamiast rysować każdą powtarzającą się zmienną indywidualnie, stosuje się tabliczkę lub prostokąt do grupowania zmiennych w podwykres, który powtarza się razem, a na tabliczce rysowana jest liczba reprezentująca liczbę powtórzeń podwykresu na tabliczce. Założenia są takie, że podgraf jest powielany tyle razy, zmienne w podgrafie są indeksowane według liczby powtórzeń, a wszelkie połączenia przekraczające granicę płytki są replikowane raz dla każdego powtórzenia podgrafu.
Przykład
W tym przykładzie rozważymy utajoną alokację Dirichleta , sieć bayesowską , która modeluje, w jaki sposób dokumenty w korpusie są tematycznie powiązane. Istnieją dwie zmienne, których nie ma na żadnej tablicy; α jest parametrem jednolitego wcześniejszego Dirichleta w rozkładzie tematów według dokumentu, a β jest parametrem jednolitego wcześniejszego Dirichleta w dystrybucji słów według tematu.
reprezentuje wszystkie zmienne związane z określonym dokumentem, w tym tematów dla dokumentu i . Litera M w rogu tablicy oznacza, że zmienne w środku są powtarzane M razy, raz dla każdego dokumentu. Płyta wewnętrzna reprezentuje zmienne związane z każdym ze w dokumencie : } rozkładem tematów dla - słowa w dokumencie i , a faktycznie użytym słowem.
N w rogu reprezentuje powtórzenie zmiennych na wewnętrznej płytce razy raz dla każdego słowa w i Kółko reprezentujące poszczególne słowa jest zacienione, co wskazuje, że każde , a pozostałe kółka że inne zmienne są zmiennymi ukrytymi . Ukierunkowane krawędzie między zmiennymi wskazują zależności między zmiennymi: na przykład zależy od i β .
Rozszerzenia
Różni autorzy stworzyli wiele rozszerzeń, aby wyrazić więcej informacji niż tylko relacje warunkowe. Jednak niewiele z nich stało się standardem. Być może najczęściej używanym rozszerzeniem jest użycie prostokątów zamiast kół do wskazania zmiennych nielosowych — albo parametrów do obliczenia, hiperparametrów z określoną wartością (lub obliczonych za pomocą empirycznego Bayesa ) lub zmiennych, których wartości są obliczane deterministycznie z losowej zmienny.
Diagram po prawej pokazuje jeszcze kilka niestandardowych konwencji stosowanych w niektórych artykułach w Wikipedii (np. wariacyjny Bayes ):
- Zmienne, które w rzeczywistości są wektorami losowymi , są wskazywane przez umieszczenie rozmiaru wektora w nawiasach w środku węzła.
- Zmienne, które w rzeczywistości są macierzami losowymi , są podobnie oznaczane przez umieszczenie rozmiaru macierzy w nawiasach w środku węzła, z przecinkami oddzielającymi rozmiar wiersza od rozmiaru kolumny.
- Zmienne kategorialne są wskazywane przez umieszczenie ich rozmiaru (bez nawiasu) w środku węzła.
- Zmienne kategoryczne, które działają jak „przełączniki” i które wybierają jedną lub więcej innych zmiennych losowych do warunkowania z dużego zestawu takich zmiennych (np. składniki mieszaniny), są oznaczone specjalnym rodzajem strzałki zawierającej linię falistą i kończącą się skrzyżowanie T.
- Pogrubiona czcionka jest konsekwentnie używana w przypadku węzłów wektorów lub macierzy (ale nie węzłów jakościowych).
Implementacja oprogramowania
Notacja płyt została zaimplementowana w różnych pakietach rysunkowych TeX / LaTeX , ale także jako część graficznych interfejsów użytkownika do programów statystycznych bayesowskich, takich jak BUGS i BayesiaLab.
- ^ Ghahramani, Zoubin (sierpień 2007). Modele graficzne (mowa). Tybinga, Niemcy . Źródło 21 lutego 2008 r .
- ^ Buntine, Wray L. (grudzień 1994). „Operacje uczenia się z modelami graficznymi” (PDF) . Dziennik badań nad sztuczną inteligencją . Fundacja dostępu do sztucznej inteligencji. 2 : 159–225. arXiv : cs/9412102 . Bibcode : 1994cs.......12102B . doi : 10.1613/jair.62 . ISSN 1076-9757 . Źródło 21 lutego 2008 r .