Predykcyjna reprezentacja stanu
W informatyce predykcyjna reprezentacja stanu ( PSR ) jest sposobem modelowania stanu kontrolowanego układu dynamicznego z historii podjętych działań i wynikających z nich obserwacji. PSR przechwytuje stan systemu jako wektor prognoz dla przyszłych testów (eksperymentów), które można przeprowadzić w systemie. Test to sekwencja par akcja-obserwacja, a jego przewidywanie to prawdopodobieństwo zajścia sekwencji obserwacji-testu, gdyby sekwencja akcji-działania testu miała zostać wykonana w systemie. Jedną z zalet korzystania z PSR jest to, że przewidywania są bezpośrednio powiązane z obserwowalnymi wielkościami. Kontrastuje to z innymi modelami systemów dynamicznych, takimi jak częściowo obserwowalne procesy decyzyjne Markowa (POMDP), gdzie stan systemu jest reprezentowany jako rozkład prawdopodobieństwa w nieobserwowanych stanach nominalnych.
- Littman, Michael L .; Richarda S. Suttona ; Satinder Singh (2002). „Predyktywne reprezentacje stanu” (PDF) . Postępy w neuronowych systemach przetwarzania informacji 14 (NIPS) . s. 1555–1561.
- Singh, Satinder; Michaela R. Jamesa; Mateusz R. Rudary (2004). „Predykcyjne reprezentacje stanu: nowa teoria modelowania systemów dynamicznych” (PDF) . Niepewność w sztucznej inteligencji: Proceedings of the Twentieth Conference (UAI) . s. 512–519.
- Wiewiora, Eric Walter (2008), Modelowanie rozkładów prawdopodobieństwa za pomocą predykcyjnych reprezentacji stanu (PDF)