Neurogammon

Neurogammon to komputerowy program do tryktraka napisany przez Geralda Tesauro z IBM Thomas J. Watson Research Center . Był to pierwszy opłacalny komputerowy program do gry w tryktraka zaimplementowany jako sieć neuronowa i wyznaczył nowy standard w komputerowej grze w tryktraka. Wygrał pierwszą Olimpiadę Komputerową w Londynie w 1989 roku, zręcznie pokonując wszystkich przeciwników. Jego poziom gry był taki, jak przeciętnego gracza.

Neurogammon zawiera siedem oddzielnych sieci neuronowych, z których każda ma pojedynczą warstwę ukrytą. Jedna sieć podejmuje decyzje dotyczące podwójnych kostek; pozostałych sześciu wybiera ruchy na różnych etapach gry. Sieci zostały wytrenowane przez propagację wsteczną z transkrypcji 400 gier, w których grał sam autor. Ruch autora został nauczony jako najlepszy ruch w każdej pozycji.

W 1992 roku Tesauro ukończył grę TD-Gammon , która łączyła formę uczenia się przez wzmacnianie z zaprojektowanymi przez człowieka funkcjami wejściowymi Neurogammon i grała na poziomie światowej klasy gracza turniejowego.

Dalsza lektura

Mandziuk, Jacek (2010). „CI w grach – wybrane podejścia” . Metody oparte na nauce i bez wiedzy w inteligentnych grach . Berlin: Springer. s. 71–89. ISBN 978-3-642-11677-3 .