Neurogammon

Neurogammon to komputerowy program do tryktraka napisany przez Geralda Tesauro z IBM Thomas J. Watson Research Center . Był to pierwszy opłacalny komputerowy program do gry w tryktraka zaimplementowany jako sieć neuronowa i wyznaczył nowy standard w komputerowej grze w tryktraka. Wygrał pierwszą Olimpiadę Komputerową w Londynie w 1989 roku, zręcznie pokonując wszystkich przeciwników. Jego poziom gry był taki, jak przeciętnego gracza.

Neurogammon zawiera siedem oddzielnych sieci neuronowych, z których każda ma pojedynczą warstwę ukrytą. Jedna sieć podejmuje decyzje dotyczące podwójnych kostek; pozostałych sześciu wybiera ruchy na różnych etapach gry. Sieci zostały wytrenowane przez propagację wsteczną z transkrypcji 400 gier, w których grał sam autor. Ruch autora został nauczony jako najlepszy ruch w każdej pozycji.

W 1992 roku Tesauro ukończył grę TD-Gammon , która łączyła formę uczenia się przez wzmacnianie z zaprojektowanymi przez człowieka funkcjami wejściowymi Neurogammon i grała na poziomie światowej klasy gracza turniejowego.

Dalsza lektura