Richarda S. Suttona
Richarda S. Suttona
| |
---|---|
Narodowość | kanadyjski |
Obywatelstwo | kanadyjski |
Alma Mater |
Uniwersytet Massachusetts Uniwersytet Amherst Stanford |
Znany z | Uczenie się różnic czasowych , Dyna, Opcje, GQ(λ) |
Nagrody |
Członek AAAI (2001) Nagroda Prezydenta (INNS) (2003) Członek Królewskiego Towarzystwa Kanadyjskiego (2016) |
Kariera naukowa | |
Pola |
Uczenie się ze wzmocnieniem sztucznej inteligencji |
Instytucje | Uniwersytet Alberty |
Praca dyplomowa | Czasowe przypisanie punktów w uczeniu się przez wzmacnianie (1984) |
Doradca doktorski | Andrzej Barto |
Doktoranci | David Silver , Doina Precup |
Strona internetowa |
Richard S. Sutton FRS jest kanadyjskim informatykiem . Jest wybitnym pracownikiem naukowym w DeepMind i profesorem informatyki na Uniwersytecie Alberty . Sutton jest uważany za jednego z twórców nowoczesnego uczenia się przez wzmacnianie obliczeniowe , mającego kilka znaczących wkładów w tę dziedzinę, w tym uczenie się przez różnice czasowe i metody gradientu polityki.
Życie i edukacja
Richard Sutton urodził się w Ohio , a dorastał w Oak Brook w stanie Illinois , na przedmieściach Chicago .
Sutton uzyskał tytuł licencjata z psychologii na Uniwersytecie Stanforda w 1978 r., a następnie uzyskał tytuł magistra (1980) i stopień doktora. (1984) w dziedzinie informatyki na Uniwersytecie Massachusetts Amherst pod kierunkiem Andrew Barto . W swojej rozprawie doktorskiej pt. Temporal Credit Assignment in Reinforcement Learning przedstawił architekturę aktorsko-krytyczną i tymczasowe przypisywanie punktów .
Kariera
W 1984 Sutton był pracownikiem naukowym ze stopniem doktora na Uniwersytecie Massachusetts.
Od 1985 do 1994 był głównym członkiem personelu technicznego w Laboratorium Komputerów i Systemów Inteligentnych w GTE w Waltham w stanie Massachusetts . W 1995 powrócił na Uniwersytet Massachusetts jako starszy pracownik naukowy.
Od 1998 do 2002 roku Sutton pracował w laboratorium AT&T Shannon w Florham Park w stanie New Jersey jako główny pracownik techniczny w dziale sztucznej inteligencji.
Od 2003 roku jest profesorem informatyki na Uniwersytecie Alberty . Do 2018 roku kierował w tej instytucji Laboratorium uczenia się przez wzmacnianie i sztucznej inteligencji.
Zachowując stanowisko profesora, Sutton dołączył do Deepmind w czerwcu 2017 r. jako wybitny naukowiec i współzałożyciel nowego biura w Edmonton .
Sutton przyjął obywatelstwo Kanady w 2015 r. i zrzekł się obywatelstwa amerykańskiego w 2017 r. [ potrzebne źródło ]
W eseju z 2019 r. Sutton skrytykował dziedzinę badań nad sztuczną inteligencją za to, że „nie wyciągnęła gorzkiej lekcji, że budowanie tego, jak myślimy, nie działa na dłuższą metę”, argumentując, że „70 lat badań nad sztuczną inteligencją [pokazało], że ogólne metody wykorzystujące obliczenia są ostatecznie najskuteczniejsze i to z dużą przewagą”, pokonując wysiłki opierające się na ludzkiej wiedzy na temat konkretnych dziedzin, takich jak widzenie komputerowe, rozpoznawanie mowy, szachy czy Go.
Wybrane publikacje
- Sutton, RS, Barto, AG, Uczenie się przez wzmacnianie: wprowadzenie . MIT Press, 1998. Przetłumaczone także na język japoński i rosyjski. Wydanie drugie MIT Press 2018.
- Miller, WT, Sutton, RS, Werbos, PJ (red.), Sieci neuronowe do sterowania . MIT Press, 1991.
- Sutton, RS (red.), Uczenie się przez wzmacnianie. Przedruk specjalnego wydania Machine Learning Journal. Wydawnictwo Akademickie Kluwer, 1992
Nagrody i wyróżnienia
Sutton jest członkiem Association for the Advancement of Artificial Intelligence (AAAI) od 2001 roku. W 2003 roku otrzymał Nagrodę Prezydenta od Międzynarodowego Towarzystwa Sieci Neuralnych, a w 2013 roku nagrodę za wybitne osiągnięcia badawcze przyznaną przez Uniwersytet Massachusetts Amherst .
Nominacja Suttona do stypendium AAAI brzmi:
Za znaczący wkład w wiele tematów uczenia maszynowego, w tym uczenie się przez wzmacnianie, techniki różnic czasowych i sieci neuronowe.
W 2021 roku Sutton został wybrany członkiem Towarzystwa Królewskiego.
Linki zewnętrzne
- Strona główna Richarda Suttona
- Richarda S. Suttona indeksowane przez Google Scholar