AlphaStar (oprogramowanie)

W przypadku usługi nadawczej: AlphaStar (usługa nadawcza satelitarna)

AlphaStar to program komputerowy firmy DeepMind , który odtwarza grę wideo StarCraft II . Został publicznie zaprezentowany z nazwy w styczniu 2019 r. W znaczącym kamieniu milowym dla sztucznej inteligencji AlphaStar osiągnął status arcymistrza w sierpniu 2019 r.

Tło

Uważa się, że gry tworzone dla ludzi mają zewnętrzną ważność jako wyznaczniki postępu w sztucznej inteligencji . Gra w szachy IBM Deep Blue (1997) i DeepMind's AlphaGo (2016) zostały uznane za główne kamienie milowe; niektórzy twierdzą, że StarCraft byłby również kamieniem milowym ze względu na „grę w czasie rzeczywistym StarCraft , częściową obserwowalność, brak jednej dominującej strategii, złożone zasady, które utrudniają zbudowanie modelu szybkiego przewijania do przodu, oraz szczególnie dużą i zróżnicowaną przestrzeń akcji. " Choć trudny, StarCraft może nadal być wykonalny przy obecnej technologii, ponieważ „jego zasady są znane, a świat jest dyskretny i zawiera tylko kilka typów obiektów”.

StarCraft II to popularna gra strategiczna czasu rzeczywistego online firmy Blizzard Entertainment .

Historia

Firma DeepMind Technologies została założona w Wielkiej Brytanii w 2010 roku. Już w 2011 roku założyciel Demis Hassabis nazwał StarCraft „następnym krokiem naprzód” po grach takich jak Go . DeepMind stał się Google w 2014 roku, po zademonstrowaniu samouczących się botów o nadludzkich zdolnościach w różnych grach na Atari 2600 . W lutym 2015 roku informatyk Zachary Mason przewidział, że badania Deepmind „prowadzą do StarCrafta za pięć lub dziesięć lat”. W marcu 2016 r., po zwycięstwie AlphaGo nad Lee Sedolem , mistrzem świata w Go , Hassabis publicznie rozważał zbudowanie sztucznej inteligencji dla StarCraft , powołując się na to, że jest to gra strategiczna z niepełnymi informacjami , w której (w przeciwieństwie do Go) znaczna część „planszy” jest niewidoczna. Formalna współpraca została ogłoszona na BlizzConie w listopadzie 2016 roku, wraz z planem wydania otwartego środowiska programistycznego dla botów w pierwszym kwartale 2017 roku.

Do 2017 roku DeepMind eksperymentował z wprowadzaniem danych StarCraft do swojego oprogramowania. W sierpniu 2017 r. firmy DeepMind i Blizzard udostępniły narzędzia programistyczne pomagające w tworzeniu botów, a także udostępniły dane z 65 000 poprzednich gier. W tamtym czasie informatyk i menedżer turniejów StarCraft , David Churchill, przypuszczał, że pokonanie człowieka przez bota zajmie pięć lat, ale zastrzegł, że AlphaGo pokonało oczekiwania. W Wired dziennikarz techniczny Tom Simonite stwierdził: „Nikt nie spodziewa się, że robot wygra w najbliższym czasie. Ale kiedy tak się stanie, będzie to znacznie większe osiągnięcie niż podbój Go przez DeepMind”.

19 grudnia 2018 r. bot DeepMind pokonał „topowego profesjonalnego gracza”, Grzegorza „MaNa” Komincza, 5:0. DeepMind ogłosił bota o nazwie „AlphaStar” 24 stycznia 2019 r. Dziennikarz z Ars Technica i inni argumentowali, że AlphaStar nadal ma nieuczciwą przewagę: „AlphaStar ma możliwość wykonywania kliknięć z chirurgiczną precyzją za pomocą interfejsu API, podczas gdy ludzie grają ograniczone mechanicznymi ograniczeniami myszy komputerowych”. AlphaStar miał również widok globalny, a nie był ograniczony przez kamerę w grze. Co więcej, chociaż liczba akcji w pięciosekundowym oknie była ograniczona, AlphaStar mógł swobodnie przydzielać swój limit akcji nierównomiernie w całym oknie, aby uruchamiać nadludzkie wybuchy aktywności w krytycznych momentach. DeepMind szybko przeszkolił AlphaStar w bardziej realistycznych warunkach, a następnie przegrał rewanż z Kominczem. Począwszy od lipca 2019 r., nowa, ograniczona wersja AlphaStar anonimowo rywalizowała z graczami, którzy „zdecydowali się” na publiczną europejską drabinkę gry wieloosobowej 1 na 1. Do końca sierpnia 2019 r. AlphaStar osiągnął „poziom arcymistrza”, plasując się wśród 0,2% najlepszych graczy.

Algorytmy

W przeciwieństwie do AlphaZero, AlphaStar początkowo uczy się naśladować ruchy najlepszych graczy w swojej bazie danych gier człowiek kontra człowiek; ten krok jest niezbędny do rozwiązania tego, co Dave Silver z DeepMind nazywa „problemem eksploracji”: odkrywanie nowych strategii byłoby w przeciwnym razie jak szukanie „igły w stogu siana”. Następnie agenci grają ze sobą i wdrażają uczenie wzmacniające. Ci główni agenci uczą się również, grając z nieoptymalnymi „agentami wyzyskującymi”, których celem jest ujawnienie słabości głównych agentów.

Reakcje

Po porażce 5: 0 w grudniu 2018 roku Komincz stwierdził: „Nie spodziewałem się, że sztuczna inteligencja będzie tak dobra”.

Stuart Russell ocenił, że zwycięstwo AlphaStar w 2018 roku wymagało „sporej ilości wysiłku związanego z konkretnym problemem”, a metody ogólnego przeznaczenia „nie były całkiem gotowe na StarCraft”.

Artykuł w Wired UK ocenił, że nowe ograniczenia AlphaStar, przyjęte na mecze w lipcu 2019 r., Tym razem były „sprawiedliwe”. Profesjonalista StarCraft, Raza „RazerBlader” Sekha, stwierdził, że AlphaStar jest „imponujący”, ale ma swoje dziwactwa, ulegając w jednej grze niekonwencjonalnemu składowi armii składającemu się wyłącznie z jednostek powietrznych. Najlepszy brytyjski gracz, Joshua „RiSky” Hayward, wyraził pewne rozczarowanie, mówiąc, że AlphaStar „często nie podejmował najbardziej efektywnych, strategicznych decyzji”. Zawodowy Diego „Kelazhur” Schwimer nazwał grę AlphaStar „niewyobrażalnie niezwykłą; to naprawdę każe zadać sobie pytanie, ile różnorodnych możliwości StarCrafta naprawdę odkryli zawodowi gracze”. Przeciwnicy AlphaStar często nie zdawali sobie sprawy, że grają z botem.

Ian Sample z The Guardian nazwał AlphaStar „przełomowym osiągnięciem” w dziedzinie sztucznej inteligencji. Churchill stwierdził, że wcześniej widział boty, które opanowały jeden lub dwa elementy StarCraft , ale AlphaStar był pierwszym, który poradzi sobie z grą w całości. Gary Marcus wyraził swój ciągły sceptycyzm wobec głębokiego uczenia się, stwierdzając: „Do tej pory trudno było przenieść takie techniki ze środowiska laboratoryjnego i gry do prawdziwego świata i nie od razu postrzegam ten wynik jako postęp w tym kierunek". Badacz AI, Jon Dodge, był zaskoczony AlphaStar, stwierdzając, że nie spodziewał się takiego „nadludzkiego” występu przez „kolejne kilka lat”; dla kontrastu Churchill stwierdza, że ​​​​„StarCraft nie jest nawet bliski„ rozwiązania ”, a AlphaStar nie jest jeszcze nawet bliski grania na poziomie mistrza świata”.

Dziedzictwo

DeepMind twierdzi, że spostrzeżenia AlphaStar mogą przynieść korzyści robotom, samojezdnym samochodom i wirtualnym asystentom, którzy muszą działać z „niedoskonałymi obserwowanymi informacjami”. Silver wskazał, że jego laboratorium „może odpocząć w tym momencie”, zamiast próbować znacznie ulepszyć AlphaStar. Sam Silver twierdzi, że „AlphaStar stał się pierwszym systemem sztucznej inteligencji, który osiągnął najwyższy poziom wydajności człowieka w każdym profesjonalnym e-sporcie w pełnej, nieograniczonej grze w profesjonalnie zatwierdzonych warunkach… Odkąd komputery złamały Go, szachy i pokera, Gra StarCraft wyłoniła się, zasadniczo za zgodą społeczności, jako kolejne wielkie wyzwanie dla sztucznej inteligencji”.

Informatyk Noel Sharkey argumentuje z dezaprobatą, że „analitycy wojskowi z pewnością będą postrzegać udane strategie czasu rzeczywistego AlphaStar jako wyraźny przykład zalet sztucznej inteligencji w planowaniu pola bitwy”. W przeciwieństwie do tego Silver argumentuje: „Powiedzieć, że ma to jakiekolwiek zastosowanie wojskowe, to nic więcej niż powiedzieć, że sztuczna inteligencja do szachów może zostać wykorzystana do zastosowań wojskowych”.

Zobacz też

Linki zewnętrzne