DeepMind
VIDEO: Pogledajte kako AI igrači uče igrati nogomet
Googleova umjetna inteligencija upućena je u nogometni trening kamp gdje je samostalno učila kako postati nogometaš.
Svi znamo koliko je nogomet kompleksan sport u kojem je osim odlične fizičke spreme i tehničke vještine vrlo važan i faktor timske suradnje.
Alphabetova (Googleova) umjetna inteligencija DeepMind nije poslužila za razvoj neke nove nogometne simulacije tipa FIFA videoigara, već su Guy Lever i njegovi kolege znanstvenici koji razvijaju jedan od najkompleksnijih AI-a današnjice, odlučili krenuti od nule, što znači da se nisu htjeli služiti skriptiranim potezima kakve koriste sve postojeće igre.
Umjesto toga ideja im je bila da njihovi virtualni čovječuljci uče igranje nogometa na "ljudski" način.
Kako biste naučili nogomet, morate zapravo riješiti mnogo otvorenih problema", kaže istraživač u DeepMindu. "Postoji kontrola cijelog humanoidnog tijela, koordinacija i zapravo svladavanje kontrole motorike niske razine uz dodatak stvari poput dugoročnog planiranja."
AI mora ponovno rekreirati sve što ljudski igrači rade, čak i stvari o kojima ne moramo svjesno razmišljati, tipa kako pomicati svaki ud i mišić da bismo se povezali s loptom koja se kreće, pri čemu donosimo stotine odluka u sekundi. Vrijeme i kontrola potrebni čak i za najosnovnije pokrete zapravo mogu biti iznenađujuće teški za naučiti. "Mi to radimo bez razmišljanja, ali ovo je stvarno težak problem za umjetnu inteligenciju jer nismo baš sigurni kako to ljudi rade", kaže Lever.
DeepMindovi simulirani humanoidni igrači modelirani su po uzoru na stvarne ljude, s 56 artikulacijskih točaka i ograničenim opsegom pokreta, što znači da nisu primjerice mogli rotirati zglob koljena pod nemogućim kutovima. Za početak, istraživači su jednostavno zadali AI igračima cilj poput trčanja ili šutiranja lopte i pustili ih da pokušaju smisliti kako do toga doći putem pokušaja i pogrešaka i "potpomognutog učenja", kao što se to radilo u prošlosti kada su istraživači učili simulirane humanoide da se snalaze na stazama s preprekama.
Znanstvenici su koristili "neuralne probabilističke motoričke osnove" (NPMP), metodu podučavanja koja je usmjerila model umjetne inteligencije prema obrascima kretanja koji su više slični ljudskim, u očekivanju da će to temeljno znanje pomoći u rješavanju problema kako se kretati virtualnim nogometnim igralištem. "To u osnovi usmjerava vašu motoričku kontrolu prema realnom ljudskom ponašanju, realističnim ljudskim pokretima", kaže Lever. "I to se uči iz snimanja pokreta - u ovom slučaju, pravih ljudi koji igraju nogomet."
Ovo "rekonfigurira akcijski prostor", kaže Lever. Pokreti AI igrača već su ograničeni njihovim ljudskim tijelima i zglobovima koji se mogu savijati samo na određene načine, a izlaganje podacima od stvarnih ljudi dodatno ih ograničava, što pomaže pojednostaviti problem. "To čini vjerojatnije da će se korisne stvari otkriti metodom pokušaja i pogrešaka", kaže Lever.
Nakon osnovnog treninga uslijedile su vježbe za jednog igrača: trčanje, dribling i šutiranje lopte, oponašajući način na koji bi ljudi mogli naučiti igrati novi sport prije nego što uđu u situaciju prave utakmice.
Cilj je bio potaknuti AI igrače da ponovno koriste vještine koje su možda naučili izvan konteksta nogometa unutar nogometnog okruženja, odnosno da generaliziraju i budu fleksibilni u prebacivanju između različitih strategija kretanja. Oni koji su svladali te vježbe korišteni su kao učitelji. Na isti način na koji je umjetna inteligencija bila potaknuta da oponaša ono što je naučila iz snimanja ljudskog pokreta, također je bila nagrađena, jer nije previše odstupila od strategija koje su AI učitelja koristili u određenim scenarijima, barem u početku. "Ovo je zapravo parametar algoritma koji se optimizira tijekom treninga", kaže Lever. "S vremenom oni u principu mogu smanjiti svoju ovisnost o učiteljima."
S obučenim virtualnim igračima, došlo je vrijeme za akciju uparivanja: počevši s igrama 2 na 2 i 3 na 3 kako bi se maksimizirala količina iskustva koju su igrači akumulirali tijekom svake runde simulacije (i oponašajući kako mladi igrači započinju s igrama malih dimenzija u stvarnom životu ), kao što možete vidjeti u ovom videu.
Kako su igrači u utakmicama bili nagrađivani samo za postizanje golova, istraživači su brzo vidjeli svojstva poput timskog rada koja su se počela pojavljivati. “Na samom početku treninga svi samo trče prema lopti, a u nekom trenutku nakon nekoliko dana vidjeli smo da su shvatili da netko od njegovih suigrača kontrolira loptu i okrenuli bi se i trčali uz teren, predviđajući da će njegov suigrač pokušati postići pogodak ili možda dodati loptu,” kaže Lever.
Ovo je prvi put da su takva koordinacija i timski rad viđeni u tako složenoj i brzodjelujućoj umjetnoj inteligenciji. "To je jedno od otkrića koje mi je zanimljivo", kaže Lever.
U čemu je poanta svega ovoga? Ne radi se o dominaciji u Svjetskom kupu za robote. Istraživači već rade na usađivanju nekih vještina niže razine koje su AI igrači naučili u fizičke robote kako bi ih natjerali da se kreću na načine koji su "sigurniji i prirodniji" u stvarnom svijetu. To nije samo zato da ne bi živcirali ljude koji s njima surađuju i komuniciraju, već i zato što nervozni i nepravilni pokreti mogu oštetiti robote koji nisu bili optimizirani za kretanje na te načine.
Sve je to dio rada na "utjelovljenoj inteligenciji" - ideji da bi opća umjetna inteligencija mogla biti potrebna da se kreće svijetom u nekoj vrsti fizičkog oblika i da bi priroda tog oblika mogla odrediti način na koji se ponaša.
Na kraju bi ovi pomalo šašavi digitalni igrači mogli pomoći i robotima i avatarima u metaverzumu da se kreću na načine koji izgledaju više ljudski – čak i ako nas nikad neće pobijediti u nogometu. "Nogomet zapravo nije krajnji cilj sam po sebi", kaže Lever. "Postoji samo mnogo stvari koje trebate riješiti da biste stigli tamo."
Znanstveni rad objavljen u časopisu Science Robotics možete pronaći na ovoj poveznici.
Učitavam komentare ...