Google DeepMind
Googleov AI igra videoigre umjesto vas
Scalable Instructable Multiworld Agent može slijediti upute na prirodnom jeziku za izvršavanje zadataka u različitim postavkama videoigara.
Videoigre su ključni poligon za sustave umjetne inteligencije. Poput stvarnog svijeta, one su bogata okruženja za učenje s odgovarajućim postavkama u stvarnom vremenu i ciljevima koji se neprestano mijenjaju.
Google DeepMind najavljuje novu prekretnicu, pomicanje fokusa s pojedinačnih igara na općeg AI agenta za igranje koji se može podučavati.
Google DeepMind je predstavio Scalable Instructable Multiworld Agenta (SIMA), generalnog AI agenta za 3D virtualne postavke. Inženjeri su se udružili s programerima igara kako bi obučili SIMA za razne video igre i kažu da ovo istraživanje označava prvi put da je agent pokazao da može razumjeti širok raspon svjetova igara i slijediti upute na prirodnom jeziku za obavljanje zadataka unutar njih kao što to čini čovjek.
Cilj prijekta nije postizanje visokih rezultata u igri. Naučiti igrati čak i jednu video igru tehnički je podvig za sustav umjetne inteligencije, ali učenjem praćenja uputa u raznim postavkama igara moglo bi se doći do korisnijih agenata umjetne inteligencije za svako okruženje.
Za razvoj SIMA agenta inženjeri su surađivali s osam studija kako bi obučili i testirali SIMA na devet različitih videoigara, kao što su No Man's Sky i Teardown. Svaka igra otvara novi interaktivni svijet, uključujući niz vještina za učenje, od jednostavne navigacije i korištenja izbornika, do rudarenja resursa, letenja svemirskim brodom ili izrade kacige.
Također su koristili četiri istraživačka okruženja, uključujući novo okruženje koje su izgradili s Unityjem pod nazivom Construction Lab, gdje agenti trebaju graditi skulpture od građevinskih blokova koji testiraju njihovu manipulaciju objektima i intuitivno razumijevanje fizičkog svijeta.
Učeći iz različitih svjetova igara, SIMA bilježi kako je jezik povezan s ponašanjem u igri. Prvi pristup je bio snimiti parove ljudskih igrača u igrama, pri čemu jedan igrač gleda i daje upute drugom. Također su imali igrače koji igraju slobodno, zatim ponovno gledaju što su radili i snimaju upute koje bi dovele do njihovih radnji u igri.
SIMA se sastoji od unaprijed uvježbanih modela računalnog vida i glavnog modela koji uključuje memoriju i izlazne radnje tipkovnice i miša.
"SIMA je agent umjetne inteligencije koji može percipirati i razumjeti različita okruženja, a zatim poduzeti radnje za postizanje zadanog cilja. Sastoji se od modela dizajniranog za precizno mapiranje slike i jezika i video modela koji predviđa što će se sljedeće dogoditi na ekranu. Fino smo podesili ove modele na podacima o obuci specifičnim za 3D postavke u SIMA portfelju.
Naš agent za umjetnu inteligenciju ne treba pristup izvornom kodu igre niti API-je po narudžbi. Zahtijeva samo dva unosa: slike na ekranu i jednostavne upute na prirodnom jeziku koje daje korisnik. SIMA koristi izlaze tipkovnice i miša za kontrolu središnjeg lika igre kako bi izvršio ove upute. Ovo jednostavno sučelje je ono što ljudi koriste, što znači da SIMA može potencijalno komunicirati s bilo kojim virtualnim okruženjem", navodi DeepMind u svojem priopćenju.
Trenutna verzija SIMA-e procjenjuje se kroz 600 osnovnih vještina, uključujući navigaciju (npr. skreni lijevo), interakciju s objektima popni se uz ljestve) i korištenje izbornika (otvori kartu). Istrenirali su SIMA-u za obavljanje jednostavnih zadataka koji se mogu izvršiti u roku od 10 sekundi.
Google DeepMindovi inženjeri kažu da je ovo važan cilj za umjetnu inteligenciju općenito, jer iako su veliki jezični modeli doveli do snažnih sustava koji mogu prikupiti znanje o svijetu i generirati odgovore, trenutno nemaju sposobnost poduzimanja radnji u naše ime.
Učitavam komentare ...