Google Genie 3: svjetski model koji daje život Projektu Genie

  • Genie 3 je Google DeepMind model svijeta koji pokreće Project Genie, prototip za stvaranje interaktivnih okruženja pomoću umjetne inteligencije.
  • Project Genie generira navigacijske svjetove u stvarnom vremenu iz teksta i slika, bez potrebe za znanjem programiranja ili dizajniranja.
  • Sesije su ograničene na 60 sekundi, a scenariji nisu u potpunosti fotorealistični, barem ne u ovoj eksperimentalnoj fazi.
  • Za sada je dostupan samo pretplatnicima Google AI Ultra u SAD-u, s planovima za buduće proširenje na druge teritorije.

Googleov Džin 3

Google je počeo praktično demonstrirati mogućnosti svoje nove generacije svjetski modeli sa Genie 3Kroz Project Genie, kompanija omogućava odabranim korisnicima da kreiraju i istražuju interaktivna okruženja generirana umjetnom inteligencijom, koristeći opise na prirodnom jeziku i neke referentne slike.

Ovaj potez je dio Google DeepMind-ove posvećenosti sistemima sposobnim za simuliraju složenu dinamiku stvarnog svijetaPored klasičnih agenata koji dominiraju zatvorenim igrama poput šaha ili Goa, projekat teži budućnosti u kojoj bi dizajniranje virtuelnih svjetova moglo biti jednostavno kao zapisivanje onoga što vam je na umu. Iako je pristup trenutno ograničen na pretplatnike u Sjedinjenim Državama, projekat zamišlja budućnost u kojoj bi dizajniranje virtuelnih svjetova moglo biti jednostavno kao zapisivanje vaših ideja.

Džin 3: Svjetski model iza eksperimenta

U srži Projekta Genie je Genie 3, model opće namjene Razvijeno od strane Google DeepMind-a. Za razliku od drugih statičkih sistema, njegova funkcija nije samo crtanje prekrasnih pejzaža, već i predviđanje kako se okruženje mijenja kada se korisnik kreće, interaguje ili mijenja elemente unutar njega.

Ova vrsta arhitekture poznata je kao svjetski modelGenie 3 je AI sistem sposoban da predvidi razvoj scenarija i uticaj radnji unutar tog okruženja. On generiše putanju koju pratite u realnom vremenu, kadar po kadar, održavajući prostornu i vizuelnu koherentnost koja prevazilazi jednostavnu animaciju ili šetnju kroz zamrznutu 3D scenu.

Da bi se to postiglo, model koristi autoregresivna generacijaOva tehnika omogućava vještačkoj inteligenciji da korak po korak gradi svijet, sjećajući se onoga što je već stvorila. Ako se lik okrene ili se vrati istim putem, vještačka inteligencija "pamti" šta je bilo tamo prije i dosljedno to rekonstruiše - ključni element za simuliranje velikih, uvjerljivih prostora, bilo da se radi o urbanom okruženju, historijskom pejzažu ili potpuno izmišljenom svijetu.

Kako funkcioniše Project Genie: od teksta do svijeta u kojem se može igrati

Projekt Genie je predstavljen kao aplikacija dostupna iz preglednikaSlično kao i kod drugih Google servisa zasnovanih na vještačkoj inteligenciji, nema potrebe za instaliranjem bilo čega ili posjedovanjem naprednog tehničkog znanja: interakcija se u suštini svodi na opisivanje onoga što želite postići i prepuštanje sistemu da uradi ostalo.

Proces počinje fazom koju Google naziva "skiciranje svjetova"Korisnik odgovara na jednostavna pitanja poput "Kakav je tvoj svijet?" i daje detalje o okruženju (pejzaž, vrijeme, grafički stil, atmosfera) i kako ga preferira istraživati: hodanjem, letenjem, vožnjom, jahanjem konja ili drugim prijevoznim sredstvima. Također navodi svoju preferiranu perspektivu, bilo iz prvog ili trećeg lica.

Googleov Džin 3

Zatim, lik treba definirati: To može biti osoba, životinja, predmet ili neki drugi entitet. apstraktnije. S tim informacijama, na scenu stupa Nano Banana Pro, još jedan Googleov model koji generira statičnu sliku pregleda. Ova vrsta početnog snimka služi za provjeru da li svijet odgovara onome što korisnik ima na umu prije nego što se krene u interaktivno istraživanje.

Ako rezultat nije uvjerljiv, moguće je prilagoditi prompt, promijeniti elemente sceneKorisnici mogu mijenjati izgled avatara ili prilagođavati vizualni stil. Mogu postavljati vlastite slike, koristiti materijal koji generiraju druge umjetne inteligencije ili početi sa stvarnim fotografijama, a sistem kombinira sve te podatke kako bi poboljšao okruženje, koje zatim postaje iskustvo navigacije.

Istraživanje u stvarnom vremenu: svjetovi koji reagiraju na vaše pokrete

Nakon što je svijet definiran i pregled prihvaćen, Project Genie prelazi u interaktivni način rada. Ovdje... Genie 3 oslobađa svoje mogućnosti simulacijeDok se igrač kreće kroz scenu, model u realnom vremenu generiše ono što se nalazi ispred njega, uzimajući u obzir ono što je već kreirano i približna fizička pravila okruženja.

Korisnik se kreće koristeći standardne kontrole za PC igre, kao što su tipke W, A, S i D za kretanje, i može podesite kameru za promjenu ugla gledanja. Iskustvo se odvija u rezoluciji do 720p i s brzinom interakcije od oko 20-24 sličice u sekundi, što je dovoljno da ponudi razuman osjećaj fluidnosti u ovoj eksperimentalnoj fazi.

Primjeri koje predlaže Google uključuju, na primjer Okean ogromnih valova viđen s vrha daske za surfanjeIli visokoplaninsko okruženje s deformabilnim snijegom gdje igrač utjelovljuje planinara s kretanjem u svim smjerovima. U oba slučaja, interes ne leži samo u početnom pejzažu, već i u tome kako okruženje reagira na postupke lika, promjene smjera ili skokove.

Remiksujte, dijelite i eksperimentišite s drugim svjetovima

Project Genie ne počinje svaki put od nule. Jedna od njegovih najupečatljivijih karakteristika je sposobnost da "remiksovanje postojećih svetova"Korisnici mogu istraživati ​​prethodno kreirane scenarije, bilo sami, od strane drugih ili odabrane iz uređene galerije, i koristiti ih kao osnovu za generiranje novih verzija.

Ova opcija remiksa omogućava primijeniti nove instrukcije na već generirani svijetTo se može postići promjenom stila, dodavanjem elemenata, promjenom načina istraživanja igre ili potpunim mijenjanjem tipa lika. Nadalje, postoji način generiranja slučajnih likova, nazvan "randomizer", koji nudi okruženja s nepredvidivim karakteristikama za one koji traže inspiraciju ili jednostavno žele eksperimentirati.

Na kraju sesije, sistem nudi mogućnost Preuzmite videozapise s turneje, jednostavan način dijeljenja kreacija na društvenim mrežama, video platformama ili u profesionalnim kontekstima, kao što su animacijski studiji, dizajn nivoa ili istraživački laboratoriji koji žele dokumentirati svoje testove.

Tehnička ograničenja i trenutni status projekta

Uprkos svom potencijalu, Google insistira da je Project Genie, za sada, prototip u ranoj fazi istraživanjaTo je očigledno u nekoliko ograničenja koja sama laboratorija detaljno navodi u svom blogu i obavijestima o korištenju.

Najjasniji je onaj vremensko ograničenje sesijaSvaki svijet se može istraživati ​​maksimalno 60 sekundi, što je limit vizualne memorije koji Genie 3 trenutno može stabilno podnijeti. Ovo ograničava trajanje iskustava, koja za sada više podsjećaju na mikro-avanture ili kratke scene nego na potpune videoigre.

Nadalje, Google upozorava da Scene nisu u potpunosti fotorealistične Niti uvijek doslovno slijede korisnička uputstva. Fizika također može biti približna: određena ponašanja, sudari ili pokreti ne moraju uvijek poštovati zakone stvarnog svijeta, što je i očekivano u sistemu koji je još uvijek u razvoju.

Još jedna istaknuta stvar je kontrola likova, koja Mogu pokazivati ​​određenu latenciju ili nedostatak preciznosti u odgovoru na korisničke naredbe. Iako je broj sličica u sekundi razuman, primjetna su mala kašnjenja u kontrolama, posebno za one koji su navikli na visoko dotjerane komercijalne videoigre.

Na kraju, neke Napredne mogućnosti Genie 3 Funkcije najavljene u prethodnim demo verzijama još uvijek nisu prisutne u ovoj verziji. Među njima su događaji koji se mogu aktivirati i mijenjati svijet dok se istražuje, funkcija koja bi mogla dovesti do mnogo bogatijeg igranja, ali koja je za sada još uvijek na planu.

Ograničen pristup i planovi geografskog širenja

U ovoj prvoj fazi, pristup Projektu Genie je Ograničeno na korisnike starije od 18 godina koji su pretplaćeni na Google AI Ultra u Sjedinjenim Američkim Državama. Ova pretplata, sa svojom visokom mjesečnom naknadom, jasno daje do znanja da je eksperiment u početku usmjeren na malu publiku sa prilično profesionalnim ili vrlo entuzijastičnim profilom.

Google je naznačio svoju namjeru da proširiti dostupnost na druge teritorije Kada sistem postane robusniji i prikupi dovoljno podataka o svojoj upotrebi u stvarnom svijetu, očekuje se da će se, ako prototip napreduje, na kraju proširiti i na druga ključna tržišta, uključujući Evropsku uniju i, unutar nje, Španiju. Iako nisu objavljeni konkretni datumi ili zemlje, očekuje se da će, ako prototip napreduje, na kraju stići do drugih ključnih tržišta, uključujući Evropsku uniju i, unutar nje, Španiju.

To proširenje, u svakom slučaju, zavisiće ne samo od tehničkih problema, već i od regulatorni zahtjevi i zahtjevi za zaštitu podataka koji su posebno strogi u Evropi. Sam Google insistira da će postupati korak po korak i da neće oklijevati da ugasi projekte koji nisu u skladu s njegovim ciljevima, nešto što je već viđeno s drugim uslugama kompanije.

Laboratorija za opštu umjetnu inteligenciju (AGI) i digitalno stvaranje

Pored neposrednog utjecaja na videoigre ili zabavu, Genie 3 i Project Genie uklapaju se u strategiju Google DeepMind-a za prelazak na opštiji sistemi vještačke inteligencijeSvjetski modeli su posebno vrijedni za obuku agenata koji trebaju razumjeti složene kontekste, predvidjeti posljedice i djelovati dosljedno u promjenjivim okruženjima.

Potencijalne primjene kreću se od robotika i simulacija fizičkih scenarija To uključuje sve, od modeliranja animacije i rekreacije historijskih lokacija do istraživanja izmišljenih svjetova u filmu, televiziji i interaktivnom sadržaju. Mogućnost brzog ponavljanja u okruženjima generiranim umjetnom inteligencijom smanjuje vrijeme i troškove, što bi moglo biti zanimljivo i malim studijima i velikim evropskim produkcijskim kućama.

Istovremeno, otvaranje takvog prototipa vanjskim korisnicima funkcionira kao veliki testni poligonInterakcije, greške i ideje koje su doprinijeli učesnici pomoći će u prilagođavanju modela, identifikaciji slučajeva upotrebe koji možda ranije nisu razmatrani i procjeni rizika, i tehničkih i etičkih, povezanih s ovim sve realističnijim simulacijama.

Sa Genie 3 i Project Genie, Google istražuje područje gdje stvaranje virtuelnih svjetova postaje mnogo pristupačnije, iako i dalje sa jasnim ograničenjima u vizuelnom kvalitetu, kontroli i trajanju iskustava; ako eksperiment sazrije i prevaziđe fazu ograničenog pristupa, mogao bi postati relevantan alat i za korisnike i kompanije u Španiji i ostatku Evrope zainteresovane za nove oblike interaktivnog dizajna i simulacije vještačke inteligencije.

Googleov Džin 3
Vezani članak:
Google Genie 3: DeepMind-ova umjetna inteligencija koja stvara interaktivne virtualne svjetove

Pratite nas na Google Vijestima