Dirbtinio intelekto pažanga
„Google“ pristatė naujausią proveržį dirbtinio bendrojo intelekto (AGI) link – modelį „Genie 3“, leidžiantį dirbtinio intelekto sistemoms sąveikauti su itin realistiška pasaulio simuliacija. Pasak bendrovės, šis modelis galėtų būti naudojamas mokant robotus ir autonominius automobilius, veikiant tokiomis sąlygomis kaip sandėlių ar miesto aplinkos.
„Google DeepMind“, atsakinga už šio projekto vystymą, pabrėžia, kad vadinamieji pasaulio modeliai yra esminė grandis siekiant AGI – dirbtinio intelekto, galinčio atlikti daugelį užduočių žmonių lygiu, o ne tik siaurai specializuotus veiksmus, kaip šachmatų žaidimas ar kalbų vertimas.
Svarbus žingsnis kuriant autonominius agentus
„Tikimės, kad ši technologija atliks svarbų vaidmenį siekiant AGI, kai autonominiai agentai vis aktyviau veiks realiame pasaulyje“, – teigiama „DeepMind“ pranešime. Tokie agentai galėtų savarankiškai vykdyti įvairias užduotis be žmogaus įsikišimo.
Nors „Genie 3“ modelis dar nėra paruoštas plačiajai auditorijai, „Google“ neatskleidė nei jo paleidimo datos, nei konkrečių testavimo planų, pažymėdama, kad šiuo metu egzistuoja nemažai ribotumų.
Realios sąveikos pasauliai sukurti tekstinėmis užklausomis
Pasak „DeepMind“, „Genie 3“ leidžia generuoti 3D aplinkas realiuoju laiku, į kurias gali įsitraukti tiek naudotojai, tiek dirbtinio intelekto agentai. Nauja versija pasižymi tuo, kad leidžia kur kas ilgiau sąveikauti su aplinka nei ankstesnė versija „Genie 2“, kurios pasauliai veikė tik iki minutės.
Pavyzdžiui, naudotojas gali tekstine užklausa sukurti slidinėjimo trasą, o vėliau – taip pat teksto pagalba – į ją įtraukti elnių bandą ar pakeisti oro sąlygas. Be to, „Genie 3“ geba atsiminti erdvės pokyčius iki minutės – jei nusisuksite nuo sienos su piešiniu ir vėl atsisuksite, piešinys liks toje pačioje vietoje. Aplinka generuojama 720p raiška ir 24 kadrų per sekundę dažniu.
Didėjanti konkurencija dirbtinio intelekto srityje
„Genie 3“ pristatymas įvyksta augančios konkurencijos fone. Visai neseniai „OpenAI“ generalinis direktorius Samas Altmanas pasidalino nuotrauka, kurioje, kaip spėjama, pavaizduotas naujasis „GPT-5“ modelis.
Tuo tarpu „Google“ siekia, kad jos pasaulio modeliai ne tik mokytų robotus ar AI agentus, bet ir suteiktų žmonėms galimybę patirti įvairias simuliacijas – nuo slidinėjimo iki pasivaikščiojimų kalnų ežerų pakrantėmis.
Ilgesnė ir kokybiškesnė sąveika
Nors ankstesnės versijos, kaip „Genie 2“, leido sąveikauti su aplinka tik trumpai ir gan nerealistiškai – jas lyginta su išplaukusia „Google Street View“ versija, kur objektai keitėsi nenuspėjamai – „Genie 3“ žada proveržį. Naujasis modelis leidžia kelias minutes tęsti sąveiką, išlaikant objektų atmintį erdvėje, o tai žymi svarbų kokybinį šuolį.
Žvilgsnis į ateitį
Pasaulio modelių kūrimas tampa vienu iš pagrindinių „Google“ prioritetų. Prie komandos dirba ir buvęs „OpenAI“ vaizdo generatoriaus „Sora“ bendraautorius. Tai rodo, kad technologijų milžinė žengia užtikrintus žingsnius į sritį, kurioje dirbtinis intelektas galėtų ne tik mokytis iš pasaulio, bet ir kurti jį pats – kartu su mumis.