Google stelt een team samen dat generatieve AI-modellen ontwikkelt die de wereld kunnen simuleren. Het team staat onder leiding van Tim Brooks.
Brooks was een van de managers van OpenAI’s videogenerator Sora. Hij stapte in oktober over naar Google’s AI-onderzoeksafdeling Google DeepMind. DeepMind heeft ambitieuze plannen om enorme generatieve modellen te maken die de wereld kunnen simuleren, meldde Brooks op X. Hij werft nu medewerkers voor het nieuwe team. Dit schrijft TechCrunch.
Volgens de vacatures die Brooks in zijn bericht deelde, zal het nieuwe team samenwerken met en voortbouwen op het werk van Google’s Gemini-, Veo- en Genie-teams. Dit om kritieke nieuwe problemen aan te pakken en modellen op te schalen tot de hoogste niveaus van rekenkracht.
Gemini is Google’s vlaggenschipreeks van AI-modellen voor taken zoals het analyseren van afbeeldingen en het genereren van tekst, terwijl Veo Google’s eigen videogeneratiemodel is.
Realtime simulatie
Genie is Google’s benadering van een wereldmodel — AI die games en 3D-omgevingen in realtime kan simuleren. Het nieuwste Genie-model van Google, dat in december werd gepresenteerd, kan een enorme variëteit aan speelbare 3D-werelden genereren.
Brooks stelt dat schaalvergroting van AI-training met video en multimodale data cruciaal is voor Artificial General Intelligence, (AGI). AGI verwijst doorgaans naar AI die elke taak kan uitvoeren die een mens kan. Wereldmodellen zullen tal van domeinen aandrijven. Denk daarbij aan visuele redenering en simulatie, en realtime interactieve entertainment.
Het nieuwe team van Brooks zal realtime interactieve generatietools ontwikkelen bovenop de modellen die ze bouwen. En onderzoeken hoe ze deze modellen kunnen integreren met bestaande multimodale modellen zoals Gemini.
Gouden toekomst voor wereldmodellen
Verschillende startups en grote technologiebedrijven richten zich op wereldmodellen. Waaronder World Labs van de invloedrijke AI-onderzoeker Fei-Fei Lee, de Israëlische startup Decart en Odyssey. Zij geloven dat wereldmodellen op een dag kunnen worden gebruikt om interactieve media te creëren. Bijvoorbeeld videogames en films. En om realistische simulaties uit te voeren, zoals trainingsomgevingen voor robots.
Creatieve professionals hebben gemengde gevoelens bij deze technologie. Een recent onderzoek van Wired onthulde dat gamestudio’s zoals Activision Blizzard, dat veel werknemers heeft ontslagen, AI gebruiken om kosten te besparen, productiviteit te verhogen en uitval van personeel te compenseren. Bovendien schatte een in 2024 uitgevoerd onderzoek in opdracht van de Animation Guild, een vakbond voor Hollywood-animators en -cartoonisten, dat meer dan 100.000 banen in de Amerikaanse film-, televisie- en animatiesector tegen 2026 door AI zullen worden beïnvloed.
Sommige startups in de opkomende wereldmodellensector, zoals Odyssey, hebben beloofd samen te werken met creatieve professionals — niet om hen te vervangen. Het is afwachten of Google dit voorbeeld zal volgen.
Auteursrechten kunnen drempel opwerpen
Er is ook nog de kwestie van copyrights die niet is opgelost. Sommige wereldmodellen lijken getraind te zijn op fragmenten van videogame-playthroughs, wat kan betekenen dat de bedrijven die deze modellen ontwikkelen, het risico lopen aangeklaagd te worden als de video’s niet gelicenseerd waren.
Google, dat eigenaar is van YouTube, stelt dat het toestemming heeft om zijn modellen te trainen op YouTube-video’s volgens de algemene voorwaarden van het platform. Maar het bedrijf heeft niet bekendgemaakt welke specifieke video’s het gebruikt voor training.