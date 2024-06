Google heeft zijn AI-onderdeel DeepMind flink aan het werk gezet en komt nu met nieuwe of verbeterde AI-tools voor het genereren van video’s en afbeeldingen. Deze zijn met name gericht op marketeers en contentcreators. Volgens het bedrijf gaat het om baanbrekende nieuwe toepassingen die de manier waarop creatieven werken ‘fundamenteel gaat veranderen’.

De grote aandachttrekkers zijn Veo voor videoproductie en Imagen 3 voor afbeeldingen, die korte films dan wel afbeeldingen genereren op basis van gedetailleerde tekstuele prompts. Volgens Google stellen de tools makers in staat sneller campagnes op maat te maken, maar aan de achterkant ook resultaten in real-time te meten. Google is zo zelfverzekerd, dat het zijn eigen marketingafdeling al met de tools heeft laten werken voor de promotiecampagne van de Pixel 8-telefoon.

Met Veo is het mogelijk video’s te genereren met een resolutie van 1080p, waarbij allerlei visuele en cinematische stijlen mogelijk zijn. De tool begrijpt instructies in natuurlijke taal en zelfs visueel vakjargon als ’timelapse’ en ‘aerial shot’. Dat maakt het mogelijk voor de maker -als we dat nog zo mogen noemen- om gedetailleerde, langere prompts te gebruiken.

Geloofwaardige bewegingen

Volgens Google kan Veo daarmee dichtbij de visie blijven van degene die de prompt invoerde. Het bedrijf belooft in een blogpost dat Veo zorgt voor coherente en consistente output, waarbij objecten en personages realistisch of op ’n minst geloofwaardig (bijvoorbeeld bij tekenfilmfiguren) bewegen. Dat laatste is nog weleens een uitdaging in AI-gegenereerde video’s.

Veo is het voorlopige resultaat van eerdere pogingen van Google op het gebied van generatieve video, zoals Generative Query Network (GQN), Lumiere, WALT en VideoPoet. Elementen uit deze en eerdere modellen zijn geïntegreerd in Veo. De tool is nog niet algemeen beschikbaar, maar er is een wachtlijst voor creatieven die met de private preview aan de slag willen.

Nieuwe generatie afbeeldingen-generator

Imagen 3 is een text-to-image model dat fotorealistische afbeeldingen genereert op basis van gedetailleerde prompts. Het is daarbij overigens ook mogelijk afbeeldingen te genereren die eruit zien als schetsen, tekenfilms, pixel art of klei-animatie.

Google wijst uitdrukkelijk op de mogelijkheid om met Imagen 3 ook tekst in afbeeldingen te kunnen zetten, zoals inscripties op gebouwen of opdrukken op kleding. Daar ging het voorheen nog weleens mis met AI-tools, die niet goed wisten wat ze met zulke tekst aan moesten.

Tip: Google consolideert interne teams om sneller met AI te innoveren

‘AI heeft geen smaak’

Google lijkt zich ervan bewust te zijn dat de angst leeft onder videoproducenten, fotografen en andere makers dat ze straks zonder werk zitten. Het bedrijf zegt in het ontwerpproces van de tools een stem te willen geven aan filmmakers, muzikanten, illustratoren en andere makers, die volgens Google meedenken over hoe de tools worden ontworpen en hoe ze moeten werken. Ook laat het de creatieven campagnes, filmpjes en afbeeldingen ontwikkelen met behulp van de tools.

Vidhya Srinivasan, Vice President en General Manager van Ads bij Google, vergelijkt AI met smartphonecamera’s: “Tegenwoordig is de gemiddelde foto of video veel beter dankzij technologie. Dat betekent echter niet dat we allemaal tijdschriftcovers kunnen schieten. Hoeveel AI ook verbetert, het heeft geen smaak of vindingrijkheid. Toch kan AI nieuwe mogelijkheden bieden om je potentieel voor creativiteit uit te breiden.”

Digitaal watermerk

Google zoekt dus actief de samenwerking op met creatieve makers, door bijvoorbeeld het Infinite Wonderland-project, waar het illustratoren nieuwe afbeeldingen heeft laten genereren voor het verhaal Alice in Wonderland van Lewis Carroll. Verder zegt het bedrijf samen te werken met muzikanten voor de verdere ontwikkeling van hun Music AI Sandbox, een reeks tools voor muziekproductie. Ook is er Lyria voor het genereren van muzikale prompts.

Content die hiermee is gegenereerd, krijgt het digitale watermerk SynthID mee, dat Google ook al gebruikt voor andere AI-gegenereerde beelden, geluiden, teksten en video. Ook alle video’s gemaakt met Veo in VideoFX krijgen dit watermerk mee.

Lees ook: Google zoekmachine binnenkort verrijkt met verregaande AI-functionaliteit