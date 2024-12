Google Cloud wil de eerder gedane belofte van krachtige beeld-AI vervullen met de komst van Veo en Imagen 3 naar het Vertex AI-platform. Deze modellen moeten de productie van grafische assets voor bedrijven aanzienlijk versnellen en tegelijk de kosten beheersbaar houden.

Veo is ontwikkeld door Google’s AI-fabriek DeepMind en is nu in ‘private preview’ beschikbaar op Vertex AI, het machine learning platform dat exclusief beschikbaar is op Google Cloud. Voorlopig dus alleen nog voor een selecte groep klanten, al rolt Google de dienst na verloop van tijd verder uit.

Het model weet video’s te produceren in high-definition op basis van enkele tekstuele prompts of afbeeldingen als bron. Verschillende stijlen zijn mogelijk, zoals realistische video’s of animaties. Zo kunnen bedrijven bijvoorbeeld bestaande assets animeren, of vanuit één tekstuele prompt compleet nieuwe video’s maken en die eventueel verder aanpassen tot het eindresultaat naar wens is.

Imagen 3 is een tekst-naar-beeld generator en vanaf volgende week algemeen beschikbaar voor alle gebruikers van Vertex AI. Het is hiermee mogelijk om met eenvoudige teksten als input fotorealistische afbeeldingen te maken waarvan de details doorgaans kloppen. Google benadrukt dit graag omdat dit juist lastig is voor beeldgenerators, die nog wel eens teveel vingers, onzinnige teksten of bizarre gebruiksvoorwerpen fantaseren.

Natuurgetrouwe afbeeldingen

Ook belooft Imagen 3 natuurgetrouwe belichting en minder artefacten in vergelijking met eerdere versies. Daarmee bedoelt het bedrijf objecten in de afbeelding die niet kloppen of misplaatst zijn, evenals verkeerde kleuren, lichten of gebrek aan scherpte. Het toevoegen van eigen merk of huisstijl is ook mogelijk, evenals toepassen van verschillende stijlen zoals een tekenfilm- of schilderij-look.

Wat deze tool vooral interessant moet maken voor marketeers, productontwerpers, creatieven of PR-personeel, is de mogelijkheid een afbeelding op detailniveau aan te passen. Het gaat dus veel verder dan een paar afbeeldingen genereren en hopen dat er iets bruikbaars tussen zit: een ‘prima’ resultaat kan worden aangescherpt tot het echt goed is. Ook handig: een tekstprompt met een bijgevoegde afbeelding ter referentie. Als voorbeeld geeft Google een foto van een jurk met de opdracht een beeld te genereren van een vrouw die deze jurk draagt.

Voorzien van digitaal watermerk

Google snapt dat vervalsingen en deepfakes (al dan niet bewust) op de loer liggen met dergelijke krachtige software. Zowel Veo als Imagen 3 zijn dan ook voorzien van een digitaal watermerk via DeepMind’s SynthID die desinformatie tegen moet gaan, schadelijke inhoud voorkomen en gebruikersinformatie beschermen. Dat laatste is overigens geen overbodige luxe.

Google biedt ook vrijwaring van copyright (copyright indemnity), wat erop neerkomt dat wanneer een partij (onterecht) claimt dat hun copyright is geschonden met behulp van deze tools, Google alle juridische consequenties voor z’n rekening neemt. Mits er natuurlijk geen misbruik is gemaakt van eventueel bronmateriaal.

