VASA-1-model van Microsoft laat foto’s praten

Microsoft heeft onlangs een onderzoek gepubliceerd waarin het bedrijf het AI-model VASA-1 presenteerde. Dit model laat met behulp van portretfoto’s en daaraan gekoppelde audiobestanden realistische ‘talking heads’ zien. Deze technologie biedt creatieve opties, maar brengt serieuze risico’s met zich mee.

Het VASA-1 AI-model bevindt zich nog in een onderzoeksfase. Microsoft laat al wel zien dat het portretfoto’s van personen in combinatie met audiobestanden ‘realistisch’ kan laten praten. De getoonde gezichtsuitdrukkingen zijn contextgevoelig, waardoor ze zich aanpassen aan de geconstateerde toon van de audio.

Zeer realistisch

De personen in de gebruikte portretfoto’s hoeven niet direct in de camera te kijken. Daarnaast beschikt het AI-model over veel mogelijkheden zoals het bepalen van de blik van de ogen, de afstand tot het hoofd en zelfs van emotionele uitdrukkingen.

Hierdoor krijgen de bewerkte beelden een zeer realistische ‘look and feel’ als zij lijken te praten, stelt Microsoft. Met de technologie zijn deze ‘pratende foto’s’ onder meer in staat liedjes te zingen.

Volgens Microsoft is VASA-1 speciaal ontworpen voor het animeren van virtuele karakters. De beelden die de techreus bij het onderzoek heeft uitgebracht zouden virtuele voorbeelden zijn die zijn aangemaakt met DALL-E van OpenAI.

Collage van verschillende gezichtsuitdrukkingen van meerdere individuen, die emoties zoals vreugde, verwarring en verrassing demonstreren, voor een visuele audiosynchronisatieanalyse.

Use cases en serieuze risico’s

De nieuwe technologie biedt vanzelfsprekend veel mogelijke toepassingen. Vanzelfsprekend kan het gebruikt worden voor het ontwikkelen van meer realistische AI-karakters, compleet met ‘normale’ lipsynchronisatie en gezichtsuitdrukkingen voor meer diepgang. Ook is het het hierdoor mogelijk om avatars aan te maken voor social media-video’s. Microsoft bedacht zelf om ook de Mona Lisa te laten zingen als frappant voorbeeld voor de zeer gevarieerde manieren waarop de technologie gebruikt kan worden.

Toch zijn er ook risico’s aan deze nieuwe AI-technologie verbonden. Als de technologie publiekelijk beschikbaar was, kon het direct leiden tot veel overtuigendere deepfakes. Juist het mogelijk kwaadwillig gebruiken van de technologie is voor Microsoft een reden om de specifieke details van VASA-1 voorlopig nog voor zichzelf te houden. Daarbij waarschuwen de onderzoekers ervoor dat hoewel de technologie goede bedoelingen heeft voor vooral de creatieve sector, de gevaren voor misbruik zeer zeker op de loer liggen.

Keuze van de redactie

Insight: Security Platforms

Lees meer over Applications

Top story

Domeinspecifieke AI verslaat generieke modellen in business apps

Het AI-team van Visma is stilletjes bezig met het herdefiniëren van documentverwerking in Europa. Met bijna ...

Berry Zwets 2 dagen geleden

Whitepapers

VASA-1-model van Microsoft laat foto’s praten

Zeer realistisch

Use cases en serieuze risico’s

Blijf op de hoogte, abonneer!

KnowBe4 gaat van security training naar human risk management

Wat weten we over SafePay, de Ingram Micro-aanvallers?

KnowBe4 gaat van security training naar human risk management

Security-industrie is fundamenteel stuk: baseer investeringen op hard bewijs

Hoe interpreteer je de resultaten van de MITRE ATT&CK evaluatie?

Hoe maak je duurzaamheid echt praktisch?

Verbeter je digitale ervaringen met de Cisco AI Assistant

Ervaar gratis Synology’s nieuwste enterprise backup-oplossing

Versnel je AI-succes met NVIDIA AI Computing van HPE

Krijg Volledig Inzicht van Gebruiker tot Cloud met Cisco ThousandEyes

GITEX DIGI_HEALTH 5.0 - Thailand

IT Arena

Innovation Week 2025

Luxembourg Venture Days

Appdevcon